[前][次][番号順一覧][スレッド一覧]

mysql:13813

From: MORIYAMA Masayuki <MORIYAMA Masayuki <moriyama@xxxxxxxxxx>>
Date: Thu, 22 Mar 2007 20:02:19 +0900
Subject: [mysql 13813] Re: UTF8 問題

森山です。

Hiro Yoshioka wrote:
> 先日のOSC2007で、松信さんのプレゼンを聞いててのコメントです。
> [mysql 13666]でも、議論されていますが、UTF8のサポートについて
> はUTF8を仕様どおり最長6バイトで実装することをお願いしたいと思います。
> 
> 4バイトのエンコーディングを導入するというのは、いくらなんでも
> 止めた方がいいと思いますが、皆さんの御意見はいかがでしょう。

RFC 2279 では、UCS-4 のコード範囲をサポートするため、6 バイト長まででし
たが、RFC 3629 では、UTF-16 のコード範囲 (U+0000〜U+10FFFF) までに制限さ
れ、4 バイト長までで良くなっています。

という事で、RFC 3629 通りの実装であれば、4 バイト長までの実装で良いと思
います。

上で言っている 4 バイトエンコーディングというのがよくわからないのです
が、MySQL の内部処理として UCS-2 (UTF-16) ではなく UCS-4 (UTF-32) を使う
という事で 4 バイトエンコーディングの導入という事なのでしょうか?

OSC2007 の松信さんのプレゼンを聞いていないので、話が掴めていません。

--
森山 将之 <moriyama@xxxxxxxxxx>

[前][次][番号順一覧][スレッド一覧]

     13812 2007-03-22 09:08 ["Hiro Yoshioka" <hyo] UTF8 問題                               
->   13813 2007-03-22 20:02 ┗[MORIYAMA Masayuki <m]                                       
     13819 2007-03-24 05:55  ┗[とみたまさひろ <tomm]                                     
     13820 2007-03-24 09:55   ┣["TAKAHASHI, Tomohiro]                                   
     13821 2007-03-24 23:37   ┗[MORIYAMA Masayuki <m]                                   
     13822 2007-03-25 23:45    ┗[とみたまさひろ <tomm]