mysql:13670
From: Yasufumi Kinoshita <Yasufumi Kinoshita <kinoshita.yasufumi@xxxxxxxxxx>>
Date: Mon, 15 Jan 2007 12:25:39 +0900
Subject: [mysql 13670] Re: UTF8 4バイト文字
木下です。 このFeature requestでしょうか? http://bugs.mysql.com/bug.php?id=14052 一昨年から放置されてるようですね。。 MySQLでは現在内部ではUCS-2(1文字2バイト固定長)なので、 UTF-8では3バイト文字までの範囲しか(文字として)扱えないのですね。 このページのSuggested fixのように、内部表現を サロゲートペアをサポートするようにするUCS-2( = UTF16)に 拡張すれば辻褄が合うと思うのですが、そうすると固定長だった文字の内部表現が 1文字が2バイトか4バイトの可変長となってしまうわけで、面倒そうです。。 相当アピールしないと必要性を理解してもらえないかもしれませんね。 #さて、困りましたね… #少し他力本願^^; #UTF-8の4バイト以上文字が特定の文字(「?」とか)に置き換えられて #しまうような応急処置なら変更箇所が少なそうなのですぐできそうですが、、 #それでは意味ないですよね? > とみたです。 > > Windows Vista で JIS第三/四水準がサポートされると、UTF8 の 4バイト文字 > が使用される可能性があるのですが、現状の MySQL では UTF8 は 3バイト文 > 字までしかサポートしていないようです。 > > MySQL に 4バイト文字を含む UTF8 文字列を INSERT/UPDATE しようとすると、 > 例によってその文字以降がすべて消えてしまいます。 > > MySQL の UTF8 4バイト文字のサポート予定とかないんでしょうか…。 > > # やはり、ASCII とか BINARY を使用して、MySQL には文字コードに関する余 > # 計な処理をさせないようにするのが良いのかなぁ…。 >
13666 2007-01-12 22:32 [とみたまさひろ <tomm] UTF8 4バイト文字 13667 2007-01-13 01:48 ┣[SOUMA Yutaka <holon@] 13678 2007-01-15 18:16 ┃┗[MORIYAMA Masayuki <m] -> 13670 2007-01-15 12:25 ┗[Yasufumi Kinoshita <] 13671 2007-01-15 13:42 ┣[<ymatsunobu@xxxxxxxx] Re: UTF8 4$B%P%$%HJ8;z(B 13679 2007-01-19 00:58 ┃┗[とみたまさひろ <tomm] Re: UTF8 4バイト文字 13692 2007-01-25 11:27 ┗["OGAWA Motoyuki (小�]