[前][次][番号順一覧][スレッド一覧]

mysql:13821

From: MORIYAMA Masayuki <MORIYAMA Masayuki <msyk@xxxxxxxxxx>>
Date: Sat, 24 Mar 2007 23:37:34 +0900
Subject: [mysql 13821] Re: UTF8 問題

森山です。

とみたまさひろ wrote:
>> OSC2007 の松信さんのプレゼンを聞いていないので、話が掴めていません。
> 
> プレゼン中で 4バイト UTF-8 への対応として、現状の utf8 は最大3バイトの
> ままにしておき、最大4バイトを扱えるものをたとえば utf8_4 というような
> 名前で導入する…という話がありました。

なるほど、ありがとうございます。
従来の utf8 は、正しく実装されていなかったのだけれども、互換性維持の為に
に、従来の実装を残して正しい UTF-8 を utf8_4 として実装するという事です
ね。(MySQL の utf8 は、CESU-8 だったという事)

たとえば、次のような感じになる。

mysql> select hex(convert(_utf8 0xEDA080EDB080 using utf8));
+-----------------------------------------------+
| hex(convert(_utf8 0xEDA080EDB080 using utf8)) |
+-----------------------------------------------+
| EDA080EDB080                                  |
+-----------------------------------------------+

mysql> select hex(convert(_utf8 0xEDA080EDB080 using utf8_4));
+-------------------------------------------------+
| hex(convert(_utf8 0xEDA080EDB080 using utf8_4)) |
+-------------------------------------------------+
| F0908080                                        |
+-------------------------------------------------+

mysql> select hex(convert(_utf8_4 0xF0908080 using utf8));
+---------------------------------------------+
| hex(convert(_utf8_4 0xF0908080 using utf8)) |
+---------------------------------------------+
| EDA080EDB080                                |
+---------------------------------------------+


[前][次][番号順一覧][スレッド一覧]

     13812 2007-03-22 09:08 ["Hiro Yoshioka" <hyo] UTF8 問題                               
     13813 2007-03-22 20:02 ┗[MORIYAMA Masayuki <m]                                       
     13819 2007-03-24 05:55  ┗[とみたまさひろ <tomm]                                     
     13820 2007-03-24 09:55   ┣["TAKAHASHI, Tomohiro]                                   
->   13821 2007-03-24 23:37   ┗[MORIYAMA Masayuki <m]                                   
     13822 2007-03-25 23:45    ┗[とみたまさひろ <tomm]