[前][次][番号順一覧][スレッド一覧]

mysql:12389

From: Yasufumi Kinoshita <Yasufumi Kinoshita <kinoshita.yasufumi@xxxxxxxxxx>>
Date: Tue, 08 Nov 2005 15:34:53 +0900
Subject: [mysql 12389] Re: MySQLの eucjpms と IE の EUC-JP

木下です。
勉強になります。

>>cp51932についての私見を述べさせてください。
>>
>>ご指摘の記事の中に出てくる
>>http://www.rikai.com/library/kanjitables/kanji_codes.euc.shtml
>>をざっと見たところ、eucJP-openとの違いは、SJISでの「NEC選定IBM拡張文字」(ED40〜EDFC)を
>>そのままの句点コードに対応するEUCでの領域 (F9A1〜FCFE) に割り当てているみたいです。
>>この領域は eucJP-open ではSJISでの 外字領域を保持する部分の一部です。
>>cp51932への対応は少なくともEUCで外字領域を保持することと二者択一になりそうですね。
>>ただ、SJISで直接格納できないPostgreSQLと違い、MySQLのcp932では外字領域が考慮されているので、
>>MySQLではEUCで外字を格納するケースのほうが稀かも知れません。
> 
> 
> DB を EUC とするのは、5.8.0 以前の Perl でプログラミングする場合にスクリ
> プトを EUC とする場合に、それにあわせて DB も EUC にするという事はあると
> 思います。その場合、Web ブラウザへの入出力文字コードを EUC にする事で、
> 余計な手間をかけずにプログラミングするという事は一般的なのかもしれませ
> ん。そのようなシステムでは、CP51932 なデータが DB に格納されてしまうとい
> う事が起きます。

まわりくどい言い方をしてしまいましたが、言いたかったことは、
「EUCで外字領域を保持する必要は無いと思うのでeucjpmsでは外字をやめて
 そのままの句点コードでNEC選定IBM拡張文字を保持すれば
 文字コードを増やすことなく対応できるのでは?」
ということです。
しかし、NEC選定IBM拡張文字 と JIS補助漢字 の重複については

> かなり古い資料になりますが、
> 
> UNIX System V リリース 4 日本語環境共通規約 第 1 版
> 発行所: 株式会社トッパン
> ISBN4-8101-8539-7
> 
> には、 日本語EUCのコードセット2 (JIS X 0201 片仮名), コードセット3
> (JIS X 0212 補助漢字) は必須ではない事が明記されていましたので、
> IE の不具合とは言い切れないでしょう。

ということで必須ではないとのことですので、cp51932に対応するためには
UCS-2からcp51932への変換を行う際に、補助漢字はNEC選定IBM拡張文字に
変換することを優先させなければならないです。
したがって、eucjpmsをcp51932にも対応させるのは無理で、
そのためにはやはり新しくcp51932のための文字コードを定義しないといけないのですね。
失礼しました。

> それよりも、CP51932 + JIS X 0212 が表示可能で POST するデータは 
> CP51932 だったりすると、FireFox でサポートしている EUC-JP が、
> eucJP-open なのか、CP51932 なのか迷ってしまいそうです。

FireFox、MozillaはLinux版でも同様な表示でした。
EUCの F9A1〜FCFEに NEC選定IBM拡張文字 が出てくるということは、
少なくともeucJP-openではなく、
「cp51932で補助漢字までをサポートもの」として考えるのが適当でしょうね。

eucJP-openは結局一種のローカルルールなので、
ブラウザの表示や、JIS X 0213への対応などを考えると
いずれはコードセット1(第1面)がシフトJISと単純に1対1で対応する
日本語EUC文字コードも別にサポートしなければならなくなるのでは?
と思いました。

-- 
NTTコムウェア
プロジェクト管理統括部
技術SE部門 DB技術グループ

木下  靖文

e-mail: kinoshita.yasufumi@xxxxxxxxxx

[前][次][番号順一覧][スレッド一覧]

     12362 2005-11-07 00:52 [MORIYAMA Masayuki <m] MySQLの eucjpms  と IE  の EUC-JP       
     12370 2005-11-07 14:06 ┣["Shuichi Tamagawa" <]                                       
     12375 2005-11-07 23:15 ┃┗[MORIYAMA Masayuki <m]                                     
     12379 2005-11-08 09:10 ┃ ┗[doumae <doumae@xxxxx]                                   
     12407 2005-11-08 22:31 ┃  ┗[MORIYAMA Masayuki <m]                                 
     12371 2005-11-07 14:48 ┗[Yasufumi Kinoshita <]                                       
     12376 2005-11-07 23:15  ┗[MORIYAMA Masayuki <m]                                     
->   12389 2005-11-08 15:34   ┗[Yasufumi Kinoshita <]                                   
     12408 2005-11-08 23:51    ┗[MORIYAMA Masayuki <m]