mysql:6076
From: "Takashi Yamashita" <"Takashi Yamashita" <takasi@xxxxxxxxxx>>
Date: Tue, 3 Sep 2002 11:34:22 +0900
Subject: [mysql 06076] Re: jdbc: UTF-8 文字列の INSERT
お世話になっております。 レスありがとうございます。 > Shift_JIS 817C は MINUS SIGN なので、UCS(Unicode) 2212 (MINUS SIGN) に対 > 応付けられているのでしょう。これは「ハイフン」ではなく、「ハイフン」は、 > UCS 002D、Shift_JIS 2D が HYPHEN-MINUS で対応。 > > UCS FF0D は compatibility area の FULLWIDTH HYPHEN-MINUS なので、Shift_JIS > → UCS の対応付けは無いのが予期された動作かと思います。 > > 「形状」はフォントにより様々でしょう。 ちょっと論点がずれてしまいますが、 UTF-8のテキストファイルをメモ帳でオープンし、 IME(Microsoft IME 200, Atok13で検証)で「まいなす」と読み仮名を入力し、 スペースで変換し、変換候補の「−」を選択し、 Enterキーを押して編集ウィンドウに「−」を貼り付けます。 今度は文字パレットの「unicode表」からunicode番号:2212「-」の 文字(表示できないため半角-で表します)をダブルクリックして 貼り付けます。 (全角数字の後に続けて「−」と入力しても同様です。) 両者を比較すると、明らかに文字の「形状」と「種類」が違います。 つまり、日本語仮名漢字変換ソフトベンダーは、 「−」に対応する文字コードとして、Shift_JISは「817C」、unicodeは「FF0D」を 選択しているようです。 すると、ソフト開発者としてはJAVAの「規則」に従うべきか、 日本語仮名漢字変換、 つまりユーザの日本語入力時に発生する「現象」に従うべきか、 どちらを選択すれば良いのでしょうか? ご意見をお待ちしております。 宜しくお願いします。 -------------------------------------------------- 山下高司 takasi@xxxxxxxxxx