mysql:12372
From: "Shuichi Tamagawa" <"Shuichi Tamagawa" <tamagawa@xxxxxxxxxx>>
Date: Mon, 7 Nov 2005 18:16:22 +0900
Subject: [mysql 12372] MySQL 日本語問題吐き出し緊急オフ会 - まとめ
玉川です。 11/4(金)の日本語問題オフ会にて議論が交わされた結果、 以下の点を優先度の高い課題として改善を要求することになりました。 a) 文字コードの自動変換に伴う文字化けへの対応 4.1以降クライアント/サーバー間で文字コードの自動変換が行われる ようになったことに伴い、文字化けが頻繁に発生している。 *--skip-character-set-client-handshakeオプションだけでは不十分 *libmysqlにmy.cnfファイル、又は環境変数に設定されたオプションを追加して欲し い *バイナリ版のデフォルトキャラクターセットはutf8の方が好ましい b) JISコード範囲外の文字の処理 4.0まではJISコード範囲外の文字でもテーブルに挿入することができたが、 4.1からはコード範囲外の文字があると、当該文字以降のすべての文字が 消失してしまう。 *範囲外の文字が含まれる場合、当該文字を他の文字に置き換えて 処理を続行するなり、後続のデータが消えてしまわないようにして欲しい *範囲外の文字が含まれる場合、現行はWarningを発生させるだけだが エラーではじくモードも欲しい c) Unicode -> JIS系文字コードへの変換 http://dev.mysql.com/doc/refman/4.1/ja/charset-cp932.html の表にあるように、Unicodeからcp932、sjisにそれぞれ変換する際に、 一方では変換先が割り当てられているが、もう一方では変換先が 割り当てられていない('3F' = '?' が割り当てられている)文字がある (eucjpms、ujisについても同様)。アプリケーション側で文字コード変換が 発生する際に、DB側と同一のキャラクターセットを指定しないと データ破壊が発生する場合がある。 *上記の表においてUnicodeからの変換先が割り当てられていない 文字について、他のキャラクターセットで割り当てられているもの については同一の文字を割り当てて欲しい。 # 木下さん、この点については私なりの解釈で書いてあります。 # 誤りがあればご指摘お願いします。 d) sjisバイナリーデータのエスケープ処理 sjis/cp932使用時に、バイナリデータをバイナリ型の列に格納すると エスケープ処理によってデータ破壊が発生する場合がある。 (0x9500がエスケープ処理によって0x955c30 = '表0' になってしまう) *エスケープ処理を正しく行うようにして欲しい その他、優先度はさほど高くないが、要望として伝えておくこと としては以下の通りです。 * キャラクタセット名のエイリアスを使えるようにして欲しい * 4.0から4.1へのアップグレード手順を日本語化して欲しい * 正規表現で日本語を使えた方が良い * 全文検索で日本語を使えた方が良い なお、「4.1から導入されたコマンドを使ったアプリケーションでの 4.0への接続」ができないという点も挙げられましたが、 この点については「必要ないのではないか」という声が多数ありました。 必要と思われる方は、このMLにて議論頂きたいと思います。 といった具合です。何か過不足がありましたら、また気になる点が ございましたらご連絡下さい。 -- Shuichi Tamagawa tamagawa@xxxxxxxxxx
-> 12372 2005-11-07 18:16 ["Shuichi Tamagawa" <] MySQL 日本語問題吐き出し緊急オフ会 - まとめ 12373 2005-11-07 20:17 ┣[Yasufumi Kinoshita <] 12374 2005-11-07 21:21 ┃┗["Shuichi Tamagawa" <] 12391 2005-11-08 15:59 ┃ ┗[Yasufumi Kinoshita <] 12400 2005-11-08 20:50 ┃ ┗["Shuichi Tamagawa" <] 12402 2005-11-08 21:14 ┃ ┗[Hirofumi Fujiwara <f] 12412 2005-11-09 10:21 ┃ ┣[Hiro Yoshioka <hyosh] 12413 2005-11-09 10:28 ┃ ┃┗[<takeshi@xxxxxxxxxx>] 12414 2005-11-09 10:38 ┃ ┃ ┗[Hiro Yoshioka <hyosh] 12415 2005-11-09 11:56 ┃ ┃ ┗[<takeshi@xxxxxxxxxx>] 12416 2005-11-09 18:43 ┃ ┃ ┗[Hiro Yoshioka <hyosh] 12428 2005-11-10 14:12 ┃ ┃ ┗[<takeshi@xxxxxxxxxx>] 12520 2005-11-30 10:49 ┃ ┣[Tetsuro IKEDA <tetsu] 12525 2005-12-01 13:26 ┃ ┃┗[Hirofumi Fujiwara <f] 12598 2005-12-21 08:20 ┃ ┗[Tetsuro IKEDA <tetsu] メタデータに2バイト目が`(60)の漢字を使用する場合の不具合の件 12599 2005-12-21 12:43 ┃ ┗[Hirofumi Fujiwara <f] 12377 2005-11-07 23:55 ┣[Tadashi Jokagi <ml@x] 12399 2005-11-08 20:43 ┃┗["Shuichi Tamagawa" <] 12378 2005-11-08 00:11 ┣[<takeshi@xxxxxxxxxx>] 12380 2005-11-08 09:27 ┃┣["Shuichi Tamagawa" <] 12381 2005-11-08 09:36 ┃┃┗[<takeshi@xxxxxxxxxx>] 12403 2005-11-08 21:22 ┃┃ ┗[とみたまさひろ <tomm] 12405 2005-11-08 21:42 ┃┃ ┗[<takeshi@xxxxxxxxxx>] 12397 2005-11-08 20:29 ┃┗["Shuichi Tamagawa" <] 12401 2005-11-08 21:11 ┃ ┗[とみたまさひろ <tomm] 12404 2005-11-08 21:27 ┃ ┣[Hirofumi Fujiwara <f] 12406 2005-11-08 21:52 ┃ ┣[<takeshi@xxxxxxxxxx>] 12417 2005-11-09 19:46 ┃ ┃┣[とみたまさひろ <tomm] 12418 2005-11-09 20:15 ┃ ┃┃┗[<takeshi@xxxxxxxxxx>] 12419 2005-11-10 11:13 ┃ ┃┃ ┗[Yasufumi Kinoshita <] 12425 2005-11-10 13:21 ┃ ┃┃ ┣[<takeshi@xxxxxxxxxx>] 12429 2005-11-10 14:47 ┃ ┃┃ ┗[MORIYAMA Masayuki <m] 12432 2005-11-10 20:15 ┃ ┃┃ ┗[Yasufumi Kinoshita <] 12433 2005-11-11 00:37 ┃ ┃┃ ┗[MORIYAMA Masayuki <m] 12435 2005-11-11 19:54 ┃ ┃┃ ┗[Yasufumi Kinoshita <] Re: MySQL 日本語問題吐き出し緊急オフ会 -まとめ 【c案整理】 12440 2005-11-12 11:48 ┃ ┃┃ ┣[MORIYAMA Masayuki <m] 12441 2005-11-12 12:52 ┃ ┃┃ ┃┗[MORIYAMA Masayuki <m] 12442 2005-11-13 14:06 ┃ ┃┃ ┣[MORIYAMA Masayuki <m] 12452 2005-11-14 11:20 ┃ ┃┃ ┃┗[MORIYAMA Masayuki <m] 12453 2005-11-14 12:51 ┃ ┃┃ ┃ ┣["Shuichi Tamagawa" <] 12462 2005-11-16 11:18 ┃ ┃┃ ┃ ┃┗[MORIYAMA Masayuki <m] 12464 2005-11-16 15:05 ┃ ┃┃ ┃ ┃ ┗["Shuichi Tamagawa" <] 12454 2005-11-14 15:27 ┃ ┃┃ ┃ ┗[Yasufumi Kinoshita <] Re: MySQL 日本語問題吐き出し緊急オフ会 -まとめ 【c案整理】皆様のご意見をお願いします。 12461 2005-11-16 03:10 ┃ ┃┃ ┃ ┣[MORIYAMA Masayuki <m] 12463 2005-11-16 15:00 ┃ ┃┃ ┃ ┗["Shuichi Tamagawa" <] 12466 2005-11-17 11:34 ┃ ┃┃ ┃ ┗[Yasufumi Kinoshita <] 12468 2005-11-17 15:46 ┃ ┃┃ ┃ ┗["Shuichi Tamagawa" <] 12470 2005-11-17 16:36 ┃ ┃┃ ┃ ┗[Yasufumi Kinoshita <] 12473 2005-11-17 17:48 ┃ ┃┃ ┃ ┗["Shuichi Tamagawa" <] 12448 2005-11-14 09:14 ┃ ┃┃ ┗["Shuichi Tamagawa" <] 12426 2005-11-10 13:57 ┃ ┃┗["Shuichi Tamagawa" <] 12427 2005-11-10 14:02 ┃ ┃ ┗[<takeshi@xxxxxxxxxx>] 12411 2005-11-09 09:15 ┃ ┗["Shuichi Tamagawa" <] 12475 2005-11-18 09:48 ┗["Shuichi Tamagawa" <] 12476 2005-11-18 09:54 ┣["Ryuichiro Munechika] 12613 2005-12-28 16:59 ┗["Shuichi Tamagawa" <]