UTF-8の特定全角文字でSJISと誤判定
- ページ: BugReport
- 投稿者: anonymous
- 優先順位: 普通
- 状態: 提案
- カテゴリー:
- 投稿日: 2012-11-20 (火) 15:13:02
- バージョン: 2.0.5.0
メッセージ
テキストファイルとして『★aaaaaaaaa』の1行をUTF-8で保存して開こうとすると毎回『このファイルを文字コード SJIS で開こうとしていますが、前回は別の文字コード UTF-8 で開かれています。前回と同じ文字コードを使いますか?』確認メッセージが表示されます。
「★a」はUTF-8では「0xe2 0x98 0x85 0x61」の並び順バイトコードとなります。
SJISでは、「0xe2 0x98」は「笘」となり正しいSJISコードですが、「0x85 0x61」は不正なコード範囲です。不正なSJISコード「0x6185」がSJISと判定されているようにみえます。文字コード判定に先頭の2バイトのみを見ているとかは無いですよね?
- MocaさんがパッチをPatchunicode#249 で出してます -- Uchi?
- ご指摘ありがとうございます。Patchunicodeにあるということは既出なのでしょうか?もしかして取り下げたほうが良いですか? --
- そのパッチで解決したならば状態を完了にすれば良いんでは -- Uchi?
- svn:2500でコミットしました。 -- もか?