|
* UTF-8の特定全角文字でSJISと誤判定 [#vd18ac4a] -ページ: [[BugReport]] -投稿者: [[anonymous]] -優先順位: 普通 -状態: 提案 -カテゴリー: -投稿日: 2012-11-20 (火) 15:13:02 -バージョン: 2.0.5.0 ** メッセージ [#xdc18ec5] テキストファイルとして『★aaaaaaaaa』の1行をUTF-8で保存して開こうとすると毎回『このファイルを文字コード SJIS で開こうとしていますが、前回は別の文字コード UTF-8 で開かれています。前回と同じ文字コードを使いますか?』確認メッセージが表示されます。 「★a」はUTF-8では「0xe2 0x98 0x85 0x61」の並び順バイトコードとなります。 SJISでは、「0xe2 0x98」は「笘」となり正しいSJISコードですが、「0x85 0x61」は不正なコード範囲です。不正なSJISコード「0x6185」がSJISと判定されているようにみえます。文字コード判定に先頭の2バイトのみを見ているとかは無いですよね? ---- #comment #attach |