|
UTF-8の特定全角文字でSJISと誤判定メッセージテキストファイルとして『★aaaaaaaaa』の1行をUTF-8で保存して開こうとすると毎回『このファイルを文字コード SJIS で開こうとしていますが、前回は別の文字コード UTF-8 で開かれています。前回と同じ文字コードを使いますか?』確認メッセージが表示されます。 「★a」はUTF-8では「0xe2 0x98 0x85 0x61」の並び順バイトコードとなります。 SJISでは、「0xe2 0x98」は「笘」となり正しいSJISコードですが、「0x85 0x61」は不正なコード範囲です。不正なSJISコード「0x6185」がSJISと判定されているようにみえます。文字コード判定に先頭の2バイトのみを見ているとかは無いですよね?
|