BugReport/105 のバックアップソース(No.4)



* UTF-8の特定全角文字でSJISと誤判定 [#vd18ac4a]
-ページ:     [[BugReport]]
-投稿者:     [[anonymous]]
-優先順位:   普通
-状態:       提案
-カテゴリー: 
-投稿日:     2012-11-20 (火) 15:13:02
-バージョン: 2.0.5.0

** メッセージ [#xdc18ec5]
テキストファイルとして『★aaaaaaaaa』の1行をUTF-8で保存して開こうとすると毎回『このファイルを文字コード SJIS で開こうとしていますが、前回は別の文字コード UTF-8 で開かれています。前回と同じ文字コードを使いますか?』確認メッセージが表示されます。
「★a」はUTF-8では「0xe2 0x98 0x85 0x61」の並び順バイトコードとなります。
SJISでは、「0xe2 0x98」は「笘」となり正しいSJISコードですが、「0x85 0x61」は不正なコード範囲です。不正なSJISコード「0x6185」がSJISと判定されているようにみえます。文字コード判定に先頭の2バイトのみを見ているとかは無いですよね?
----

#comment
#attach

    ホーム 一覧 単語検索 最終更新 バックアップ リンク元   ヘルプ   最終更新のRSS