BugReport/105 のバックアップ(No.7)




UTF-8の特定全角文字でSJISと誤判定

  • ページ: BugReport
  • 投稿者: anonymous
  • 優先順位: 普通
  • 状態: 提案
  • カテゴリー:
  • 投稿日: 2012-11-20 (火) 15:13:02
  • バージョン: 2.0.5.0

メッセージ

テキストファイルとして『★aaaaaaaaa』の1行をUTF-8で保存して開こうとすると毎回『このファイルを文字コード SJIS で開こうとしていますが、前回は別の文字コード UTF-8 で開かれています。前回と同じ文字コードを使いますか?』確認メッセージが表示されます。 「★a」はUTF-8では「0xe2 0x98 0x85 0x61」の並び順バイトコードとなります。 SJISでは、「0xe2 0x98」は「笘」となり正しいSJISコードですが、「0x85 0x61」は不正なコード範囲です。不正なSJISコード「0x6185」がSJISと判定されているようにみえます。文字コード判定に先頭の2バイトのみを見ているとかは無いですよね?


  • MocaさんがパッチをPatchunicode#249 で出してます -- Uchi? 2012-11-21 (水) 23:10:09
  • ご指摘ありがとうございます。Patchunicodeにあるということは既出なのでしょうか?もしかして取り下げたほうが良いですか? -- 2012-11-26 (月) 11:28:29
  • そのパッチで解決したならば状態を完了にすれば良いんでは -- Uchi? 2012-12-01 (土) 12:44:20

URL B I U SIZE Black Maroon Green Olive Navy Purple Teal Gray Silver Red Lime Yellow Blue Fuchsia Aqua White
[添付ファイル一覧] [全ページの添付ファイル一覧]
アップロード可能最大ファイルサイズは 2,048KB です。

    ホーム 一覧 単語検索 最終更新 バックアップ リンク元   ヘルプ   最終更新のRSS