|
* UTF-8の特定全角文字でSJISと誤判定 [#vd18ac4a] -ページ: [[BugReport]] -投稿者: [[anonymous]] -優先順位: 普通 -状態: 提案 -カテゴリー: -投稿日: 2012-11-20 (火) 15:13:02 -バージョン: 2.0.5.0 ** メッセージ [#xdc18ec5] テキストファイルとして『★aaaaaaaaa』の1行をUTF-8で保存して開こうとすると毎回『このファイルを文字コード SJIS で開こうとしていますが、前回は別の文字コード UTF-8 で開かれています。前回と同じ文字コードを使いますか?』確認メッセージが表示されます。 「★a」はUTF-8では「0xe2 0x98 0x85 0x61」の並び順バイトコードとなります。 SJISでは、「0xe2 0x98」は「笘」となり正しいSJISコードですが、「0x85 0x61」は不正なコード範囲です。不正なSJISコード「0x6185」がSJISと判定されているようにみえます。文字コード判定に先頭の2バイトのみを見ているとかは無いですよね? ---- - MocaさんがパッチをPatchunicode#249 で出してます -- [[Uchi]] &new{2012-11-21 (水) 23:10:09}; - ご指摘ありがとうございます。Patchunicodeにあるということは既出なのでしょうか?もしかして取り下げたほうが良いですか? -- &new{2012-11-26 (月) 11:28:29}; - そのパッチで解決したならば状態を完了にすれば良いんでは -- [[Uchi]] &new{2012-12-01 (土) 12:44:20}; - [[svn:2500]]でコミットしました。 -- [[もか]] &new{2012-12-02 (日) 16:15:01}; - 素早い対応ありがとうございます。次期バイナリで確認後ご報告いたします。 -- &new{2012-12-03 (月) 15:27:46}; - ご報告が遅れていまさらですが、2.1.1.1で改善したことを確認していました -- &new{2015-08-21 (金) 13:12:59}; #comment #attach |