某MLの過去ログが見たいなぁ〜と思ってネットを探していたら、発見。
ところがマルチバイト未対応のML倉庫インフラらしく、符号化されたまま表示されちゃうのね。「Re: =?iso-2022-jp?……」みたいな感じ。本文も
(ESC)$B!!!!!!!
みたいな表示になっちゃってる((ESC)の部分は制御文字なので画面上は左矢印みたいな記号になってる)。日本語電子メールでのエスケープシーケンスはJISコードだから ISO/IEC 2022 方式か。
じゃあってンでブラウザの文字エンコーディングを ISO-2022-JP に変えてみると……あ、なんか日本語っぽくなったけど……ちょっと妙だなぁ。
どう瘢雹もう瘢雹まく届かないよう瘢雹なので
(中略)
のよう瘢雹なことができると
う瘢雹れしいです。
なんか変なのが挟まってる(笑)。
「瘢雹」ってェのはJISで16進にすると 0x616d703b か。ASCIIなら「amp;」だな。あっ。
「う」は…… 0x2426 か。解った。
「う」の後半 0x26 が「&」だと判断されて「&」にエスケープされてンのね(笑)。
似たような理由で「ー」とかも化けまくり。単に文字エンコードを変える前に、HTMLエンコードをデコードせなアカンのか。ちっ、面倒だなぁ。
面倒なのでスルー(ぇー
#実はUTF-8な状態で表示させといて最近の秀丸エディタにコピペするとサクっと表示されるという素晴らしく簡単な対処法がある。