Gmailの文字コード判別について

| トラックバック(0)
この記事をブックマーク:  はてなブックマークに登録 この記事をlivedoorクリップ! Buzzurlにブックマーク Yahoo!ブックマークに登録

Gmailのインターフェースが日本語化されるのにやや先立って、メールのエンコーディング方法が内容によって適宜変化するように仕様が変わりました。
これに伴い、Gmailから送られた日本語メールが相手側で文字化けする現象は格段に減っていると思われます。
現状でのテスト結果を以下にまとめておきます。

(※2005/7/20 追記)韓国語を含む場合でのテスト結果を、Mr. Y.S.様よりお送りいただいたので追記させていただきました。Thanx a lot!
(※2005/6/9 追記)インターフェースを英語にした場合および、中国語を含む場合でのテスト結果を、Ms K.O.様よりお送りいただいたので追記させていただきました。Thanx a lot!

【1】初期テストの条件
・Gmailの言語設定を「日本語」にしています
・作成するメールの形式は通常の「プレーンテキスト形式」です

【2】初期テストの結果
メールの件名と本文の内容を変えて、以下の4パターンのメールを送信した結果、ヘッダ情報は以下のようになりました。

(1)件名・本文ともに日本語含む
Content-Type: text/plain; charset=ISO-2022-JP
Content-Transfer-Encoding: 7bit
※件名はISO-2022-JPエンコード済み

(2)件名は英語、本文は日本語含む
Content-Type: text/plain; charset=ISO-2022-JP
Content-Transfer-Encoding: 7bit

(3)件名は日本語含む、本文は英語
Content-Type: text/plain; charset=ISO-8859-1
Content-Transfer-Encoding: quoted-printable
※件名はISO-2022-JPエンコード済み

(4)件名・本文ともに英語
Content-Type: text/plain; charset=ISO-8859-1
Content-Transfer-Encoding: quoted-printable

(4)はもともと文字化けとは無関係です。
(1)(2)については、このヘッダ情報であれば文字化けは発生しません。
唯一、(3)だけはメーラーによっては件名が化けるかもしれないと感じましたが、Hotmailで受信したところ文字化けはしませんでした。(他のWebメールでもテストしてみたいと思います)

【3】追加テストの結果

▼3−A:Gmailの言語設定を「英語」にした場合

【2】と同じ4パターンでのテストの結果、いずれのパターンについても、言語設定が「日本語」の場合と同じ結果となるそうです。

▼3−B:中国語を使う場合(※言語設定は「英語」とします)

【2】と同じ4パターンでのテストの結果、ヘッダ情報は以下のようになったとのことです。(「GB2312」は、中国語簡体字の文字コードセットです)

(1)件名・本文ともに中国語含む
Content-Type: text/plain; charset=GB2312
Content-Transfer-Encoding: base64
※件名はGB2312エンコード済み

(2)件名は英語、本文は中国語含む
Content-Type: text/plain; charset=GB2312
Content-Transfer-Encoding: base64

(3)件名は中国語含む、本文は英語
Content-Type: text/plain; charset=ISO-8859-1
Content-Transfer-Encoding: quoted-printable
※件名はGB2312エンコード済み

(4)件名・本文ともに英語
Content-Type: text/plain; charset=ISO-8859-1
Content-Transfer-Encoding: quoted-printable

▼3−C:韓国語を使う場合(※言語設定は「英語」「日本語」いずれでもOKとします)

【2】と同じ4パターンでのテストの結果、ヘッダ情報は以下のようになったとのことです。(「EUC-KR」は、韓国の標準的な文字コードセットである韓国語EUCです)

(1)件名・本文ともに韓国語含む
Content-Type: text/plain; charset=EUC-KR
Content-Transfer-Encoding: base64
※件名はEUC-KRエンコード済み

(2)件名は英語、本文は韓国語含む
Content-Type: text/plain; charset=EUC-KR
Content-Transfer-Encoding: base64

(3)件名は韓国語含む、本文は英語
Content-Type: text/plain; charset=ISO-8859-1
Content-Transfer-Encoding: quoted-printable
※件名はEUC-KRエンコード済み

(4)件名・本文ともに英語
Content-Type: text/plain; charset=ISO-8859-1
Content-Transfer-Encoding: quoted-printable

【4】結論
以上の結果から、Gmailの言語設定が「英語」でも「日本語」でも、まず文字化けの心配はなくなってきたと言えそうです。
また、中国語・韓国語を含む場合も、日本語の場合と同様に文字コードが正しく自動判別されるようです。

※なお、Mr. Y.S.さんの情報によると、日・中・韓の三ヶ国語を混在させた場合は、UTF-8になるそうです。

※まだテストしていない「添付ファイルがあるケース」「リッチテキスト形式メールでのケース」については、もし問題などにお気づきの方はタレコミください。

トラックバック(0)

このページのトラックバックURL:
http://www.gmail-maniacs.net/nimda/mt-tb.cgi/30