文字化け2011〜まだまだ化けます〜

>100 Views

February 24, 24

スライド概要

2011/09/17 に LOCAL DEVELOPER DAY (LDD) ’11/Fall in KUSHIRO で発表したスライドです。

シェア

またはPlayer版

埋め込む »CMSなどでJSが使えない場合

関連スライド

各ページのテキスト
1.

文字化け2011 〜まだまだ化けます〜 株式会社fonfun 尾形 鉄次 (OGATA Tetsuji) Twitter: @xtetsuji 2011/9/17

2.

自己紹介

3.

自己紹介 • 尾形 鉄次 (OGATA Tetsuji) Twitter: @xtetsuji • http://post.tetsuji.jp/ ここで語りきれないことも書きます • 高校卒業までの18年、音更町で過ごしま した。その後、大学で上京して十数年…

4.

所属紹介 • 株式会社fonfun(フォンファン) http://www.fonfun.co.jp/ http://rmail.jp/ • 任意団体g15アソシエーション http://g15.jp/ • Hokkaido.pm http://hokkaido.pm.org/

5.

Agenda

6.

Agenda • LTの5分で語れることは、ごくわずか • 技術者向けというよりも、メールや ウェブを普通に使うビギナー層向け • 技術的な話は懇親会等で話しましょう • 詳しくは分厚い参考書籍を見ましょう

7.

参考書籍 • プログラマのための 文字コード技術入門 • 技術評論社(2010/02) • 多少分厚い参考書 (400ページ弱)

8.

文字化け今昔

9.

文字化け今昔 • どうして文字化けが発生するのか • 日本語の文字コードいっぱい(歴史的に) • 昔はその判別によく失敗していた

10.

文字化け今昔 • 例えばブラウザでウェブ閲覧 • 昔は化けたが、今はそれほどでもない • ブラウザソフトウェアの高性能化、 そしてUTF-8(後述)の事実上の標準化 • 現在、文字化けは少なくなった?

11.

文字化け今昔 • 現在、文字化けは少なくなった? • 少なくなったのは事実 • しかし、Windowsだけでなく、Linux やMac OS X等、多様なOSが普及して いる今、メール等の情報のやり取り で文字化けがあるのも事実

12.

文字コード復習 • 日本語 (歴史的にたくさんの文字コード) • Shift_JIS (Windowsを初めとした標準) • ISO-2022-JP (メールで使われる) • EUC-JP (UNIX/Linux/昔のプログラミング) • Unicode (世界中の文字を収録) • UTF-8 など (最近のトレンド)

13.

それでも文字化け • 「受け手」が最新のブラウザやメール ソフトを使っているとは限らない • いわゆる「機種依存文字」 • 機種依存文字以外の文字化けについて は今回は割愛(時間がないので…)

14.

それでも文字化け • 受け手の環境が不明であれば、出来る 限り歴史的な「機種依存文字」を使わ なければいい(消極的だが効果的) • 「機種依存文字」って何?

15.

機種依存文字 • 丸数字: ① ② ③ ④ ⑤ ... • 合字: ㈱ ㈲ ㌗ ㌕ ...

16.

機種依存文字 • 丸数字や合字はShift_JISのWindows拡張 (CP932) として生まれた経緯があり、 あまりにみんなが使うので、後の文字 コード(集合)ではこれらが取り込まれた • Unicode、JIS X 0213 など • では使っていいのでは?

17.

機種依存文字 • いわゆる「機種依存文字」を使えるの は、自分、受け手、転送経路すべてで 機種依存文字を扱える場合のみ • 受け手や転送経路が不明であれば、極 力使わないほうがよい • 受け手が多数であるML等は特に要注意

18.

実体験

19.

実体験 • 私がOSにDebian GNU/Linux、メーラー にWanderlustを使っていた頃の話 • 委託先の会社の方から こんなメールがMLに流れてきました

20.

実体験 A社の機器設置場所ですが、2つあるという連絡が参りました。 �駐車場のある5F建ての建物 �地下のある2F建ての建物 ��のどちらの建物になりますでしょうかとのことでした。 設置場所電話番号だと�になり、住所だと�になります。

21.

実体験 • 読めないよ! • わかるんですよ、丸文字だってことは • でも丸数字を後で参照するなよ! • もうわかんないよ!

22.

大人の対応 • Linuxを個人環境として使っている人は いつも(主にWindowsユーザから)こんな メールをもらい頭を悩ましている(かも) • 大人な対応→怒らない、心眼で読む • 大人Linux-erに感謝しよう!

23.

もう一つ実体験 • 私がMacBook Airに作業環境を変えて Mac OS X上でWanderlustを使っていた 頃の話(今現在はこの環境) • 会社に入りたての営業の方から こんなメールがMLに流れてきました

24.

もう一つ実体験 【来週の訪問予定】 ㈰株式会社A社 進捗状況報告 ㈪B株式会社 子会社への展開提案 ㈫C社 進捗状況報告 ㈬D社 打ち合わせ ㈭E株式会社 ヒアリング ㈮F株式会社

25.

もう一つ実体験 • 新しく入った営業の人、スゲーよ! • 日曜日から仕事してる! • 一瞬、素で驚いた • …というのは嘘(読み間違い)で、これも 機種依存文字である丸数字が原因

26.

もう一つ実体験 • Windowsの機種依存文字①②③④⑤⑥ はMac OS Xではそれぞれ㈰㈪㈫㈬㈭㈮ • 大人な対応→怒らない、対応で読む • 大人Mac-erに感謝しよう!

27.

結論 • Linux-erやMac-erに感謝するよりも先に 機種依存文字を使わないことが良い • 例えばWindowsの老舗メーラー 「Becky!」には機種依存文字を色違いで 表示させて警告してくれる機能がある

28.

終わりに • ウェブの話や絵文字の話もしたかった • 今後のカンファレンスでもっと時間を もらってお話させていただくかもしれ ません • その時はよろしくお願いします

29.

ご清聴 ありがとうございました