以下は、会社の技術系MLに投げたメールです。
私たちの多くは、文字コードを使ったシステムを作っていて、いわゆる『文字化け』などの問題にもちょくちょくぶち当たっているわけですが、その割に、文字コードについての知識があまりないプログラマが多いように見受けられます。
その理由として、プログラマにとって適切な資料があまりないことがあるのではないかと思います。
書籍だと、深く理解したい人のためには、こんな良書があります。
『
文字符号の歴史―欧米と日本編』
しかし、この本はちょっとマニアックすぎますし、出た時期が古くて最近のことは書かれていませんし、プログラマ向けに書かれているわけではないので、知りたいことがそのまま載っているわけではありません。
※とはいえ、良書ですので、文字コードヲタ、規格ヲタの人にはおすすめです
Webには、多くの情報がありますが、そもそもWebで文字コードについて書くことが難しいこともなどもあって、なかなかこれというサイトが見つかりません。プログラマ向けに書かれたサイトだと、用語の使い方が不適切だったり、歴史的経緯を無視した書き方だったりして、今ひとつというところが結構あります。
そんな中、良書が出ました。
『
プログラマのための文字コード技術入門』
この本の紹介文では、『本書は、ソフトウェア技術者をおもな対象として、文字コードの基礎知識をなるべく筋道立てて説明しようと試みた技術解説書です』と書かれています。その通り、『筋道立てて説明』されています。かといって、マニアックにならず、必要十分なところで押さえた記述になっています。
この本の1章に、『文字コードを複雑化させる二つの理由』というのが書かれています。
・過去の経緯の積み重ね
・文字そのものの難しさ
本書は、この二つの理由をしっかり踏まえて書かれています。そこが、本書の良書たるゆえんだと思います。
本書の流れも、このことを踏まえた構成になっていますので、最初から順番に読むことをおすすめします。
1つ残念なところとしては、EBCDICおよびその拡張の文字コードについて、ほとんど書かれていないことです。オープン系のシステムでも、ホストとの連携と行った場面では、これらの文字コードについての意識は必須ですし、文字コード変換できる・できないといった話題は、JIS X 0213:2004の時代になった今だからこそ重要だと思います。
本書は、皆さんにぜひ読んでいただきたい本だと思います。
上であえて『EBCDICおよびその拡張の文字コード』について触れているかというと、社内のプロジェクトが、銀行系を中心に、ホストを使うもの・ホストと連携するものがまだ多いからです。逆に、もうホストなんか使わなくなったという人にとってはそんな記述無くてよかったというところかもしれません。
ところで、本書では、アイヌ語について所々で触れています。JIS X 0213に触れる以上当然かなというぐらいで読んでいたのですが、著者が札幌出身ということもあるんでしょうね。
著者のサイトを見たら、滝野すずらん公園の写真が載っていました。私も札幌出身(生まれて三年間と中二〜高校生・予備校生まで)で、高校時代に滝野すずらん公園にも行ったことがあるので、ちょっと親近感を覚えました。
- 2010/03/28(日) 23:17:26|
- レビュー
-
| トラックバック:0
-
| コメント:0