« Amazonが使えん | トップページ | PostgreSQLアクセス権関連 »

2006.02.28

エンコード三昧

文字エンコーディングの問題は英語ベースのオープンソースで日本語を扱うときにさんざんな目にあった、という人は多かろう。(PHPでmbstring系の関数がどれだけありがたいことか)
ところが私が現在直面しているのはタイ語による障害だったりする。

先日までやられていたのがタイ語(TIS620) v.s.Unicode(UTF-8)。
タイ語のDBMSから出力したタイ語を含むファイルを、UTFしか理解できないウェブシステムに食わせるのに四苦八苦。
当初はウェブシステム側でエンコード、という話をしていたが、最終的に出力したファイルにiConvをかますことで解決した。
そして今日はまた別件で、タイ語(TIS620) v.s. 日本語(Shift JIS)……。
データをファイルからDBMSに読み込もうとすると異常終了。おそらくデリミタ破損か、異常コードが混入してしまっているんだろうなあ。
こっちのタイ語情報は別に必要ないので、そもそも出力自体を抑制する方向で検討中。
いやあ、しかしタイ語は侮れんわ(^^;
タイ語のシステムを日本人と中国人で作ってる、というのがそもそも問題なのかもしれんなあ。

|

« Amazonが使えん | トップページ | PostgreSQLアクセス権関連 »

コメント

コメントを書く



(ウェブ上には掲載しません)




トラックバック

この記事のトラックバックURL:
http://app.cocolog-nifty.com/t/trackback/2022/8877259

この記事へのトラックバック一覧です: エンコード三昧:

« Amazonが使えん | トップページ | PostgreSQLアクセス権関連 »