« vsftpを利用可能にする | トップページ | 一見ムダなようでムダでない重複記事 »

2014.08.18

unicodeは何が標準か?

UTF-8かUTF-16か、というお話。
みなさんの周囲でUTFを使う、といったらUTF-8だろうか? UTF-16だろうか?
ウェブ屋であれば迷うことなくUTF-8だろうと思うのだが、あるデバイスでの拡張文字がUTF-16で定義されていて驚いた。

そこのメーカーさんの話だと
「え、今時UTF-16が標準でしょ?」
とかのたまったが、少なくともHTML5ではUTF-16は非推奨である。
UTF-16が推奨される世界については、後学のために教えて欲しいところである。
日本語しか使わない、ということになると、理論上はUTF16の方が高速動作が期待できる、とはいえるのではあるが。

UTF-8の特徴はASCIIの拡張であることにある。このためASCIIコード群についてはバイナリレベルで互換性があるため、低レベルコーディングなどの可搬性が優れる。
ウェブの世界でUTF-8が推奨されるのはここに理由がある。タグ区切り文字である<はもちろんASCIIコードレベルで同一性が担保されるのだがUTF-16の世界ではバイナリレベルでは<のコードを含む文字が存在しうる。
このためUAなどの実装に注意が必要、ということなのだとか。

……まあ実際問題としては、本当にそういう点で優劣判断がつくのかは微妙なところである。
UTF-8のメリットはASCII圏の住人による英語文化圏中心主義と見なせなくもないのではあるから。

でもまあ、デファクトスタンダードを使うことのメリットは使わないメリットを通常ははるかに凌駕するので、私個人はこれからもUTF-8一択だなあw

参考)UTF-8 を使用するのが望ましい理由。

|

« vsftpを利用可能にする | トップページ | 一見ムダなようでムダでない重複記事 »

コメント

コメントを書く



(ウェブ上には掲載しません)




トラックバック

この記事のトラックバックURL:
http://app.cocolog-nifty.com/t/trackback/2022/60172233

この記事へのトラックバック一覧です: unicodeは何が標準か?:

« vsftpを利用可能にする | トップページ | 一見ムダなようでムダでない重複記事 »