2010-04-10

C++0x本:UnicodeとUCSについて

C++0xでは、Universal Character Setをサポートしている。これは、ISO/IEC 10646で規定されている文字コードである。

ところが、ユニバーサル文字セット、UCS、あるいは、ISO 10646などと言っても、通じない人もいると思われる。ところが、そういう人は、Unicodeと言えば、「ああ、あれねー」と合点してくれるのである。

実際、私なども、日常会話では、Unicodeで済ませている。ユニバーサル文字セットとか、ISO 10646などと言ったりはしない。というのも、それでは、通じないからだ。

さて、C++0xの本を書くにあたって、これを何とかしなければならない。

最も簡単な方法は、単に、Unicodeと呼んでしまうことだ。これは、もちろん、正しくはない。C++0xの規格では、Universal Character Setである。しかし、現実として、Unicodeと混同されているし、実際、コードポイントもエンコード方式も、すべて同じだ。

果たして、あえて「ユニバーサル文字セット」などと書く意義はあるのだろうか。誤解を招くだけではないか。

1 comment:

  1. http://ja.wikipedia.org/wiki/URL%E3%82%A8%E3%83%B3%E3%82%B3%E3%83%BC%E3%83%89

    今回の書籍では、規格での呼称を そのままコピペしたものを直訳するという方針ではなかったと思いますので、
    規格上の呼称と俗称の対応が明確になるような用語集を付ければ
    良いのではないかと思いますが、いかがでしょうか

    ReplyDelete

You can use some HTML elements, such as <b>, <i>, <a>, also, some characters need to be entity referenced such as <, > and & Your comment may need to be confirmed by blog author. Your comment will be published under GFDL 1.3 or later license with no Invariant Sections, no Front-Cover Texts, and no Back-Cover Texts.