2008-05-02

空白はどのように記述すればいいのか

ちなみに、Wikipediaによると、以下の文字が空白として登録されているらしい。

U0009-U000D (Control characters, containing TAB, CR and LF)
U0020 SPACE
U0085 NEL
U00A0 NO-BREAK SPACE
U1680 OGHAM SPACE MARK
U180E MONGOLIAN VOWEL SEPARATOR
U2000-U200A (different sorts of spaces)
U2028 LSP
U2029 PSP
U202F NARROW NBSP
U205F MEDIUM MATHEMATICAL SPACE
U3000 IDEOGRAPHIC SPACE

ここで欲しいのは、スペースのある空白だ。一体どれを使うべきなのか。結局、日本人としてはU+3000が使いやすい。ちなみに、U+00A0はあまり使いたいとは思わない。なぜならば、これは文字通り、NO-BREAK SPACE なので、ブラウザで表示させると、狭いウインドウからはみ出してしまうという、あまりよろしくない挙動をする。

前にも失敗したように、CSSのwhite-spaceは地雷だし。

ちなみに、日本人だから、空白記号がどうこう言えるのだが、西側には、背景色と同じ色か、あるいは通過色の画像ファイルを使うなんて事を本気で言い出す連中もいるらしい。まあ、連中はASCII外の文字を、直接入力する環境がないし。そういう点から見ると、CJKの世界に住んでいる人間は、Unicodeに関しては結構恵まれているのだろうか。

ちなみに、このUnicodeの空白記号を恐れることなく使う兵達がいる。いやはや。

2 comments:

齊藤 said...

問題なのはスペースだけではありません。
http://www.stained-g.net/shinichiro/EUC-JP-Horizontal-Ellipsis.html
似たような記号を意味で使い分けるということを誰もに強制するわけにはいかないし、難しいところだとは思う。
htmlタグに使っている<>だって括弧の一種なのか不等号なのかはっきりしろと小一時間問い詰めたい。

江添亮 said...

なるほど、似たような記号を意味で使い分けるのがお嫌いですか。
その意見、もっともですな。
さればさ、RFC5242などいかがかな?