2009-07-10

Bloggerの不思議な文字参照への変換

Bloggerは、いくつかの文字を、文字参照に自動で変換してしまう。回避方法はない。

問題は、その文字に、句読点が含まれていることだ。つまり、U+3001と、U+3002のことだ。

従って、上の文章は、HTMLコード上では、「Bloggerは&#12289いくつかの文字を&#12289文字参照に自動で変換してしまう。回避方法はない。」となってしまう。これは、HTMLならば、特に問題はない。まともなブラウザなら、ちゃんと変換してくれるし、その変換が実感できるほど遅いと言うことはない。問題は、常に文字参照に変換されてしまい、回避できないと言うことだ。たとえば、script要素の中にJavascriptのコードを書き、この中で句読点を使うと、HTMLの文字参照に変換されてしまう。Javascriptは、HTMLの文字参照を扱えないので、正しく実行できない。此を避けるため、Javascript上の文字列で句読点を使いたい場合、\u3001、\u3002としなければならない。実に面倒だ。

No comments: