2009-07-10

Bloggerの不思議な文字参照への変換

Bloggerは、いくつかの文字を、文字参照に自動で変換してしまう。回避方法はない。

問題は、その文字に、句読点が含まれていることだ。つまり、U+3001と、U+3002のことだ。

従って、上の文章は、HTMLコード上では、「Bloggerは&#12289いくつかの文字を&#12289文字参照に自動で変換してしまう。回避方法はない。」となってしまう。これは、HTMLならば、特に問題はない。まともなブラウザなら、ちゃんと変換してくれるし、その変換が実感できるほど遅いと言うことはない。問題は、常に文字参照に変換されてしまい、回避できないと言うことだ。たとえば、script要素の中にJavascriptのコードを書き、この中で句読点を使うと、HTMLの文字参照に変換されてしまう。Javascriptは、HTMLの文字参照を扱えないので、正しく実行できない。此を避けるため、Javascript上の文字列で句読点を使いたい場合、\u3001、\u3002としなければならない。実に面倒だ。

No comments:

Post a Comment

You can use some HTML elements, such as <b>, <i>, <a>, also, some characters need to be entity referenced such as <, > and & Your comment may need to be confirmed by blog author. Your comment will be published under GFDL 1.3 or later license with no Invariant Sections, no Front-Cover Texts, and no Back-Cover Texts.