2013-06-30

最も変わった自然言語

The weirdest languages

自然言語処理の一環として、最も変わった言語を算出したそうだ。

変わった言語スコアを算出するために、21種類の言語機能について、多数派の方法ではない文法を使っている言語が高く評価されるようにした。

スコアの結果はともかく、いくつか紹介されている自然言語の文法が興味深い。

例えば、語順はSOV型の方が多いので、英語のような広く使われている言語は、全体からみると変わった言語であるというのはよく知られているが、他にもいくつか変わった文法が紹介されている。

イエスかノーで答えられる疑問文の文法で、多数派なのは、どこかに特別な疑問助詞を追加する文法だ。たとえば、日本語の「か」のような文法が相当する。

猫だ
猫か(疑問文)

英語では語順をひっくり返すことで疑問文にする。

This is a cat.
Is this a cat?(疑問文)

もちろん、英語でも他の方法で疑問文を作ることもできるが、一般的には語順をひっくり返す文法が使われている。

この言語機能の文法で、もっとも変わっている言語は、Chalcatongo Mixtecだ。この言語は、メキシコで6000人ぐらいの話者がいるらしいが、何と、肯定文と疑問文に一切の違いがない。

助詞はないし、語順の入れ替えもないし、イントネーションの違いすらない。

私とかアレとかいった代名詞的主語の文法も面白い。代名詞的主語の文法で最も多数派なのは、主語の代名詞情報を動詞に含ませるものだ。つまり動詞の格変化とか呼ばれている文法だ。代名詞的主語の情報を動詞の変化で表すので、特別な代名詞は使わない。

主語として使える特別な代名詞の言葉(たとえば英語におけるIとかitなど)を使っている言語は、意外と少数派なのだそうだ。

KutenaiとかMumuyeのような変わった言語では、主語にあたる特別な代名詞があるのだが、文法上、通常の主語とは別の場所で使うのだそうだ。

Chalcatongo Mixtecはこの文法でもやはり変わっていて、複合的な文法になっている。動詞に付け足す変化があるし、代名詞の言葉もある。ただし、代名詞の言葉は通常の文法で主語が現れる場所とは別の場所に配置するらしい。

2 comments:

  1. エントリと異なるので恐縮だが、不自由なソフトウェアでも、こちらについてのエントリが欲しい。
    The Future of C++
    http://channel9.msdn.com/Events/Build/2013/2-306

    ReplyDelete
  2. いまさらC99やTwo Phase Lookupに対応とか、正直10年遅れている。
    C++11対応も貧弱で、3,4年は遅れている。

    ReplyDelete

You can use some HTML elements, such as <b>, <i>, <a>, also, some characters need to be entity referenced such as <, > and & Your comment may need to be confirmed by blog author. Your comment will be published under GFDL 1.3 or later license with no Invariant Sections, no Front-Cover Texts, and no Back-Cover Texts.