デジタル通信は、回線の両端で計算処理を行うことによってデータを圧縮して送ることができるほか、デジタル信号にビットを少しつけ足し、通信路での符号誤りを訂正できる。人類は、デジタル通信に最適化した発声器官や神経中枢回路を発展させ、超多元な音節を使うことで通信路の伝送効率を高めるとともに、付加的な符号として文法規則(助詞・助動詞・副詞や動詞の活用など)を用いて、コンパクトで複雑・繊細な情報源符号化を実現している。
上記の記述に誤り・疑問・異論はありますか。
それを書いているのは、
BioEssays です。
Noll, H. “The digital origin of human language – a synthesis”, BioEssays 25-5:pp489-500 (2003)
>未成熟リンパ細胞が、抗原に即した抗体を作り出すのと似て仕組みで
>人間の脳細胞は、生後に外部から受ける刺激を処理するための神経
>回路を組みなおします。
脳細胞は刺激の反復によりシナプスのつながりをどんどん伸ばしていくイメージだったので、抗体を作る仕組みと同じとは知りませんでした。
そのことについて、書いてある本とか、ホームページはありますか?
>デジタル通信に最適化した発声器官や神経中枢回路を発展させ
の部分ですが、
未成熟リンパ細胞が、抗原に即した抗体を作り出すのと似て仕組みで
人間の脳細胞は、生後に外部から受ける刺激を処理するための神経
回路を組みなおします。
これは「中枢神経回路の親和性成熟」と呼びうる現象であり、人類が
極度に長い赤ちゃんの期間を過ごすという晩生性をもつゆえに可能な
ことであるそうです。
三つ子の魂百までとはよくいったものです
母音や子音を組み合わせた音節を使った多シンボルのデジタル変調伝送を
最適化する方向へ進化しているのは確かだと思いますが,変調方法は簡単
なものにとどめ,代わりに変調速度を上げて,伝送速度を稼ぐ方向もあった
と思います。
例えば,モールス符号とか,ケンシロウ進数といった
http://www.wdic.org/w/SCI/%E3%82%B1%E3%83%B3%E3%82%B7%E3%83%AD%E...
変調方法を,人間の音声言語が選ばなかった,あるいは,選べなかったのは
初期の中枢神経系の処理能力の問題や,言語のあり方の為じゃないかと思います。
しかし,モールス符号のような,音声言語へ進化していたら,狼煙や太鼓で
通信するのも簡単でしょうし,音声を文字として記録するのもずっと早くに
始まっていたでしょう。
音節が120あるとした場合には、
2を底とする対数をとると、
log 2 120 = 6.91になりますよね
この数字の意味は何なのでしょうか。
いったいこれはどう理解すればよいのでしょうか。
は確かです。しかし、それは英語とかオランダ語の1文字の情報量ではありません。ただし、通信路を設計するときには、そうなるでしょう。いわば、理想的な最大情報量です。
たとえば、「カナ+常用漢字」で日本語を1024文字内で書くと決めます。理想的な最大情報量は2の10乗が1024ですから、各文字10ビットですね。通信路を設計するにはこれだけいるでしょう。
「カナ+康煕字典の漢字」で、日本語を8192文字で書くと決めます。この場合は各文字13ビットですね。通信路にもこれだけ要ります。
ただし、実質の日本語の情報量が3ビットも増えたわけではありません。確率をとると、たぶん、約7000文字はめったにつかわれないので、1文字あたりの情報量はへっているでしょう。
しかし、単純化して、1音節だけに注目した場合(他の音節との連接を考えない場合)、7ビットといえないでしょうか。
離散的音声信号の発声器官運動制御・離散的聴覚・デジタル符号処理・パターン認識を行なう中枢神経回路は、未成熟な状態で生まれる脳内で、生後何年もかけてゆっくりと形成される。赤ん坊の未成熟な脳神経は、外界から繰り返し受け入れる音や光の刺激に対応して神経回路を形成する。これは極度に晩生(altricial)な人類にのみ可能な神経回路の組織化である。
これは、体内に侵入してくる病原菌の構造に即して、免疫システムが抗体を作る過程と似ている。
進化言語学者のフィリップ・リーバーマンによれば、ヒトが離散的に母音を発声するためには、喉頭より上の声道の垂直部分と水平部分の長さが等しくて直交していなければならず、そのような身体形状をもつ化石は今から5万年前まで登場しない。
この時期は、ミトコンドリアDNAの突然変異解析の結果導かれた、現生人類起源を10万年前のアフリカとする「アフリカ単一起源説」とも整合する。
以下,だらだらとした感想になってしまいましたがお許しください。
言語が,ただの動物の鳴き声などと異なる本質は,離散的なシンボルを
組み合わせて伝達できることだと私も思います。
しかし
> 人類は、デジタル通信に最適化した発声器官
は,どうでしょう。
人の音声は,確かにアナログ量を変調して送っているのではなく,複雑では
あるもののデジタル量を変調して送っているのですが,その性能の善し悪し
はアナログな送受信の帯域や変調速度や送信出力や受信感度で計るものじゃ
ないでしょうか?
文字による伝達は,もっとデジタル変調がそのまま見えており,読む方は
速度も労力もまあよいとして,活字やタイプライターといった文明の利器が
使える以前の,手で文字を書く速度や労力は,まだまだ最適化には程遠いと
思います。パソコンを使っていてさえ,腱鞘炎になったりします。まあ文字
というのは人間の進化の歴史からみればつい最近使い始めたものなので,
まだまだ適応が出来ていないのでしょうね。
> 超多元な音節を使うことで通信路の伝送効率を高める
色々なデジタル無線技術が,複雑な変調を使って256値といった沢山の
シンボルを送っているのと同じようなものでしょうね。無線の場合は
割り当てられた電波の周波数帯域の中で伝送効率を高めるために苦労して
いますが,人間も口と耳の限界のなかで伝送効率を高めるために音素や
音節を工夫してきたのでしょう。
それに,電波の周波数帯が時代によって増やされるように,人間の口と耳の特性も
改良されてきているでしょうね。
> 付加的な符号として文法規則(助詞・助動詞・副詞や動詞の活用など)を用いて
> コンパクトで複雑・繊細な情報源符号化を実現している。
文法規則とは,現象を言語にデジタイズする際の量子化誤差を減らす,あるいは
非可逆圧縮を行う際の最適化された圧縮方式である。と言うのでしょうか,
おもしろい発想ですね,すごい,案外そうなのかも。
もし人類の言語がデジタルならば、人類の条件に合わせてデジタルとして発達したのでしょう。
しかし、言語の発音はデジタルを形式として借りているようにも解釈できますが、意味するところは連続的に変化する意味論空間のアナログ体でしょう。
ついでに、「回線の両端で計算処理を行うことによってデータを圧縮して送ることができる」の「計算」の中身ですが。。。(JPEGのような非可逆圧縮でなく)完全にもとにもどすことのできる可逆圧縮ですが、なぜ圧縮ができるかというと、もとのメッセージを構成する文字列の生起確率が違うので、生起確率の大きいものを短くすることで、なるべく理論的な最大エントロピー(上記の26記号なら4.7ビット)に近づけているわけです。この考えの原始的なのが、トンツー(・-)のモールス符号で、英語で生起確率の多いeに最短のトン(・)をあてはめています。
この考えをそのまま人間の使う言語の単語にあてはめると、よく使う単語ほど短くするとよいことになりますが、実際の言語(英語、日本語、中国語、・・・)はそうなってはいませんね。
「アルファベット26文字」が仮に皆同じ確率で英語の中で生起したら、4.7ビットです。しかし、たとえば、qの次はuがくるのが100%近くで、予測可能なら、情報量は小さくなります。英語の場合は、選んだテキストによりますが、1文字あたり0.6ないし1.3ビットといわれています(*)。このように、言語ごとに文字の持つエントロピーは異なります。データの圧縮というのは、この原理を用いて、1文字記号ごとのエントロピーを高くしていることになります。
同じ言葉でも、書体、筆の使い方によって印象が変ります。
つまり、文字による通信でもアナログです。
漫画の飾り文字なんかもアナログですよね。
ということでは?
というのは大切ですね!
はありますね。
最初の質問文に対して
・既存のデジタル通信と、超多元デジタル通信が混在していて、何を指しているのか、何の説明だかが分からない。
・超多元な音節を使うことで通信路の伝送効率が高くなるしくみがわからない。
・文法規則も含めて通信仕様であると言うのが斬新。私としては伝送の仕様と文法は分けるべきではないかと思う。文法は符号というには複雑すぎると思うのだが。
>漢字を使うと、台湾人も韓国人も日本人も中国人も、会話では通じないことが、通じたりします。これはアナログ的な性質のおかげだとおもいます
・アナログ的ということは連続な性質ですか?漢字が連続的であるという意味が想像できません。漢字は1文字ずつに意味があり、使っている言語(音声・文法)が違っても、"割合と"同じ意味を想起できます。ShinRaiさんの言うところの超多元デジタル的だと思います。漢字の数だけ(何個あるんだろ?)離散的な文字情報の超多元デジタルなのでは?
>情報量
・情報工学に詳しいわけじゃないのでなんですが、
http://ja.wikipedia.org/wiki/%E6%83%85%E5%A0%B1%E9%87%8F
情報量は「できごとの起こりにくさ(確率)だけによって決まる純粋に数学的な量のこと」
だそうなんですが、文字を確率に置き換えているのですか?どういう意味でしょう?どんな計算式を使っていますか?
・英語のアルファベットは1文字と音節が1対1で対応していないのでは?文字の話がしたいのか、音節の話がしたいのか、議論が発散していませんか?
>中国の四声なんかも、同音意義語対策かもしれませんね。
・中国語には同音異義語があるのですか?
水掛け論になってしまいますね。検証可能にするためには操作的定義と、計画された実験的手法が必要かと思いますが。
たとえば「たきるあ」という符号を送りたいときに、伝送路の状態がよくないとき、「たばこのた、きってのき、るすいのる、あさひのあ」と言います。
この「たばこ、きって、るすい、あさひ」というのは、いわゆる伝送路符号化の誤り訂正のための冗長ビットといってもよいでしょうか。
情報源符号化の誤り訂正というのは、むずかしいですね。
それはアナログのパターン認識だからでしょうか。
「ラーメン食べたい」「君は九州人だから、とんこつ味なの?」
「いや、僕は九州出身だけど、実は醤油味しか食べないんだ」
こまごまと聞く以外に情報源符号の意味するものを明らかにすることはできないのでしょうか。