デジタル通信は、送信者が有限な離散信号を直線的に配列して送信し、受信者がそれを離散信号列として受け取れば可能となる。コンピュータは、0と1を離散信号として用いる二元デジタルだが、人類言語の場合は、離散的な音節信号数が100程もある超多元なデジタル通信である。

デジタル通信は、回線の両端で計算処理を行うことによってデータを圧縮して送ることができるほか、デジタル信号にビットを少しつけ足し、通信路での符号誤りを訂正できる。人類は、デジタル通信に最適化した発声器官や神経中枢回路を発展させ、超多元な音節を使うことで通信路の伝送効率を高めるとともに、付加的な符号として文法規則(助詞・助動詞・副詞や動詞の活用など)を用いて、コンパクトで複雑・繊細な情報源符号化を実現している。

上記の記述に誤り・疑問・異論はありますか。

回答の条件
  • 1人3回まで
  • 150 ptで終了
  • 登録:2009/01/04 19:22:54
  • 終了:2009/01/11 19:25:03

回答(36件)

ただいまのポイント : ポイント73 pt / 150 pt ツリー表示 | 新着順
「デジタル信号にビットを少しつけ足し、通信路での符号誤りを訂正できる」 きゃづみぃ2009/01/04 20:59:28ポイント3pt
言葉の場合も同様です。 「たばこのた」などのように聞き間違いを防ぐための付けたしがあります。 また、音声は、声の高さなどで「端」や「橋」など 「はし」という文字の聞き分けを 行っています。 そして、前 ...
コメントありがとうございます ShinRai2009/01/04 21:04:51
フォネティック・コードは、通信路符号化の一手段ですね。 中国の四声なんかも、同音意義語対策かもしれませんね。 前後の意味から判断できるのは、クロード・シャノンがいうように、我々の言語表現に冗長性がか ...
たばこのた、きってのき、るすいのる、あさひのあ ShinRai2009/01/11 13:00:57
たとえば「たきるあ」という符号を送りたいときに、伝送路の状態がよくないとき、「たばこのた、きってのき、るすいのる、あさひのあ」と言います。 この「たばこ、きって、るすい、あさひ」というのは、いわゆる ...
中枢神経回路の親和性成熟 ShinRai2009/01/07 14:29:29
>デジタル通信に最適化した発声器官や神経中枢回路を発展させ の部分ですが、 未成熟リンパ細胞が、抗原に即した抗体を作り出すのと似て仕組みで 人間の脳細胞は、生後に外部から受ける刺激を処理するための神経 ...
教えてください hiko3karasu2009/01/07 16:03:59ポイント2pt
>未成熟リンパ細胞が、抗原に即した抗体を作り出すのと似て仕組みで >人間の脳細胞は、生後に外部から受ける刺激を処理するための神経 >回路を組みなおします。   脳細胞は刺激の反復によりシナプスのつながり ...
抗原に対して抗体をつくるのと同じ仕組みで神経中枢回路をつくる ShinRai2009/01/07 23:25:00
それを書いているのは、 BioEssays です。 Noll, H. “The digital origin of human language – a synthesis”, BioEssays 25-5:pp489-500 (2003)
けっこう興味深いですね T_SKG2009/01/06 02:03:00ポイント2pt
以下,だらだらとした感想になってしまいましたがお許しください。 言語が,ただの動物の鳴き声などと異なる本質は,離散的なシンボルを 組み合わせて伝達できることだと私も思います。 しかし > 人類は、デ ...
母音を発するためには最適な声道が必要なのです ShinRai2009/01/06 11:10:13
進化言語学者のフィリップ・リーバーマンによれば、ヒトが離散的に母音を発声するためには、喉頭より上の声道の垂直部分と水平部分の長さが等しくて直交していなければならず、そのような身体形状をもつ化石は今から ...
進化には場当たり的な処がありますが T_SKG2009/01/07 00:40:58ポイント1pt
母音や子音を組み合わせた音節を使った多シンボルのデジタル変調伝送を 最適化する方向へ進化しているのは確かだと思いますが,変調方法は簡単 なものにとどめ,代わりに変調速度を上げて,伝送速度を稼ぐ方向もあ ...
日本語の1音は6.73ビットである、ということは正しいでしょうか ShinRai2009/01/05 10:17:56
ちなみに、以下のような表現は正しいでしょうか。 情報量(=エントロピー、H)は、底を2とする対数で数え、元が2個のときの1単位を1ビットとする。英語のアルファベットは26文字であるので、1文字あたりの情報量は4.7 ...
いいえ。生起確率がちがいます。 sibazyun2009/01/05 23:07:16ポイント3pt
「アルファベット26文字」が仮に皆同じ確率で英語の中で生起したら、4.7ビットです。しかし、たとえば、qの次はuがくるのが100%近くで、予測可能なら、情報量は小さくなります。英語の場合は、選んだテキストによりま ...
たしかに生起確率の問題はあります ShinRai2009/01/06 11:52:59
しかし、単純化して、1音節だけに注目した場合(他の音節との連接を考えない場合)、7ビットといえないでしょうか。
26元記号の情報量は7ビット弱 sibazyun2009/01/06 12:31:02ポイント2pt
は確かです。しかし、それは英語とかオランダ語の1文字の情報量ではありません。ただし、通信路を設計するときには、そうなるでしょう。いわば、理想的な最大情報量です。 たとえば、「カナ+常用漢字」で日本語を1 ...
120の音節があるとした場合 ShinRai2009/01/06 22:51:18
音節が120あるとした場合には、 2を底とする対数をとると、 log 2 120 = 6.91になりますよね この数字の意味は何なのでしょうか。 いったいこれはどう理解すればよいのでしょうか。
なぜ、圧縮できるか sibazyun2009/01/06 00:30:26ポイント1pt
ついでに、「回線の両端で計算処理を行うことによってデータを圧縮して送ることができる」の「計算」の中身ですが。。。(JPEGのような非可逆圧縮でなく)完全にもとにもどすことのできる可逆圧縮ですが、なぜ圧縮が ...
発声器官や神経中枢回路が先です。 miharaseihyou2009/01/06 01:30:18ポイント2pt
もし人類の言語がデジタルならば、人類の条件に合わせてデジタルとして発達したのでしょう。 しかし、言語の発音はデジタルを形式として借りているようにも解釈できますが、意味するところは連続的に変化する意味論 ...
極度の晩生性がキモです ShinRai2009/01/06 11:16:09
離散的音声信号の発声器官運動制御・離散的聴覚・デジタル符号処理・パターン認識を行なう中枢神経回路は、未成熟な状態で生まれる脳内で、生後何年もかけてゆっくりと形成される。赤ん坊の未成熟な脳神経は、外界か ...
書体はアナログ ラージアイ・イレブン2009/01/05 22:33:22ポイント1pt
同じ言葉でも、書体、筆の使い方によって印象が変ります。 つまり、文字による通信でもアナログです。   漫画の飾り文字なんかもアナログですよね。
たんなる感想ですが・・・ Mook2009/01/04 20:09:46ポイント11pt
言語に関して専門家ではないので、個人的な感想ですが 全体として、言語の音としての信号論と文法などを同一レベルで 論じていることに違和感を感じます。 個々の文章に関しては、 >100程もある超多元な 100程 ...
率直なご感想ありがとうございます ShinRai2009/01/04 20:34:12
1) 全体として、言語の音としての信号論と文法などを同一レベルで 論じていることに違和感を感じます。 これは、ノーバート・ウィーナーが「人間機械論」で、言語は通信として扱えると書いてあったので踏襲してみた ...
おひさしぶりです。 hiko3karasu2009/01/04 21:05:13ポイント10pt
>超多元な   こういう比喩は使わないほうがよろしいかと。 「多元な」と言うならまだわかりますがそれを超えた「超多元」とはどういう意味ですか?   >デジタル信号にビットを少しつけ足し、通信路での符号誤 ...
デジタルの定義に戻る必要があります ShinRai2009/01/04 21:32:56
>超多元な こういう比喩は使わないほうがよろしいかと。 「多元な」と言うならまだわかりますがそれを超えた「超多元」とはどういう意味ですか? 2の1乗のビットにくらべると、DNAは2の2乗、アミノ酸は4乗+ ...
漢字(文字)については australiagc2009/01/05 10:17:45ポイント1pt
お久しぶりです、ShinRaiさん! とりあえず漢字に関してですが、これは「音節に比べれば、よほどデジタル」という方に賛同です。 というのも、世界共通の書き言葉である数字は、「使うと、台湾人も韓国人も日本人も中 ...
デジタルとアナログ Mook2009/01/04 21:24:23ポイント7pt
私も文字は音声よりデジタル的だとおもいます。 少なくとも一つの文字は一つの文字としてやり取り可能ですが、音というのは離散的でなく (つまりアナログ的)、文字で書けば「あ」という音も人によって微妙に音が ...
母音のフォルマント周波数 ShinRai2009/01/04 21:39:03
言語学でいう音素は離散的であるというのが定義です。 したがって子音はそれぞれ離散的です。 また、母音も離散的です。 フォルマント周波数1,2,3の組み合わせにより、それぞれが離散的になっているのです ...
言語を論じているのですか、それとも音声を論じているのですか? Mook2009/01/04 22:41:09ポイント6pt
母音と子音を別々の観点で見て、それを結びつけるのは論理的ではないと感じます。 この点は先の音の強弱・高低の点でも感じたのですが、最初の文章で「言語」という面と 「音声」(発声器官・神経中枢)の面が論 ...
やはり、「言語はデジタルに似ている部分がある。」までしかいえないのでは? hiko3karasu2009/01/04 23:44:54ポイント5pt
ShinRaiさんの説明では似ているだけで同等には扱えないです。私も全体に論理が飛躍していると思います。 また、「離散的」の意味がよく判りません。   >2の1乗のビットにくらべると、DNAは2の2乗、アミノ酸は4 ...
論理的にエビデンスを示さなければ sidewalk012009/01/05 11:09:44ポイント3pt
水掛け論になってしまいますね。検証可能にするためには操作的定義と、計画された実験的手法が必要かと思いますが。
理解できない記述があります。 Gay_Yahng2009/01/05 11:59:56ポイント3pt
最初の質問文に対して ・既存のデジタル通信と、超多元デジタル通信が混在していて、何を指しているのか、何の説明だかが分からない。 ・超多元な音節を使うことで通信路の伝送効率が高くなるしくみがわからない。 ...
用語の不明確さ sidewalk012009/01/05 13:43:09ポイント2pt
はありますね。
デジタルもアナログも両方あるよ adgt2009/01/05 18:46:35ポイント1pt
ということでは?
人類言語がコンパクトだとすると誤り訂正や符号化の巧拙ではなく、推論や学習のおかげ POPO2009/01/04 21:25:20ポイント4pt
人類の言語は確かに誤り訂正的な機能も有していますが、「コンパクト」だと評価するのであれば、誤り訂正や符号化のやり方が優れているからだけでは無いと思います。 受け手側の過去の経験との照合や推論を行うこと ...
コンパクトさ ShinRai2009/01/04 21:36:50
たとえば、食べる、食べた、食べるな、食べたら、食べよう、食べたい、 みたいに、たった1音節の違いで、意味がまるで違うところをコンパクトと表現しました。 送り手と受け手が共通の情報源符号化・復号化テーブ ...
逆です POPO2009/01/04 23:45:59ポイント3pt
創造という言葉は受け手による創造という意味で使いました。 人間の言語は送り手と受け手が共通の情報源符号化・復号化テーブルを持っている様に見えては実は完全に共通のテーブルを持っているわけではない(もしくは ...
不完全性 sidewalk012009/01/05 13:54:02ポイント1pt
というのは大切ですね!
受け手による創造ですか、わかりました ShinRai2009/01/05 06:13:41
確かに、たとえば俳句や短歌は、17文字、31文字で表現して、受け手の中にある記憶や変換テーブルから再構築されて、感動を生みます。 こういったことをいっておられるわけですね。 もちろん、俳句や短歌の場 ...
  • id:sibazyun
    回答限度3を使い切ったので、「120の音節があるとした場合」へのコメント。音節が120で 6.91ビットは、表面的な情報量、つまり、その情報を失わずに送るのに必要な伝送路の容量を決めます。たとえば、たかだか1秒間に10音節が速さの限度だとすれば、69.1ビット毎秒の伝送路があればよいわけです。これは、それを120元の信号として送ろうが、2元(0と1)との信号にコーディングしようが良いわけです。

    一方、120音節あるが、生起確率に差があり、統計的にそのメッセージ体系では実質2ビット、20ビット毎秒だとすれば、圧縮方法を工夫することによって、伝送路の容量を20ビット毎秒近くまで落とすことができます。
  • id:ShinRai
    sybazyunさん、
    コメントありがとうございます。アラシ対策として、回答限度を落としています。
    場外参加となって申し訳ありません。

    表面的な情報量というのは、わかります。

    でも、120元の信号として送ろうが、0,1にコーディングしようがのところが
    いまひとつ理解できていません。

    120元をわざわざ01にコーディングする意味ってない気がしませんか。
    つまり、人類の脳の中枢神経は、コンピュータのようにナノセカンドで動くわけ
    ではありませんが、コンピュータと違って並列処理が得意だから、120元の離散
    信号をうまくあやつれる。

    うまく言えているのかわかりませんが、多元デジタルのすばらしさを理解すると
    きに、バイナリーの考えが邪魔をするような気がします。

  • id:hiko3karasu
    私も3回終わりました。
    横からコメントして外しているかもしれませんが。
    sibazyun さんの言っているのは情報量と伝送路の話でしょう。
    ShinRai さんの「言語はデジタル通信」に即した話ではないではなく、情報量の使い方の説明ということでは?
    ShinRai さん的なデジタル通信で言えば、1秒間に10音節を送るとき、
    120本の排他的信号線(または1本の信号線で120段階の信号)を使って1秒間に10回おくりますが、伝送路という意味では1本の信号線で2段階の(0/1の)信号をつかって1秒間に70回くらい信号を送っても同じですよということです。
    とうぜん、ShinRai さんのデジタル通信で使うには「0000001」とか送られても分からないので
    0000001→あ
    と言うコンバータを人間の脳内に入れないといけないですね。
  • id:sibazyun
    わたしは、hiko3karasuさんがおっしゃるような意味で書きました。
    人の言語の音ということですと、「弁別素性」があって、「子音性のありなし」などで音素を分けていきますね。たとえば、
    http://ja.wikipedia.org/wiki/%E5%BC%81%E5%88%A5%E7%B4%A0%E6%80%A7
    参照。ここには18素性、つまり18ビットの弁別要素があります。
    もっとも、例えば「母音はすべて舌背性」なので、「子音」には舌背性の4ビットは使えないです。しかし、それでも、たとえば、ある言語が120音素しか使っていないとすれば、7ビットなので、「人類の言語が使うことができる要素のすべてを該当言語がつかっているわけではない」という冗長性(redundancy)を認めることができるでしょう。
  • id:hiko3karasu
    >それを書いているのは、 BioEssays です。
    英語ですか。・・・しきいが高い
  • id:ShinRai
    ためしに少し関連する部分を日本語にしてみます。




    誕生後の表現型の変異の遺伝子メカニズム

     半世紀以上も前にポルトマンを印象付けた革新的に新しい事態というのは、環境によって変異を受けた表現型が遺伝によって伝わる能力である。あるいは、積極的に組織の成長を特定の目的へと方向付ける環境の能力である。裏口からラマルクがこっそりと入ってきているみたいだ。

     環境と発展的な対話をしながら学習する能力をもつ他のシステムとしては、唯一、免疫システムがある。抗体の特異性を説明するにあたって、1940年代に受けいれられていたモデルである、ポーリングの教育理論は、抗原と抗体の相補性は、イムノグロブリンのタンパク質鎖が抗原に巻きつくためであるという完全なアナログであった。この教育理論に対して、デジタルモデルで最初に挑んだのは、イエルネであった。1948年から1950年にかけて、コペンハーゲンの国立セーラム研究所で私は彼と同じ部屋にいたとき、私は彼が数学的なアプローチによる情報処理で考えているのだということがわかった。彼の最初の手がかりは、抗体の濃度もその抗原との親和性も免疫を付与した後で時間とともに増えることを観察したところから得られた。

     このことから、彼は、仮定された身体メカニズムが繰り返し選択を行うことによって改善された、所与の特異性あるいはかみ合いをもつ抗体分子があらかじめ作られて存在していることを仮定した。これは、今日、親和性超変異として知られている。この考えを発展させて、バーネットは、選択は細胞レベルで行われていると提案した。今日、クローン選択説として知られている考えである。最終的な実験による証明は、またもイエルネが行った。彼がジュネーブのWHOの机の上で考え付き、1961年にピッツバーグ大学で実験的に実現した独創的な溶血性血小板による手法である。ジェルンは、古典的論文となった「免疫システムのネットワーク理論」の中で、免疫と神経システムがよく似ていることをはじめて指摘した。:「免疫システムは、主として抑圧的な固有行動によって支配されている機能的ネットワークとして見た場合でも、外部の刺激に対して開放されており、神経システムと驚くほど似ている。神経システムにとってと同様に、外部からの信号によるネットワークの変調は、外部世界へのその適応を表わしている。早い段階で受けた印は、深い痕跡を残す。どちらのシステムも経験に学び、強化されることによって持続するとともに絶え間ざるネットワークの組み換えの中に保存される記憶を作り上げるが、それは子孫には伝達されない。免疫システムと神経システムの間にあるこれらの表現型における驚くべき相似性は、それらの表現と調節を支配する遺伝子セットが似ていることの結果であるかもしれない。」

     後になって、同様にすばらしいノーベル賞記念講演「免疫システムの生成文法」の中で、イエルネは免疫システムと言語の間のいくつかの相似性について論じている。中心となる統語コンポーネント、音韻コンポーネント、意味コンポーネントをもつ装置であるとする生成文法についてのチョムスキーの定義に言及して、イエルネはこの概念をタンパク質の構造にあてはめようとする。こうして彼は、統語法則を、ポリペプチド連鎖の折り畳みパターンを決定する法則に結びつけるが、「意味に相当するものを見つけることはより難しい。免疫システムは意味がある抗原と意味のない抗原を区別するであろうか」という。この問いに答えないまま、彼は免疫システムが遺伝的なものであることについて触れ、リンパ球を急増させる生成的能力が、抗体ポリペプチドの可変的部位を符号化するDNAの断片が肉体的な変異を起こすべくスイッチを入れることを指摘した。彼は以下のように結論する。「小さな子供たちが、彼らの生まれ落ちたどのような環境においても言語を習得することは、奇跡である。チョムスキーが先駆けた文法への生成的アプローチは、この深遠で普遍的な特徴である能力は、人間の脳が生まれながらにしてもっているものであると説明する以外に説明のしようがないという。生物学的にいえば、どのような言語でも学ぶ能力が遺伝すると仮説することは、それは我々の染色体のDNAの中に符号化されていなければならないということを意味する。もしこの仮説がある日検証されたならば、そのときから言語学は生物学の一分野ということになり、人間性もおそらくいつか科学の一部となるであろう。」

     私がデジタルと定義づけた免疫システムと言語の構造的類似性をイエルネが比較することは正しい。そして、彼は、未解決の問題とは、話として表現される現実の出力から、まだ知られていない神経構造を分離する深い裂け目を飛び越えて、いかにして遺伝子型から表現型になるのかであることに気づく。しかし彼は、統語コンポーネントを、ポリペプチド連鎖の折り畳みと結び付けようとして、問題にぶつかる。すでに説明したように、我々は、デジタルからアナログへの変換に直面している。それは意味論的な意味を表現するために統語的な規則を実践するとき、統語を意味と結びつける、同様に、タンパク質合成においても、連鎖の折り畳みによって作り出されるアナログ情報あるいは意味論的な意味は、三次元の形状となり、パターン認識において機能する。すべての生物学的な情報伝達はパターン認識にもとづいている。それは、抗原抗体反応のような問題のタンパク質と他のタンパク質の相補的な三次元表面構造の物理的な相互作用や、酵素による代謝の触媒的変異へと終結する相互作用や、遺伝子活性化におけるDNAとの転写因子の相互作用や、信号変換における受容体との相互作用などである。これらの相互作用のすべてが、双子が同じDNAの複製を共有する類似性に示される驚くほどの精度で、どのようにしてぴったりと統合されて表現型を作り出しているのかは、依然として深遠なる謎である。これはおそらく永遠に謎のままであろう。チョムスキーがこの生物学の罠に近づかないのももっともである。
     

この質問への反応(ブックマークコメント)

「あの人に答えてほしい」「この質問はあの人が答えられそう」というときに、回答リクエストを送ってみてましょう。

これ以上回答リクエストを送信することはできません。制限について

絞り込み :
はてなココの「ともだち」を表示します。
回答リクエストを送信したユーザーはいません