Mastodon

『意味がわかるAI入門』批判

2023年9月出版の比較的新しい書籍である. 現代言語哲学で主力である真理条件意味論を取り上げて,それを分布意味論(意味の使用説の一種)と比較している第二章は稀有であり,本書の白眉である(第一章はAIの系譜学).

まず,本書の主張を読む際にあたっては著者の経歴及び彼の受けている影響を鑑みるべきである.著者は東京大学人文社会系研究科出身の博士(文学)である.また,「私は、とある言語学の学派からの影響で、ニューラルネットワーク研究の果てに人間の言語能力の秘密が解明されるという見込みに懐疑的です。」(p.303) と述べている.つまり,著者によってそれとは明かされない,ある言語学派の主張に整合的であろうとすると,ニューラルネットワーク研究が言語の解明にトドメを刺すことはないという結論に著者は至るのである.本書の主張は,このことを差し引いて評価されねばならない.以下では,著者の各主張に対する批判的検討を行う.

5-1

著者は,Word2vec が未知の単語に対応不可能なことを指摘する.また,その問題への対策として fastText を紹介するが,「where → whe + ere」等の意味を持たない部分文字列への分割を生んでしまうことを指摘する.

応答: fastText の性能の説明が十分でない.つまり,既存の言語学形態素分析とのスコア比較が掲載されておらず,読者の直観に訴えかけるのみとなっている.形態素による分析が単純性の点で勝るにせよ,言語生成の性能という外的整合性が劣っていれば,比較して優れていると結論できないだろう.

ちなみに,漢字もまた部分から構成される点で,合成語と似たものである.これに関する研究には,以下のものがあるらしい(本書の内容ではないが).

aclanthology.org

5-2

二点の主張がある.

  • 「ローマ」と「イタリア」の関係は,他の可能世界では偽になりうる偶然的な地理的関係であり,意味ではない.
  • ジェンダー等の道徳的規範が守られていない.

応答: まず第一の主張は,真理条件意味論(可能世界)を仮定した場合に導かれるものである.そもそも,現代の大規模言語モデルが示唆するように,言語使用と現実世界との対応(記号接地)は別のメカニズムである可能性が高く,真理条件意味論はこの点においても困難をきたしている(『人工知能の哲学入門』p.171 を参照). 第二の主張もまた,合成原理を仮定した場合に導かれるものであるが,かなり困難をきたしている,というより論が通っていないと言わざるを得ない.倫理に違反する言語使用が無意味である,という結論はおかしいだろう.なぜならば,例えば誰かが「女性は洗濯・掃除をすべきである」という(本質主義的)発言を行う際に,それを無意味だということは我々の通念に反するからである.そもそもこの文に意味がないならば,我々はそれを理解し,倫理的に反応する(非難する)ことさえ不可能になってしまうだろう.本書の初めの方に著者自身が引いた,「人種やジェンダーといったセンシティブな質問に適切な回答を返す」ことに対する賞賛と,どう折り合いをつけるのだろうか.果たして,人間の入力する「人種やジェンダーといったセンシティブな質問」は無意味であると結論するのだろうか.著者はこれを,合成原理であれば回避できる問題である,と主張するが,これもLLMに「語の内包的意味に基づいて回答して」などと言えば,安易に解決されてしまうだろう.

5-3

著者は次のように述べる.「英語や日本語のようにメジャーな言語ならともかく,マイナーな言語では大量の文書データが手に入るとは限らないので、低リソースの言語でも言語モデルの性能を向上させることには実用上の利点がある。それに何より、人間の言語能力に関心があるなら体系性を無視することはできない」.すなわち,大規模言語モデルには体系性が不足しており,実用的課題として,マイナー言語の存続に関わりうるというものである.

応答: しかしこれもまた,技術的な進展によって解決される可能性が大である(『大規模言語モデルは新たな知能か』)上,記号主義的アプローチと合わせて使うことで,ニューラルネットワークモデルを体系性を持った形に拡張することは可能である.

6

「幻覚」(ハルシネーション)を,言語哲学上の観点から,もっと積極的に評価してほしかったというのが私の意見である.というのも,形式意味論言語学も,嘘を周縁的なものとして扱ってきたきらいがあるからである.真理条件意味論はその首領であろう.なぜ,フィクション論が理論の拡張というネガティブな形でしか与えられなかったのか? それは既存の理論においては,文字列が,現実と対応しなければならなかったからである.しかし「幻覚」を観察すれば,現実世界における使用頻度に従うため無関係とは言えないにせよ,言語はその本質においてむしろ現実と独立したものと考えうるのである.つまり,使用の確率分布と現実との対応は理論的に分離されていなければならなかったのだ.これを一緒くたにしたことで,理論が拡張に次ぐ拡張,ぶっちゃけて述べれば「退行的プログラム」となってしまったのではないか.

現代形而上学においては,理論評価のための基準として,「正確性・(内的・外的)整合性・単純性・包括性・一貫性」という五つの基準が用いられている(『現代形而上学』p. 145).いまのところは,構成的なものであって「理論」ではないと言うことは可能にせよ,いずれは大規模言語モデルの理論は分析的アプローチによって「理論」としての身分を得ることになるだろう(哲学者が数式を受け入れるのであれば).

いうまでもなく,言語哲学及び言語学上の命題は,大規模言語モデルの振る舞いに整合的でなければならない.その過程において,いくつかの命題は撃ち落とされるだろう.反対に,真理に漸近していたと評価されるものもあるかもしれない.数十年後には,真理条件意味論が廃れていることもありえないことではない(かつての記号論のように).いずれにせよ,言語理論と大規模言語モデルとの反照的均衡による言語哲学の刷新は不可避なのであって,言語の一ユーザーである我々は,この動向を今後とも注視していきたいものである.