大規模言語モデルもそうだが、機械・深層学習モデル自体が反実在論的な認知的自律者 (https://link.springer.com/article/10.1007/s13347-024-00696-1) であるといえる。したがって、普遍論争に深層学習モデルが寄与する側は、唯名論ということになるだろう。
先日、大学の友達と個物と普遍について話していたら、家族的類似性と普遍の関係 (https://jstor.org/stable/4544648) や、類似性唯名論(resemblance nominalism)と深層学習モデルの数理の関係について思い立ったので、以下にその思い付きをメモしておこうと思う。といっても、倉田剛『現代存在論講義I』における類似性唯名論への批判への、深層学習の哲学 (https://compass.onlinelibrary.wiley.com/doi/full/10.1111/phc3.12625) からの応答ということにしかならないだろうが。なお本稿では、『現代存在論講義』で触れられている Price (2008) のプロトタイプ(典型例)による説明を用いない。なぜならば、一般的に DNN モデルの中にそのような機序が存在するかは分からないからである(しかし、k-近傍法やLVQのような典型例を用いるアルゴリズムは、Price (2008) に対する批判が成り立つであろう)。
- 類似性唯名論は主観的・相対的な観点を持ち込んでいる
これに関しては、類似性唯名論が普遍に対する反実在論に位置づけられている以上、意味不明な反論と言わざるをえない。唯名論に対して唯名論ですよね、と言っているようなものだ。そもそも、普遍が主観的・相対的であることの何が悪いのかが分からない。たとえば人間以外の宇宙生物の存在論において weiuwouq という普遍が存在したとして、その普遍が彼らの存在論に相対的であるということの何が悪いのか。
- 類似性の準拠クラスの問題
これは、DNN モデルがどの特徴量に従って分類問題を解いているかということに対応するだろう。しかしそれは、プラグマティックな問題に過ぎない。たとえばモデルが特徴量 A に重み付けして画像 X を α に分類しているとしても、それは偶然的な事柄である。
さらに特徴量の重み付けが離散的ではないことは(たとえば、特徴量 A には 0.3 、B には 0.2 重み付けするなど)、類似性唯名論の拡張を示唆するものとも言えるだろう。
- 単集合的な性質の問題
世界に一つしか存在しない個物があったとしても、それのみからなる普遍が論理的に可能であるという反論は、そもそも Huw Price のようなプラグマティストに対して正しい応答であるかは分からない。論理的に可能であっても実践的には不可能なことも存在するだろう。特にパターン認識では、一例や数例しかインスタンスが存在しないクラスを正しく分類することは難しいとされている。第一、一つの個物しか属していない普遍の具体例を上げる責任があるのは、この反論者である(そのような普遍は見つかりはしないだろうが)。
- 説明の理論的倹約性
実在論者によれば、「ある対象がFのクラスに属するがゆえにF性をもつ」という説明より、むしろ「ある対象がF性をもつがゆえにFのクラスに属する」という説明の方がより自然らしいが、これには全く同意できない。むしろこれこそがドグマの元であると思われる。深層学習モデル (ただし、
は画像の集合、
はクラスの集合)を考えてみよう(なお、万能近似定理により、モデルは関数
と同値とみなせる)。このモデルは、画像を投入するとクラスを返す関数である。
の要素を普遍者とみなせば、このモデルは個物の普遍を定める関数となる。
ここで注意しなければならないのは、 Rodriguez-Pereyra (2002) における類似性の定義のように、距離関数 があり、同じ普遍に属する任意の個物対の距離が
(定数)であるといった形で類似性が現れるとは限らないということである。なぜならば一般的に言って、関数
について
は成立しないからである(これが成り立つのであれば、解釈可能性といった研究は要らないであろう。いや、もちろん距離関数の設定次第かもしれないが、ここでは純粋なユークリッド距離を定めた特徴量多次元空間を考えている)。本稿では、類似性を
と同値なものとみなすことによって、つまり類似性を
に還元することによって、類似性唯名論の擁護を図っている。
というわけで、以上のように類似性唯名論は、Price (2008) のような旧来の認知科学を援用した仕方ではなく、深層学習(パターン認識)の数理を用いて擁護可能でありそうであることが分かった。
