Mastodon

漢字系の構造

項目系の構造を惟るに当たり,漢字を例として考覈する。

項目系

すべての漢字が収載された辞書を D_{kanji},すべての部首が収載された辞書を D_{busyu}とする。これらの直和を Dとする。

 

 D_{kanji} = (丫, 亜, \cdots, 弯)

 

なんかよくわかんなくなったので,漢字の構造分析を拝借する。その中では,漢字の構造式というものが紹介されている。

 露 = 雨 + 路 (足 + 各 (夂 + 口)) みたいなふうに書いてくれる。ここで,入れ子の一番深い所を第一階層とするらしい。露は第4階層。

集合論的な書き方をすれば,

 露 = {雨} + {路 | 路 = {足} + {各 | 各 = {夂} + {口}}}

雨は根項目だから,集合ではない。

項目として見れば, i = 露, i^-_1 = 雨,i^-_2 = 路,i^{2-}_1 = 足とかになる。

この書き方が優れているのは,階数を右上に添えているから!!!

 

麤という漢字をトークンにすると(部首や位置の情報が全部消えているのである意味bag-of-elements),麤 = (鹿, 鹿, 鹿) になる。このとき,これをどう扱うねんという問題なむいでにければ,多分  f_鹿 = 3 やねん。

 

ここで注意しておきたいのは,上に示したのは冪集合の部分集合になるということである。というのも,階層分解は一意ではないからである。もちろん最後には最小構成素にはなるだろうが,別にそれに辿る道は一つではない。

つまり,項目の冪集合を束(包含関係による半順序集合)で表したときに,辺を切り落としていく必要がある。だが,どの枝を残しどの枝を切れば良いのだろう?意味が分からないよ!

 

数学的には厳密じゃないのかな〜とか思ったりもする。あと,一番やるべきなのは基礎のところのような気がしてきている。

 

私かに京大を目指してる。やることが終わったら。
英語って難しいね。