漢字の階層構造
漢字の集合を,漢字を
,その構成素を
とする。
の冪集合
において,包含関係による半順序関係
を考える。
半順序関係を表すハッセ図において,ノード
の濃度が
であるとき,ノード
は階層
に布置される。
存在可能な構成素を考える。
を満たす
を存在可能な構成素という。存在可能な構成素の集合
は,写像
で定義される。
漢字の帰属度について考える。漢字のある属性を,親子関係が不明な漢字の対を
とする。
例えば,について考えてみよう。
となる。
例えば である元
の数は,
。下図では,
を除いている。これがすなわち写像
による効果である。
例えば,のように分解するのは可能としても,
のようには分解できないということだ。(筆順フォントは有料なのでご宥恕ください)
でも,構成素ってどうやって決まるんだろう?
『漢字の構造分析に関わる問題 : 漢字字体の構造分解とコード化に基づく計量的分析』によれば,漢字であることが構成素になる必要十分条件のようだ。もしそうだとすれば,はどこまでを要素として定めるんだろう。「夂」なんて漢検辞書に載ってなかったぞ。
漢字系の構造
項目系の構造を惟るに当たり,漢字を例として考覈する。
項目系
すべての漢字が収載された辞書を,すべての部首が収載された辞書を
とする。これらの直和を
とする。
なんかよくわかんなくなったので,漢字の構造分析を拝借する。その中では,漢字の構造式というものが紹介されている。
みたいなふうに書いてくれる。ここで,入れ子の一番深い所を第一階層とするらしい。露は第4階層。
集合論的な書き方をすれば,
雨は根項目だから,集合ではない。
項目として見れば,とかになる。
この書き方が優れているのは,階数を右上に添えているから!!!
麤という漢字をトークンにすると(部首や位置の情報が全部消えているのである意味bag-of-elements),麤 = (鹿, 鹿, 鹿) になる。このとき,これをどう扱うねんという問題なむいでにければ,多分 やねん。
ここで注意しておきたいのは,上に示したのは冪集合の部分集合になるということである。というのも,階層分解は一意ではないからである。もちろん最後には最小構成素にはなるだろうが,別にそれに辿る道は一つではない。
つまり,項目の冪集合を束(包含関係による半順序集合)で表したときに,辺を切り落としていく必要がある。だが,どの枝を残しどの枝を切れば良いのだろう?意味が分からないよ!
数学的には厳密じゃないのかな〜とか思ったりもする。あと,一番やるべきなのは基礎のところのような気がしてきている。
私かに京大を目指してる。やることが終わったら。
英語って難しいね。
■
根項目の集合を と表す。
全ての項目は、 のクリーネ閉包
に属する。
範列(パラダイム)関係
項目や要素等のオブジェクトの属性について
項目や要素等のオブジェクトは、それぞれ属性を持つ。
属性の種類
属性 | 英名 | 物理量単位 |
---|---|---|
時間位置 | ||
長さ |