« 2008年1月12日 | トップページ | 2008年1月16日 »

2008/01/14

形態素解析

情報宣教方法論(形態素解析)

 形態素とは、文章を構成する品詞等の部品のことであり、これを分析して、様々なことに応用しやすい形に区切り、分類してくれるソフトウェアが存在する。私が利用しているのは、京都大学が開発したMeCabというソフトウェアであるが、これがオープンソースとして提供されているので無料で使用できる。
 そして、それを用いて何をするのかと言えば、インターネット上に散在する様々な記事に対応して、それらの頁に含まれる建物や場所、地名や名所旧跡を自動的に認識して、その位置を指し示すことができる地図を自動的に表示させようということなのである。
 これにより、今まで地図と言えば、人がそれを手に取って開き、あちこち探してやっと目的の場所を見つけるもののようであり、言うなれば地図が人が何かしてくれるのを待っているようであったが、上で述べたような地図なら、地図の方から人にアプローチしてくれて、場所を調べたいときに、いつもそこに地図が開かれていることになるだろう。
 しかし、このような仕組みの目指すところは、実はもう少し先にある。それは、一言で言うと、言葉と位置の融合ということである。それは、上記のようにして、ある文章の中に含まれる複数の位置情報を抽出したなら、その位置を例えば点の集まりとして地図の上に表示して見れば、その点の分布する一帯が、この文章に対応する地図の領域ということなのである。そして、そのようにして、様々な文書に対応する領域が地図の上にプロットされてくると、今度はそれらの領域の重なった部分がそれぞれの文書の関連を表していると解釈することができる。というのは、それぞれの文章に含まれる地名自体は、共通していなくても、それらの文章の表す地図上の領域が交差ということが十分にあり得るからである。そのようにして、従来はまったく関連がないように見なされていた文章同士が、実はその対応する地図上の領域が交差することから、それらの間の新しい関係が認識されるということが想定される。しかも、これらはコンピュータによる自動処理が可能なのである。そして、このような分析の対象としての文書(これを専門用語でコーパスと呼ぶが)は、Web上の文書に限らず、メールの文書でも、オフラインで認めるレポートであっても差し支えないのである。そこで、上述のような処理をプログラム化することができれば、それは、ポータルサイトやメーラ、ワープロ等々、様々な場所に実装できることになる。そして、地図上に投影する対象も、決まりきった地名や住所だけでなく、その地域の産物の名前、行事やイベントの名前、方言や言い伝え等々、様々に拡大して行くことが想定される。そして、それはまた、上記のような文書から地図へのマッピング処理の一般化により、人間の思考に定着し、さらに高度で複雑な体型へと進展していくことが考えられるのである。

| | コメント (0) | トラックバック (0)

数列の極限

解析概論(1.4)

 数列は、世代を表す。最初に初代の数式があり、その第二世代、第三世代と経過して行く様を研究するのが数列の理論である。そして、この世代を数学では、nという単純な変数で表す。数列は、この世代変数nのみの関数であるゆえに、そこで表現され得る関数も、いかにも世代的なものとなる。その代表的なものはn乗という関数である。これは、初代の数字に世代を追うごとにある数が掛けられて行くものであり、したがって、そのある世代における計算結果は、(初代の数)×(ある数のn乗)ということになる。さらに複雑にしようと思えば、世代毎に掛ける数字にもnを含めて、(1ーn)や(1ー1/n)のようにすることもできる。
 複雑な数列も漸化式を使うことにより、単純に表すことができる。逆に、漸化式で単純に表すことができても、一般項は非常に複雑で、とても数式では表しえないことがある。これは、自然の摂理を見るようだ。単純な要因が、多くの世代に渡って繰りし働くことにより、非常に複雑なものになり、一つの細胞が何度も融合、分裂を繰り返すことにより、美しくも非常に複雑な体系が現されてくる。それは、まるでパイの皮を何度も折り曲げては伸ばし、さらに折り曲げるようなものだ。その結果、生み出されるフラクタルな形状は、この世界の特徴を備えている。
 この世界には、二つの複雑性がある。一つは、数と数の四則演算により生み出される複雑性であり、これは以前書いたように、無限の世界を有限の世界に投影する。そしてもう一つは、今取り扱っているところの世代という繰り返し演算が生み出す複雑性であり、これはフラクタルのような自己相似的な複雑性を創造する。
 神は、最初に人を男と女に創造し、「神が合わせられたものを人は離してはならない」と言われた。そして、アダムはエバとの間に、自分に似た子孫カインとアベルを生んだのであり、これら兄弟の間に最初の殺人事件が勃発する。聖書の提示する世代の数列は、二つの極限を持つ。一つは、振動しながら堕落し、影のような人生を歩む道。そしてもう一つは、揺れ動きながらも神に従い、まばゆい光の中を歩む道である。


| | コメント (0) | トラックバック (0)

« 2008年1月12日 | トップページ | 2008年1月16日 »