« 小野が骨折だあ〜? | トップページ | きついゲームだったああ »

2005/06/03

WEBマイニング

【216】
(久しぶりの「アイディア」投稿)
業務にかこつけて(?)、6月2、3日に開催された、
東京大学 生産技術研究所(東京駒場)の 生研公開
に行ってきた。

非常に高度で多岐にわたる研究成果が発表されており、
圧倒された。(ま、初めてということもあるが....)

発表の中で「大規模WEBマイニング」(喜連川研究室)
という、インターネット上のあふれている情報をいかに
関連づけ、効率よく活用していくか、という研究成果
発表があった。(ぱっと見の理解なので、取り違えてい
るかもしれないが......違っていたらごめんなさい!)

「リンク情報」などの構造的な関連付け手法とともに
「アクセスログ」等の情報を利用した手法なども発表
されており、非常に興味深い内容。

まるで、昔、このブログに書いた「Logical BlogMap」
に通じるものがある。

「アクセスログ」「URL履歴」等を利用することにより、
より詳細なリンケージを把握することができ、インター
ネット上の情報を有機的に利用することができる。ただ、
その情報が詳細な分、情報収集やその判定が「肝」にな
ると思われる。

私のアイディアでは、もっと「軽めな(お遊び的な?)」
レベルの方向であるため、結びつきの強度を
「トラックバック数」「コメント数」などから推定
と、している。
アイディアを掲載した時点では、具体的な手法は考えて
いなかったが、たとえ「お遊び」でも、同じように
情報収集手段などの検討が必須。

「Logical BlogMap」の場合は「お遊び」」機能。

ラフな感じで、サーバー側のソフトに機能をちょっと
追加して、

  • コメント数+アクセス数=注目レベル -->「円」の大きさ
  • トラックバック=リンケージ -->「線分」有無および矢印
  • トラックバック数=リンケージ強度 -->「線分」の太さ


という風に、データが利用できれば、なんかできそうな
気がする。


|

« 小野が骨折だあ〜? | トップページ | きついゲームだったああ »

アイディア」カテゴリの記事

コメント

コメントを書く



(ウェブ上には掲載しません)




トラックバック


この記事へのトラックバック一覧です: WEBマイニング:

« 小野が骨折だあ〜? | トップページ | きついゲームだったああ »