2010年度の研究テーマ

サーチエンジンを用いたFocused Crawlingに関する研究(担当:大村)
現在、web上には膨大なページが存在します。このような膨大なページの中から効率よく必要な情報を取得するには、検索エンジンを使うことが一般的です。しかし、一般的な検索エンジンはweb上の全てのページを対象にしている為、検索結果も膨大になり、効率良く情報を取得できない場合があります。そこで、特定の分野のみを表示する検索エンジンを提供することによって効率よく情報を取得できるようにすることが本研究の目的です。
特定の分野に特化した検索エンジンを作成するためには、その分野のページを大量に取得する必要があります。そこで、特定の分野のページを効率良く取得するために、Focused Crawlerと呼ばれるCrawlerを改良する研究を行っています。
優先度に基づく効率的なWebコミュニティ取得方法(担当:松葉)
私はWeb コミュニティを効率的に取得する研究を行っています。ここでのWeb コミュニティとはWeb 空間上で密にリンクし合っているページ集合で、関連性の高い情報を共有して持っている可能性が高いと考えられます。よって、Web コミュニティを取得することは有益であると言えます。私の研究ではコミュニティに含まれそうなページを優先的にクロールしていくことで効率的Webコミュニティを取得することを目指しています。

過去の研究テーマ

高次元検索、距離空間索引の研究(担当:香取)
高次元ベクトル空間中の大量のデータの中から特定のデータに近いものだけを高速に検索する技術についての研究を行っています。高次元ベクトルデータには、この研究分野で一般に 「次元の呪い」と呼ばれている低次元とは異なる特殊な性質があるため、従来の索引手法は適用することができません。この問題について、当研究室ではI/O コストの減少を目指した空間分割に代わる手法や、ユークリッド距離を一般化したLp 距離の効率的な絞りこみ法などの研究を行っています。
O/Rマッピングに関する研究(担当:小林)
リレーショナルデータベースとオブジェクト指向言語との間には、データモデルの設計思想の違いから、インピーダンスミスマッチと呼ばれるマッピング作業が生じます。この煩雑な作業を解決するひとつの手段として考案されたのが、O/R マッピング技術です。当研究室では、生成されるコードにオブジェクトキャッシュ機構を導入することで、より高速なデータベースアクセスを実現する手法を研究しています。
XMLビュー維持機構の研究(担当:佐藤)
XMLデータは様々なデータを表現するためのフォーマットとして広く使われており、大規模なXMLデータベースに対する検索の高速化は重要な技術のひとつです。当研究室では、XML データベースの実体化ビューの差分更新を効率よく行うための手法について、研究を行っています。