セミナー
論文紹介
G. V. Cormack and R. N. S. Horspool: Data compressionm using dynamic Markov modelling, the Computer journal, vol. 30, no. 6, 1987(吉田くん)
~ファイル圧縮技法を応用したスパムフィルタの流れから辿りついた論文。バイナリファイルを圧縮する方法としてHuffmanコーディングが知られているが、それに対するGuazzoの改良。元のデータが一様な性質を持つ場合にはHuffmanコーディングが優れているが、そうでない場合にはこの改良が有効らしい。
ミーティングのまとめ
- 細部さん@NIIとの打合せ結果の検討
- 問題点をさらに明確化し、文書化すること。
- 問題点が明らかになったら、篠山くんと分担を決め、方向性を定めること。
- 細部さんとの次回のミーティングまでには、実装可能な具体像を定めること。
ウェブページの出現時期を発見すること(福久くん)
- 研究の方向性についてさらに検討すること
- Wikipediaを用いた事前実験の計画を具体化すること
スパムフィルタ関連研究(佐藤くん)
(鶴見くん)
Ziv Bar-Yossef, Maxim Gurevich: Efficient Search Engine Measurements, WWW 2007.
T. Iwata, K. Saito, T. Yamada, Modeling User Behavior in Recommender Systems based on Maximum Entropy, WWW2007.
~ お薦めシステムを用いているユーザがどれだけお薦めの影響を受けるかを調査した結果。Maximum entropyモデルを用いて評価を試みた。パラメター:商品を買った率。
- FIT論文を仕上げること(5/24に学生さんの間でデバッグ、5/25まで)