自然言語検索 (Google Operating System)

2004年設立の hakia は昨年、稼働開始し、年内に正式運用する予定。 http://www.powerset.com/:PowerSet はPARC (Palo Alto Research Center) の自然言語処理技術を応用した検索エンジンを年内に公開する予定。

Gmailの道 (Google Operating System)

元々のGmailの設計ではメッセージを削除できなかったが、ユーザの希望に折れる形で削除ボタンができた。 大量のメッセージを見つけるのにGmailでは検索をするが、ユーザはフィールドごとにソートする機能も欲しがる。 Gmailはメッセージをタイトルに応じてス…

新手のウェブスパム (Google Operating System)

ウェブスパムとは、ウェブ上のコンテンツでなんらかの方法で、本来、そのページを訪れるつもりのない人々を引き寄せるもののことだと思います。*1Bloggerは無料のブログサービスで、なおかつURLの転送をサポートしているようです。このことを悪用し、山ほど…

棒グラフの波線省略の問題 (高木さん)

しばらく前から、話題になっていたグラフの描き方に関する問題を高木さんが取り上げています。ぼくも大切な問題だと思います。一部に「捏造」が言いすぎだという批判がありますが、グラフの表示を恣意的に操作する方法は捏造の典型的な技術ですので、ぼくは…

行列と閑古鳥 (Life is Beautifulさん)

二週間ほどまえに新宿のサザンテラスに行ってびっくりしました。寒い晩だったのですが、ドーナツ屋の前に200人くらいの行列が。よく分らないまま、近くで食事をし、2時間ほどして出てきたら、まだ同じ状態で。なんでこんなことになったのか知りませんが、そ…

スクリプト言語用のデバッガの使い方 (高林さん)

Ruby, Python, Perlのデバッガの使い方を紹介しています。また。JavaScriptのデバッグにはFireFoxで動くFireBugが便利だそうです。*1 *1:ぼく個人はデバッガは滅多に使わず、念力デバッグに頼ってましたけど。。。Javaでのデバッグはassertの埋め込みに頼り…

豊田さんの講演

「大規模Webアーカイブの時空間分析とその実際」 (風間さん) 1月22・23日に開催された人工知能学会・知識ベースシステム研究会と電子情報通信学会の知能ソフトウェア工学研究会の合同研究会での招待講演の模様が解説されています。 豊田@WWW '06 (ょゎさん) …

研究メモ

メーリングリストを組み合わせることで仮想ユーザを合成する実験方式にあった懸案を除去した。元々のアイデアはハムはメーリングリストから送られてくるメッセージ集合、スパムはハニーポットで収集したものとしている。この場合、ハムにはメーリングリスト…

リポジトリ運動

昨夜、毎月開催されている勉強会に慶應義塾大学メディアセンターから入江伸さんを招いて講演をしていただきました。今回は大学図書館におけるリポジトリ運動についてのご講演でした。 機関リポジトリの歩み 門外漢なので、背景知識が足りず、講演会当日は10%…

研究メモ

[1]は社会理工の赤間先生に教えていただきました。Word-netについて調べているうちに行きあたったのが[2]。そうこうするうちに[3]を見つけてしまった。ちらりと見ただけだけど、これはやばいかもしれない。 A. Enright, S. Van Dongen, and C. Ouzounis, "An…

Blog Digest

図書館員が極めて重要である33の理由 Are librarians totally obsolete?の項目に日本語訳を与えています。 理由1-理由11 理由12-理由22 理由23-理由33

Lessig講演ビデオ

2007/2/10: 生貝さんからCC Japanの海外情報へのリンクを教えていただいたので追加しました。舘村さんからLessig教授の著作を紹介していただいたので、ついでにほかの著作もリストしました。 二日前に Creative Commons に関する勉強会の報告をしました。今…

Blog Digest

最悪の事故が起こるまで人はなにをしていたのか How to share your search results: ブログページに指定したキーワードに関連する本、ニュース、ビデオ、地図を掲示できる。

石井裕@MIT

出過ぎた杭は誰にも打てない〜コンピューター研究者・石井裕〜NHKの番組「プロフェッショナルの仕事」は Tangibleインタフェイスを生んだMITメディアラボの石井先生を取り上げていました。若い人の力を引き出すのは飢餓感、屈辱感を生むように学生と教員が向…

研究メモ

疑問 Bayes方式のスパムフィルタを用いて、個人のメッセージを他人のフィルタを用いることの有効性は有効か。 Bayes方式のスパムフィルタでは、通常、単語の出現頻度に関する情報(辞書)を学習する。辞書だけでなく、スパムの判定に用いる閾値も学習できるの…

Alan Kay講演会@東工大

squeakerがブログに書いてくれたので、ここにも書きます。興味のあるひとはわたしにメールを下さい。

CSWebのビルド

なぜか苦労したのでメモしておく。 getaのインストール 準備 perl, jperl, chasen, nkf のうち、perl は OS に入っているものを流用、日本語を使わないのでjperl はパス、にも関わらず chasen はなぜか fink でインストールしてしまったが今回は無関係、nkf …

Creative Commons

OCW

2007.02.09: のびたさんからJOCW発足時の様子について情報をいただいたので一部を修正しました。 OCWは高等教育機関で利用されている学習教材を外部に広く公開する試みです。ソフトウェアのプログラムを外部に公開する試みとしての、オープンソースというも…

META II

大島くんから紹介してもらった論文です。プログラミング言語を書くのに、字句解析器を作って、構文解析器を書いて、インタプリタとかコンパイラを作ってというのが一般的ですが、古には全然、違う方法があったそうです。Alan Kayの講演会で紹介されたGolden …

Eskin+ (2001)

学生の吉田くんが研究で参考にしている論文です。システムコール列を観察して、侵入検知を行う研究はいろいろあります。ふつうはシステムコール列をn-gramの列に変換して、解析をするのですが、この論文ではプロセスごとに特性が異なり、固定長のn-gramでは…

Vizster

SNSのさきがけでFriendsterというものがあります。ご存じですか?もともとの発想は、出会い系SNSのようです。mixiにも似ているのですが、4ホップ先のユーザまでしかプロフィールが公開されない点で制限が強く、そのことが各ユーザにより多くの情報を得る目的…

Spam Deobfuscation

しばらく前にCEAS 2005の論文概要を二つ紹介しましたが、ようやくそのうちの一方を真面目に読み終えました。隠れマルコフも堂々マルコフも存じあげなかったのですが、基本的なコンセプトは簡単なようです。 H. Lee and A. Ng, "Spam Deobfuscation using a H…

子どもを産む機械

Garr ReynoldsのPresentation Zenを読んでいます。最近では、Apple の Steve Jobs のプレゼンのエッセンスやiPhoneに対するSteve Ballmerの反応を批評したりして面白いです。さらに、なんと高橋メソッドを紹介してしているのにはびっくりです。この Reynolds…

複雑ネットワークの科学2章

複雑ネットワークの科学を読んで考えたことの覚え書きです。

サーバヘ接続…

Mac OS X の Finder の「移動」に「サーバへ接続…」という項目があります。ここでサーバのアドレスを「afp://server」とか「smb://server」とか入力すると AFP や SMB を利用してサーバ上のファイルを見ることができます。でも、「/」が開くために、ユーザ数…

CEAS 2005

昨日に続いて、スパムに関する国際会議の論文を紹介します。今日は、2005年の国際会議で発表された論文集から5件を選んでみました。論文概要はしっかりと読み、内容はパラパラとみくった程度ですから、詳細については踏み込みません。今日、紹介するのは以下…

CEAS 2004

Conference on Email and Anti-Spamのなかから、面白そうな論文を学生さんにピックアップしてもらったので、アブストラクトを眺めながらまとめてみました。

SharePoints for Mac OS X

ファイル共有設定とWindows共有設定で苦労したけれど、SharePoints というソフトで設定すれば簡単でした。

Subversion環境のインストール

subversion を使ってみようと思いたち、MacBook Pro に subversion の client をインストールしてみた。

トラックバックの練習

理屈は理解したものの、実際はどうやって使うものかよく分らない。そういう悩みを持つ人はほかにもたくさんいるようです。たとえ、知り合いとはいっても、無関係な内容のトラックバックを張るのは失礼かと思って遠慮していたわけです。そこで見つけたのがト…