« 再現率と精度とSwanson | メイン | hobokingさんへのお返事 »

検索界と音楽界のメイニアックなつながり

社長ブログに私とMichael Sembelloの「メイニアックつながり」の話が出たが、重要なことを思い出した。
検索界と音楽界には、メイニアックな人にとっては衝撃的なつながりがある。
日本でこれを知っている人は殆どいないだろう。

tf-idfのエントリでちらっと紹介した私の英国の恩師Stephen Robertson
確率モデル(probabilistic model)という情報検索アルゴリズムの体系を築き上げた大家。
もともとロンドンのCity大学の先生だったが、当時の英マイクロソフト研究所所長Roger Needham
(Karenの夫。追悼Karen Sparck Jonesのエントリ参照。)
にヘッドハンティングされてマイクロソフトに入社した。
Okapi BM25という彼が考案した検索アルゴリズムは、検索研究者の間で最もポピュラーであると言っても過言ではない。

私は英国留学時代、BM25が実装されたOkapiというシステムを実際に使って研究していた。
BMとはBest Matchの略で、ようするに各検索キーワードに重みを与えて、順位つきで検索結果を出すこと。
例えば"information retrieval"で検索する場合、まず"information"と"retrieval"の両方を含む文書を検索し、その後にいずれかの語のみを含む文書を検索する。
対義語はExact Match。例えば、"information retrieval"というフレーズをそっくりそのまま含む文書のみ検索する。
"retrieval of information"だけ含む文書も"retrieval"だけを含む文書も検索しない。
25というのは検索アルゴリズムのバージョン番号で、本当はBM11とか、BM2500とか、内部的にはいろいろな番号がある。

話がそれてしまったが、とにかくStephen Robertsonは現在の検索界で最も有名な人の一人で、例えばACM SIGIRからSIGIR Award (Gerard Salton Award)を受賞した6番目の人間である。
(SIGIRについてはこちらのエントリ参照。)

さて、80年代の英国のポップスを聞いていた方。
Thomas Dolbyを覚えているだろうか。
シンセサイザーポップスの黎明期に活躍し、米国でもShe Blinded Me with Scienceというヒットをとばし、坂本龍一とフィールドワークという曲を作ったりもしていたあの人である。
私は英国音楽を好むのでCDを一枚もっている。初期のピコピコサウンドが好きである。

ここで問題。Stephen RobertsonとThomas Dolbyは何つながりでしょう。

これは昨年11月、私がStephen Robertson本人から直接聞いた情報なので確かなもの。
以下、その時のSteveと私の会話のおおまかな日本語訳。
Steve:「Tetsuya、最近ホームページ見たけど君はミュージシャンだったんだね。CD作ったりしてるの?」
私:「学生の頃、レコード会社にデモテープは送ったけど断られたよ。」
Steve:「そうか。ぼくの弟は、結構successfulなミュージシャンなんだよ。」
私:「有名なの?なんていう名前?」

その後は想像がつくだろう。
そう、二人のつながりは、血のつながり。They're real brothers!
この事実を知った瞬間、私の脳の左上にあったStephen Robertsonに関する情報を格納したニューロンと、
右下の隅っこにあったThomas Dolbyに関する情報を格納したニューロンとの間に、
ズバッと音がして太いリンクがはられたのを感じた。ずばリンク。衝撃だった。
当たり前と言えば当たり前なのだが、SteveはThomas Dolbyのことを「Tomよばわり」していた。

でもこの驚きはSteveとThomas Dolbyのことを両方知っているメイニアックな人としか分かち合えないのである。
友達募集。

トラックバック

このエントリーのトラックバックURL:
http://mvt.fresheye.com/mt/mt-tb.cgi/562

この一覧は、次のエントリーを参照しています: 検索界と音楽界のメイニアックなつながり:

» NTCIR(エンティサイル)もよろしくお願いします from 検索メイニアック!
既に紹介した国際ワークショップEVIAは、NTCIR(エンティサイル)という評価... [詳しくはこちら]

» 検索と検索とノーパン from 検索メイニアック!
問題: 「検索」を英訳すると?... [詳しくはこちら]

» SIGIRに旅立つ前に from 検索メイニアック!
月曜日から丸一週間、ACM SIGIRである。 上記エントリで書いたように、私は... [詳しくはこちら]

» スパーク・ジョーンズとヴァン・ゴッホ from 検索メイニアック!
今日でSIGIRの本会議は終了。 ACM Athena Lecturer Awa... [詳しくはこちら]

» FIT 2007発表終了、夢・創・想・感 from 検索メイニアック!
今、東海道新幹線が台風で止まっている。 昨日名古屋からさっさと帰ってきて助かった... [詳しくはこちら]

» ECIR08ワークショップ講演無事終了 from 検索メイニアック!
朝、部屋のカーテンを開けるとこんな感じ。雨が降っている。 しかしこの国の人はこの... [詳しくはこちら]

» 将来に対する漠然とした不安 from 検索メイニアック!
EVIA 2008のチラシとAIRS 2009のチラシを作成しシンガポールに送付... [詳しくはこちら]

コメントを投稿

(いままで、ここでコメントしたことがないときは、コメントを表示する前にこのブログのオーナーの承認が必要になることがあります。承認されるまではコメントは表示されません。そのときはしばらく待ってください。)

2008年07月

    1 2 3 4 5
6 7 8 9 10 11 12
13 14 15 16 17 18 19
20 21 22 23 24 25 26
27 28 29 30 31    

プロフィール


「ニューズウォッチ」「フレッシュアイ」の名付け親。情報検索の研究者。工学博士。
2000年~2001年、英ケンブリッジ大学客員研究員。TOEICスコア985点。
2007年1月(株)東芝を退職。2月より(株)ニューズウォッチ自然言語処理研究室室長。
個人ホームページ
フレッシュアイ 社長ブログ