« 子連れシンガー | メイン | EVIAとEVJF終了、疲れた »

情報検索のポエム

全くおもしろくないはずだが、まず以下の拙文を見ていただこう。

もし君にシソーラス・ナビゲイション(注1)ができ、
各クエリ・タームに適切な重みを与えることができ、
あらゆる検索式に対して集合を検索でき、
文書をスコアと日付により順位付けできるなら…

もし君にトランザクションを記録・分析することができ、
単語に対し強いもしくは弱いステミング(注2)を行うことができ、
フィードバック(注3)の反復によりタームを抽出し、
質問者が求める文献情報を見つけられるなら…

もし君にデッドロックや衝突(注4)をうまく裁きつつ、
自分の陥ったボトルネックをさらすことなく、
再現率と精度を笑顔で迎えつつ、
両者の妥協点を見つけることができるなら…

もし君が厳しい評価に耐え、
気の合うインタフェースを維持することができるなら、
君は手にするだろう、
無限の情報と、データベースのその向こうに広がる世界への鍵を!

(注1)シソーラス・ナビゲイション(thesaurus navigation): キーワードの上位・下位語などにユーザを導くこと。
例えば、「パソコン」と「ウイルス」という検索キーワードを入力したユーザに対して、「パソコンの上位概念にはコンピュータがありますよ」と教えてあげれば、ユーザは最終的に「コンピュータ」と「ウイルス」というキーワードを用いてより有用な検索結果を得ることができるかも知れない。

(注2)ステミング(stemming): 英語テキストなどに対して、検索などの目的で語尾の変化を吸収すること。
例えば文書中のsingingという語のおしりのingを除去し、singにした上でデータベースに登録する。
ユーザがsingerで検索した場合、これもerの除去によりsingにすれば、singingを含む文書を検索できる。
また、accessibilityという語は弱いステミングによればaccessibilになり、強いステミングによればaccessになるかも知れない。

(注3)フィードバック(feedback): レレバンス・フィードバックのこと。

(注4)衝突(collision): デッドロックと同様にデータベース用語。データベースを書き換えようとする複数の矛盾する操作がほぼ同時に要求されてしまうこと。
例えば、二人のユーザが同時に同じデータをそれぞれ書き換えようとするケース。

頭がおかしい検索メイニアックの戯言だと思うであろう。
実はこれは、英City大学のSusan JonesさんがStephen Robertsonに捧げた下記の詩を私が無理矢理訳したものである。
Susanさんと面識はないのだが、「好きなように使っていいわよ」とメイルで許可をいただいた上でここから転載した。
Thank you Susan and Steve!

If you can do thesaurus navigations,
Give every query term its proper weight,
Retrieve a set for all search formulations,
Then rank the documents by score and date --

If you can log and analyse transactions,
Perform word-stemming (either strong or weak),
And follow feed-back loops with term extractions
To find the reference enquirers seek --

If you can handle deadlock and collision
But not betray the bottleneck you're in,
And learn to balance recall with precision
Whilst greeting both impostors with a grin --

If you can stand a tough evaluation,
Maintaining a congenial interface,
Yours is the key to boundless information,
And worlds that lie beyond the database!

何が言いたかったかというと、韻を踏む(rhymeする)のは美しいということである。
ご存知の通り、中国語も韻を踏むことができるが、日本語は基本的に韻を楽しめる言語ではない。

韻を踏むとはすなわち発想支援である。
韻を踏もうと思って文章を考えていると、何かしら書けてしまう。
深層心理が浮かび上がってくる。
私が英語で作詞をする理由のひとつはこれである。
書きやすいからである。

日本の洋楽ロックの雑誌には、歌詞を深読みしすぎた論評が載っていることがある。
単に韻を踏むためにノリで書いたと思われる歌詞について、インタビューで問い詰めたり。
洋楽ロックを語るなら、(しばしば不正確な)和訳ばかり見ていないで、少しでもよいから原文を眺めてみて欲しい。

なお、Susan Jonesさんによれば、英語の詩に韻が登場したのは800年ほど前だそうである。
詳しい方ならすぐわかるだろうが、この彼女の詩はKiplingのIfという有名な詩のパロディである。

ときに、「検索」と「メイニアック」は意識的に少し韻を踏んでいるのにお気づきだろうか。

トラックバック

このエントリーのトラックバックURL:
http://mvt.fresheye.com/mt/mt-tb.cgi/590

この一覧は、次のエントリーを参照しています: 情報検索のポエム:

» 米国生活とオートマトン from 検索メイニアック!
Pittsburghに4泊しただけで、体重がこれまで踏み込んだことのない領域に突... [詳しくはこちら]

コメントを投稿

(いままで、ここでコメントしたことがないときは、コメントを表示する前にこのブログのオーナーの承認が必要になることがあります。承認されるまではコメントは表示されません。そのときはしばらく待ってください。)

2008年07月

    1 2 3 4 5
6 7 8 9 10 11 12
13 14 15 16 17 18 19
20 21 22 23 24 25 26
27 28 29 30 31    

プロフィール


「ニューズウォッチ」「フレッシュアイ」の名付け親。情報検索の研究者。工学博士。
2000年~2001年、英ケンブリッジ大学客員研究員。TOEICスコア985点。
2007年1月(株)東芝を退職。2月より(株)ニューズウォッチ自然言語処理研究室室長。
個人ホームページ
フレッシュアイ 社長ブログ