« 2007年09月 | メイン | 2007年11月 »

2007年10月31日

メイニアックの、メイニアックによる、メイニアックのための漫画

明日、私が関わっている新しいサービスがフレッシュアイラボにリリースされる。
(と書いてしまうとリリース中止できなくなるな)
それもあって、最近ほとんど研究に時間が割けなくてストレスがたまってきた。

そこで気分転換に検索メイニアックのバナーを考えてみた。どうだろう。
DrManiac.JPG
右手にはフラスコを持たせるつもりがついワイングラスを描いてしまった。
台紙は昨年のSIGIRでもらったノートパッド。これぞ検索メイニアック。


ちなみに学帽をとるとこうなっている。
bald.JPG
サービス公開を前に、私の頭髪もこれに近づきつつある。
明日をお楽しみに。

2007年10月27日

シスターの逆襲

妹がTOEICで990点(満点)をとった。

本ブログのプロフィール欄には「TOEICスコア985点」という
さりげない自慢が書いてあるが、今後はこの部分を削除して、
代わりに「妹はTOEICスコア満点」と書かざるを得ない。
くそ~。いつかこっそり再受験しなければ。
そして満点が取れた時だけ公表しよう。そうしよう。

2007年10月26日

エイドリアン、モーガン・フリーマン、カブトムシ

2004年に公開され話題となった映画Million Dollar Babyを、この間ケイブルテレビで初めて見た。
普段「ベビー」を「ベイビー」と表記して社会不適応気味な私だが、
邦題の「ミリオンダラー・ベイビー」を見て少し安心した。
この場合のMillion Dollarはこれ全体で形容詞化しているので(従ってmillion dollarsになっていない)、
「ミリオン・ダラー・ベイビー」という表記よりも「ミリオンダラー・ベイビー」のほうがしっくりくる。

で、この映画だが、ボクシングの話らしいということ以外なんの予備知識もなしに見た。
エイドリア~ン」という展開を予期していたので衝撃を受けた。

それにしてもMorgan Freemanのナレイションは素晴らしい。
一時期レイザーラモンHG(元気?)が彼の名前を連呼していたのも頷ける。

Morgan Freemanと言えば映画War of the Worldsでもナレイションを担当していた。
ちなみにH.G.Wellsの原作は頭に定冠詞がついたThe War of the Worlds

それで思い出したが、Yoko OnoがThe BeatlesのことをいつもBeatlesというので、
Paulがいちいちカチンと来ていたという話を聞いたことがある。
たしかにTheがないと尊厳が損なわれて、なんとなく「たまたまそこに居合わせたカブトムシ」のような感じがする。
もちろんこれはYoko Onoが日本人だからで、悪意はなかったのだと思うが。

ところがなんと、John Lennonまでもが、ソロになってからのGodという曲で
"I don't believe in Beatles"と歌ってしまっている。
The Beatlesの定冠詞は否定文においては省略可能ということか。

2007年10月25日

フレディ・マーキュリー、社長のハグ

櫻井よし子の「日本よ、勁き国となれ」を買おうと思って本屋に行ったが、うっかり
東郷かおる子の「わが青春のロック黄金狂時代」を買ってしまった。

買った私が馬鹿だった。
おもしろかったのは、Freddie Mercuryにインタビューするためホテルに押しかけたら、
Freddieは元恋人(女性)および現在の恋人(男性)と三人で同じ部屋に泊まっていたというエピソードくらい。
人生太く短く。


さて連夜の宴のせいで風邪を引いた。

月曜日。会社の宴会で金田社長にハグされる(注1)

火曜日。アイルランド人を居酒屋に連れて行って八海山を飲ませる。感動していた。

水曜日。東芝の友人と飲み。数々のご叱咤をいただく。

木曜日。疲れたので家でおとなしくビール。(疲れなくても毎日家で飲んでいるが。)

(注1)
へんな会社だと思われてしまうので補足。
宴席で、この間のちょっとした社外表彰に対して改めて社内で表彰していただいた。
ハグはその副賞。
今回から社内表彰制度が始まり、今やみんな社長のハグだけを夢見てひたすら仕事に打ち込んでいる。
ちなみにハグは辞退も可能。

ん?やっぱりへんな会社?

2007年10月24日

NTCIR-7説明会 (2007/11/09)

初のNTCIR-7関連公式行事に関する情報。
今回はどういうことをやるのか、NTCIR未経験者にもわかりやすく説明する会なので、
奮ってご参加ください。


先日,第7回NTCIRワークショップ(NTCIR-7)のタスク参加について
ご案内させて頂きました.詳細は本メール末尾の「ご案内」をご覧下さい.

本日は,NTCIR-7の説明会についてご案内させて頂きます.

NTCIR-7からはタスクの内容や構成が大きく変わるため,タスク参加の
締切前に主旨などについて説明し,円滑に進めることが目的です.
説明会には,タスクへの参加意志とは無関係に,どなたでも参加して
頂けます.皆様,どうぞ奮ってご参加下さい.

日時: 2007年11月9日(金)9:30~12:00
場所: 学術総合センター2階 中会議室1・2
(交通案内: http://www.nii.ac.jp/introduce/access1-j.shtml)

内容:
○NTCIRの概要
○各クラスタ等の説明
・Advanced Cross-lingual Information Access
・User Generated Contents
・Focused Domains
・Multimodal Summarization of Trends
○意見交換

説明会への参加をご希望される方は,11月7日(水)までに
氏名,所属,メールアドレスを
ntc-secretariat at nii.ac.jp(NTCIR事務局)宛にご連絡下さい.

なお,NTCIRのメーリングリスト ntcir at nii.ac.jp に登録して
頂きますと,NTCIR関係の連絡をお知らせします.


お問い合わせ先:
NTCIR事務局
ntc-secretariat at nii.ac.jp

---
神門 典子
NTCIRプロジェクト

=== 以下,NTCIR-7のタスク参加ご案内 ===


第7回NTCIRワークショップ(NTCIR-7)のタスク参加案内をお送りします。
情報アクセス技術の研究や開発にご関心がある個人もしくはグループは
参加することができます。詳細は本メール末尾の英文案内をご覧下さい。


NTCIRは、情報アクセス技術の研究促進を目的として、研究に必要不可欠
な大規模かつ再利用可能な実験用データセットを提供します。さらに、
研究上のアイディアや妥当な評価方法について議論できるフォーラムを
提供します。具体的には、複数の研究チームが共通の「研究課題(タスク)」
を進めることで、協調と競争のバランスを保ちながら研究者コミュニティー
が発展することを目指しています。

第1回NTCIR-1の成果報告会は、1999年に開催されました。それ以降、回を
重ねるごとにタスクの種類や参加チームの数が増加し、言語横断情報検索、
自動要約、質問応答、特許情報処理、意見情報分析、動向情報分析、Web
検索などの多彩なテーマの発展に貢献してきました。

他方において、研究動向の変化や技術水準の高度化に追随するためには、
定例行事として甘んじることなく常に新たな挑戦が必要であると考えています。
今回のNTCIR-7では、NTCIR-6までの成果を踏まえるとともに、タスクの内容
と構成を一新し、以下に示す3つのクラスタを中心とした運営を行います。

○Advanced Cross-lingual Information Access
・高度な言語横断情報検索と質問応答

○User Generated Contents
・多言語意見情報の分析、言語横断ブログ検索

○Focused Domains
・特許情報の機械翻訳とマイニング

また、動向情報の要約も計画されています。


各クラスタでは、1つ以上のタスクを実行します。タスクへの参加資格や参加
方法は、NTCIR-6までと同じです。企業や大学などを問わず、情報アクセス
技術の研究開発にご関心がある個人もしくはグループは参加することが
できます。国立情報学研究所と覚書を交して頂くことで、通常では入手が
難しい、多彩な文書データを研究目的のために無償で提供いたします。


皆様の参加を心よりお待ちしております。


---
神門 典子
NTCIRプロジェクト


*************************************************************
Call for Participation

The 7th NTCIR Workshop (2007/2008)
Evaluation of Information Access Technologies: Information Retrieval,
Question Answering, and Cross-Lingual Information Access

October 2007 - December 2008
(Final Meeting: December 16-19, 2008, NII, Tokyo, Japan)

http://ntcir.nii.ac.jp/
*************************************************************
Online Registration:
http://research.nii.ac.jp/ntcir/cgi-bin/ntc7Registration.cgi?lang=en
*************************************************************

We are pleased to announce that the Seventh NTCIR (NTCIR-7)
workshop will start this year, and the concluding Workshop meeting
will be held at NII, Tokyo, Japan in December 16-19, 2008.

Participation is invited from anyone interested in research on
information access technologies and evaluation of them, such as
retrieval of documents from various genres, cross-lingual
information retrieval of Asian languages, question answering
and cross-lingual information access.

NTCIR Workshops are periodical events which are held once per
one and half years. All the documents needed for evaluation
will be provided from NII to the participants.

We have used Documents in East Asian Languages, but attracted
international participation. You are most welcome to participate!

Each task has Wiki or mailing lists for discussion. Discussion
for task design and evaluation methodologies are welcome.

** Tasks/Clusters for NTCIR-7

NTCIR-7 hosts the following tasks.

Cluster 1. Advanced Cross-lingual Information Access (ACLIA)
* Complex Cross-Lingual Question Answering (CCLQA)
* Information Retrieval for Query Answering (IR4QA)

Cluster 2. Information Access to User Generated Contents (UGC)
* Multi-Lingual Opinion Analysis Task (MOAT)
* Cross-Lingual Information Retrieval over Blog data (CLIR-B)

Cluster 3. Information Access to Focused Domains (PATENT)
* Patent Mining Task
* Patent Translation Task

Cluster Independent
* Multimodal Summarization of Trends (MuST)

** Clusters and Tasks Overview

* Cluster 1: Advanced Cross-lingual Information Access (ACLIA)
http://aclia.lti.cs.cmu.edu/wiki/moin.cgi/Home

This cluster evaluates ”Complex CLQA”, ”CLIR” and ”the contribution
of CLIR to CLQA”. Documents are (Simplified and Traditional)
Chinese, and Japanese news published in 1998-2001. Questions/topics
are English, Chinese, Japanese and can be more.

CCLQA and CLIR share the same set of questions/topics, and
participation is welcome to test (1) end-to-end QA, or (2) CLIR
or IR module only using either original natural language questions,
or analyzed queries containing question types. IR modules will
be evaluated both IR itself and effectiveness in QA.

CCLQA and IR focusing to specific types of questions is new for
NTCIR. And we would like to know ”What kind of IR mechanism
would be the best for what kind of QA mechanism?”, ”What kind
of combination is the best?”, etc.

* Cluster 2: Information Access to User-Generated Contents
http://kde.ics.tut.ac.jp/~seki/ntcir_cl2/

CLIR-B: http://ntcir.nii.ac.jp/index.php/CLIRB/
MOAT: http://ntcir.nii.ac.jp/index.php/Table/MOAT/

This cluster consists of ”Cross-Lingual Information Retrieval
for Blog (CLIR-B)” task and ”Multilingual Opinion Analysis
Task (MOAT)”. These use a newly crawled blog corpus of Chinese,
Japanese and English, which including both blog posts and
the comments for them; Topics will be shared by the tasks.

CLIR has been investigated in NTCIR from the beginning, but
Blog is a new document genre for NTCIR. CLIR for Blog shall be
an informational task to search opinionated documents relevant
to each topic. Opinion Analysis Task tests the ability of
the system to automatically identify relevance and opinionatedness
of each sentences in the relevant documents, opinion holder,
polarity and stakeholder (target of the opinion). Compared to
Opinion Analysis Task using news documents in NTCIR-6, identifying
”Stakeholder” is new.

* Cluster 3: Information Access for Focused Domains
http://if-lab.slis.tsukuba.ac.jp/fujii/ntcfd/index-en.html

Translation: http://if-lab.slis.tsukuba.ac.jp/fujii/ntc7patmt/index-en.html
Mining: http://www.nlp.its.hiroshima-cu.ac.jp/~nanba/ntcir-7/cfp-en.html

This cluster consists of ”Patent Translation” and ”Patent Mining”
tasks. It is targeting to evaluate the technologies to enhance
the information access for Patent, which were investigated
in the past NTCIRs.

Patent Translation will conduct both intrinsic and extrinsic
evaluation. Intrinsic evaluation consists of automatic
evaluation using a metrics like BLEU and human judgments.
Extrinsic evaluation adopts CLIR-task based evaluation, i.e.,
the contribution machine translation for CLIR will be tested.

Patent Mining task targets cross-genre information access
between patents and scientific papers. Abstracts of conference
papers are used as ”topics” and the systems are requested
to provide appropriate International Patent Classification (IPC)
classes. It can be done as automatic categorization of paper
abstracts to IPC classes or as a cross-genre retrieval from
conference papers to patents.


* Multi-modal Summarization of Trends (MuST): TBA

Automatic identification and extraction of numeric information
related to the trends of a topic, and way of visualization will
be investigated and evaluated. For visualization, as a common
platform, an open source software for visualization will be provided.

** Important Dates

Registration Due: November 15, 2007
Documents Release: November 15, 2007
Dry Run: from November 2007 to April 2008
Formal Run: from 2007-11 to 2008-08
Task Overview Partial Release: by September 1, 2008
Evaluation Results Return: by September 1, 2008
Papers for Proceedings Due: October 1, 2008
Camera-ready for Proceedings Due: November 1, 2008
Final Meeting: December 16-19, 2008


* Notes

1. Whether there will be a dry run or not depends on each task.
For further information, please consult the web site for each task.

2. The exact dates for the dry and formal runs are decided by each
task. For further information, please contact Noriko Kando


The registration system for NTCIR-7 task participation is online.
Please register for NTCIR-7 at ;
http://research.nii.ac.jp/ntcir/cgi-bin/ntc7Registration.cgi?lang=en


”How to Participate” and ”User Agreement forms” to obtain the data
set will be released soon. These are generally similar to
the previous ones that we used for NTCIR-6.
Just for your information:

HOW TO PARTICIPATE in NTCIR-6
http://research.nii.ac.jp/ntcir/ntcir-ws6/howto-en.html

USER AGREEMENT FORMS for NTCIR-6
http://research.nii.ac.jp/ntcir/ntcir-ws6/permission/perm-en.html

******************************************************************

2007年10月23日

人生の記録

国立情報学研究所で、Dublin City Universityのlifelogに関する取り組みについて聴講してきた。
発表者のCathal(tを発音せずにカホルという。Irish名。) Gurrinは私の友達の友達で、初対面だった。

Cathalは、夜寝ている間以外は常に、首からSenseCamというMicrosoft製カメラをぶら下げ、
さらにGPSを携帯している。これをやり初めて一年半近くたつという。
SenseCamは自動的に一日約3千枚もの写真をとりまくるので、
自分がいつどこで何をしていたかが全て画像として残る。
今のところ、音声情報は記録しないvisual lifeloggingである。ブログの発展系とも言える。

私もディジタルカメラとGPSを海外出張にもっていって、
あとで技術スタッフN氏に写真と地図をマッシュアップしてもらった経験はある。
GPSの性能には不満を感じたが、プラハアムステルダムの自分の足跡を眺めるだけでも結構楽しかった。

さて、Cathalの発表は基本的にlifeloggerとしての体験談だったが、
問題はlifelogをいかに役立てるか。
この点については世の中でまだ本格的な取り組みが見られないようだ。

Lifelogの応用としては、補助脳、犯罪防止、生活改善などたくさん考えられるが、
検索メイニアックとしてはまず情報検索に応用したい。
これに関しては、前にある講演のためにこんな漫画を描いたことがある。
(新しいアイデアというわけではないが。)


恋人が来るのを待っていると、雨が降ってきたので急遽デートプランを変更。
自分のlifelogから以前行ったことがある近場のレストランを自動検索。
taciturn-rain.jpg


ユーザがどんな一日を過ごしてきたかに応じて番組推薦。
taciturn-tv.jpg


赤ん坊の泣き声を聴いて and/or 泣き顔を見て救急病院検索。
taciturn-baby.jpg

なお、taciturnというのは「寡黙な」ということ。
Lifelogなどを使って気が利く検索を実現したいという話。


夜はCathalを居酒屋に連れて行ったので、彼のSenseCamには私がかなり写っているはず。
私はというと、こうして手でせっせとブログを書くしかない。
SenseCam欲しいなあ。ぶら下げていれば少しは日頃の行いがよくなるかなあ。

2007年10月14日

酒場で格闘ドンジャラホイ

The Police (ザ・ポリース)の曲で私が一番好きなのは、Every Little Thing She Does Is Magic。
私も趣味で作詞作曲を嗜む人間だが、どうしてこんな曲が作れるのかさっぱりわからない。
(わかっていたら私も今頃Stingやっとるわい。)
この曲が発売された当時、私はロンドンに住んでいた。
あれから四半世紀が過ぎた今でも、Top of The Popsで放映されたプロモーションビデオは覚えている。

ところで最近この曲の邦題を知った。なんと「マジック」。ううむ、そぎ落としたなあ。
Mr.マリックのテーマソングか何かと間違えそうだなあ。
もちろん原題は「あの娘のやることは何から何まで魔法やねん」という意味なのだが。

逆に、おせっかいに英語の文脈をつけたした邦題というのも最近みかけるようになった。
この間ケーブルテレビで見たGwyneth Paltrow主演のProofという映画。
映画の内容からすると、「数学的証明」と「証拠」の両方の意味を含んでいると思われるが、
邦題は「プルーフ・オブ・マイ・ライフ」。これだと「数学的証明」という意味合いはほぼ排除されてしまう。

ポリスと言わずにザ・ポリースと言い張る社会不適応気味の私だが、
今日、近所のスーパーマーケット(俗に言うスーパー)で心の友を発見した。
そのプルーフがこれである。
celery.jpg
セロリでなくセルリー。そうだよなceleryだもんな。
これを書いた人はキャベツをキャビッジというのだろうか。

Tom JonesのIf I Only Knewの邦題が「恋はメキ・メキ」。
"make you make you love me"というフレーズを聴いて誰かが適当につけたのだろうが、
ここまで来ると感心する。
前述のEvery Little Thing She Does Is Magicも、「魔法」という言葉を使わずに「マジック」としたのは、
あの曲の最後のほうで"magic, magic, magic"と連呼するからだろう。

さて、次の邦題をもつ原曲のタイトルは何でしょうか。
コステロ音頭 / Elvis Costello
いまは納豆はいらない / Frank Zappa
娘17売春盛り / Frank Zappa
酒場で格闘ドンジャラホイ / Korpiklaani

答えはこちら

2007年10月13日

失敗談専門の論文誌

よいアイデアだと思って実験してみたけど結果はダメだった。
そういう研究内容に特化したオンライン国際論文誌ができたらしい。
その名もJINR(Journal of Interesting Negative Results in
Natural Language Processing and Machine Learning)

自然言語処理・機械学習における興味深い否定的結果に関する論文誌。

定理証明により論文を書く世界では否定的結果も立派な成果だが、
実験を通して提案手法の有効性を示すことが多い言語処理や情報アクセス技術の世界では、
否定的結果が論文として認められるケースは少ない。
しかし否定的結果からも有用な知見が得られることはある。
これがJINRの主旨らしい。
まだ論文は一本も載っていないが、現在テキスト要約のワークショップ
DUC(Document Understanding Conferences)の参加者などから論文を募っているようである。
(SIGIR 2001のワークショップとして開催された最初のDUCには私も参加し発表した
9/11の直後だったので、New Orleansの会場まで来られなくなったNew York在住の研究者が
電話で議論に参加していたなあ…)

うまくいかない提案手法を考案するのは私もかなり得意なので、JINRのことは心に留めておこう。
まずは、JUNR(Journal of Uninteresting Negative Results)、つまり
「失敗するべくして失敗したつまらない研究内容を集めた論文誌」と呼ばれないよう、
編集委員会には是非頑張っていただきたい。

2007年10月12日

情処FI研発表資料とスナイパー

欧州の情報検索の国際会議ECIRの査読を3件、
国際論文誌Information Retrievalの査読を2件やった。
もう満腹。デザートも入らない。


まだ約ひと月前だが11月のFI研の発表資料を仕上げた。これ
そろそろ新機軸を打ち出したいなあ。


ときに今日、社内の会議で座席の配置のことが話題に上った。
あとどれくらい続くかはともかく、現在、私の席はこんなことになっている。
desks.jpg

よく考えると不思議だ。なんでだろう。(テツandトモは元気だろうか。)
これ以上詳細なレイアウトを書くと社長がスナイパーに狙われる可能性が高いので、
このへんでやめておくが。

2007年10月11日

11月の情処FI研プログラム

11/8のFI研(情報学基礎研究会)プログラムが公開された。
ディジタル図書館ワークショップと合同開催なのだが、発表件数が少ないなあ。
自分の発表は三番目。つくばエクスプレスが楽しみ。

◆ 第88回情報学基礎研究会
※ 第33回ディジタル図書館ワークショップと合同開催

日 程: 平成19年11月8日(木)
会 場: 筑波大学春日キャンパス 情報メディアユニオン2階メディアホール
(茨城県つくば市春日1-2)
http://www.slis.tsukuba.ac.jp/grad/access/
テーマ:「ネットワークコミュニティによる知識創出」およびディジタル図書館一般

[交通手段]
つくばエクスプレスつくば駅より徒歩10分

最新情報は情報学基礎研究会のページをご覧ください。
http://www.ipsj.or.jp/katsudou/sig/sighp/fi/
ディジタル図書館ワークショップに関しては下記URLをご覧ください。
http://www.dl.slis.tsukuba.ac.jp/DLworkshop/
◎ 照会先
永森 光晴(筑波大学大学院図書館情報メディア研究科)

◎ プログラム

11月8日(木) 13:00 - 17:30

[13:00 - 15:00] セッション1
(1) 知識創出を目指した集合知再構成手法の提案
○川戸祐介, 松村 敦, 宇陀則彦(筑波大学)

(2) 集合知を利用したデジタルアーカイブの構築とその課題
○研谷紀夫(東京大学大学院情報学環)

(3) A Further Note on Alternatives to Bpref
○Tetsuya Sakai(NewsWatch), Noriko Kando(NII)

(4) SNS(Social Networking Service)における信頼と図書館における応用
○井上創造,堀優子,池田大輔(九州大学)

[15:30 - 17:30] セッション2
(5) 研究者業績情報システムと学術情報リポジトリの連携
○小野 真由美(東京大学), 井上創造, 星子 奈美(九州大学)

(6) 研究支援ツールとしての機関リポジトリにおけるバージョン管理機能
○池田 大輔(九州大学)、宗 孝(Fusic)、納富 貞嘉(Fusic)、井上 創造(九州
大学)

(7) プレプリントへのタイムスタンプ付与システムの構築
○山地一禎,片岡俊幸, 曽根原登(NII), 行木孝夫(北大)

(8) ディジタルリソースの保存方式選択のためのガイドライン
○白 才恩、杉本 重雄(筑波大学)

2007年10月10日

1月の情処研究会でNTCIR特別セッションやります

発表募集:
情報処理学会 第183回自然言語処理研究会・第89回情報学基礎研究会 合同研究発表会

日程 平成20年1月21日(月)・22日 (火)
会場 国立情報学研究所 12階1208+1210会議室
http://www.nii.ac.jp/introduce/access1-j.shtml

テーマ:言語処理・言語情報アクセス技術の評価 および一般

【趣旨】

言語処理・言語情報アクセス技術の進歩には,これらを適切に評価するた
めの方法論および実験データが不可欠です.特に1980年代以降,MUC
(Message Understanding Conference), DUC(Document Understanding
Conference), TREC(Text Retrieval Conference),そして国立情報学研究所
主催のNTCIR(エンティサイル)などの国際的な取り組みを通じて,大規模な
データセットにより多くの研究機関がその技術を比較評価する基盤が整っ
てきました.一方,言語処理・言語情報アクセス技術の多様化およびデー
タの大規模化に伴い,これらを評価する方法論自体も,進化させていく必
要が生じています.そこで今回は,特に言語処理・言語情報アクセス技術
の評価に着目した研究発表を募集します.

また,上記特別セッション以外の一般セッションでの発表も通常通り募集
いたします.自然言語処理・情報学基礎に関する幅広いご発表をお待ちし
ています.

なお,今回の合同研究会の第一日(21日)には「NTCIR特別セッション」を予
定しています.ここでは,NTCIRの足跡・現在進行中の各タスクの中間報
告,情報検索評価実験に関するチュートリアルの他,NTCIRに関連する一般
の研究発表の場を設ける予定です.奮ってご応募ください.

NTCIR: http://ntcir.nii.ac.jp/


【日程】

発表申込締切: 平成19年11月22日(木)
原稿締切:   平成19年12月21日(金)
原稿ページ数制限予定: 6~8ページ

発表時間予定: 1件25~30分
       (質疑応答を含みます.多少変わることもあります.)


【発表申込方法】

自然言語処理研究会にお申込みの場合:
以下のページからお申込みください。
http://nl-ipsj.r.dl.itc.u-tokyo.ac.jp/cgi-bin/reg183.cgi
特別セッションでの発表を希望される場合は備考欄に「特別セッション発
表希望」と明記してください。

照会先(自然言語処理研究会)
乾 健太郎 (奈良先端科学技術大学院大学)
E-mail: inui at is.naist.jp

情報学基礎研究会にお申込の場合:
研究会発表申込書の様式で,発表題目,発表者名(登壇者に○),略称所
属,概要(80字以上100字程度),発表申込者連絡先(住所,氏名,Tel,
Fax,E-mail),発表に必要な機材,および★NTCIR特別セッションでの発表
希望有無★を明記の上,情報学基礎研究会の照会先(酒井)まで E-mailでお
申し込みください.

照会先(情報学基礎研究会)
酒井 哲也 ((株)ニューズウォッチ)
E-mail: tetsuyasakai at acm.org

なお,発表申込受付は先着順で行なっております.また,NTCIR特別セッ
ションでの発表をご希望された場合でも,一般セッションでのご発表をお
願いする場合がございますので予めご了承ください.さらに,締切間際に
なりますと,申込件数によっては次回の研究会でのご発表をお願いする場
合がございます.発表申込締切後のキャンセルは原則としてできませんの
で,十分ご検討の上お申し込み下さい.


【研究会ホームページ】

最新情報は各研究会ホームページに掲載予定です.

情報学基礎研究会:
http://www.ipsj.or.jp/katsudou/sig/sighp/fi/
自然言語処理処理研究会:
http://nl-ipsj.r.dl.itc.u-tokyo.ac.jp/

以上

2007年10月08日

どんだけ!アンパンマン

三歳の娘の頭の中がアンパンマン・ワールドに侵食されている。
病院には「四歳までテレビはなるべく見せないように」なんていうポスターが貼ってあるが、
現代社会でそれは不可能だ。
娘はケーブルテレビで録画した劇場版アンパンマンを見まくっている。
最初の1フレイムくらいでどのエピソードか言い当ててしまう。(親バカ指数60%)
へたをすると私のスターウォーズのキャラクターに関する知識よりも娘のアンパンマンのキャラクター
に関する知識の方が広いかも知れない。(親バカ指数70%)

泣かせる話もたまにあるが、基本的には善玉が悪玉を毎回暴力でねじ伏せる。
ばいきんまんは決して改心しない。永久に悪者である。
そのくせアンパンマンは、悪いことが起こると「一体、誰が…」なんてとぼけたことを言う。
顔を取り替えるたびに記憶がリセットされるのか!?

そういうわけで、我が家ではアンパンマン人形などを使ったアンパンマンごっこが大流行だが、
あれをエンドレスにやらされるのは精神的に相当辛い。
娘と接している時間が私よりもはるかに長い妻にいたってはヘロヘロである。
最近は知育玩具か何かでなるべく気をそらそうとしてはいるのだが。

そもそも、アンパンマン・ワールドは血液型A型の大人には馴染まない。
アンパンマンしょくぱんまんカレーパンマン。ここまでは大いに共感できる。
しかし、クリームぱんだあたりからよくわからなくなってくる。パンダである。
もっとよくわからないのは、あかちゃんまん。もはや食べ物ではなく、赤ちゃん。
一般市民では、だいこんやくしゃなんかは食べ物だからまあいいとして、カバおなんていうカバも出てくる。

ちょっと待て、ばいきんまんが自力で飛べるというのは初耳だぞ。
あの貧弱な羽で本当に飛ぶのか!? 詳しい方教えてください。
(アンパンマン・ワールドに侵食されているのは自分の頭か。)

兎に角、子供にとってはものすごく魅力があるようだ。
娘はまだろくに喋れないころから、
スーパーマーケットでアンパンマンの人形を見つけると興奮して「ぱんまん!」と叫んでいた。
(アンパンマン、しょくぱんまん、カレーパンマンの上位概念として発した言葉だと推察される。)
たしかに、幼児にとって非常に顔認識がしやすいキャラクターデザインではある。
つい先程も、上記のアンパンマンサイトを見ていたら、夜11時近くまでパソコンを娘にのっとられた。

自分としてはムーミンとかプーさんあたりに傾倒して欲しいのだが、
プーさんのDVDも最近すっかりご無沙汰である。

ときに、メロンパンナちゃんの顔の格子模様を見るとHellraiserを思い出すのは私だけでしょうか。

2007年10月04日

EVIA2008ホームページほか

前にちょろっと書いたEVIA 2008のホームページができた。
http://ntcir.nii.ac.jp/index.php/EVIA-2008/
Preliminary Call For Papers (CFP)のpdf versionはこちら
論文投稿締切は来年の8月なのだが気が早いかなあ。

ついでに先日、NTCIR-7のACLIA(Advanced Crosslingual Information Access)のサイト
このページの中身を書いた。
ACLIAは、比較的複雑な質問を扱う言語横断質問応答と、
このための要素技術としての(言語横断)文書検索技術に関する一連のタスク。
NTCIR-7ではACLIAのことをCluster 1とも呼んでいる。
詳細についてはこれらのサイトをご覧ください。

2007年10月02日

メイニアックな論文3つ

11月の情報処理学会 第88回 情報学基礎研究会(第33回 ディジタル図書館ワークショップと共同開催)
で発表する論文を仕上げて提出したので早速ここに載せておく。

Sakai, T. and Kando, N.:
A Further Note on Alternatives to Bpref
情報処理学会研究報告 2007-FI-88, to appear (2007)

「Bprefに代わる評価指標に関するさらなる考察」という意味。
Alternatives to Bpref(Bprefに代わる評価指標)という論文の続編。
不真面目なタイトルだが、研究会は査読がないのでなんでも許されてしまう。


査読を通ったちゃんとした論文としては、
情報処理学会論文誌:データベース9月号に以下の2本が掲載された。

Sakai, T.:
Evaluating Information Retrieval Metrics based on Bootstrap Hypothesis Tests
情報処理学会論文誌データベース Vol.48, No.SIG 9 (TOD35), pp.11-28 (2007)

Sakai, T.:
On the Properties of Evaluation Metrics for Finding One Highly Relevant Document
情報処理学会論文誌データベース Vol.48, No.SIG 9 (TOD35), pp.29-46 (2007)

2本合わせて36ページもある。質より量。


こう書くと会社で論文ばかり書いているように思われるかも知れないが、とんでもない。
最近はフレッシュアイの新サービス立ち上げのために、私なりに同僚と力を合わせて働いている。
むしろ基礎研究のための時間をいかに確保するかが課題となっている。
もちろん検索メイニアックは研究をしないと死んでしまうので、確保はするつもり。

2007年10月01日

テレビ・フォアキャストのブログパーツのテスト


弊社スタッフブログに載っているブログパーツ
を早速テストしてみよう。
ちなみに、技術者Nさんの
「弊社自然言語処理研究室の室長・酒井哲也さんを中心に作り出した」というのはいいすぎで、
私は基本アルゴリズムの実装のみ。
このような形に仕上げたのは技術者Nさん、Oさんや制作の方々をはじめとする関係者の方々。
いやいやいやいや、そんなご謙遜を。(内輪で何をやっとるのか。)

こんなかんじで、テレビで話題になったキーワードをジャンル別に監視できます。

カレンダー

« 2007年10月 »
1 2 3 4 5 6
7 8 9 10 11 12 13
14 15 16 17 18 19 20
21 22 23 24 25 26 27
28 29 30 31

プロフィール


「ニューズウォッチ」「フレッシュアイ」の名付け親。情報検索の研究者。工学博士。
2000年~2001年、英ケンブリッジ大学客員研究員。TOEICスコア985点。
2007年1月(株)東芝を退職。2月より(株)ニューズウォッチ自然言語処理研究室室長。
個人ホームページ
フレッシュアイ 社長ブログ