2010-04-18 Sun
チューリップが綺麗だった
恵比寿の路地でチューリップが綺麗に咲いていました。春ですねぇ。
from overlast using Panasonic DMC-FX100
それにしても、チューリップの花びらって面白い形してますよね。。と思うのですが、みなさんはどう思われますか?うーむ。
- チューリップ - Wikipedia
チューリップブック―本当にチューリップのすべてが分かる
[Amazonで詳細を見る]
[2010-04-19-1] あ、そうか、チューリップの花って朝は閉じるよね
[-] 1
2010-04-17 Sat
弟に娘が生まれて叔父になった
今日の午前4時37分に弟夫婦に娘が生まれたそうです。予定日より20日も早いから 2405g なんだとか。でも、元気そうなのでよかったよかった。
ということで叔父になりました。
お祝いに何を買ってあげようか悩むけど、とりあえず、きむらゆういち先生の定番本は買ってあげようかな。
いないいないばああそび (あかちゃんのあそびえほん)
[Amazonで詳細を見る]
今日は、書くこと無いかな?と思っていたら、良いニュースがあってよかった!!
2010-04-16 Fri
情報検索の教科書「Information Retrieval: Implementing and Evaluating Search Engines」
「Information Retrieval: Implementing and Evaluating Search Engines」という情報検索の教科書が出るそうです。@tsubosaka さんから教えていただきました。ありがとうございます。
この本は必ず買うと思います。MIT Press から出るみたいですが、いまのところ Amazon.com でも予約できないので時々様子を見ないと。。
[2010-05-05]:追記
MIT Press から出ます。Amazon.co.jp か Amazon.com で予約できます。
Information Retrieval: Implementing and Evaluating Search Engines
[Amazonで詳細を見る]
- Amazon.com: Information Retrieval: Implementing and Evaluating Search Engines
- Information Retrieval: Implementing and Evaluating Search Engines
-- http://www.ir.uwaterloo.ca/book/
— I Foundations —
1 Introduction
2 Basic Techniques
3 Tokens and Terms
— II Indexing —
4 Static Inverted Indices
5 Query Processing
6 Index Compression
7 Dynamic Inverted Indices
— III Retrieval and Ranking —
8 Probabilistic Retrieval
9 Language Modeling and Related Methods
10 Categorization and Filtering
11 Fusion and Metalearning
— IV Evaluation —
12 Measuring Effectiveness
13 Measuring Efficiency
— V Applications and Extensions —
14 Parallel Information Retrieval
15 Web Search
16 XML Retrieval
— VI Appendix —
A Computer Performance
1, 2, 4, 6, 14 章のサンプルが公開されています。それだけでもかなり読みごたえがあります。パラパラ見てみましたけど、とにかく図が良くて、とても分かりやすいしイメージが浮かびやすいです。
6章をちょっと時間をかけて眺めると、Managing Gigabytes が出版された 1999 年よりも技術がググと進化して、知見も世の中に沢山たまっていることを実感できました。
いまは Google にいる Stefan Büttcher さんが University of Waterloo に居たときに実装した Wumpus や、書いた論文がもとになっているのかな。
- The Wumpus Search Engine
-- http://www.wumpus-search.org/
Wumpus はソースコードを見られるので、教科書を読みつつ眺めるのが良さそうです。
関連する定番教科書
Introduction to Information Retrieval


[Amazonで詳細を見る]
# 検索の定番教科書。最初に読むと全体が掴める
Managing Gigabytes: Compressing and Indexing Documents and Images, Second Edition


[Amazonで詳細を見る]
# IIRを読んだ後に読むと、細かい実装が分かって良かった
関連ページ
- Information Retrieval: Implementing and Evaluating Search Engines - The MIT Press
-- http://mitpress.mit.edu/catalog/item/default.asp?ttype=2&tid=12307
2010-04-16 Fri
En Google modified by Gulfweed の Chrome Extention をインストール
FireFox を使っていたときはコレがなきゃ生きて行けないよ!と思っていた User Script のうちの一つに「En Google modified by Gulfweed」がありました。
で、久々に調べてみたら、Chrome 用の Extention が公開されています!すごい!ありがたや!
- En Google - Gulfweed
-- http://gulfweed.starlancer.org/?En%20Google
-- dev channel が必要です。
インストールする前に、こんな感じだった Google の検索窓。

インストールしたあとは、こんな風になります。

検索対象やUIの言語をワンクリックで切り替えられるし、論文検索とコード検索のリンクもつきます。便利過ぎ!
Google で検索オプションの切り替えを頻繁にする人にオススメです。
関連リンク
- Google Chrome Dev for Mac
-- http://www.google.com/chrome/eula.html?extra=devchannel
2010-03-29 Mon
さくらインターネットのアカウントの住所確認入力を忘れてた
さくらインターネットのレンタルサーバを追加で、もう一つ借りたのですが、このところの忙しさのためか住所確認のコードを入力し忘れていました。
サーバを借りると、さくらから以下のような手紙が郵送されてくるのですが、これに書いてある「お知らせ番号」を入力しないと、一定期間後にアカウントが停止されちゃうのです。がーん。
from overlast using Panasonic DMC-FX100
レンタル開始から20日経過してましたが、幸いなことにアカウントは停止になっていませんでした。よかったよかった。
そういえば、さくらインターネットのレンタルサーバはディスク容量が明日30日から3倍以上に増強されるのです。やったね。
関連リンク
- SAKURA Internet // 2010年03月16日 「さくらのレンタルサーバ」「さくらのメールボックス」「さくらのマネージドサーバ」サービス改定のお知らせ
-- http://www.sakura.ne.jp/news/archives/20100316-001.news
利用料金は据え置きで、ディスク容量を下記の通り増量いたします。
---------------------------------------------
プラン名 増量前 増量後
---------------------------------------------
・さくらのレンタルサーバ
ライト 500MB → 1GB
---------------------------------------------
スタンダード 3GB → 10GB
---------------------------------------------
プレミアム 10GB → 40GB
---------------------------------------------
ビジネス 20GB → 80GB
---------------------------------------------
ビジネスプロ 40GB → 150GB
---------------------------------------------
・さくらのメールボックス 300MB → 1GB
---------------------------------------------
2010-03-29 Mon
「ちょっと良いですか?」にご用心
気になったのでメモ。
「ちょっと良いですか?」と質問されたら用心しよう。質問者は時間泥棒かもしれないですよ。
時間泥棒は時間を泥棒する事が目的の人。または、建設的な議論や論理的な検討を目的にはしていない人。こういう人と真剣に議論すればするほど、次回に議論したときにガッカリすることになる。
時間泥棒に対処する方法はいくつかある。例えば以下のような感じ。
1:無視する
2:聞く気が無い感じで対処する
3:制限時間をあらかじめ言う
4:全力で相手をする
5:断る
1、2は交流がある相手の場合には論外の対応。3は感じが悪いかもしれなくて、4は自分がとても疲弊するから駄目。明らかに自分の責任範囲を超えている件に関しては5でいいかも。
検討してみると3が汎用的で良いかも。ということで「ちょっと良いですか?」と時間泥棒から声をかけられたときの対処法。
「**時から**で席を立つので、それで大丈夫でしたら」ということ。
そして、時間が来たら華麗に席を立ち上がり魔の手から逃れること。理由なんて何でも良いでしょう。時間は10分以上割きたくないですね。
モモ―時間どろぼうとぬすまれた時間を人間にかえしてくれた女の子のふしぎな物語
[Amazonで詳細を見る]
2010-03-29 Mon
@mirakui 元気でね">@mirakui 元気でね
今日は社内で親しかった @mirakui さんが新天地に向けて旅立った日。
彼は社内で特にキラキラしてるエンジニアの一人で、彼が別の地を選んだということが、他の人間に与える影響力っていうのは、すごく大きいと思う。しばらくしたら、いろいろ聞かせて欲しいな〜。
from overlast using Panasonic DMC-FX100
彼のお別れの時間には社内の若手エンジニアがゾロっと集まって、彼を天井を突き破って胴上げ。
誰よりも頑張っている人の一人である彼にかける気の効いた言葉なんてないけれど、これからも新天地で周りの人に影響を与えまくって輝き続けてください。と思いました。
明日から寂しくなるなぁ。まぁ、白金と恵比寿って近いから会えるか。
関連リンク
- 転職しました - 床のトルストイ、ゲイとするとのこと
-- http://d.hatena.ne.jp/mirakui/20100329/1269851046
2010-03-28 Sun
友人とお茶
@debugordie さんと久々にお茶。彼は学生時代から今までお世話になっていて引っ越しのときにはレンタカーの運転までやってくれた大切な友人です。
どうやら、そんなに生活に変わりはないみたいだけど、アカデミックに残っているために苦労は多いみたい。これから上手い事やってパーマネントなポストに着けると良いですね。超応援しています。
最近の話をしていたら、お互いに普段取り組んでいるテーマで扱うデータが全然違うけれど、活用する手法やアルゴリズムは、かなり近いっぽい事が分かりました。お互いに良い影響があるといいですね。
久々に話が通じる人と話したので、ちょっと愚痴っぽくなってしまったけれど、おかげで頭の中が整頓されました。それに、彼が大分苦労している話を聞いているうちに、僕も負けじと突き抜けなければいけないな、と思ったのでした。
恵比寿には都合でしょっちゅう来るみたいなので、今後はたまに遊びたいすね。
あ、近日、彼の携わっているプロジェクトが楽しい発表をしてくれるみたいなので、発表されたらブログで紹介しようと思います。
一流料理人が考えた納豆かけごはん
[Amazonで詳細を見る]
2010-03-28 Sun
渋谷区東あたりの明治通りも桜が咲いてた
中目黒からの帰り道、明治通りを横断するときに、しだれ桜がだいぶ咲いていることに気付きました。綺麗なんだけど、空が暗くて綺麗に写らないな。
from overlast using Canon EOS Kiss X2
この次期に日中のしだれ桜を見ないと、明治通り周辺に住んでいる者としては損した気分になると思うので、見られてよかったです。
2010-03-28 Sun
目黒川周辺はお花見シーズンでした
中目黒の「いろは寿司」でランチを食べて満足した後で、目黒川に目をやると桜が 3 分程度咲いていて、かなり綺麗でした。
from overlast using Canon EOS Kiss X2
見頃は、今週半ば過ぎの暖かくなったあたりかな。少なくとも今日と明日は真冬のような冷え込み(夜の気温が5度くらい)なので、まだ見頃ではないと思います。
でも、お客さんは沢山いましたし、探すと8分咲き程度の桜もあってグルグル回っているうちに満足しちゃいました。
from overlast using Canon EOS Kiss X2
今週と来週の末は両方とも大忙しなので、今週末の夕方にブラっと行ってみようかな。
《続きを読む》
2010-03-28 Sun
自転車のバルブキャップが壊れてた
僕の自転車は BD-1 なのですが、その後輪のバルブキャップが壊れてました。バルブキャップは自転車のタイヤに空気を補充したあとで締めるキャップです。
from overlast using Panasonic DMC-FX100
プラスチックのキャップの割に強く締めてしまっていたのかもしれません。パッカリと割れてしまい、どうしようもない感じです。後で調べてみたら、フレンチバルブのキャップは割れやすいのだとか。うーむ。
なんとかしないといけないな!と思い、引き出しから数年ぶりにアロンアルファを取り出して修理することを試みました。
from overlast using Panasonic DMC-FX100
が、アロンアルファを一回開封してから数年放置ちゃっていたので、中で固まってしまっていたんですよね。ガックリです。
しょうがないからセロテープでグルグルっと固めてやりました。
次は金属製のバルブキャップにすればいいのかな。ネットで調べたら数百円で買えるみたい。近所に自転車屋があるので、そこに買いにいってみよっと。
BD-1 Riese&muller BD-1 8speed Silver
[Amazonで詳細を見る]
# BD-1 かなり良いです。コンパクトになるので玄関にも無理矢理置けます。
2010-03-27 Sat
「南極料理人」の DVD をレンタルしました
近所の TSUTAYA で「南極料理人」の DVD をレンタルしてきました。自衛官が南極に強制赴任するお話。
南極料理人
[Amazonで詳細を見る]
ストーリーにはそんなに山や谷は無いのですが、食事と南極という極限の設定を通した人物描写がひたすら続きます。ちょっと悲しい出来事もあるけど、全編通して笑えるし、割と意外性のある終わり方。こういう映画は良いですね。何度でも見られます。
全編を通して、とにかく料理がおいしそうで仕方が無い。でも、誰も「おいしい」って言わないの。美味しいっていう言葉を言わないで伝わるって素敵。
見終わった後に満足感があったし、無性に海老フライとラーメンが食べたくなる映画でした。超オススメなので、見た事なかったら見てみて。音楽も良かったなぁ。
原作も読んでみたくなりました。
面白南極料理人
[Amazonで詳細を見る]
南極料理人 サウンドトラック
[Amazonで詳細を見る]
# Amazon で試聴できるみたい。
関連サイト
- 映画「南極料理人」オフィシャルサイト
-- http://nankyoku-ryori.com/
# すっごいおもしろいサイトデザイン!!
2010-03-27 Sat
全文検索エンジンの試作を始めました
2週間くらい前から全文検索エンジンの試作を始めました。将来的には検索と文字列処理と関連性がらみの処理を乗せたいです。
from overlast using Panasonic DMC-FX100
まだ、indexer と sercher しかないものの一応、転置index で N-gram indexの作成と、N-gram検索はできるようになっています。
今は、indexer 用に posting list の圧縮アルゴリズムを、教科書を見ながら一つずつ実装しているところです。
実際に公開するまでには壁が沢山ありそうですが、ちゃんと作って公開しようと思っています。というか、自分で使いたいのです。だから作っています。
開発は一貫して Perl で試作して、それを C に置き換えることを繰り返しています。Perl の柔軟性は勉強や試作には最適です。どこまで Perl でいけるのかな。もうすでに Perl では処理時間がかかりすぎる状態にはなっていますが、いけるとこまで両方の言語で作っていきます。
# 仮想コードがちゃんと存在してる場合は python の方が良いかなと思いますが。
やっている事がまとまって来た部分はブログに書くようにします。まとまらない間は Twitter でダラダラ書いていきます。
- Toshinori Satou (overlast) on Twitter
-- http://twitter.com/overlast
ところで何で検索エンジンなのか、ということですが、無理矢理一言でまとめると『「興味がある範囲の自然言語処理」と「柔軟な検索機能」というのが切っても切り離せないものだから』です。大小さまざまな検索エンジンの周りをラッピングすることは、この2年で沢山やったので、そろそろ自分でコア部分を積み上げたいなと思ったのです。
やる必要のあることが膨大ですが、自分が学んだことを定着する意味でも良いかなと思っています。全く飽きのこない分野なので、そのうちアウトプットは出ることでしょう。さてさて、どうなりますかね。
関連書籍
Introduction to Information Retrieval


[Amazonで詳細を見る]
Managing Gigabytes: Compressing and Indexing Documents and Images


[Amazonで詳細を見る]
WEB+DB PRESS Vol.55


[Amazonで詳細を見る]
WEB+DB PRESS Vol.53


[Amazonで詳細を見る]
WEB+DB PRESS Vol.49


[Amazonで詳細を見る]
2010-03-26 Fri
高さ6メートルの巨大ショートケーキ
いつの間にか出現した巨大なケーキのオブジェ前で、記念撮影をする人が多いです。こんなに撮影してもらえたら制作者の人も大喜びだろうなぁ。ぐりとぐらの巨大パンケーキってこんな感じなのかな?
from overlast using Panasonic DMC-FX100
製作中は鉄骨のフレームがむき出しになっていて、それはそれで感じるものがありました。こうしてケーキな見た目になると、その内側がどうなっているのか想像もつかない感じです。
実はこのケーキのクリーム部分はフワフワな素材です。スポンジ + シリコンで出来てるのだとか。子供が大喜びで蹴りまくっていたのが印象的でした。
ぐりとぐら
[Amazonで詳細を見る]
関連記事
- 6mの「巨大いちごショート」 ミッドタウンに出現! : J-CASTモノウォッチ
-- http://www.j-cast.com/mono/2010/03/14061869.html
2010-03-26 Fri
これから先の3ヶ月の予定を眺めてみた
今日は、この先 3 ヶ月の予定を立てる日。後で見返したいからちょっとだけ日記に書いておこう。
予定なんて埋めようと思わなくても埋まってしまいます。実際の内容は伏せますが、大雑把に以下のような割合になりそう。
ものかき | 10% |
人格強制 | 10% |
説明書づくり | 5% |
パフォーマンスガイド | 5% |
道路工事 | 20% |
飛び込み営業 | 10% |
保守点検 | 15% |
実験 | 10% |
13714 | 15% |
研究や開発の余地はほぼ無いっすね。ということで実験が楽しみ。
気の効いた書籍が一切思い浮かばないっすね。
2010-03-26 Fri
今日は朝から雨が降ったりやんだり
今日は朝から雨が降って、やんで、降って、やんで、、、と全然スッキリしないお天気でした。このときは丁度やんでるとき。
from overlast using Panasonic DMC-FX100
一回暖かくなって、また寒くなったので、次に暖かくなったら一気に暖かくなりますね。どこかでお花見したいなぁ。
2010-03-25 Thu
直感的に一小節分の作曲を楽しめる「inudge」
「inudge」というお手軽に作曲を楽しめるサイトを試していました。かなり直感的なUIで、扱える長さが一小節分だけという割り切りが素敵。
- inudge
-- http://www.inudge.net/index.en.html
早速何か作ってみることにして10分ほど弄くって、以下のようなフレーズを作ってみました。直感的に音を作れるのでついつい音がしまいがち。なので、音数を減らすことを意識すると狙ったメロディを作れると思います。
うーん、もっと音を減らしてもいいかも。
作ったメロディは上のようにブログに貼ったり、Twitterで共有したりできるので、遊んでみるといいかも。
大学の学部生までは DTM ソフトで作曲してたのですが、この数年は全然やってなかったな。当時は、Cubase のめっちゃ古いやつ使ってた気がするなぁ。やっぱ音楽は楽しいから好きだな。
Cubase 5
[Amazonで詳細を見る]
2010-03-25 Thu
2009 年度が一区切り
昨日で 2009 年度が一区切りしました。今年度は最高な出来事と最低な出来事が入り交じっており、良くも悪くも公私ともに思い出深い年度でした。
この 1 ヶ月はかなり迷走していましたが、今日になって、なんとか向く方向を見定めることが出来ました。まずは、ちょっと無理っぽいところから手をつけます。
今月からは、しばらくそのための準備をします。
考えている事は、なるべくブログにアウトプットします。ちゃんと書いて後で見直したいな。あとは、この1ヶ月のブログ記事も未整理ですが、断片と写真は沢山あるので過去に戻りながら埋めていきたいな。さて、寝る。
2010-03-20 Sat
ブラブラ散歩
午後までゆったりと体を休めて、夕方になってからブラブラと散歩のため外出。近所に目をひいた花があったのでパチリ。
from overlast using Canon EOS Kiss X2
こういう感じの花が好き。もうちょっと手入れできる気もするけど。
このあと散歩は渋谷方面へ。
2010-03-06 Sat
技術とノウハウのバランス
技術を選択する際に考慮する際の要素のひとつに「ノウハウ」があります。
技術の選択にノウハウの有無が絡むケースに出会うことは、僕にもありました。たとえば以下のような場合。
- 「すでに内部にノウハウがある」という理由で、より優れた技術をさておき、既知の技術を選ぶ
- より優れた技術を「ノウハウがゼロ」の状態から、開拓ながら使うことを選ぶ
僕はどちらかというと、技術検証をして状況ごとにもっとも優れた選択肢を探し出すスタイルが好きです。
検証した結果、優れているが実用性が欠けている技術だと分かった場合は、実用性を上げる施策をおこなうことで実用化することを選ぶことを好みます。
でも現実には、ありものの技術を使い、既存のノウハウを使い回し、コスト最小で切り抜けなければいけない状況にも多く出会います。
では、どうすればいいのか、ということを考えると、いつでも「少しずつ試したことが無いことを試して技術やノウハウを蓄積する」のに越したことが無いという結論に至ります。