2009-11-05 Thu

今日も朝が寒い

昨日に引き続き、今朝もたいへん寒いです。手袋が欲しいくらいです。上着は完全に真冬用のものじゃないと外出できません。


from overlast using Panasonic DMC-FX100

僕はすでに風邪をひいていますけど、みなさんもお気をつけください。

投稿者:としのり  日時:23:59:59 | コメント | トラックバック |

2009-11-04 Wed

論文探しに使う学会リスト

WEB+DB PRESS Vol.53 に載っていた岡野原さんによるサーチエンジン特集の最後の最後に、関連する学会リストが載っていました。

WEB+DB PRESS Vol.53

[Amazonで詳細を見る]


僕がまったく見ていない学会もリストにあったのでメモメモ。

あと、DO++: 自然言語処理の学会をマージしました。

- 検索全般
-- SIGIR TREC WWW WSDM CIKM

- 索引手法
-- SPIRE DCC SEA ALENEX CPM

- ランキング
-- ICML NIPS

- 自然言語処理
-- ACL EMNLP CoNLL Coling NAACL EACL IJCNLP LREC HLT HPSG IWPT MT_Summit TMI

- データベース
-- SIGMOD VLDB

- マイニング
-- KDD ICDM SDM

- 人工知能
-- AAAI IJCAI

- 会社
-- Google Labs
-- Yahoo! Research
-- Microsoft Research


読み物には永遠に困ら無さそうです。

関連リンク


- ACL Anthology
-- http://aclweb.org/anthology-new/
- WhatToSee
-- http://www.cs.utah.edu/~hal/WhatToSee/
- 機械学習/機械学習の論文を探す - とうごろうぃき
- DO++: いろんな学会
-- http://hillbig.cocolog-nifty.com/do/2008/05/post_e58f.html
- DO++: 自然言語処理の学会
-- http://hillbig.cocolog-nifty.com/do/2008/04/post_fe44.html

投稿者:としのり  日時:23:59:59 | コメント | トラックバック |

2009-11-04 Wed

Opinion mining and sentiment analysis(意見マイニングと評判分析)というサーベイ論文

なんかあんまり日本語の言及が無いですけど、「Opinion mining and sentiment analysis」というサーベイ論文が書籍化されていて、おまけにその内容が無料で閲覧できるようになっています。

- Opinion mining and sentiment analysis (survey)
-- http://www.cs.cornell.edu/home/llee/opinion-mining-sentiment-analysis-survey.html

Bo Pang and Lillian Lee
Foundations and Trends in Information Retrieval 2(1-2), pp. 1–135, 2008.
Also available as a book or e-book.


1601981503

[Amazonで詳細を見る]


日本人なら乾孝司さんの文献を先に読むのが良いと思います。

- テキストを対象とした評価情報の分析に関する研究動向, 乾孝司, 奥村学
-- http://www.cisr.iri.titech.ac.jp/~inui/paper/nlp2006-survey.pdf
- blogマイニングと評判分析, 奥村学, 乾孝司
-- http://www.mibel.cs.tsukuba.ac.jp/~inui/paper/nlp2006-tutorial.ppt

2006年から後の動きを追うときや、乾さんの文献に書いてないことを補うときには「Opinion mining and sentiment analysis」な気がします。

両論文とも問題点や課題が整頓されているので、読んでいると視野が広がる感じがして好きです。

その他の文献や記事は「評判分析」とかで検索すると、ザクザク出てくるので、その文献の参考文献を探すのも良いのでは。

関連リンク


- 乾孝司
-- http://www.mibel.cs.tsukuba.ac.jp/~inui/

投稿者:としのり  日時:23:59:59 | コメント | トラックバック |

2009-11-03 Tue

11月に買おうと思ってたものを買い物

11月になったら買おうと思ってたものを買いました。

ユニクロのヒートテック長袖シャツ。


去年買おうと思ったときには既に春だったので、来年買うぞと思っていたヒートテック長袖シャツを購入。


from overlast using Panasonic DMC-FX100

薄手と厚手があったので1つづつ購入。具合が良かった方を買い増すことにします。
それにしてもユニクロ混み過ぎ。

ほぼ日手帳2010


おととしから使い始めて、去年から使えるようになったほぼ日手帳。
かなり重宝しているので今年も購入。


from overlast using Panasonic DMC-FX100

カバーは2009年のを使い回します。
想定外なことに、カバー用カバーは売り切れていたのです。人気なんですね。

その他


他は書店で確定申告系の書籍を眺めたり、靴屋で好みの靴を探したりしました。

関連リンク


- ユニクロ ヒートテック - ユニクロオンラインストア[store.uniqlo.com]
-- http://store.uniqlo.com/jp/CSaDisp/Mheattech
- ほぼ日刊イトイ新聞 - ほぼ日ストア
-- http://www.1101.com/store/index.html

投稿者:としのり  日時:23:59:59 | コメント | トラックバック |

2009-11-03 Tue

2009年11月のコレが欲しい

今月から欲しいものリストのうち、別に公開しても誰にも迷惑にならないことをメモしときます。

欲しいモノがありすぎて、頭の中に無数の欲しいモノが出てくるので書いておこうかなと。

随時追記して、消化できなかったものは次の月に繰り越し、いらないものは消します。はい。

電化製品


- 20091107 : なんらか安くて小さいノートパソコン

ガジェット


- 20091107 : Canon の一眼レフカメラにくっつける広角レンズ。

生活用品


- 20091103 : ポーレックスのセラミックミル
- 20091103 : UNIFLAMEコーヒーバネットとフィルター
- 20091103 : デバイススタイル マイクロパウダーセパレーター

書籍


- 20091106 : 本質の研究 数学**
-- 高校のころの数学でスッポ抜けた分野を補いたくなってきた




とりあえず自宅でコーヒー入れたいなと思ったのですが、
買うものを選ぶときに、商品名が長過ぎてスムーズに情報を探せないので、メモろうかなと思ったのでした。

投稿者:としのり  日時:23:59:59 | コメント | トラックバック |

2009-11-03 Tue

2009年11月のココに行きたい

今月から行きたい場所リストのうち、別に公開しても誰にも迷惑にならないことをメモしときます。

自分の寿命を考えると、あと30年くらいしか生きられない気がするし、そうすると初詣はあと30回しか行けないんですよ。
なので、行きたい場所は全部行くぞと思ったのでした。

随時追記して、消化できなかったものは次の月に繰り越します。はい。

ご飯


- 20091107 : 恵比寿 あいびき
-- 横を頻繁にとおっているけど、かならずおいしそう。

観光


- 20091103 : 伊豆大島あたり

社会見学


- 20091103 : 羽田空港のジャンボ機整備

ハイキング


- 20091103 : 奥多摩にある山のうちどれか(曖昧)




まだ、ちょっとしか溜まってないすね。これからこれから。

そこなら自分も行く!という方はTwitterで声をかけてくだっさい。

投稿者:としのり  日時:23:59:59 | コメント | トラックバック |

2009-11-03 Tue

リセット再起動

大分ブログ書いていませんでしたが、[2009-10-09]以降は忙しくしていました。
あと、季節の変わり目にバッチリ体調を崩しました。

具体的に何をやっていたのかというと、書けることでは、

- 調べもの用の文献さがし
- 調べものをして、まとめ作業
- 虚脱感を伴い熱が出る風邪にかかったので、暇があればひたすら寝る
- MG勉強会#08の予習と、#06の復習資料作成
- 自宅の大掃除を 1/4 消化

をやっていました。

平日は割と自分のI/Oが一杯になるし、休みは体調は崩れて何か書く気にならないし、という1ヶ月でした。

新しいことを一気にやると、睡眠が沢山必要なのには驚きました。
落ち着いて寝られる日は、一度寝たら全然目が覚めず、目が覚めたら夕方なこともありました。

たぶん、この1年半で今月は一番良く寝たと思います(主に週末に)。

今月の半ばにまた忙しくなりそうですが、それまではTwitter以外の公開できる書き物をする時間を作れるといいな。

投稿者:としのり  日時:23:59:59 | コメント | トラックバック |

2009-11-02 Mon

自然言語処理は農業に似てるかも

自然言語処理と呼ばれる技術で問題を解いていて最近思うことは、
全く同じ問題に出会わないなぁ、ということです。

幸いなことに、ある程度似てる問題は頻繁に見つかります。
なんで完全に同じ解き方で解ける問題が見つかりにくいのでしょう。

それは、たぶん、人間が生み出す言語情報を扱っているため、だと思います。

自然言語処理技術では主にテキストデータを扱いますが、そのデータはどんなに自動生成的なデータでも、元々は人間が作ります。
たとえばブログサービス上では、膨大な量のブログ記事を多数の人間が各自が好きなように生成しています。

ユーザがどんな文章を書くか、どんな話題を扱い、どんなふうにカテゴリ分けするのかなどの要素は、
技術者がデータを処理する手法を選ぶ際に、必ず考慮するべきです。

ですが、これらの要素は事前にコントロールできません。
また、ある時点でダンプしたデータからも、なかなか傾向を完全に正確には見いだしにくいです。

そのため、各データについて、各時点における最も有効な手法を考案することは、毎回全然違う作業になりますし、僕の経験上では難しい(というか時間のかかる)作業です。

どうやったら、よりよく、より速く問題を解けるのでしょうか。

たぶん、沢山勉強をして、最新の情報を仕入れ続け、問題を解きまくる、しか無いと思います。

多くのタスクでは、形態素解析してtokenの頻度を合計して終わり、だけで欲しい結果を得られるケースは少ないと思います。
一方で大量のデータを眺めていると、人間は賢いので、自分の脳の中でデータが持っている傾向がつかめたりするものです。

そのため技術者・研究者が手法を考案する際には日々の鍛錬の成果と経験の量が大切になります。

なんとなく考案された手法の良さの良さは、
「手法の最適さ = α * log(経験量) + β * exp(鍛錬) 」
のようにになっている気がします。αとβには個人差があると思います。

10人の自然言語処理屋がいたら、たぶん10通りの解き方が生まれると僕は思います。
また、他人の選んだ手法が最適かどうかを考える能力も、同じように個人差があると思います。

こういう設定って、農業にすごく似ているなと僕は思っています。(細かいことは全部省きます)

個人的にはexpの跳ね上がる瞬間をまだ経験できていない気がします。
今後も、良い出力結果を得るために努力を続けていかないとな。。

投稿者:としのり  日時:23:59:59 | コメント | トラックバック |

2009-11-02 Mon

Mac OS X 上で MikuInstaller.app と Wine を使って Windows アプリを起動

増田で人気な記事で紹介されている P-Study System という Windows アプリを Mac OS X 上で動かしてみたいと思ったので、動かしてみました。

- 急がばまわれ式・堅実で一番効率的な英語の勉強法
-- http://anond.hatelabo.jp/20091026215137

2. 単語の習得は、P-Study Systemという無料のソフトウェアが超おすすめ。
http://www.takke.jp/
このソフトウェアは神、いわゆるゴッド。
忘却曲線理論とやらを参考にしていて、ゲーム感覚で効率的に単語が身に着くソフト。


起動方法は、Wine を一回も試したことがなかったので起動する手法を Wine に決定!
Wine をそのまま使わずに、MikuInstallerを使う事にしました。

- MikuInstaller
-- http://mikuinstaller.sourceforge.jp/


用意するアプリはP-Study Systemじゃなくても良いです。
僕も、数種類のアプリを試しました。
その中で、とあるVB6のランタイムに依存してるアプリを起動出来ませんでした。
いろいろ試したのですが、何か足りないみたいなのです。。。
なので、最初はVB6ランタイムに依存してないアプリで試してみて下さい。

必要なもの


- MikuInstaller.app
-- 公式ページで配布しているMikuInstallerは2008年から更新が停止している。そのためWineのバージョンが大分古い。
-- 今回は公式配布のMikuInstallerの最新版に組み込まれているWineを、バージョンが新しめのWineに置換している野良パッケージを使った。

- MikuinstallerのDarwineをアップグレードしてみる(その2) - 鍵屋的日記(鍵屋のブログ)
-- http://d.hatena.ne.jp/kagiya/20090813
S&S 2009/10/07 20:19
またまた返信が送れてしまってすいません。
ご返事のありがとうございます。
その更新したファイルは(http://firestorage.jp/d/2cyjc3)の方にありますのでぜひダウンロードしてください。


- Windows 上でインストールした P-Study System のフォルダ
-- http://www.takke.jp/

インストールと起動の手順(アバウトに)


- 事前にX11をインストールしておく
- MikuInstaller.appをアプリケーションフォルダに放り込む
- MikuInstaller.appをダブルクリック → Wineが入ってMikuInstaller経由でWineと関連づく
- 起動したいWindowsアプリ or インストーラーがWineと関連付いていることを確認する
- 起動したいWindowsアプリ or インストーラーをダブルクリックして起動する
- 以下は普通のWindowsアプリと同じ

アプリによって、上手にインストーラーが動く場合と動かない場合があります。
また、Windowsでアプリをインストールしたフォルダを丸まるコピーしたのに上手く動かない場合があります。

いろいろ原因があるみたいですが、以下を試してみるのが解決に向けた最初の手だと思います。
P-Study System は Wine でインストールできないし、解凍してコピーするだけでは起動できないし、という状態でした。

インストーラーが上手に動かない or アプリの起動時に何かが足りないと言われる場合にやること(アバウトに)


-- Windowsで、目的にアプリをインストールする
-- アプリを一回起動して、必要なファイルやフォルダを生成する
-- アプリがインストールされたフォルダを丸ごとMacにコピーする

上記のようなことをやると、Leopard では P-Study System が動きました。やった!


from overlast

今後もどうしてもWindowsアプリを起動する必要があるときは、Wineを試してみようと思います。

でも、使ってみたところ、Wine は万人にオススメできる解決方法ではないですね。。

難しいことが苦手な方には VMware Fusion を購入して Windows をインストールした環境を作ることをオススメします。
VMwareなら一回インストールできてしまえば、ほとんどトラブルが無いと思います。

投稿者:としのり  日時:23:59:59 | コメント | トラックバック |

2009-11-02 Mon

起きたら昼過ぎ

週末に取れなかった疲れがドっと出たためか、昼過ぎまで全く目覚めず寝たのでした。

外に出てみたら、もうこんなに空が暗くて脱力。


from overlast using Panasonic DMC-FX100

こういう日は極力減らしたいし、風邪はほとんど治ったので、
今日を境に気合いを入れ直します。

投稿者:としのり  日時:23:59:59 | コメント | トラックバック |

2009-11-01 Sun

雨が止まない

雨が止まないので渋谷から帰れないなぁ、と思っていたのですが、30分くらいTSUTAYAにいたら霧雨くらいになってくれました。


from overlast using Panasonic DMC-FX100

日曜日で雨の0時台っていうのは、交差点がこんなにガラガラするんですね。。。

投稿者:としのり  日時:23:59:59 | コメント | トラックバック |

2009-11-01 Sun

映画 サマーウォーズ

もう秋ですし、冬寸前ですが、サマーウォーズを見てきました。

細かいことは抜きにして、僕はサマーウォーズ好きです。また見たいです。

サマーウォーズ完全設定資料集

[Amazonで詳細を見る]

サマーウォーズ オリジナル・サウンドトラック

[Amazonで詳細を見る]


関連リンク


- 映画「サマーウォーズ」公式サイト
-- http://s-wars.jp/index.html

投稿者:としのり  日時:23:59:59 | コメント | トラックバック |

2009-11-01 Sun

すごい風と銀杏と

今日はすごい風で、本当に人が吹き飛ばされたり、自転車に乗っている人が倒れたりしました。


from overlast using Panasonic DMC-FX100

ふと、新宿で足下を見ると、銀杏がボタボタ落ちていました。


from overlast using Panasonic DMC-FX100

上を見上げると、すごく立派な銀杏の木。


from overlast using Panasonic DMC-FX100

休日にデータサイズがどうのこうのと頭を悩ませていて、何をやっているのか悩みかけたりしましたが、このくらいドーンとしてないと駄目だよなぁと思ったのです。

投稿者:としのり  日時:23:59:59 | コメント | トラックバック |

2009-11-01 Sun

バイドゥからバイドゥ飴をいただきました

バイドゥのモバイル検索の公開にあわせて作られたらしいバイドゥ飴をいただきました。
# もらってから、すっかり忘れていました。


from overlast using Panasonic DMC-FX100

「サービスローンチ!」→「宣伝しよう!」→「飴とシールをつくろう!」という発想が素敵。

せっかくなのでバイドゥ画像検索を使ってみたら、MacのChromeで見たら検索結果がガタガタに。ゲンナリ。

- http://image.baidu.jp/i?tn=baiduimage&ct=201326592&cl=2&lm=-1&s=10&word=松岡修造&sub=hotimage


そのうち直るかな。

動画検索は普通に使えましたし便利でした。

バイドゥ


- Baidu(バイドゥ)
-- http://www.baidu.jp/

投稿者:としのり  日時:23:59:59 | コメント | トラックバック |

2009-10-09 Fri

つらいのよ

何もそこで寝なくてもと思いますが、事情があるんですね。


from overlast using Panasonic DMC-FX100

仲が良いですなぁ。

投稿者:としのり  日時:23:59:59 | コメント | トラックバック |

2009-10-09 Fri

今日は秋空

昨日は真っ青だった空が、今日は一転して秋っぽい空になりました。


from overlast using Panasonic DMC-FX100

そういえば、もう10月半ばなんですよね。
カレンダーをみて愕然としました。はあ。

投稿者:としのり  日時:23:59:59 | コメント | トラックバック |

2009-10-08 Thu

台風が通り過ぎて晴天に

台風はお昼前に通り過ぎたみたいで、風は強かったけど、なんとか雨は止んでいました。


from overlast using Panasonic DMC-FX100

お昼過ぎにはすっかり青空。よかったよかった。



友人の家が雨漏りしたり、浸水したり、看板が飛んで来たりと、ちょっと心配なことが多かったですが大事がなくて何よりでした。

投稿者:としのり  日時:23:59:59 | コメント | トラックバック |

2009-10-08 Thu

Google Chrome にブックマークレットを追加してみる

Google Chrome に FireFox で良く使っていたブックマークレットを追加してみます。

ブックマークバーの表示


Windows の場合は Shift + Ctrl + B を押すと表示され、
Mac の場合は Shift + Command + B を押すと表示される。

ブックマークバーが表示されると、編集と削除が楽になる。

ブックマークレットの追加


1. ブックマークレットバーを右クリックして、「Add Page」をクリックします。
2. 編集できるようになるので、上にタイトル、下にJavaScriptのコードになるように入力して、OKボタンを押すと良いです。

ブックマークレットの例


1. WebサイトのタイトルとURLを取得するブックマークレット
- 今見ているページのタイトルと URL をプロンプトに表示するブックマークレット。改行コードは環境により\nか\rかが変わります。

javascript:var url=location.href;var title=document.title;var code ="- "+title+"\r-- "+url+"\r";var x = prompt('',code);


2. flickrのMediumなサムネイル取得
- 例えば「http://www.flickr.com/photos/overlast/3990772539/」のようなページでChangeLogメモに貼付けるためのコードを出力するブックマークレット。
改行コードは環境によって\nか\rかが変わります。


javascript:var photosrc = document.evaluate("//img[@class='reflect']",document, null, XPathResult.FIRST_ORDERED_NODE_TYPE,null).singleNodeValue.src.replace(/\.[^\.]+$/, '_m.jpg'); var phototitle = document.evaluate("//h1",document, null, XPathResult.FIRST_ORDERED_NODE_TYPE,null).singleNodeValue.innerHTML;var widget = document.evaluate("//div[@class='Widget']",document, null, XPathResult.FIRST_ORDERED_NODE_TYPE,null).singleNodeValue;var userstream = /href="(\S+)"/.exec(widget.innerHTML)[1];usernick = /<b .*?>(.+)<\/b>/.exec(widget.innerHTML)[1];var photoid = document.location.href.split('/')[5];var photolink = 'http://flickr.com' + userstream + photoid + '/';var userlink ='http://flickr.com' + userstream.replace(/\/photos\//,'/people/');var camerainfo = document.evaluate("//ul/li[@class='Stats']/a[@class='Plain']", document, null, XPathResult.FIRST_ORDERED_NODE_TYPE, null).singleNodeValue.innerHTML;if (camerainfo.length > 5) { camerainfo = ' using ' + camerainfo; }; var code = "\r" + '<a title="' + phototitle + '" href="' + photolink + '"><img src="' + photosrc + '" /></a>' +"\r" + '<br />from <a href="' + userlink + '">' + usernick + '</a>' + "\r";var x = prompt('',code);



改行コードの扱い

Mac 用の Chrome はブックマークレット内の改行コードを"\r"にしないと正常に改行されませんでした。

関連リンク


- Google Chrome : ヘルプ - ブックマークの管理
-- http://www.google.com/support/chrome/bin/answer.py?hl=jp&answer=95714

投稿者:としのり  日時:23:59:59 | コメント | トラックバック |

2009-10-08 Thu

台風、まだ通過してなかった

朝の時点では、まだ台風は通過していませんでした。

外は、凄い風と叩き付けるような雨、かと思ったら、しばらく暴風がだけだったりで不安定すぎるお天気です。

20091008_amesh 20091008_tenkijp

何時に家を出ようかな。。。

投稿者:としのり  日時:23:59:59 | コメント | トラックバック |

2009-10-07 Wed

FireFox から Google Chrome に乗り換えると 1 年間で 6 時間以上節約できるかも

FireFox を使っていると FireFox のプロセスがメモリを食いまくったり、CPU 使用率が常に 100 %近くになったりしますよね。

2009-10-08_0044

こまめにタブを閉じていれば問題は起こらない可能性がありますが、ブラウザのタブが気がついたら 50 個くらいになってしまう僕は、毎日1回か2回くらい再起動することになるのです。

FireFox は僕の MacBook で一回の再起動に短くて 1 分程度かかっているのですが、これを 1 年間毎日続けていたら、

1分 * 365日 = 365分 ≒ 6時間

程度かかってしまいます。

6時間という時間は非常に長いですし、実際にFireFoxを再起動すると 1分で再起動が終わらないこともしばしばあります。
僕は死ぬまでに何日間 FireFox を再起動しなければいけないのでしょうか。
僕はそんなことはどうでもいいんです。6時間とか後付けです。

何が言いたいかというと 「Google Chrome がすばらしい」ということです。速い。CPU 使用率がかなり低い。

まだ何ヶ月も使っているわけではないですし、FireFox で気に入って使っていたアドオンが無かったりで、いろいろ違いに戸惑いますが少なくとも CPU 使用率が100%近くになって MacBook のファンが永遠にグルグル回りつづけることが減った気がします。

仮に年間の再起動率が半分になるだけで3時間近く得するのかとボンヤリ考えたら、「もうFireFoxからChromeに乗り換えよう」と迷わず決意することができました。

20091007_chrome

Google Chrome は最近ではMacでもちゃんと日常使いができるようになりました。
個人的には、Flash Player と Autopagerize が入れば後は何とかなるので乗り換えを躊躇する必要はなかったです。

20091007_sunred 20091007_autopagerize

フォントの選択や、タブの挙動がコントロールしやすいと、もっと使いやすくなるな、と思いました。あと、時々描画がバグるのがカワイイです。そのうち修正されると思いますけど。

「あー、なんで FireFox にあるのに Chrome にないの?」とカッとしたときには、Chrome 用の拡張を書くか、ブックマークレットを書いてなんとかする必要がありますね。

何かやったときには記事を書くようにします。

関連リンク


- Google Chrome
-- http://www.google.com/chrome/

- Autopagerize
-- http://autopagerize.net/

- AutoPager extension for Google Chrome ver 0.1
-- http://os0x.g.hatena.ne.jp/os0x/20090507/1241698956
--- 拡張を書く際の参考になる

- Chrome Extension Packaging Script
-- http://d.hatena.ne.jp/Constellation/20090708/1247007187

- 被はてなブックマーク数を表示するGoogle Chrome拡張書いた。
-- http://mattn.kaoriya.net/software/chrome/20090902225759.htm
--- 欲しいなと思ったらあった。mattn++

投稿者:としのり  日時:23:59:59 | コメント | トラックバック |