2009-11-04 Wed
Opinion mining and sentiment analysis(意見マイニングと評判分析)というサーベイ論文
なんかあんまり日本語の言及が無いですけど、「Opinion mining and sentiment analysis」というサーベイ論文が書籍化されていて、おまけにその内容が無料で閲覧できるようになっています。
- Opinion mining and sentiment analysis (survey)
-- http://www.cs.cornell.edu/home/llee/opinion-mining-sentiment-analysis-survey.html
Foundations and Trends in Information Retrieval 2(1-2), pp. 1–135, 2008.
Also available as a book or e-book.
1601981503


日本人なら乾孝司さんの文献を先に読むのが良いと思います。
- テキストを対象とした評価情報の分析に関する研究動向, 乾孝司, 奥村学
-- http://www.cisr.iri.titech.ac.jp/~inui/paper/nlp2006-survey.pdf
- blogマイニングと評判分析, 奥村学, 乾孝司
-- http://www.mibel.cs.tsukuba.ac.jp/~inui/paper/nlp2006-tutorial.ppt
2006年から後の動きを追うときや、乾さんの文献に書いてないことを補うときには「Opinion mining and sentiment analysis」な気がします。
両論文とも問題点や課題が整頓されているので、読んでいると視野が広がる感じがして好きです。
その他の文献や記事は「評判分析」とかで検索すると、ザクザク出てくるので、その文献の参考文献を探すのも良いのでは。
関連リンク
- 乾孝司
-- http://www.mibel.cs.tsukuba.ac.jp/~inui/
2009-11-03 Tue
11月に買おうと思ってたものを買い物
11月になったら買おうと思ってたものを買いました。
ユニクロのヒートテック長袖シャツ。
去年買おうと思ったときには既に春だったので、来年買うぞと思っていたヒートテック長袖シャツを購入。
from overlast using Panasonic DMC-FX100
薄手と厚手があったので1つづつ購入。具合が良かった方を買い増すことにします。
それにしてもユニクロ混み過ぎ。
ほぼ日手帳2010
おととしから使い始めて、去年から使えるようになったほぼ日手帳。
かなり重宝しているので今年も購入。
from overlast using Panasonic DMC-FX100
カバーは2009年のを使い回します。
想定外なことに、カバー用カバーは売り切れていたのです。人気なんですね。
その他
他は書店で確定申告系の書籍を眺めたり、靴屋で好みの靴を探したりしました。
関連リンク
- ユニクロ ヒートテック - ユニクロオンラインストア[store.uniqlo.com]
-- http://store.uniqlo.com/jp/CSaDisp/Mheattech
- ほぼ日刊イトイ新聞 - ほぼ日ストア
-- http://www.1101.com/store/index.html
2009-11-03 Tue
2009年11月のコレが欲しい
今月から欲しいものリストのうち、別に公開しても誰にも迷惑にならないことをメモしときます。
欲しいモノがありすぎて、頭の中に無数の欲しいモノが出てくるので書いておこうかなと。
随時追記して、消化できなかったものは次の月に繰り越し、いらないものは消します。はい。
電化製品
- 20091107 : なんらか安くて小さいノートパソコン
ガジェット
- 20091107 : Canon の一眼レフカメラにくっつける広角レンズ。
生活用品
- 20091103 : ポーレックスのセラミックミル
- 20091103 : UNIFLAMEコーヒーバネットとフィルター
- 20091103 : デバイススタイル マイクロパウダーセパレーター
書籍
- 20091106 : 本質の研究 数学**
-- 高校のころの数学でスッポ抜けた分野を補いたくなってきた
とりあえず自宅でコーヒー入れたいなと思ったのですが、
買うものを選ぶときに、商品名が長過ぎてスムーズに情報を探せないので、メモろうかなと思ったのでした。
2009-11-03 Tue
2009年11月のココに行きたい
今月から行きたい場所リストのうち、別に公開しても誰にも迷惑にならないことをメモしときます。
自分の寿命を考えると、あと30年くらいしか生きられない気がするし、そうすると初詣はあと30回しか行けないんですよ。
なので、行きたい場所は全部行くぞと思ったのでした。
随時追記して、消化できなかったものは次の月に繰り越します。はい。
ご飯
- 20091107 : 恵比寿 あいびき
-- 横を頻繁にとおっているけど、かならずおいしそう。
観光
- 20091103 : 伊豆大島あたり
社会見学
- 20091103 : 羽田空港のジャンボ機整備
ハイキング
- 20091103 : 奥多摩にある山のうちどれか(曖昧)
まだ、ちょっとしか溜まってないすね。これからこれから。
そこなら自分も行く!という方はTwitterで声をかけてくだっさい。
2009-11-03 Tue
リセット再起動
大分ブログ書いていませんでしたが、[2009-10-09]以降は忙しくしていました。
あと、季節の変わり目にバッチリ体調を崩しました。
具体的に何をやっていたのかというと、書けることでは、
- 調べもの用の文献さがし
- 調べものをして、まとめ作業
- 虚脱感を伴い熱が出る風邪にかかったので、暇があればひたすら寝る
- MG勉強会#08の予習と、#06の復習資料作成
- 自宅の大掃除を 1/4 消化
をやっていました。
平日は割と自分のI/Oが一杯になるし、休みは体調は崩れて何か書く気にならないし、という1ヶ月でした。
新しいことを一気にやると、睡眠が沢山必要なのには驚きました。
落ち着いて寝られる日は、一度寝たら全然目が覚めず、目が覚めたら夕方なこともありました。
たぶん、この1年半で今月は一番良く寝たと思います(主に週末に)。
今月の半ばにまた忙しくなりそうですが、それまではTwitter以外の公開できる書き物をする時間を作れるといいな。
2009-11-02 Mon
自然言語処理は農業に似てるかも
自然言語処理と呼ばれる技術で問題を解いていて最近思うことは、
全く同じ問題に出会わないなぁ、ということです。
幸いなことに、ある程度似てる問題は頻繁に見つかります。
なんで完全に同じ解き方で解ける問題が見つかりにくいのでしょう。
それは、たぶん、人間が生み出す言語情報を扱っているため、だと思います。
自然言語処理技術では主にテキストデータを扱いますが、そのデータはどんなに自動生成的なデータでも、元々は人間が作ります。
たとえばブログサービス上では、膨大な量のブログ記事を多数の人間が各自が好きなように生成しています。
ユーザがどんな文章を書くか、どんな話題を扱い、どんなふうにカテゴリ分けするのかなどの要素は、
技術者がデータを処理する手法を選ぶ際に、必ず考慮するべきです。
ですが、これらの要素は事前にコントロールできません。
また、ある時点でダンプしたデータからも、なかなか傾向を完全に正確には見いだしにくいです。
そのため、各データについて、各時点における最も有効な手法を考案することは、毎回全然違う作業になりますし、僕の経験上では難しい(というか時間のかかる)作業です。
どうやったら、よりよく、より速く問題を解けるのでしょうか。
たぶん、沢山勉強をして、最新の情報を仕入れ続け、問題を解きまくる、しか無いと思います。
多くのタスクでは、形態素解析してtokenの頻度を合計して終わり、だけで欲しい結果を得られるケースは少ないと思います。
一方で大量のデータを眺めていると、人間は賢いので、自分の脳の中でデータが持っている傾向がつかめたりするものです。
そのため技術者・研究者が手法を考案する際には日々の鍛錬の成果と経験の量が大切になります。
なんとなく考案された手法の良さの良さは、
「手法の最適さ = α * log(経験量) + β * exp(鍛錬) 」
のようにになっている気がします。αとβには個人差があると思います。
10人の自然言語処理屋がいたら、たぶん10通りの解き方が生まれると僕は思います。
また、他人の選んだ手法が最適かどうかを考える能力も、同じように個人差があると思います。
こういう設定って、農業にすごく似ているなと僕は思っています。(細かいことは全部省きます)
個人的にはexpの跳ね上がる瞬間をまだ経験できていない気がします。
今後も、良い出力結果を得るために努力を続けていかないとな。。
2009-11-02 Mon
Mac OS X 上で MikuInstaller.app と Wine を使って Windows アプリを起動
増田で人気な記事で紹介されている P-Study System という Windows アプリを Mac OS X 上で動かしてみたいと思ったので、動かしてみました。
- 急がばまわれ式・堅実で一番効率的な英語の勉強法
-- http://anond.hatelabo.jp/20091026215137
http://www.takke.jp/
このソフトウェアは神、いわゆるゴッド。
忘却曲線理論とやらを参考にしていて、ゲーム感覚で効率的に単語が身に着くソフト。
起動方法は、Wine を一回も試したことがなかったので起動する手法を Wine に決定!
Wine をそのまま使わずに、MikuInstallerを使う事にしました。
- MikuInstaller
-- http://mikuinstaller.sourceforge.jp/
用意するアプリはP-Study Systemじゃなくても良いです。
僕も、数種類のアプリを試しました。
その中で、とあるVB6のランタイムに依存してるアプリを起動出来ませんでした。
いろいろ試したのですが、何か足りないみたいなのです。。。
なので、最初はVB6ランタイムに依存してないアプリで試してみて下さい。
必要なもの
- MikuInstaller.app
-- 公式ページで配布しているMikuInstallerは2008年から更新が停止している。そのためWineのバージョンが大分古い。
-- 今回は公式配布のMikuInstallerの最新版に組み込まれているWineを、バージョンが新しめのWineに置換している野良パッケージを使った。
- MikuinstallerのDarwineをアップグレードしてみる(その2) - 鍵屋的日記(鍵屋のブログ)
-- http://d.hatena.ne.jp/kagiya/20090813
またまた返信が送れてしまってすいません。
ご返事のありがとうございます。
その更新したファイルは(http://firestorage.jp/d/2cyjc3)の方にありますのでぜひダウンロードしてください。
- Windows 上でインストールした P-Study System のフォルダ
-- http://www.takke.jp/
インストールと起動の手順(アバウトに)
- 事前にX11をインストールしておく
- MikuInstaller.appをアプリケーションフォルダに放り込む
- MikuInstaller.appをダブルクリック → Wineが入ってMikuInstaller経由でWineと関連づく
- 起動したいWindowsアプリ or インストーラーがWineと関連付いていることを確認する
- 起動したいWindowsアプリ or インストーラーをダブルクリックして起動する
- 以下は普通のWindowsアプリと同じ
アプリによって、上手にインストーラーが動く場合と動かない場合があります。
また、Windowsでアプリをインストールしたフォルダを丸まるコピーしたのに上手く動かない場合があります。
いろいろ原因があるみたいですが、以下を試してみるのが解決に向けた最初の手だと思います。
P-Study System は Wine でインストールできないし、解凍してコピーするだけでは起動できないし、という状態でした。
インストーラーが上手に動かない or アプリの起動時に何かが足りないと言われる場合にやること(アバウトに)
-- Windowsで、目的にアプリをインストールする
-- アプリを一回起動して、必要なファイルやフォルダを生成する
-- アプリがインストールされたフォルダを丸ごとMacにコピーする
上記のようなことをやると、Leopard では P-Study System が動きました。やった!
from overlast
今後もどうしてもWindowsアプリを起動する必要があるときは、Wineを試してみようと思います。
でも、使ってみたところ、Wine は万人にオススメできる解決方法ではないですね。。
難しいことが苦手な方には VMware Fusion を購入して Windows をインストールした環境を作ることをオススメします。
VMwareなら一回インストールできてしまえば、ほとんどトラブルが無いと思います。
2009-11-02 Mon
起きたら昼過ぎ
週末に取れなかった疲れがドっと出たためか、昼過ぎまで全く目覚めず寝たのでした。
外に出てみたら、もうこんなに空が暗くて脱力。
from overlast using Panasonic DMC-FX100
こういう日は極力減らしたいし、風邪はほとんど治ったので、
今日を境に気合いを入れ直します。
2009-11-01 Sun
雨が止まない
雨が止まないので渋谷から帰れないなぁ、と思っていたのですが、30分くらいTSUTAYAにいたら霧雨くらいになってくれました。
from overlast using Panasonic DMC-FX100
日曜日で雨の0時台っていうのは、交差点がこんなにガラガラするんですね。。。
2009-11-01 Sun
映画 サマーウォーズ
もう秋ですし、冬寸前ですが、サマーウォーズを見てきました。
細かいことは抜きにして、僕はサマーウォーズ好きです。また見たいです。
サマーウォーズ完全設定資料集

サマーウォーズ オリジナル・サウンドトラック


関連リンク
- 映画「サマーウォーズ」公式サイト
-- http://s-wars.jp/index.html
2009-11-01 Sun
すごい風と銀杏と
今日はすごい風で、本当に人が吹き飛ばされたり、自転車に乗っている人が倒れたりしました。
from overlast using Panasonic DMC-FX100
ふと、新宿で足下を見ると、銀杏がボタボタ落ちていました。
from overlast using Panasonic DMC-FX100
上を見上げると、すごく立派な銀杏の木。
from overlast using Panasonic DMC-FX100
休日にデータサイズがどうのこうのと頭を悩ませていて、何をやっているのか悩みかけたりしましたが、このくらいドーンとしてないと駄目だよなぁと思ったのです。
2009-11-01 Sun
バイドゥからバイドゥ飴をいただきました
バイドゥのモバイル検索の公開にあわせて作られたらしいバイドゥ飴をいただきました。
# もらってから、すっかり忘れていました。
from overlast using Panasonic DMC-FX100
「サービスローンチ!」→「宣伝しよう!」→「飴とシールをつくろう!」という発想が素敵。
せっかくなのでバイドゥ画像検索を使ってみたら、MacのChromeで見たら検索結果がガタガタに。ゲンナリ。
- http://image.baidu.jp/i?tn=baiduimage&ct=201326592&cl=2&lm=-1&s=10&word=松岡修造&sub=hotimage
そのうち直るかな。
動画検索は普通に使えましたし便利でした。
バイドゥ
- Baidu(バイドゥ)
-- http://www.baidu.jp/
2009-10-09 Fri
つらいのよ
何もそこで寝なくてもと思いますが、事情があるんですね。
from overlast using Panasonic DMC-FX100
仲が良いですなぁ。
2009-10-09 Fri
今日は秋空
昨日は真っ青だった空が、今日は一転して秋っぽい空になりました。
from overlast using Panasonic DMC-FX100
そういえば、もう10月半ばなんですよね。
カレンダーをみて愕然としました。はあ。
2009-10-08 Thu
台風が通り過ぎて晴天に
台風はお昼前に通り過ぎたみたいで、風は強かったけど、なんとか雨は止んでいました。
from overlast using Panasonic DMC-FX100
お昼過ぎにはすっかり青空。よかったよかった。
友人の家が雨漏りしたり、浸水したり、看板が飛んで来たりと、ちょっと心配なことが多かったですが大事がなくて何よりでした。
2009-10-08 Thu
Google Chrome にブックマークレットを追加してみる
Google Chrome に FireFox で良く使っていたブックマークレットを追加してみます。
ブックマークバーの表示
Windows の場合は Shift + Ctrl + B を押すと表示され、
Mac の場合は Shift + Command + B を押すと表示される。
ブックマークバーが表示されると、編集と削除が楽になる。
ブックマークレットの追加
1. ブックマークレットバーを右クリックして、「Add Page」をクリックします。
2. 編集できるようになるので、上にタイトル、下にJavaScriptのコードになるように入力して、OKボタンを押すと良いです。
ブックマークレットの例
1. WebサイトのタイトルとURLを取得するブックマークレット
- 今見ているページのタイトルと URL をプロンプトに表示するブックマークレット。改行コードは環境により\nか\rかが変わります。
javascript:var url=location.href;var title=document.title;var code ="- "+title+"\r-- "+url+"\r";var x = prompt('',code);
2. flickrのMediumなサムネイル取得
- 例えば「http://www.flickr.com/photos/overlast/3990772539/」のようなページでChangeLogメモに貼付けるためのコードを出力するブックマークレット。
改行コードは環境によって\nか\rかが変わります。
javascript:var photosrc = document.evaluate("//img[@class='reflect']",document, null, XPathResult.FIRST_ORDERED_NODE_TYPE,null).singleNodeValue.src.replace(/\.[^\.]+$/, '_m.jpg'); var phototitle = document.evaluate("//h1",document, null, XPathResult.FIRST_ORDERED_NODE_TYPE,null).singleNodeValue.innerHTML;var widget = document.evaluate("//div[@class='Widget']",document, null, XPathResult.FIRST_ORDERED_NODE_TYPE,null).singleNodeValue;var userstream = /href="(\S+)"/.exec(widget.innerHTML)[1];usernick = /<b .*?>(.+)<\/b>/.exec(widget.innerHTML)[1];var photoid = document.location.href.split('/')[5];var photolink = 'http://flickr.com' + userstream + photoid + '/';var userlink ='http://flickr.com' + userstream.replace(/\/photos\//,'/people/');var camerainfo = document.evaluate("//ul/li[@class='Stats']/a[@class='Plain']", document, null, XPathResult.FIRST_ORDERED_NODE_TYPE, null).singleNodeValue.innerHTML;if (camerainfo.length > 5) { camerainfo = ' using ' + camerainfo; }; var code = "\r" + '<a title="' + phototitle + '" href="' + photolink + '"><img src="' + photosrc + '" /></a>' +"\r" + '<br />from <a href="' + userlink + '">' + usernick + '</a>' + "\r";var x = prompt('',code);
改行コードの扱い
Mac 用の Chrome はブックマークレット内の改行コードを"\r"にしないと正常に改行されませんでした。
関連リンク
- Google Chrome : ヘルプ - ブックマークの管理
-- http://www.google.com/support/chrome/bin/answer.py?hl=jp&answer=95714
2009-10-08 Thu
2009-10-07 Wed
FireFox から Google Chrome に乗り換えると 1 年間で 6 時間以上節約できるかも
FireFox を使っていると FireFox のプロセスがメモリを食いまくったり、CPU 使用率が常に 100 %近くになったりしますよね。
こまめにタブを閉じていれば問題は起こらない可能性がありますが、ブラウザのタブが気がついたら 50 個くらいになってしまう僕は、毎日1回か2回くらい再起動することになるのです。
FireFox は僕の MacBook で一回の再起動に短くて 1 分程度かかっているのですが、これを 1 年間毎日続けていたら、
1分 * 365日 = 365分 ≒ 6時間
程度かかってしまいます。
6時間という時間は非常に長いですし、実際にFireFoxを再起動すると 1分で再起動が終わらないこともしばしばあります。
僕は死ぬまでに何日間 FireFox を再起動しなければいけないのでしょうか。
僕はそんなことはどうでもいいんです。6時間とか後付けです。
何が言いたいかというと 「Google Chrome がすばらしい」ということです。速い。CPU 使用率がかなり低い。
まだ何ヶ月も使っているわけではないですし、FireFox で気に入って使っていたアドオンが無かったりで、いろいろ違いに戸惑いますが少なくとも CPU 使用率が100%近くになって MacBook のファンが永遠にグルグル回りつづけることが減った気がします。
仮に年間の再起動率が半分になるだけで3時間近く得するのかとボンヤリ考えたら、「もうFireFoxからChromeに乗り換えよう」と迷わず決意することができました。
Google Chrome は最近ではMacでもちゃんと日常使いができるようになりました。
個人的には、Flash Player と Autopagerize が入れば後は何とかなるので乗り換えを躊躇する必要はなかったです。
フォントの選択や、タブの挙動がコントロールしやすいと、もっと使いやすくなるな、と思いました。あと、時々描画がバグるのがカワイイです。そのうち修正されると思いますけど。
「あー、なんで FireFox にあるのに Chrome にないの?」とカッとしたときには、Chrome 用の拡張を書くか、ブックマークレットを書いてなんとかする必要がありますね。
何かやったときには記事を書くようにします。
関連リンク
- Google Chrome
-- http://www.google.com/chrome/
- Autopagerize
-- http://autopagerize.net/
- AutoPager extension for Google Chrome ver 0.1
-- http://os0x.g.hatena.ne.jp/os0x/20090507/1241698956
--- 拡張を書く際の参考になる
- Chrome Extension Packaging Script
-- http://d.hatena.ne.jp/Constellation/20090708/1247007187
- 被はてなブックマーク数を表示するGoogle Chrome拡張書いた。
-- http://mattn.kaoriya.net/software/chrome/20090902225759.htm
--- 欲しいなと思ったらあった。mattn++
2009-10-07 Wed
台風が上陸寸前。僕の体調は最悪。
台風が近づくと気圧のためなのか、何となく調子が悪くなります。
血行が悪くなるんですかね。。富士山の上に登ったときの軽いやつに一日中かかっている感じになるのです。正直パソコンなんかに向かってられません。
そのため、今日は夕方くらいで帰って来て2時間半くらい寝ていました。
その後食事をして、お風呂にゆったりつかって、やっと動けるようになりました。
今の台風はどんな感じなのか見てみましたが、22時の段階では、まだ上陸するかしないかなのですね。
この感じだと、今日寝ている間に関東より上に行ってくれるのかな。。。
関連リンク
- 東京アメッシュ
-- http://tokyo-ame.jwa.or.jp/
- tenki.jp
-- http://tenki.jp/
2009-10-04 Sun
新橋湯
少し散歩してから新橋湯へ。恵比寿の新橋商店街にあるのです。
ここは古い割に嫌な感じがしないので好き。
from overlast using Panasonic DMC-FX100
新橋湯はすごくお湯が熱いので、長い間湯につかっていられません。
60秒入って、60秒以上休んでを2回ほど繰り返したら、ポカポカ。
中では飲み物を売っていないので、コンビニでカルピスソーダ。
from overlast using Panasonic DMC-FX100
ノーカロリーと書いてあるのに弱くなってるなと気がつきました。
新橋湯の場所
東京都渋谷区恵比寿1丁目23−6
大きな地図で見る



