2011-05-11 Wed

統計的機械翻訳に関する教科書・資料

個人的には統計的機械翻訳って夢があるので好きです。

もしもインターネット上の記事が全部日本語に綺麗に翻訳されたら(英語でも良いですけど)、それまで全く発見できなかったけど興味がある異国の文書が見つかって、ものすごく賢くなれるだろうし、知らない人に話かけやすくなるから友達も増えるだろうし、異国の事が分かるので地球が少しだけ平和になるかも、などと思います。

厳密な翻訳じゃなくても、あるだけマシなレベルの翻訳って必要だと思います。

Dictionary

最近、統計的機械翻訳に関する資料を探したので、その過程で見つかったもののうち目立ったものをまとめました。ついでに教科書についても数冊しか目立ってないので紹介します。

続きを読む

投稿者:としのり  日時:23:59:59 | コメント | トラックバック |

2011-05-10 Tue

第 201 回自然言語処理研究会(NL研)は 2011 年 5 月 16・17 日

最近に @mamoruk さんに教えていただいてハッと気がついたのですが、もう次の NL 研なんですね。今年はいろいろあるために時間が経つのが速い気がします。 2011 年 5 月 16 日(月), 17日(火)に東大だそうです。

- NL201 CFP

日程2011年5月16日(月), 17日(火)
会場東京大学本郷キャンパス 工学部6号館3階セミナー室AD

特別講演として MSRA の辻井先生による特別講演「言語と知識:粒度の細かな情報アクセスと言語処理の役割」が行われるそうです。

続きを読む

投稿者:としのり  日時:23:59:59 | コメント | トラックバック |

2011-05-09 Mon

自動車運転免許を取りに行った教習場も原発事故の影響を受けていた

先日発表された「文部科学省及び米国エネルギー省航空機による航空機モニタリングの測定結果について」という資料を読んでみると、半減期が30年であるセシウム137と、半減期が2年であるセシウム134の地表面における放射性物質の蓄積状況を測定するため航空機モニタリングした結果が、大変にわかりやすい図で掲載されていた。

- 文部科学省及び米国エネルギー省航空機による航空機モニタリングの測定結果について

非常にのどかで自然がいっぱいで山や田畑が大変に多いという利点があったために、雨や風で半減期が長期間来ないセシウムが大きく移動しにくいであろう福島県で、以下のような結果が出ているのは素人でも危なさを感じる。

続きを読む

投稿者:としのり  日時:23:59:59 | コメント | トラックバック |

2011-05-04 Wed

自分のことも積極的に書いてみよう

今年に入ってから、ほとんどわざと自分の生活に関するメモを減らしていました。理由は、僕の生活なんて他の人は読みたいものでは無いのでは?と思ったからなんですけど。

でも、自分で自分の過去の記事を見ると、多少発見があったりします。自分の成長の幅も実感できたりします。自分の今いる位置を確認することは、とても大切で気持ちの良いものでした。

なので、記事が分散しすぎない程度に私生活に関する記事を書いてみようと思います。なるべく、その時に聞いたり考えたりしたことを思い出しつつ書いていくことにします。

P1170693

ちなみに今日はキーマカレーを作りました。いしたにさんからずいぶん前に教えてもらって以降、ほぼ毎回コスモ食品の中辛ルーを使っています。コスモ食品のルーは200円程度の固形ルーと比べるとちょっと高いですが、出来あがったカレーの風味が値段の割に上品で水のようにスイスイ食べられます。オススメ。少し鼻風邪をひいているので、体が温まり丁度良いです。

コスモ 直火焼 カレー・ルー 中辛

[Amazonで詳細を見る]


他には今まで一度も読んでいなかった HTML5 の仕様を眺めはじめました。HTML5ってずいぶん簡単に書けるようになったんですね。あとはブログのデザインテンプレートを新しくすることに取り組みはじめ、頼まれていた用事を消化し、かなり前に止まっていた線形代数の復習を再開したり。やらなければいけないことは沢山ありますが、気になる順に消化していこう。

関連リンク


- コスモ食品株式会社
# 通信販売もやっている。4000円以上購入で送料無料。

投稿者:としのり  日時:23:59:59 | コメント | トラックバック |

2011-05-04 Wed

時間を無駄にしないためのコツ

「今日は時間を無駄にした」と思うときがしばしばあります。

Clock

以下では「時間を得するためのコツが書かれた記事」を紹介します。
最後に最近思ったことをメモしてます。

続きを読む

投稿者:としのり  日時:23:59:59 | コメント | トラックバック |

2011-05-03 Tue

Project Euler でようやく Level 1 に到達

[2011-04-11] から続けている Project Euler はようやく Level 1 に到達しました。1 問目から 25 問目までは Level0 なのかと軽くショック。

20110503_01

Euler に取り組む前に「C++ だけで解く。標準ライブラリ以外は使わない。」と決めて、今のところ意地を張り続けているので、 Level1 に到達する前に多倍長整数演算の関数を 2 回書いたり、整数の性質について身を持って知りはじめたりしてます。
Perl か Python でやってたら 2 倍以上速く解ける気がするのですが修行だと思って頑張るぞ。

1 問目を解いた人は 144358 人だったけど、25 問目は 37360 人。途中で 10 万人以上も居なくなってますが、みんなも僕と同じくらい飽きっぽいということかな。1 問解くごとに、解いた人がグングン減っていくのでとても気持ち良いです。

とりあえず、ようやくスタートラインみたいなので次の Level2(あと 50 問)まで継続していきます。

参考資料


はじめての数論 原著第3版

[Amazonで詳細を見る]

STL標準講座―標準テンプレートライブラリを利用したC++プログラミング

[Amazonで詳細を見る]


関連リンク


- Project Euler
-- http://projecteuler.net/

関連記事


- [O] Project Euler はじめました
- [O] 「はじめての数論」の効率の良い読み方
- [O] Project Euler - Problem 1 〜 4

関連エントリ

[2011-06-13-1] Project Euler で Level 2 に到達
[-] 1
投稿者:としのり  日時:23:59:59 | コメント | トラックバック |

2011-05-02 Mon

のんびりとお参りと散歩

新年度に入った後ようやく暇になったので、昼食の後で日本人的にお参りをしてきました。

DSC01605

普段は特に特別な宗教活動はしていませんが、不思議なもので神社やお寺でお賽銭箱にお賽銭を放りこみ手を合わせると、自分が無意識で考えていることが浮き彫りになります。自分を超越しているものの前では自分が自分に課している制約が外れるのかもしれません。自分の内面を確認したり矯正したりすることができるので、精神的に参ることが多かった去年の前半はよく手を合わせました。

おみくじを久々に引いてみたら大吉でした。書いてあることを要約すると「慎み深く生きれば良いことありますよ」とのこと。努力を継続し周囲の友人への感謝を忘れずに今年度の前半を過ごすことにします。

その後、電車で銀座に出てブラブラして、恵比寿に戻って水餃子を沢山食べて帰宅。実は黄砂が飛んでたみたいだけど、ずっとマスクをしていたので、そんなに黄砂の影響を感じなかった一日でした。

関連記事


- 残尿感。: タモリさんの餃子
■材料(50個ぐらい)
・皮
強力粉:500g
塩:大さじ1
お湯:300cc

・具
豚ひき肉:200〜300g
白菜:200〜300g
中華スープの素:大さじ一
鶏ガラスープの素:少々
紹興酒;大さじ一
ごま油:少々
醤油:少々
塩こしょう:少々

■作り方
・皮
1.材料を混ぜ、3,4時間寝かせる。
2.たたいて空気を抜いたあとでちぎって棒状にする。
3.親指第一関節分くらいにちぎり、球にしてのばす。
一気にちぎるのではなく、3,4個ちぎるごとにのばすのがコツ。

・具
1.豚ひき肉を作る。
豚肩ロース100をたたき、豚バラ肉200を粗めに切ってフードプロセッサーにかけて、など
面倒くさかったら豚ひき肉を買ってくる。
2.白菜を軽くゆでる。ゆでたら荒くみじん切り。
3.肉をもむ。よくもめばもむほどぷりぷりした感じになる模様です。
4.3に上記の調味料を混ぜてよく混ぜる。
中華スープの素は種類によって味が濃いとか薄いとかあるので、適宜調節する。
どうせ醤油につけて食べるので、多少薄いくらいの方がいい気がします。
5.白菜を混ぜて(水は切る)さらに混ぜる。
6.具を皮で包むおなじみの工程。
7.温めたフライパン(テフロン)に放射状に餃子を並べる。
8.餃子が2/3つかるくらいにお湯をいれフライパンにふたをしてしばらく待つ。火は強火。
  ふたは密閉せずに穴があいている方がいいです。
9.ちょっと焦げ臭い、水が飛んだ頃合いを見計らって餃子の上から
  サラダオイルを流し入れ、ふたをし、もう少し焼く。
10. フライパンの柄をまわし、餃子をはがし、皿をかぶせてひっくり返す。


GW中に作る、、たい。

投稿者:としのり  日時:23:59:59 | コメント | トラックバック |

2011-05-01 Sun

黒 MacBook のバッテリー膨張でトラックパッドが誤作動してたけど解消

この半年くらいずっと、愛用している 3 年前に買ったマックブック黒のトラックパッドの動きが変でした。

P1170684

原因はバッテリーの膨張。それをアップルストアのジーニアスバーで無償で直してもらうことができました。
# 保証も Apple Care も切れていたのに。Apple すばらしい。ありがたや。

同じ症状で悩んでいる人が何人もいると思うので、記事にしておきます。

続きを読む

投稿者:としのり  日時:23:59:59 | コメント | トラックバック |

2011-04-30 Sat

データ構造と情報検索と言語処理勉強会(DSIRNLP)をはじめます

TokyoNLP や TokyoR など、都内では様々なセミナー型の勉強会が開催されています。

でも、まだ隙間が空いていると思ったので、新たなセミナー型勉強会を開くことにしました。

新しく始める勉強会の名前は「データ構造と情報検索と言語処理勉強会(DSIRNLP)」です。
名前にかなり悩みましたが、変にひねらず「と(AND)」でつなげることにしました。

続きを読む

投稿者:としのり  日時:23:59:59 | コメント | トラックバック |

2011-04-19 Tue

Hadoop-Snappy - Hadoop で Google の高速データ圧縮/伸長ライブラリを使う

少し前に Google が Snappy という名前の高速なデータ圧縮/伸長ライブラリを公開しました。 Snappy でググれば沢山解説が出てきます。Snappy は過去に Zippy という名前で参照されていたそうです。

そのライブラリが公開されてから1週間ちょっと後に @issay さんが、Hadoop-Snappy という Hadoop 用のライブラリを公開しました。名前のまんま、Hadoop から Snappy を使うための実装です。

20110419_01

最近、1年ぶりくらいに本格的に Hadoop を使いはじめたので、リハビリをしながら @issay さん本人から、どんな感じなのかを教えてもらいました。

結論としては、Snappy と Hadoop-Snappy を使おう、ということになりました。

続きを読む

投稿者:としのり  日時:23:59:59 | コメント | トラックバック |

2011-04-18 Mon

プレーンテキストでコピペするためのアプリ

唐突ですが、テキストをプレーンテキストでペーストするためのアプリを Mac と Windows についてそれぞれご紹介。

Mac OS Xの場合:ClipMenu をインストールする


Mac OS Xの場合は ClipMenu をインストールして使っています。アプリをダウンロードして他のアプリと同じように起動します。

- ClipMenu: Mac OS X 用クリップボード管理ソフト
20110418_01

コピペするときに一回メニューから選択してから、事前に適切に設定するればプレーンテキストでペーストできます。

Windows の場合 : Get Plain Text をインストールする


Windows の場合は Get Plain Text を使うのが良いのでは。

- Get Plain Text - clipboard extender to paste unformatted text to any application
20110418_02

画面右端の「Instant Download」または「Portable Download」からダウンロードできます。フリーウェアで Windows XP / Vista / 7 に対応していて便利。

インストール後は非常駐型ソフトとして動作するので、あらかじめランチャーに登録したりショートカットを作ったりして便利に使えるようにしておきましょう。

任意のテキストをコピーした後で Get Plain Text を起動すると、クリップボード内のテキストがプレーンテキストに変換されます。

おわりに


最初は「Evernote の公式クライアント上でプレーンテキストをペーストする機能」を見つけられなくて、そういう機能が無いかなと思って記事を公開したら、「いや、普通にあるよ」と教えてもらいました。完全にモチベーションを失ったのですが、役に立つ日もくるかもしれないので別記事にしておきました。

投稿者:としのり  日時:23:59:59 | コメント | トラックバック |

2011-04-18 Mon

Evernote にプレーンテキストをコピペする方法

Evernote の公式クライアントアプリを使った際のハマりどころに「プレーンテキストをペーストできない」ということがありました。簡単なことなのに分からなくて悩みました。

20110418_0320110418_04

左の画像みたいにリッチなフォーマットではなく、右の画像みたいに素のテキストで貼りつけたい。コピー元がブラウザだけならブラウザ拡張で対応できるけど、Evernote にはブラウザ以外からもコピペすることが多いです。

では、どうするか。

続きを読む

投稿者:としのり  日時:23:59:59 | コメント | トラックバック |

2011-04-15 Fri

見えない所に眠っている長所

今日は、G さんが素晴らしい言い換えを教えてくれた。

「良くない」「イケてない」
↓↓↓↓↓↓
「なかなか良いところが見えてこない」

初めて聞いたとき、あまりに前向きな表現なので感動してドキドキした。

「一見良くないように見えるかもしれないが、実は良い部分が自分からまだ見えていない部分に眠っている」というスタンス。

Ninja

最近は考えるのが面倒だからパッと判断することが多かったけど、じっくりと腰をすえて正面からぶつかることで見えてくることは、確かにある。と思った。

投稿者:としのり  日時:23:59:59 | コメント | トラックバック |

2011-04-14 Thu

ミーティングを早く終わらせる10のコツ

研究開発をしていても週に何度かのミーティングがあります。でもミーティングは極力短くしたいです。自分が本質的に関係ないミーティングであればなおさら。

Meeting nieuwe leden

今日は、この 3 年間で感じたミーティングを短くするコツをメモしておきます。

続きを読む

投稿者:としのり  日時:23:59:59 | コメント | トラックバック |

2011-04-13 Wed

Project Euler - Problem 1 〜 4

昨日から Project Euler をはじめたのですが、当面は簡単な問題が続くと思うので多少溜めて記事にします。

今週前半は1問目〜4問目まで解きました。

続きを読む

投稿者:としのり  日時:23:59:59 | コメント | トラックバック |

2011-04-12 Tue

4月前半に感じたことメモ

Evernote でメモをするようになってから、考えていることの断片が多く記録されるようになりました。

とくに秘密でもないものだけまとめてみました。

続きを読む

投稿者:としのり  日時:23:59:59 | コメント | トラックバック |

2011-04-11 Mon

Project Euler はじめました

複数の友人からの熱心な勧めがあったので、Project Euler(プロジェクト・オイラー) をはじめました。そんなに熱心に勧めるほど面白いならやるしかない。

- Project Euler
-- http://projecteuler.net/

20110411_01

寝る前にユーザ登録をサクっとして Euler 生活をはじめましたよ。

続きを読む

投稿者:としのり  日時:23:59:59 | コメント | トラックバック |

2011-04-10 Sun

都知事選 2011 で投票してきました

今日は都知事選でした。都民になってから初。

候補者は以下のとおり。

候補者名(読み方)年齢党派選管に届け出た職業肩書
谷山雄二朗(たにやま・ゆうじろう)38無所属映画監督インターナショナル・デジタル・パートタイマー
古川圭吾(ふるかわ・けいご)41無所属会社役員訪問介護会社役員
渡邉美樹(わたなべ・みき)51無所属会社経営ワタミ前会長
石原慎太郎(いしはら・しんたろう)78無所属(都議会自民党・都議会公明党推薦)東京都知事作家
ドクター・中松(どくたー・なかまつ)82無所属国際創造学者発明家
マック赤坂(まっく・あかさか)62スマイル党財団法人会長セラピスト
東国原英夫(ひがしこくばる・ひでお)53無所属無職前宮崎県知事
小池晃(こいけ・あきら)50無所属(日本共産党推薦)政党役員前参議院議員
姫治けんじ(ひめじ・けんじ)59平和党核兵器廃絶平和運動建物管理業建物管理業
雄上統(おがみ・おさむ)69東京維新の会僧侶真宗大谷派住職・作家
杉田健(すぎた・たけし)43新しい日本政治団体代表幹事社団法人職員

かなり悩みましたが「消去法でこの人」という人に投票しました。誰に投票したかは秘密ですが、投票したからには意見を言う権利があると思ってるので、都政に今までより関心を持ちます。

夜になって結果が開票されて、まもなく「石原慎太郎さんが4選目」だということが分かりました。ネット上の若者は「石原か。。」とつぶやいている人が多いように思います。ネットとか使ってない層の人がガッツリと石原支持だったということでしょうか。

それにしても 20 代、30 代の人の投票率が悪かったみたいですね。東京都の20代、30代の都政に関心のある若者は「隣の友人を投票に行きたい気分にさせる」という宿題を、次回の都知事選にまでに解き終わる必要があります。

政治に関する Web サービスっていろいろあるけれど、もっと日常的に使える便利で粘着質なサービスが増えると、いざと言う時にとても役立つような気がします。政治家の活動の監視や可視化に自然言語処理技術を適用するのは可能ですが、現実的な精度で自動的に結果を抽出できる汎用的な技術の種類は少ないです。半自動で情報を集めて人手による編集を期待するようなサービスを監視の量が最小になるように構築できれば長く運営できるものになりそうです。難易度が高い気がしますけど。

投稿者:としのり  日時:23:59:59 | コメント | トラックバック |

2011-04-09 Sat

Amazon マーケットプレイスに書籍を出品する際の最低価格

Amazon マーケットプレイスの送料が最近は 250 円に値下がりしてます。ということは少量の書籍をマーケットプレイスに出品する場合の「赤字が出ない最低価格」が以前と変わっています。

Amazon Kindle

いらない本を出すときのために計算してみました。

続きを読む

投稿者:としのり  日時:23:59:59 | コメント | トラックバック |

2011-04-08 Fri

「はじめての数論」の効率の良い読み方

今日の帰りに @echizen_tm さんの勧めに従って「はじめての数論」を購入。

- 「はじめての数論」を読了しました - EchizenBlog-Zwei

数論本はこれが初めてだったので他書との比較はできないが、これはもっていて損はない本だと思う。というか積極的に今すぐ購入すべき本ではないかと思います!


はじめての数論 原著第3版

[Amazonで詳細を見る]


読み始める前にパラパラっとめくってみると何となく積ん読本になりそうな予感。もしかすると何か効率のよい読み方があるのかな?

続きを読む

投稿者:としのり  日時:23:59:59 | コメント | トラックバック |