前の月 / 次の月 / トップページ
01 02 03 04 05 06 07 08 09 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31

2012-01-24 Tue

NLP若手の会(YANS) の公式 Twitter アカウントができていた

NLP若手の会(YANS) という自然言語処理および関連分野で活動をしている若手向けコミュニティがあります。
# 「どこまでが若手なのか」はよく議論になりますが(笑)

- NLP若手の会(YANS) Web Site - YANSサイトへようこそ
-- http://yans.anlp.jp/

NLP若手の会 (YANS) は、
自然言語処理および関連分野の若手研究者の交流を促進し、
若手のアクティビティを高めることを目指したコミュニティです。

なおYANSは、Young Researcher Association for NLP Studies
の頭文字をとったものです。


今日になって突然、この会の公式 Twitter アカウントができていました。これはフォローしなくては。

続きを読む

投稿者:としのり  日時:23:59:59 | コメント | トラックバック |

2012-01-22 Sun

創作をする時に口に出してはいけない 3 つの悪魔のフレーズ

寿司ブログを眺めながら「寿司ランチに行きませんか」と声を書ける最適なタイミングを見計らったり計らなかったりしていたら、面白い記事が投稿されました。

- 面倒な仕事その2 : naoyaの寿司ブログ
-- http://naoya.hatenablog.com/entry/2012/01/22/192924

自分が作らないことで目線を上げるということと、自分が手を動かして作ることで良い感じの地点に着陸させるということが、ものづくりにおいて自分の中で矛盾していていつもそのジレンマに悩むことになる。


以下はこの記事とあんまり関係ないのですが。

僕は白髪が増えたら嫌なので五目炒飯を食べながら10秒だけ考えたのですが、このような悩みは「イケてる研究がしたい」と身を焦がしている大学院生や教員の悩みにすごく近い気がしました。

続きを読む

投稿者:としのり  日時:23:59:59 | コメント | トラックバック |

2012-01-21 Sat

テキストファイルをソートするときに頻繁に使うUnixコマンド

@nokuno さんの Unix コマンドに関する記事を読みました。

- テキストファイルを処理するときのUnixコマンドまとめ
-- http://d.hatena.ne.jp/nokuno/20120121/1327139192

実務では何でもかんでも難しい手法や複数台の計算機で処理することが正義ではなく「同じ処理を実現する最も簡単で効果的な手法」で処理することが正義なので、この手の記事はいくつあっても良いものだ、と思いました。

便乗して、僕が中小規模なデータをソートする際に頻繁に使っている Unix コマンド(と Perl のワンライナー)も書いてみます。

続きを読む

投稿者:としのり  日時:23:59:59 | コメント | トラックバック |

2012-01-20 Fri

IT 系イベントを見逃さないための Twitter bot と RSS Feed まとめ

先日[2012-01-18-1]申し込みが始まった mixi Engineers’ Seminar #3 は、本当に短時間に120人の定員が埋まってしまいましたが、このイベントは観測範囲が適切で、かつ、ずっと Twitter の TL を眺めていれば、あっさりと申し込めたと思います。

- mixi Engineers’ Seminar #3のお知らせ
-- http://alpha.mixi.co.jp/blog/?p=5322
# 僕は @echizen_tm さんが教えてくれた3秒後に申し込みをしました。

でも適切な観測範囲という概念はすごく曖昧なので、以下に僕が IT 系イベントを見逃さないためにリストに入れている Twitter bot や購読している RSS Feed を紹介します。

続きを読む

投稿者:としのり  日時:23:59:59 | コメント | トラックバック |

2012-01-19 Thu

Lucene 3.5.0 のソースコードを読み始めた

オープンソースの検索エンジンライブラリはいろいろありますが、今日もきちんとメンテされているライブラリは少数。最近は Lucene をお手軽に扱うための Solr を使っている友達が一番多いです。

- Apache Lucene
-- http://lucene.apache.org/

そんな中、周りの友人が猫も杓子もうわ言のように「Lucene !! Lucene !!」と言いはじまっており、Lucene の中身を見るのが楽しい時期がまた来たのかな?と感じたので、久々にLuceneのコードを見てみることにしました。

続きを読む

投稿者:としのり  日時:23:59:59 | コメント | トラックバック |

2012-01-18 Wed

mixi Engineers’ Seminar #3のテーマは「データマイニング」

2012年2月2日(木) 19:00~21:30に渋谷のmixiさんでmixi Engineers’ Seminar #3が開催されます。

- mixi Engineers’ Seminar #3のお知らせ
-- http://alpha.mixi.co.jp/blog/?p=5322

テーマは「データマイニング」だそうです。高村さんの評価表現の話と、神嶌さんのレコメンドの話。mixiの石井さんはデータ解析の話(詳細不明)。楽しみですね。

続きを読む

関連エントリ

[2012-01-20-1] IT 系イベントを見逃さないための Twitter bot と RSS Feed まとめ
[-] 1
投稿者:としのり  日時:23:59:59 | コメント | トラックバック |

2012-01-17 Tue

NLPの参考書の新定番「日本語入力を支える技術」がAmazonで予約可に

日本語自然言語処理の参考書の新定番になるであろう、@tkngさんの労作「日本語入力を支える技術」がAmazon.co.jpで予約可能になっていました。(via @nokunoさん)

日本語入力を支える技術~変わり続けるコンピュータと言葉の世界

[Amazonで詳細を見る]


こういう書籍を書いてくださった@tkngさんに感謝、感謝です。あと少しで一旦終わりですね。

続きを読む

投稿者:としのり  日時:23:59:59 | コメント | トラックバック |

2012-01-16 Mon

Chromeiumベースのブラウザ「SRWare Iron」は確かに Chrome より快適な気がする

ここ数年はGoogle Chromeを使い続けていましたが、Chromeと同じChromeiumベースのブラウザである「SRWare Iron」を使ってみました。

まだ20分ほどしか使っていませんが、Ironで普段観ている色々なページを開く度に0.5秒くらいずつ得している気がします(体感)。Google Chromeを使っているときによくあるページ描画の最後の最後で突っかかる感じが軽減されている気がします。

これは良いかも。

続きを読む

投稿者:としのり  日時:23:59:59 | コメント | トラックバック |

2012-01-14 Sat

言語処理学会第18回年次大会(NLP2012)のプログラムが公表されていた

2012年3月13日(火)〜16日(金)まで広島市立大学で開催される言語処理学会第18回年次大会(NLP2012)のプログラムが公表されていました。

パッと眺める限り、今年のチュートリアルはどれも楽しそうなのにも関わらず2トラック並列だから2つしか見られないのがとても悩ましいです。何とかならなかったのかな、と思ったり。
# 何とかならなかったのでしょう。2つみられるだけで幸せです。
# Ustream で録画していただけるとありがたいです。

- 言語処理学会第18回年次大会(NLP2012)
-- http://www.anlp.jp/nlp2012/

(T-a) 3月13日(火) 13:00-15:00 (603講義室)
「大規模言語資源時代の意味談話処理」
乾健太郎 氏(東北大学)
(T-b) 3月13日(火) 13:00-15:00 (602講義室)
「ネットワークと機械学習」
鹿島久嗣 氏(東京大学)
(T-c) 3月13日(火) 15:30-17:30 (603講義室)
「統計的機械翻訳の最先端」
渡辺太郎 氏(NICT)
(T-d) 3月13日(火) 15:30-17:30 (602講義室)
「現代日本語書き言葉均衡コーパスによる日本語研究の展望」
山崎誠 氏(国立国語研究所)


あとは発表者がやけに多い気がしました。開催地が広島だからでしょうか。時期が良かったのでしょうか。

続きを読む

投稿者:としのり  日時:23:59:59 | コメント | トラックバック |

2012-01-13 Fri

「エンジニアサポート新年会2012 CROSS」に参加します

2012年1月27日(金)に「エンジニアサポート新年会2012 CROSS」に、DSIRNLP の主催者として個人的に参加することになりました。

- エンジニアサポート新年会2012 CROSS
-- http://tech.nifty.co.jp/party/2012/

DSIRNLP 以外にも、TokyoNLP や Tokyo.R や TokyoWebmining などのデータマイニングやら機械学習やらの勉強会も参加するのですが、それらの主催者の方々と一緒に、データマイニングのセッションのパネラーとして登壇させていただくことになりました。
# @nifty_engineer さんや @yokkuns さんや @hamadakoichi さんなどのご好意のおかげ。どうもありがとうございます。

続きを読む

投稿者:としのり  日時:23:59:59 | コメント | トラックバック |

2012-01-12 Thu

風邪をひいたら一時的にでも生活スタイルを変えよう

お医者さんに行って「風邪ですね」と言われる部類の感冒にかかったときに、適切な診断の末に貰った薬を飲むのは当然として、最終的に感冒を根治する方法はほとんどひとつです。

その方法は「体力を回復する」ということ。シンプル。

今回は多少怪しい内容ですが風邪を治す

続きを読む

投稿者:としのり  日時:23:59:59 | コメント | トラックバック |

2012-01-11 Wed

丁寧で柔らかい言葉で楽しい話をできる大人になりたい

とあることがキッカケで、年を取るほどに丁寧な言葉で率直に話す方が良いなと実感しました。
 
砕けた表現をするために、きつい響きの表現を使う必要は無いし、丁寧な言葉を使うために婉曲な表現を使う必要は無い、ということです。

続きを読む

投稿者:としのり  日時:23:59:59 | コメント | トラックバック |

2012-01-10 Tue

新しい辞書をゼロから作る際に既存の商用辞書を活用できるか

「「危ない橋を完全に回避する能力」を鍛えたい[2012-01-08-1]」 と「経験はリスク回避能力を高める[2012-01-09-1]」の続き。

今日は「リスクは回避したい。でも、現実的にある程度のリスクを許容しないと作業を始めることすら困難」という状況でどうしたら良いかを考えたいと思います。昨日までは、完全回避をしたい、と言っていましたが実際には回避しきれない場合もあります。

最初のテーマは「新しい辞書をゼロから作る際に既存の商用辞書を活用できるか」です。

続きを読む

投稿者:としのり  日時:23:59:59 | コメント | トラックバック |

2012-01-09 Mon

経験はリスク回避能力を高める

昨日の「危ない橋を完全に回避する能力」を鍛えたい[2012-01-08-1]の続き。

リスク回避能力を高めると、日常で起きる様々なトラブルを避けたり、受けるダメージ量を長期的な視野で最適化(例 : いま軽く怒られる事で、のちのちの大爆発を避ける)したりできます。

こういう能力はどうすると鍛えられるのか、ということを考えてみます。

続きを読む

関連エントリ

[2012-01-10-1] 新しい辞書をゼロから作る際に既存の商用辞書を活用できるか
[-] 1
投稿者:としのり  日時:23:59:59 | コメント | トラックバック |

2012-01-08 Sun

「危ない橋を完全に回避する能力」を鍛えたい

2011年12月29日に京都大学で開催された第4回入力メソッドワークショップで、@nokuno さんの成果としてSocial IMEの共有辞書の公開と、そのクリーニング方法について発表が行われました。

- Social IMEの共有辞書を公開しました
-- http://d.hatena.ne.jp/nokuno/20111230/1325334850

このSocial IMEの共有辞書は公開当初、@nokunoさんが手動または自動で収集した「ネット上に公開状態で存在するMS IMEのユーザ辞書」から生成した、漢字と読みのペアのリスト、も含まれていました。それに対し複数の有識者の方から指摘があり、最終的にはSocial IMEの共有辞書からMS IMEのユーザ辞書由来のリストは削除されました。おつかれさまでした。

今回は、この件から個人的に感じた教訓について書こうと思います。

続きを読む

関連エントリ

[2012-01-10-1] 新しい辞書をゼロから作る際に既存の商用辞書を活用できるか
[2012-01-09-1] 経験はリスク回避能力を高める
[-] 2
投稿者:としのり  日時:23:59:59 | コメント | トラックバック |

2012-01-07 Sat

2012年の目標関連のエントリまとめ

1回で書くと自分でもよく分からないことになるので、数回に分けた目標関連のエントリからリストだけ抜粋。

なかなか欲張った内容なので、達成率がどの程度になるのかが楽しみ。

続きを読む

投稿者:としのり  日時:23:59:59 | コメント | トラックバック |

2012-01-06 Fri

自分の得意な技術領域を増やさないと技術者として死ぬ

2012 年は2011年までの経験や知見を活かして、何かに取り組みたいと思います。
 
まずはツールを作ったり、NL研とか全国大会などの国内の発表に出せる気軽なネタづくりを頑張ってみます。

続きを読む

投稿者:としのり  日時:23:59:59 | コメント | トラックバック |

2012-01-05 Thu

他人のことは多少堅苦しくても「さん」付けで呼ぶ

今日は他人との付き合い方の話で感じたことがあるので書きます。

男性の口語の敬称だと「さん」と「くん」がよく使われますし、女性の口語の敬称だと「さん」と「くん」に加えて「ちゃん」がよく使われますね。

自分が他人にどの敬称を使うのが良いのでしょうか。

続きを読む

投稿者:としのり  日時:23:59:59 | コメント | トラックバック |

生活習慣は定着するまで気長に3日坊主を続ける

理想的な生活習慣は身につけることができたら格好良いです。

でも、いろいろあって身につけたい生活習慣に限って簡単には身につきません。僕の脳みそは楽なこことが大好きなので、楽に快感を得られることが目の前にあると負けてしまいがちです。でも、長期的にはそれが最適ではないわけです。

ということで「これが身についたら自分は去年より良くなる」と思う習慣をリスト化しました。

続きを読む

投稿者:としのり  日時:23:59:59 | コメント | トラックバック |

2012-01-04 Wed

基礎力はルーチンワークで鍛える

自分以外の人が読んで楽しいかわからないこと年始のエントリも終盤。今日は基礎トレについて。
 
やらないことリストを書いたり、実装力を鍛えたりする一方で、筋トレ的な行動で基礎力を向上することも、技術者として生き残ったり、時間の節約をすることにつながるのでメニューを作っておきたいです。
 
基礎力のトレーニングは、毎日細かい粒度(毎日続く量)のルーチンワークを機械的にこなすのが一番楽です。

続きを読む

投稿者:としのり  日時:23:59:59 | コメント | トラックバック |

2012-01-03 Tue

能力を高めるために友人の習慣を素直に真似する

2011年は空き時間が少なかったのですが、2012年以降はさらに時間が足りなくなりそうです。
 
短時間でより多くのコードを書きたければ、無駄なく書くことと、速く書くことが求められます。
 
僕が今よりも無駄なくコードを書くためには、かなりの練習が必要です。

続きを読む

投稿者:としのり  日時:23:59:59 | コメント | トラックバック |

2012-01-02 Mon

時間の節約のため「やらないことリスト」を書いてみる

年初に書くのやりたいことリストは毎年飽和気味なので、やることを厳選するか、時間の浪費を抑えて有益なことに回す必要があります。
  
個人的には心理的な壁を乗り越えて行動の頻度を上げるよりも、生理的な欲求を抑制して時間を有益に使う方がチャンスが多いし、課題もたくさんあります。

ここでは時間の浪費を抑える方法として、やらないことリストの作成、を挙げます。

続きを読む

投稿者:としのり  日時:23:59:59 | コメント | トラックバック |

2012-01-01 Sun

2012年の抱負

新年恒例の「2012年の抱負」をまとめました。

あんまり沢山あると良くないし、少ないと達成できないかもしれないです。
ということで7個くらいの項目を立ててみました。

続きを読む

投稿者:としのり  日時:23:59:59 | コメント | トラックバック |

あけましておめでとうございます 2012

新年あけましておめでとうございます。

二年参りで渋谷の氷川神社に来ました。

続きを読む

投稿者:としのり  日時:23:59:59 | コメント | トラックバック |

関連エントリ

[2013-01-01-1] あけましておめでとうございます 2013
[-] 1