前の日 / 次の日 / 2010-07
01 02 03 04 05 06 07 08 09 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31

2010-07-04 Sun

第一回 自然言語処理勉強会@東京

第一回 自然言語処理勉強会@東京に参加しました。

- 第1回 自然言語処理勉強会@東京 : ATND
-- http://atnd.org/events/5858
# ハッシュダグは「#tokyoteximining」でした。

会場は株式会社ミクシィさんの会議室でした。受付付近からの眺めが最高! @kimuras++。

P1140742
# オフィス内が写った写真は駄目、だそうなので景色の写真。いい景色。素晴らしい。

この2年ぐらいの間に多発した勉強会のおかげなのか、自然言語処理に興味を持っている人が増えたのか、ともかく勉強会を開けるくらい参加者が集まるのは素晴らしいことだと思います。

P1140740

これだけ参加者がいれば当面は月一ペースで開催できそうですね。
主催者の @nokuno さん、発表をされた @sleepy_yoshi さん、@shuyoさん、 @PENGUINANA_ さん、 @suzuvieさんおつかれさまでした!

打ち上げのお店は会場の側でした。
まじめに言語学の話をしているテーブルや、sinとcosどっちが好き?と話してるテーブルがあり、大変愉快でした。

P1140746
- yao ヤオ - 原宿/ダイニングバー [食べログ]
-- http://r.tabelog.com/tokyo/A1306/A130601/13032507/
場所:東京都渋谷区神宮前2-33-12 ビラビアンカ 1F。

個人的に今日のMVPは @hitoshi_ni さんな気がするなぁ。
的確なツッコミがすばらしかったです。

みなさんおつかれさまでした。

発表演目


FSNLPの1章を読む by @nokuno さん


ソーシャル検索エンジンAardvarkの論文紹介 by @sleepy_yoshi さん


Webページの本文抽出 using CRF by @shuyo さん


LDAでtweetをタギングしてみる by @PENGUINANA_ さん


FSNLPの2章を読む by @suzuvie さん



使われた教科書


Foundations of Statistical Natural Language Processing

[Amazonで詳細を見る]


紹介された論文・サイト


- The Anatomy of a Large-Scale Social Search Engine
-- http://vark.com/aardvarkFinalWWW2010.pdf

- Project Gutenberg
-- http://www.gutenberg.org/wiki/Main_Page

- Webページの本文抽出 (nakatani @ cybozu labs)
-- http://labs.cybozu.co.jp/blog/nakatani/2007/09/web_1.html

- CLEANEVAL home page
-- http://cleaneval.sigwac.org.uk/
# 2007年のHTMLからの本文抽出コンテスト

- ExtractUniqueBlock - コンテンツ抽出(本文抽出) Perl モジュール
-- http://www.mibel.cs.tsukuba.ac.jp/~ceekz/ExtractUniqueBlock/

- Learning to classify short and sparse text & web with hidden topics from large-scale data collections
-- http://portal.acm.org/citation.cfm?id=1367510
-- http://www2008.org/papers/pdf/p91-phanA.pdf

- Collaborative Filtering for Orkut Communities: Discovery of User Latent Behavior.
-- http://www2009.org/proceedings/pdf/p681.pdf

- Not-So-Latent Dirichlet Allocation: Collapsed Gibbs Sampling Using Human Judgments.
-- http://www.aclweb.org/anthology/W/W10/W10-0720.pdf

- The Role of Semantic History on Online Generative Topic Modeling.
-- http://cs.gmu.edu/~carlotta/publications/Siam_SemOLDA.pdf

関連リンク


- 自然言語処理勉強会@東京 | Google グループ
-- http://groups.google.co.jp/group/tokyotextmining

- The Anatomy of Large-Scale Social Search Engine: ソーシャル検索エンジンAardvark論文の輪講用資料 - 睡眠不足?!

投稿者:としのり  日時:23:59:59 | コメント | トラックバック |

吉野家 (原宿)

勉強会にギリギリ間に合う時間に起床したので、昼ご飯を吉野家で素早く食べました。

P1140736

豚丼を頼んで食べていたら、横に外国から来た観光客の方が座って、目を見開いてメニューを見ていたのが印象的でした。
吉野家も英語メニューを用意する時代がきてるということかな。

投稿者:としのり  日時:23:59:59 | コメント | トラックバック |