日本の県名にマッチする正規表現

ググってすぐに見つからなかった日本の県名の正規表現を、
主に観賞用としてPerlでRegexp::Assembleを使って生成した。

生成した正規表現は以下。コピペ用。

(?^u:(?:(?:(?:[富岡]|和歌)山|(?:[広徳]|鹿児)島|(?:[石香]|神奈)川|山[口形梨]|
福[井岡島]|[佐滋]賀|宮[城崎]|愛[媛知]|長[崎野]|三重|兵庫|千葉|埼玉|奈良|
岐阜|岩手|島根|新潟|栃木|沖縄|熊本|秋田|群馬|茨城|青森|静岡|高知|鳥取)県|
大(?:分県|阪府)|京都府|北海道|東京都))


使うときはコピペして、xとかで冗長な正規表現を許容するか、改行を消して使う。

生成コードは
https://github.com/overlast/private/blob/master/lang/perl/nlp/wikipedia_ja/generate_prefecture_name_regexp.pl
に置いておいた。


投稿者:としのり  日時:23:59:59 | コメント | トラックバック |
blog comments powered by Disqus