2006-09-08 日本を切り出すらしい Neta # 日本語トークンを切り出すための正規表現。 JP_TOKEN = re.compile(u"[一-龠]+|[ぁ-ん]+|[ァ-ヴ]+|[a-zA-Z0-9]+") JPは日本国ですよ 誰かマジでどうにかしてくれ.