2004-01-01から1ヶ月間の記事一覧

正規表現で日本語を扱う場合

正規表現で日本語を扱う場合 Perl5.8の正規表現で日本語を扱う場合、euc-jpとutf8のどちらがパフォーマンスが良いかちょっと試したところ、やっぱりutf8のほうが良かった。 utf8→euc-jpの変換を加えてもutf8のほうが速い。入力から出力までeuc-jpのまま処理…