分かち書き KAKASIとかChaSenとかMeCabを入れるのが面倒だったので作った日本語を分かち書きするコード。 my @CharUtf8 = ( '[\x{ff10}-\x{ff19}]+', # [0-9]+ '[\x{ff21}-\x{ff3a}\x{ff41}-\x{ff5a}]+', # [a-zA-Z]+ '\x{3092}', # を '[\p{InHiragan…
引用をストックしました
引用するにはまずログインしてください
引用をストックできませんでした。再度お試しください
限定公開記事のため引用できません。