LEP

Jcode::CP932は古いJcode.pmだと使えないので、その旨を出すことにしよう。

Jcode::CP932は古いJcode.pmだと使えないので、その旨を出すことにしよう。 make testでエラーが出るとの指摘をうけて調べてみたところ、該当のエラーが出るのは古い(2.0より前の)Jcode.pmを使っている場合のようでした。 というわけで、Jcode.pmが古い場…

Jcode::CP932をCPANにアップしたよ。

Jcode::CP932をCPANにアップしたよ。 すっかり放置していたJcode::CP932ですが、Strawberry Perlを入れて動作確認をしたついでにCPANにアップしました*1。 オリジナルのJcode.pmとの主な相違点は UTF-8とレガシーエンコーディングとの変換はJIS系ではなくCP9…

Strawberry PerlをインストールしてEncode::EUCJPMSが入るかを確認してみた。

Strawberry PerlをインストールしてEncode::EUCJPMSが入るかを確認してみた。 今更ですが。 cygwinが入っててハマる CPANモジュールを入れようとしたらエラーが出まくるので「おや?」と思ったらコンパイル環境がインストールされてなくて、かわりに(過去に…

Jcode::CP932 0.06 (with patched Jcode.pm)

Jcode::CP932 0.06 (with patched Jcode.pm) いちおう弾さんにpatchを送ったのだけど、どうやらいろいろ忙しそうなのでpatched Jcode.pmをの同梱版したJcode::CP932-0.06を公開します。→ダウンロード(ppm版) 基本的には現状で問題ないはずですが、あとでev…

2006-11-02

JISとCP932のUNICODEマッピングの違いの一覧表ってどこかになかったっけ? どこかで見た気がするんだけど忘れてしまった。 とりあえず、Lingua::JA::Mailで使っていたものと、市岡さんの書かれたものを参考にしてみた。 # JIS => CP932 $pkg->set_jis_cp932(…

Encodeのfallbackでは対処できない(orしにくい)っぽい。

Encodeのfallbackでは対処できない(orしにくい)っぽい。 調べてみたら、fallback関数に渡されるのはUnicode文字のord(数値)だけらしい。そしてfallback関数はoctetを返さなくちゃいけない。 ということはつまり、文字コードごとにfallback関数を用意して…

Jcode::CP932での正規化処理

Jcode::CP932での正規化処理 Encodeのどこかのバージョンから*1、変換に失敗したときに呼び出す関数を指定できるようになった記憶がある。ということは、そこで呼び出す関数を用意して、 $FALLBACK = \&FB_NORMALIZE_CP932; sub FB_NORMALIZE_CP932 { ... } …

Jcode::CP932を作らなくても平気な気がしてきましたよ。

Jcode::CP932を作らなくても平気な気がしてきましたよ。 (註:結局Jcode::CP932はCPANにアップしました。) Jcode.pmにちょっとしたpatchをあてるだけで、Jcode::CP932はこんなにすっきりしてしまいましたよ。 package Jcode::CP932; require 5.008001; our…

2006-10-27

Encode::EUCJPMSのバージョンが上がってるじゃん。 メーリングリストを見ていたら、ミラクルリナックスの森山さんからレガシーエンコーディングプロジェクトの報告が。ざっとながめると ※ Encode::EUCJPMS で CP50220 と CP50221 が利用できるため、ISO-2022…

2006-06-28

Jcode::CP932 - 0.04 あ、canとData::Dumperとevalを使えばできるじゃん!*1 Jcode-2.0ってsjisとかの部分がハードコーディングされてるので、convertとかsetとかappendをコピペしないといけないんですよね……。 %jname2eと%ename2jがmyじゃなくてourなら良か…

Jcode::CP932 - 0.03

Jcode::CP932 - 0.03 動作をJcode-2.0に準拠するように変更して(それにともないJcode-2.0が必要)、Encode::CP932Familyを同梱するようにしました。 Jcode-CP932-0.03.tar.gz Jcode-2.0ってsjisとかの部分がハードコーディングされてるので、convertとかset…

Jcode::CP932 - 0.02

Jcode::CP932 - 0.02 森山さんのEncode::CP932Familyを元にIBM拡張文字とNEC選定IBM拡張文字の変換を追加しました。 とりあえずはこれで問題ないのかな……。 Jcode-CP932-0.02.tar.gz

Jcode::CP932 0.01

Jcode::CP932 0.01 とりあえず作りました。Jcode-2.05がベースです。use Jcodeするかわりにuse Jcode::CP932することで使えます。 Jcode->new()を使っている場合はJcode::CP932->new()に変更する必要がありますが、jcode()を使っている場合はuseの部分を変更…

Jcode::CP932っぽいもの

Jcode::CP932っぽいもの 試しに作ってみた。基本的にはUnicodeとの変換をEncodeのCP932を使うように変更しただけです*1。 他にJcode-2.0以降に含まれるJcode::_Classicと::Constantsと::Trと::H2Zが必要。 EncodeのFallbackとかどうにかしたほうがいいんだろ…

古いJcode(or jcode.pl)の実装を利用すればJcode::CP932は作れるのか……

古いJcode(or jcode.pl)の実装を利用すればJcode::CP932は作れるのか…… あ、そうか。 レガシーエンコーディング同士での変換なら(ある程度は)問題ないから、レガシーエンコーディングとUnicodeの変換にだけEncodeモジュールを用いればいいのか。 # 森山 …

とりあえずレガシーエンコーディングプロジェクトの成果待ち

とりあえずレガシーエンコーディングプロジェクトの成果待ち もうちょっとお気楽に対応できるかと思っていたんだけど、やっぱり大変そう。(だからこそレガシーエンコーディング対策プロジェクトを立ち上げているのだと思いますけれど) # 森山 将之 『eucJP…

2006-06-05

LEP *

JIS系とCP932系の相互変換 現状で問題になっている(気がする)のはJIS系とCP932系のUnicodeマッピングが非互換だかららしくて、sjis同士*1やeuc-jp同士*2だと(あまり)問題がなくても、Unicodeに変換しちゃうとそれぞれお互いに変換できなくなる。らしい。…