PHP3(SJIS)で構築されていたシステムの会員データを
PHP4(EUC)の新システムへ移行することになったのですが、
保存されている会員情報は
・一件ずつURLエンコードされている
・SJISとEUCのデータが混在している
・ハシゴ高、崎の旧字体(山+立+可)等の機種依存文字も混入
・記号のエスケープもされていない
という現状で、どこから手をつけるべきかと困惑しています。
URLエンコードからの抽出、SJISとEUCのデータの振り分けまではなんとかなりそうなのですが
崎の旧字体等はPHPで出力させる際、以降の字を巻き添えに文字化けしてしまいます。
なんとか、文字化けや破損の無い状態で出力させる方法・アイデアはありませんか?
例として、正常に出力したいURLエンコード文字列(EUC)を挙げておきます。⇒「%C8%F8%94%B3」