人力検索はてな
モバイル版を表示しています。PC版はこちら
i-mobile

EUCのhtmlファイルが1万個ほどあります。
1ファイルあたりの容量は1-3kb程度です。

この中のいくつかのファイルに、一部が文字化けしたファイルが混じっています。
Sjisからの変換時に文字化けしたらしいです。ファイル内すべての文字化けではなく、一部(2-3行)が化けている状態です。

これらの文字化け箇所を迅速に検索・編集する方法はないでしょうか。
1万ファイルをすべて手作業でチェックするのは死ぬほど大変なので、何とか効率的な方法を探しています。


●質問者: にしk
●カテゴリ:インターネット ウェブ制作
✍キーワード:EUC HTML SJIS ファイル 文字化け
○ 状態 :終了
└ 回答数 : 1/1件

▽最新の回答へ

1 ● MoonWolf
●60ポイント

http://www.ruby-lang.org/ja/

Ruby言語のスクリプトで簡単にチェックできます。

ARGV.each {|path|

open(path,'rb') {|f|

text = f.read || ''

unless text=~/\A([\t\r\n\x20-\x7e]|[\xa1-\xfe][xa1-\xfe])*\z/n

puts path

end

}

}

使い方: ruby check.rb *.html

文字化けしたファイル名が表示されます。

◎質問者からの返答

ありがとうございます。

当方ただのHTML書きのため、開発言語となると

さっぱりです。

が、せっかくのご好意、何とか勉強してみます。

#でも他に方法があれば是非に回答募集いたします。。。

関連質問


●質問をもっと探す●



0.人力検索はてなトップ
8.このページを友達に紹介
9.このページの先頭へ
対応機種一覧
お問い合わせ
ヘルプ/お知らせ
ログイン
無料ユーザー登録
はてなトップ