1ファイルあたりの容量は1-3kb程度です。
この中のいくつかのファイルに、一部が文字化けしたファイルが混じっています。
Sjisからの変換時に文字化けしたらしいです。ファイル内すべての文字化けではなく、一部(2-3行)が化けている状態です。
これらの文字化け箇所を迅速に検索・編集する方法はないでしょうか。
1万ファイルをすべて手作業でチェックするのは死ぬほど大変なので、何とか効率的な方法を探しています。
Ruby言語のスクリプトで簡単にチェックできます。
ARGV.each {|path|
open(path,'rb') {|f|
text = f.read || ''
unless text=~/\A([\t\r\n\x20-\x7e]|[\xa1-\xfe][xa1-\xfe])*\z/n
puts path
end
}
}
使い方: ruby check.rb *.html
文字化けしたファイル名が表示されます。
ありがとうございます。
当方ただのHTML書きのため、開発言語となると
さっぱりです。
が、せっかくのご好意、何とか勉強してみます。
#でも他に方法があれば是非に回答募集いたします。。。