元のHTMLはDreamweaverで作成されたものですが、一度Wordで編集されてしまったため、非常に可読性が悪くなってしまい、編集もままならない状況です。
ことに、mso-で始まる、おびただしい数のスタイルシートを何とかしたいです。
DreamweaverおよびFrontPageを利用する以外の方法で、対処できる策がありましたらご教示いただければ幸いです(この作業のためだけに上記ソフトを調達するのは困難な状況です)。
実際のタグがどれかはわかりませんが、余計なタグを増やさないために、「テキストエディタ」、それも正規表現とエスケープシーケンスのどちらにも対応したものを使って、置換と整形をしていくのが早いと思います。
私の履歴の中に、正規表現についての私の質問がまだ見られる状態になってる筈です。
これを使えば、mso-で始まる???をいっぺんに置換、ができるはずですので、ご参考になさってください。
また、エスケープシーケンスで、要らないタグを消したり、
改行を増やしたりできます。
EmEditor Free
再度Wordで開き、「ファイル→名前を付けて保存」を選び、ファイルの種類を「Webページ(フィルタ後)(*.htm;*.html)」を選択して保存して見て下さい。
Office特有のタグが削除されます。
http://office.microsoft.com/ja-jp/assistance/HP030852791041....
※試す際はバックアップを残しておいて下さい。