MS Wordで編集されたことのあるHTMLファイルから、Word特有のタグを除去する方法を教えてください。


元のHTMLはDreamweaverで作成されたものですが、一度Wordで編集されてしまったため、非常に可読性が悪くなってしまい、編集もままならない状況です。
ことに、mso-で始まる、おびただしい数のスタイルシートを何とかしたいです。

DreamweaverおよびFrontPageを利用する以外の方法で、対処できる策がありましたらご教示いただければ幸いです(この作業のためだけに上記ソフトを調達するのは困難な状況です)。

回答の条件
  • URL必須
  • 1人2回まで
  • 登録:2006/08/02 16:24:02
  • 終了:2006/08/03 00:18:55

ベストアンサー

id:naleringar No.4

naleringar回答回数110ベストアンサー獲得回数52006/08/02 19:23:11

ポイント35pt

実際のタグがどれかはわかりませんが、余計なタグを増やさないために、「テキストエディタ」、それも正規表現とエスケープシーケンスのどちらにも対応したものを使って、置換と整形をしていくのが早いと思います。

私の履歴の中に、正規表現についての私の質問がまだ見られる状態になってる筈です。

これを使えば、mso-で始まる???をいっぺんに置換、ができるはずですので、ご参考になさってください。

また、エスケープシーケンスで、要らないタグを消したり、

改行を増やしたりできます。

EmEditor Free

http://www.vector.co.jp/soft/winnt/writing/se047993.html

id:dhalmel

ご回答ありがとうございます。

naleringarさんの正規表現関連質問も拝見いたしました。

この方向のアプローチも検討してみます。

方向性が固まりそうなのでこれで終了します。

ありがとうございました。

2006/08/03 00:17:08

その他の回答(3件)

id:tawazou No.1

tawazou回答回数33ベストアンサー獲得回数72006/08/02 16:36:22

ポイント20pt

再度Wordで開き、「ファイル→名前を付けて保存」を選び、ファイルの種類を「Webページ(フィルタ後)(*.htm;*.html)」を選択して保存して見て下さい。

Office特有のタグが削除されます。

http://office.microsoft.com/ja-jp/assistance/HP030852791041....

※試す際はバックアップを残しておいて下さい。

id:dhalmel

ご回答ありがとうございました。

使用しているWord(2002=Office XP)で試しました。

削除されたタグはありましたが、消えてほしいところが消えませんでした。

2006/08/02 17:10:21
id:tawazou No.2

tawazou回答回数33ベストアンサー獲得回数72006/08/02 17:32:48

ポイント15pt

2回目の回答です。


フィルタをかけて保存する以外としては、

「ファイル→名前を付けて保存」を選び、名前を付けて保存ダイアログボックス内の「ツール→Webオプション」で調整するくらいしかありません。

(これも恐らくご希望の結果は得られないと思います。)

残念ながら、一度Wordで更新してしまった場合、元に戻すことはできませんので、あとはテキストエディタを使って文字列置換などを駆使するしかないと思われます。


URLはダミーです。

http://q.hatena.ne.jp/1154503440

id:dhalmel

ありがとうございます。

やはり地道にいくしかないんでしょうかね…

2006/08/02 17:55:08
id:kn1967 No.3

kn1967回答回数2915ベストアンサー獲得回数3012006/08/02 18:10:41

ポイント20pt

もしもWEBとして公開していたのであれば、

Internetarchiveに過去のものが保存されているかもしれません。

一度探してみてはいかがでしょう?

http://www.archive.org/index.php

id:dhalmel

過去のものは手許にありました。

最悪の場合はこれと照合しながら修正していくのもありかなとは思っています。

ご回答ありがとうございます。

2006/08/03 00:13:50
id:naleringar No.4

naleringar回答回数110ベストアンサー獲得回数52006/08/02 19:23:11ここでベストアンサー

ポイント35pt

実際のタグがどれかはわかりませんが、余計なタグを増やさないために、「テキストエディタ」、それも正規表現とエスケープシーケンスのどちらにも対応したものを使って、置換と整形をしていくのが早いと思います。

私の履歴の中に、正規表現についての私の質問がまだ見られる状態になってる筈です。

これを使えば、mso-で始まる???をいっぺんに置換、ができるはずですので、ご参考になさってください。

また、エスケープシーケンスで、要らないタグを消したり、

改行を増やしたりできます。

EmEditor Free

http://www.vector.co.jp/soft/winnt/writing/se047993.html

id:dhalmel

ご回答ありがとうございます。

naleringarさんの正規表現関連質問も拝見いたしました。

この方向のアプローチも検討してみます。

方向性が固まりそうなのでこれで終了します。

ありがとうございました。

2006/08/03 00:17:08

コメントはまだありません

この質問への反応(ブックマークコメント)

「あの人に答えてほしい」「この質問はあの人が答えられそう」というときに、回答リクエストを送ってみてましょう。

これ以上回答リクエストを送信することはできません。制限について

絞り込み :
はてなココの「ともだち」を表示します。
回答リクエストを送信したユーザーはいません