人力検索はてな
モバイル版を表示しています。PC版はこちら
i-mobile

MS Wordで編集されたことのあるHTMLファイルから、Word特有のタグを除去する方法を教えてください。

元のHTMLはDreamweaverで作成されたものですが、一度Wordで編集されてしまったため、非常に可読性が悪くなってしまい、編集もままならない状況です。
ことに、mso-で始まる、おびただしい数のスタイルシートを何とかしたいです。

DreamweaverおよびFrontPageを利用する以外の方法で、対処できる策がありましたらご教示いただければ幸いです(この作業のためだけに上記ソフトを調達するのは困難な状況です)。

●質問者: でぐちきり
●カテゴリ:コンピュータ インターネット
✍キーワード:Dreamweaver FrontPage HTML MS Word
○ 状態 :終了
└ 回答数 : 4/4件

▽最新の回答へ

1 ● tawazou
●20ポイント

再度Wordで開き、「ファイル→名前を付けて保存」を選び、ファイルの種類を「Webページ(フィルタ後)(*.htm;*.html)」を選択して保存して見て下さい。

Office特有のタグが削除されます。

http://office.microsoft.com/ja-jp/assistance/HP030852791041....

※試す際はバックアップを残しておいて下さい。

◎質問者からの返答

ご回答ありがとうございました。

使用しているWord(2002=Office XP)で試しました。

削除されたタグはありましたが、消えてほしいところが消えませんでした。


2 ● tawazou
●15ポイント

2回目の回答です。


フィルタをかけて保存する以外としては、

「ファイル→名前を付けて保存」を選び、名前を付けて保存ダイアログボックス内の「ツール→Webオプション」で調整するくらいしかありません。

(これも恐らくご希望の結果は得られないと思います。)

残念ながら、一度Wordで更新してしまった場合、元に戻すことはできませんので、あとはテキストエディタを使って文字列置換などを駆使するしかないと思われます。


URLはダミーです。

http://q.hatena.ne.jp/1154503440

◎質問者からの返答

ありがとうございます。

やはり地道にいくしかないんでしょうかね…


3 ● kn1967
●20ポイント

もしもWEBとして公開していたのであれば、

Internetarchiveに過去のものが保存されているかもしれません。

一度探してみてはいかがでしょう?

http://www.archive.org/index.php

◎質問者からの返答

過去のものは手許にありました。

最悪の場合はこれと照合しながら修正していくのもありかなとは思っています。

ご回答ありがとうございます。


4 ● naleringar
●35ポイント ベストアンサー

実際のタグがどれかはわかりませんが、余計なタグを増やさないために、「テキストエディタ」、それも正規表現とエスケープシーケンスのどちらにも対応したものを使って、置換と整形をしていくのが早いと思います。

私の履歴の中に、正規表現についての私の質問がまだ見られる状態になってる筈です。

これを使えば、mso-で始まる???をいっぺんに置換、ができるはずですので、ご参考になさってください。

また、エスケープシーケンスで、要らないタグを消したり、

改行を増やしたりできます。

EmEditor Free

http://www.vector.co.jp/soft/winnt/writing/se047993.html

◎質問者からの返答

ご回答ありがとうございます。

naleringarさんの正規表現関連質問も拝見いたしました。

この方向のアプローチも検討してみます。

方向性が固まりそうなのでこれで終了します。

ありがとうございました。

関連質問


●質問をもっと探す●



0.人力検索はてなトップ
8.このページを友達に紹介
9.このページの先頭へ
対応機種一覧
お問い合わせ
ヘルプ/お知らせ
ログイン
無料ユーザー登録
はてなトップ