ところがXMLファイルが整形式となっていなかったため、インポートに失敗しました。
もとのXMLファイルでは、開始タグと終了タグで囲まれた内容に、"<"や">"などの特殊文字をそのまま記述してしまったので、それらを"<"や">"に書き直せば解決できると思います。
しかし修正箇所が膨大に存在するため、自動的に修正をする方法を探しています。
そのような修正が可能なソフトや、プログラムを教えてください。
そのXMLで使われているタグの種類がそう多くないと仮定して、
通常のテキストエディタ(メモ帳などの)で行う方法があるかなと思います。
例えば、↓なら、
<test> 3<x 、またはx>4 </test>
1.開始タグ・終了タグを別の文字に一括置換する。( <や/>でなく、個別のタグを指定して置き換える)
例えば<test>→{%test%},</test>→{%test%}など
→{%test%} 3<x 、またはx>4 {%test%}
2. <や>を"<"や">"に一括置換する。
→{%test%} 3<x 、またはx>4 {%test%}
3. 1で置換したタグを一括置換でもとのタグに戻す
{%test%}→<test>,{%test%}→</test>
→<test> 3<x 、またはx>4 </test>
要するに、"<"や">"への置換で、タグが影響を受けないように、一旦別の文字に置き換えるということです。
ファイル数及び、タグの種類が少なく、ひとつのファイルのサイズが大きいならこの方法が手っ取り早いかもしれません。
DTDやSchemaなどの厳密なモノはなさそうな気がしますがとりあえずタグの種類だけでもわかればなんとか…。