テキストファイルを分割する高機能なフリーソフトはたくさんあるようですが、たとえば、10MB 付近で、</entry> という文字列直後を分割地点に指定できるようなフリーソフトはありますか?
(10MB でなくても 1万行付近でも可)
対象となっている xml ファイルは複数あり、とても大きいのですが一般的な html ファイルのような構成だとイメージしてください。単純な <header> があって、非常に長い <body> があります。
分割後は、スクリプトなどをつかってファイルの冒頭にヘッダ (xml 宣言など) を、末尾にフッタ (というより、</body></html> のような閉じタグ) を自動で追加するつもりです。
Win XP Home です。
質問などあればコメント欄にお願いします。
DTDなりSchemaなりがあれば分割可能だが、すべてのXMLファイルは同一のDTDまたはSchemaで定義されていると考えてよろしいか?
いつもありがとうございます。
この xml ファイルには DTD や Schema がありませんが、すべて同じ構造で作られています。
ファイル処理の際に 100MB を超えるファイルも結構あるので、ファイル処理が遅くなったりできなくなったりしているのを回避させようという動機です。
リンク先の 実体参照を使う方法をためしたところ、自前の xml ファイルでも正常に分割&参照ができることを確認しました。
引き続き調査して追記します。