分割されたXMLﾌｧｲﾙの前後を調節して､整合性をとるvbsを作成してくれる方､お願いします｡ 300?500pt 完全回答をお願いします｡補足なども読んでください｡質問はｺﾒ…

分割されたXMLﾌｧｲﾙの前後を調節して､整合性をとるvbsを作成してくれる方､お願いします｡
300?500pt 完全回答をお願いします｡補足なども読んでください｡質問はｺﾒﾝﾄ欄にお願いします｡

ｱﾄﾞﾚｽ帳のような､どでかいXMLﾌｧｲﾙがあります｡後で処理するには重すぎるので､ﾌｧｲﾙ分割ﾂｰﾙを使って適当な大きさに分割しましたが､xml構造を無視して分割してしまうので､整合性をとれる形にしたいと思っています｡
次のようなxmlﾌｧｲﾙです

addressbooktokyo.xmlの中身
<xml version="1.0" encoding="utf-8"?>
<myaddress version="1.0">
<header>
<各種ﾍｯﾀﾞｰ情報､たとえば地域などﾌｧｲﾙによって微妙に違う>
</header>
<body>
<person>
<name>山田さん</name>
<phone>0123456789</phone>
</person>
膨大な繰り返し･･･
</body>
</myaddress>

質問などはｺﾒﾝﾄにお願いします｡

分割されたﾌｧｲﾙは次のようになります｡
addressbooktokyo000.xml
addressbooktokyo001.xml
addressbooktokyo002.xml
addressbooktokyo003.xml
･･･
addressbooktokyo050.xml

初回のﾌｧｲﾙのみにﾍｯﾀﾞ(開始から</header>まで)があります｡末尾のﾌｧｲﾙのみにﾌｯﾀ(</body></myaddress>)があります｡

作業の流れ
1. 000ﾌｧｲﾙを開いて､ﾍｯﾀﾞをどこかに保存する
2. 001ﾌｧｲﾙを開いて､開始から最初の</person>までを削除しつつ､変数に読み込んで､000の末尾に追加する
3. 000の末尾にﾌｯﾀ(</body></myaddress>)を追加して､保存して閉じる
4. 001の開始部分にﾍｯﾀﾞを挿入する
5. 002ﾌｧｲﾙを開いて､開始から最初の</person>までを削除しつつ､変数に読み込んで､001の末尾に追加する
3. 001の末尾にﾌｯﾀ(</body></myaddress>)を追加して､保存して閉じる
以下ﾙｰﾌﾟ
最後. 最後のﾌｧｲﾙのみ､ﾌｯﾀはつけずに保存して閉じる

以上です｡

以前に､次のURLで質問をしたのですが､対象のXMLﾌｧｲﾙがあまりにも大きすぎたので､ﾌｧｲﾙ分割ﾂｰﾙで指定したｻｲｽﾞにぶった切ってから､あとで整合性をとるやり方に切り替えたいと思います(分割ﾂｰﾙは速いんです)｡
http://q.hatena.ne.jp/1355133738

いろいろ考えてみましたが､なかなか納得できる結果ではなかったので参考出品です｡
100M のﾌｧｲﾙを 10M に分割するのは数十秒でしたが数Gのﾌｧｲﾙを処理する時間は未確認ですので､前回のｽｸﾘﾌﾟﾄと大差ないようでしたら(＆ほかに回答なければ)､質問をｷｬﾝｾﾙください｡

PHP は使用可能ということなので､PHP での実装です｡
なお､分割したﾌｧｲﾙを処理するのではなく､直接分割する例です｡

下記を適当な名前(divFile.php)等で処理するﾌｧｲﾙがあるﾌｫﾙﾀﾞに保存し､
ｺﾏﾝﾄﾞﾗｲﾝで php.exe のﾌﾙﾊﾟｽに引数でｽｸﾘﾌﾟﾄを指定し実行してみてください｡

下記はCﾄﾞﾗｲﾌﾞの Program Files 下に PHPがｲﾝｽﾄｰﾙされている実行例です｡

C:\>"C:\Program Files\PHP\php.exe" divFile.php

<?php
// 引数は処理するﾌｧｲﾙ名
DivideFile( 'sample.xml' );

//---------------------------------------------------------------------
function DivideFile( $filePath )
//---------------------------------------------------------------------
{
 // 処理用ﾃﾞｰﾀ
 //------------------------
 $headerKeyword = "<body>"; // ﾍｯﾀﾞ部分の最終ｷｰﾜｰﾄﾞ
 $footerKeyword = "</body>"; // ﾌｯﾀﾞ部分の先頭ｷｰﾜｰﾄﾞ
 $recordKeyword = "</person>"; // 分割内の最終ｷｰﾜｰﾄﾞ
 $fileSize = 10 * 1024 * 1024; // 分割ｻｲｽﾞ ex) 10MB

 // 読込ﾌｧｲﾙのｵｰﾌﾟﾝ
 //------------------------
 $rfp = fopen( $filePath, "rb" );

 // ﾍｯﾀﾞの切り出し
 //------------------------
 $readData = fread( $rfp, $fileSize );
 $spos = strpos( $readData, $headerKeyword );
 if( $spos === false ) {
 echo "分割ｻｲｽﾞ内に".$headerKeyword."がありません｡";
 return;
 }
 while( ord($readData[$spos]) != 13 ) { $spos++; }
 if( ord($readData[$spos+1]) == 10 ) { $spos++; }
 $header = substr($readData, 0, $spos + 1);

 // ﾌｯﾀﾞの切り出し
 //------------------------
 fseek( $rfp, $fileSize * (-1), SEEK_END );
 $readData = fread( $rfp, $fileSize );
 $epos = strrpos( $readData, $footerKeyword );
 if( $epos === false ) {
 echo "分割ｻｲｽﾞ内に".$footerKeyword."がありません｡";
 return;
 }
 while( ord($readData[$epos]) != 13 && ord($readData[$epos]) != 10 ) { $epos--; }

 $footer = substr($readData, $epos + 1 );


 // ｻｲｽﾞの整合
 //------------------------
 $fileSize -= strlen( $header );
 $fileSize -= strlen( $footer );

 // 分割処理
 //------------------------
 fseek( $rfp, $spos + 2, SEEK_SET );
 $restBuffer = "";
 $fileIndex = 1;
 while( !feof( $rfp ) ){
 $readBuffer = fread( $rfp, $fileSize );
 if ( $readBuffer === false ) {
 echo "ﾌｧｲﾙの読み込みに失敗しました｡\n";
 return;
 }
 $readBuffer = $restBuffer.$readBuffer;
 if( ( $pos = strrpos( $readBuffer, $recordKeyword ) ) === false ) {
 echo "検索文字が見つかりませんでした｡\n";
 return;
 }
 if ( strpos( $readBuffer, "\n", $pos ) === false ){
 $pos = strrpos( $readBuffer, $recordKeyword, $pos - strlen($readBuffer) - 1 );
 }
 while( ord($readBuffer[$pos]) != 13 && $pos < strlen($readBuffer) ) { $pos++; }
 if( ord($readBuffer[$pos+1]) == 10 ) { $pos++; }

 // 出力ﾌｧｲﾙ名
 echo "--->". $fileIndex." 番目のﾌｧｲﾙを書き出しています\n";
 $wFile = sprintf( 'sample_%03d.xml',$fileIndex );
 $wfp = fopen( $wFile, "wb" );
 fwrite( $wfp, $header );
 fwrite( $wfp, substr($readBuffer, 0, $pos + 1) );
 fwrite( $wfp, $footer );
 fclose( $wfp );
 $restBuffer = substr( $readBuffer, $pos );
 $fileIndex++;
 }
}
?>