wiki2xhtmlというツールがあるようです。
MediaWiki用の書式をXHTMLに変換できそうですので、これでHTMLにして、通常のテキストに持っていくのが良いのでは?
http://mito.xml.gr.jp/log.html?MLID=xmldesign&N=2003
http://otndnld.oracle.co.jp/tech/xml/htdocs/xml_ts/xml_ts3.html
http://www.kazusoft.com/howtoexport/transxml.html
XMLはとりあえず、HTML形式に変換すると作業が楽です。
ある意味、HTMK形式に変換すると、テキストに変換したのも同値なので。最後は、その逆の作業を行います。
ご参考ください。
そこではなく、wiki記法を除外したいのです。
「xmlをパースして記事部分を取り出すことはできた」と質問に書いてありますので、そこから先をお答えください。
ありがとうございます。
wiki2xhtmlというツールがあるようです。
MediaWiki用の書式をXHTMLに変換できそうですので、これでHTMLにして、通常のテキストに持っていくのが良いのでは?
まさにこれです!!
ありがとうございます。
こういう記事もありますね。
http://journal.mycom.co.jp/news/2007/06/26/003/index.html
さっそく試してみます。
まさにこれです!!
ありがとうございます。
こういう記事もありますね。
http://journal.mycom.co.jp/news/2007/06/26/003/index.html
さっそく試してみます。