MTのコメント投稿の事例やソースは参考になりますが、ブログサービス運営者側で、かつコメントではなくユーザーの記事本文の場合となると、ちと話が違うと思います。
http://www.sixapart.jp/movabletype/manual/3.3/03_blog_admin_guide/customizing_blogs/sanitizing.html
以下の疑問のうち、いくつでもいいので、回答または部分的にでも解説されたURLをお願いします。
1. なんの制限もせずにあらゆるタグ(Javascriptやstyle属性内の外部リソース参照などを含む)許した場合、たとえばどんな危険が考えられるか。
2. ブラックリスト方式が適切かどうか。適切だとしたら、どのようなリストで、正規表現などでどう処理するのがよいか。
3. 2.と同様に、ホワイトリスト方式の場合。
4. 通常の < や > を実体参照化する場合、2.や3.の処理でタグとどう区別すべきか。
5. このような問題を考えるのは、すごく楽しいですね。