匿名質問者

クローラーの大量アクセスについて教えて下さい。

私はいまクローラーを書いているのですが、そのなかで使うwhile文の終了処理を書き忘れていました。
そのため特定のサイトに大量のアクセスをしてしまったかもしれません。プログラムを実行していた時間は5分前後だと思います。プログラムがいつになっても終了しないので強制終了させ、その後原因に気づきました。
サイトはブラウザから確認したところ落ちてはいませんでした。

この場合、私のアクセスが攻撃とみなされることはありますか?
もしあれば何かしらの責任を負うことになるのでしょうか?(岡崎市立中央図書館事件のことを知っているので不安です)
また、自分がどれほどアクセスしたのか調べたいのですがどのような方法があるでしょうか?自分のアクセスしたログを知るコマンドなどがあれば教えて下さい。

回答の条件
  • 1人5回まで
  • 登録:
  • 終了:2015/06/14 17:55:04

回答2件)

匿名回答1号 No.1

時間にして5分程度で,実害も発生していなかったのであれば
法的責任を負う心配は低いです。

とはいえそのサイトの管理人がアクセスログを見た時に
あなたのIPを「怪しい」と認知はするかもしれません。

怪しいと判断するタイミングは今日の時点ですぐではなく
後になってログを検査する段階になってからかもしれません。

なので再度同じことをやってしまった場合は
あとからあなたのIPアドレスがブロックされるなどの処置になる場合もあると思います。

対象は公的な機関のサイトですか?

個人のサイトであればまず心配の必要はないのですが。。。

>自分がどれほどアクセスしたのか調べたいのですがどのような方法があるでしょうか
ご自分で書いたプログラムならば,ご自分でログを仕込む必要があるのでは。

匿名回答3号 No.2

クローラを業務で作成することも、またクローラによる攻撃に対処する業務も
経験がある人間の意見として。

岡崎のような件はかなり特殊というか、いきなり通報みたいなオペレーションは
まっとうな企業ではまずないとおもいます。

管理者に基本的な知識があれば、クローラの暴走によりサーバが異常負荷になれば、
原因はすぐに特定されるので一時的に接続元のIPを制限・遮断します。

その後も警戒監視しますが、クローラが非常識な頻度でのアクセスをやめず、
かつ身元が特定できるのであれば、警告等を経て、
それでも改善しない場合は法的措置を検討の流れが一般的ではないかとおもいます。

クローラの動作ログについては自身でプログラムをつくっているのですから
そのプログラムにログを残す機能を追加しましょう。
あと必ず動作検証環境用のWebサーバをローカルネットワーク内でいいので作って
動作検証をしてから稼動させてください。

ログ残すコードが書けない?検証環境が構築できない?
正直その程度ができない方が興味本位でクローラを稼動させるのは迷惑な話なので、
諦めるか、勉強しなおすかしてください。

  • 匿名回答2号
    匿名回答2号 2015/06/10 01:52:39
    もしかすると大量のアクセスをしてしまったかもしれない、
    という内容のメールを相手に送っておけば問題ないと思いますが。
    あなたが悩んでいる事実は、自分から伝えない限り相手には決して伝わりませんよ。
    ウジウジ悩んで手をこまねいていても時間を浪費するだけで何の解決にもなりません。

    あと、プログラムのテストをするなら、まず自前のサーバーを用意して、
    そっちで思う存分テストしたうえで一般に用いた方がいいと思うのですけれども。

この質問への反応(ブックマークコメント)

「あの人に答えてほしい」「この質問はあの人が答えられそう」というときに、回答リクエストを送ってみてましょう。

これ以上回答リクエストを送信することはできません。制限について

回答リクエストを送信したユーザーはいません