WEBスクレイピングについて


LINE社のホームページ(http://linecorp.com/)をPHPのfile_get_contentsでスクレイピングしてみたところ
文字などがすべて英文で取れてしまいました。プログラムが英文サイトとして認識しているようです

日本語で取りたいのですが、どうしたら良いでしょうか。

回答の条件
  • 1人5回まで
  • 13歳以上
  • 登録:2014/07/03 14:36:25
  • 終了:2014/07/04 10:16:35

回答(1件)

id:psne No.1

ぽけっとしすてむ回答回数514ベストアンサー獲得回数2872014/07/03 14:45:13

ポイント200pt

Accept-Languageで指定する方法があります。

<?php
$context = stream_context_create(array(
		"http" => array(
				'method'  => 'GET',
				'header'  => implode("\r\n", array(
						'Accept-Language:ja,en-US;q=0.8,en;q=0.6',
				)),

		)
));
$data = file_get_contents('http://linecorp.com/', false, $context);
id:psne

http://www.php.net/manual/ja/function.stream-context-create.php
色々できますので、stream_context_createの説明もご確認ください。

2014/07/03 14:50:14
id:menzaifu

できました。ありがとうございます!

2014/07/04 10:16:16

コメントはまだありません

この質問への反応(ブックマークコメント)

「あの人に答えてほしい」「この質問はあの人が答えられそう」というときに、回答リクエストを送ってみてましょう。

これ以上回答リクエストを送信することはできません。制限について

絞り込み :
はてなココの「ともだち」を表示します。
回答リクエストを送信したユーザーはいません