CORE SERVERでTIDYを使う方法。

PHP初心者です。CORE SERVERでPHPからTIDYを使用しつつWEBスクレイピングしたいと思います。
PEARはgo-pearを使って
http://d.hatena.ne.jp/kemworld/20071003/1191421021
を参考に、何とかインストールはできたのですが、TIDYについてはさっぱりです。
phpinfo()でtidyが入っていないことだけ確認できました。
どのようにしてインストールすれば良いでしょうか?

よろしくお願いします!

回答の条件
  • 1人2回まで
  • 登録:
  • 終了:2010/11/18 06:40:02
※ 有料アンケート・ポイント付き質問機能は2023年2月28日に終了しました。

ベストアンサー

id:asuka645 No.1

回答回数856ベストアンサー獲得回数97

ポイント35pt

ご利用のPHPのバージョンは4でしょうか、それとも5でしょうか?

お知らせください。


PHP5なら、configure オプション --with-tidy を指定してインストールします。

PHP4の場合は、(古い) PECL 拡張モジュール http://pecl.php.net/package/tidy を使います。


参考:Tidyのインストール/設定(PHP公式マニュアル)

id:ReoReo7

ありがとうございます。確認してみたところ、PHP5.2.5でした。

大変初心者の質問で申し訳ないのですが、「configure オプション --with-tidy を指定してインストール」の方法が全く分からないです。

FFFTPを介して接続しています。ここからどのファイルにアクセスしたら良いでしょう?

/virtual/youraccount/にはフォルダlog, Maindir, pear, public_htmlがあります。

public_htmlにはフォルダgo-pearがあります。

その他初期設定と特に変わりありません。

尚、サーバーにはphpMyAdminをインストールしてMySQLとの連携で使っています。php5は最初からインストールされていて、ルートディレクトリ?に相当するようなフォルダを使用した覚えはありません(ただpublic_htmlの下にphpファイルを置いて使っているだけ)。

あいまいな質問ですが、本当にPHPは初心者なので教えて頂けると助かります。

2010/11/12 13:08:54

その他の回答1件)

id:asuka645 No.1

回答回数856ベストアンサー獲得回数97ここでベストアンサー

ポイント35pt

ご利用のPHPのバージョンは4でしょうか、それとも5でしょうか?

お知らせください。


PHP5なら、configure オプション --with-tidy を指定してインストールします。

PHP4の場合は、(古い) PECL 拡張モジュール http://pecl.php.net/package/tidy を使います。


参考:Tidyのインストール/設定(PHP公式マニュアル)

id:ReoReo7

ありがとうございます。確認してみたところ、PHP5.2.5でした。

大変初心者の質問で申し訳ないのですが、「configure オプション --with-tidy を指定してインストール」の方法が全く分からないです。

FFFTPを介して接続しています。ここからどのファイルにアクセスしたら良いでしょう?

/virtual/youraccount/にはフォルダlog, Maindir, pear, public_htmlがあります。

public_htmlにはフォルダgo-pearがあります。

その他初期設定と特に変わりありません。

尚、サーバーにはphpMyAdminをインストールしてMySQLとの連携で使っています。php5は最初からインストールされていて、ルートディレクトリ?に相当するようなフォルダを使用した覚えはありません(ただpublic_htmlの下にphpファイルを置いて使っているだけ)。

あいまいな質問ですが、本当にPHPは初心者なので教えて頂けると助かります。

2010/11/12 13:08:54
id:asuka645 No.2

回答回数856ベストアンサー獲得回数97

ポイント35pt

CORE SERVERというのはレンタルサーバのことですね。

見落としていました。ごめんなさい。


結論から言うと、残念ですが、PEARパッケージのインストールはできないようです。

事情は「CORESERVERでは、ライブラリ導入依頼をしても「セキュリティを高める」という理由から断られます」をご覧下さい。

ダメ元でCORE SERVER運用に頼んでみてはいかがでしょうか。

id:ReoReo7

ありがとうございます。

いろいろと調べるお手間をかけさせてすみませんでした。

以下は日本語が正しいか分からないのですが、

go-pearはOKで、pearからpearパッケージであるtidyのインストールは不可、

ということでしょうか?

結論的には、tidyの使用は不可能ということですね。

これを回避しながら何とかスクレイピング手段を探していきたいと思っています。

引き続き誰かから何かコメントがあるかもしれませんので、募集したいと思います。

2010/11/13 01:34:35
  • id:ReoReo7
    virtual/youraccount/pear/PEAR/temp/download/tidy-1.2.tgz
    を発見しました。
    go-pear/index.htmlからtidyを検索してパッケージ展開しようとしたところ、
    "unable to open package.xml"という趣旨のエラーコードにてtidyインストールが止まりました。
    この時のファイルと思います。
    尚、この時展開フォルダはautodetectで指定しました。

    どうしたら良いでしょう?一度ファイル削除?
  • id:rouge_2008
    CGI版のPHPを使うのでしたら、拡張モジュールをインストールする事で使用可能になると思います。
    なお、configure オプション --with-tidy を指定してtidyをインストールできるのは、PHP本体のインストール時です。
    CORE SERVERで独自にPHPをインストールできるかどうか分かりませんし、セキュリティの心配もありますので、インストール済みのCGI版のPHP+インストールした拡張モジュールで動かす方が良いと思います。


    ※拡張モジュールtidyのインストールには、libtidyがサーバーにインストールされている必要があります。
    次のような感じでサポート掲示板で要望を出してみてください。
    拡張モジュールのインストールごとお願いしてもいいかもしれません。
    http://webcache.googleusercontent.com/search?q=cache:QIitliRE27EJ:sb.xrea.com/showthread.php%3Fp%3D90029+CORE+Server+libtidy&cd=1&hl=ja&ct=clnk&gl=jp
    ただし、現在sb.xrea.comに接続できませんので、復活してからになると思います。
  • id:rouge_2008
    PEARのライブラリとしてtidyが提供されているかどうか分かりませんが、PEARのライブラリでしたら自分でインストールする事になると思います。

    「/virtual/youraccount/pear/PEAR/temp/download/tidy-1.2.tgz」は、次のページでダウンロードできるファイルと同一ではありませんか?
    これはPEARのライブラリではなく、PECLの拡張モジュールです。
    http://pecl.php.net/package/tidy

    上でもコメントしましたが、拡張モジュールであるtidyでしたら、サーバー側にlibtidyがインストールされていれば、おそらくインストールして利用する事が出来ると思います。
  • id:rouge_2008
    PHPでスクレイピングに役立つライブラリが紹介されています。
    http://dxd8.com/archives/85/

    tidyをインストールできない場合は、いくつか試してみてはいかがでしょうか?
    どれが早いかは分かりません。m(__)m
  • id:ReoReo7
    >rouge_2008さん

    いつもありがとうございます。
    はい、一緒です。
    サーバーにlibtidyがあれば、インストールして利用可能なのですね。
    libtidyの確認方法がちょっと分からないのですが、検討してみたいと思います♪
  • id:ReoReo7
    >rouge_2008さん

    追加コメントをありがとうございます。
    tidyに限定せずに検討して、インストールに成功すればそれを使っていけば良いのですね!
    ありがとうございます。
  • id:ReoReo7
    >「libtidyの確認方法」
    sb.xrea.comが復活してから、サポート掲示板で(ダメ元で)要望を出す。
    ですね。
    ちょっと心理的敷居が高いですが、他ライブラリと併せて検討してみます♪
  • id:rouge_2008
    まだメンテナンス(リニューアル?)中ですね・・・
    libtidy本体だけでなく、開発用パッケージも必要ですが、使用しているサーバーと、PHPのPECL拡張モジュールのインストールに必要な事を伝えれば大丈夫だと思います。
    ※開発用パッケージがインストールされていなければ、「ヘッダがみつかりません」というエラーが発生します。
    http://www.lovebug.jp/index.php?%A1%D6.%2Fconfigure%A1%D7%A1%A2%A1%D6make%A1%D7%A1%A2%A1%D6make%20install%A1%D7%A4%CE%B0%D5%CC%A3


    拡張モジュールtidyをインストールする場合、SSHでログインして作業する事になりますが、登録は済ませてありますか?
    http://www.coreserver.jp/help/index.php/path/
    上記ページに『(登録からご利用まで1日程度掛かります)』とありますので、管理画面から登録できるようになっているのではないかと思いますが・・・


    拡張モジュールのインストール方法は、次のページとそのリンク先のページを参考にしてください。
    参考ページの説明で分からなければ回答いたします。
    http://macs.o-ya.net/cboard/c-board.cgi?cmd=ntr;tree=1056;id=bbs
    http://d.hatena.ne.jp/flyaway/20080321/1206102937


    tidyはPHP5以降にバンドルされている物が新しいです。
    http://php.net/downloads.php
    ※CORE SERVERが5.2系のようですので、5.2.14にバンドルされているファイルでいいと思います。
  • id:ReoReo7
    ありがとうございます。
    メンテナンス鬱陶しいです。。。

    サーバーを伝えて、PHPのPECL拡張モジュールのインストールに必要なのでlibtidy本体に加えて開発パッケージも入れて欲しいと伝えるということですね。

    coreserverの有償版の登録は済ませてあり、現在使用中です。
    FTP登録はしていましたが、先ほど管理画面からSSHも登録しておきました。
    5~10分でできるようです。アドバイスありがとうございます。

    「tidyはPHP5以降にバンドルされている物が新しいです」→分かりました。

    いろいろとご丁寧にありがとうございます。
    開発スケジュール(素人で遅い...)の関係で、若干ペンディングされていますが1週間以内にはPHPによるスクレイピングに着手できる予定です。

    ご丁寧にありがとうございます。また分からなければ質問させて頂きます。
  • id:rouge_2008
    ポイント送信ありがとうございました。
    ユーザー掲示板からの依頼後、どのくらいで導入されるのか分かりませんので、お問い合わせフォームから問い合わせてもいいかもしれません。
    まだユーザー掲示板が復活していませんし・・・(メンテナンス長いですね。(^^; )


    tidyなしでスクレイピングをする場合ですが、「PHP Simple HTML DOM Parser」も便利なようです。
    http://simplehtmldom.sourceforge.net/

    ・紹介ページ
    http://smkn.xsrv.jp/blog/2010/02/php_simple_html_dom_parser/
    http://www.nijiiroworks.com/blog/214.html


    ※フォーム送信を行う場合は、「HTMLScraping」の方が便利なように思います。
    http://www.rcdtokyo.com/etc/htmlscraping/
    http://www.rcdtokyo.com/ucb/contents/i000851.php
    (「HTTP_Request」+「TidyまたはHTMLParser」が必要です。)

この質問への反応(ブックマークコメント)

「あの人に答えてほしい」「この質問はあの人が答えられそう」というときに、回答リクエストを送ってみてましょう。

これ以上回答リクエストを送信することはできません。制限について

回答リクエストを送信したユーザーはいません