国产av日韩一区二区三区精品,成人性爱视频在线观看,国产,欧美,日韩,一区,www.成色av久久成人,2222eeee成人天堂

目次
PHP は最も単純なクローラー プロトタイプを?qū)g裝します (原作者の通常のコメントが逆になり、エラーが発生します (笑)) " >PHP は最も単純なクローラー プロトタイプを?qū)g裝します (原作者の通常のコメントが逆になり、エラーが発生します (笑))
ホームページ バックエンド開発 PHPチュートリアル PHP クローラー キャプチャ情報とアンチクローラー関連

PHP クローラー キャプチャ情報とアンチクローラー関連

Jun 13, 2016 pm 12:20 PM
curl nbsp quot

PHP クローラーは情報とアンチクローラー関連をキャプチャします。
58 はユーザーをクロールし、Ganji と 58 は相互にクロールしました。最終的には、すべての情報は同じであり、それらはすべてデータベース呼び出しでした。クローラー、隠されたルールああ、支配的なプレイヤーの一部がさまざまな方法で密かに攻撃しています。ユーモラスな例についてはあまりコメントしたくありません。 Donkey.com Web サイトの。この時代は、お金を使い、お金を集める時代です。あらゆる種類のヤオ?チェン、ヤン?ミー、ゲー?ユー、あらゆる種類の地下鉄やバスの広告、あらゆる種類の衛(wèi)星テレビの広告が圧倒的です~~~

PHP クローラーがどのように情報をキャプチャするかについて話しましょう~~Curl 関數(shù)は PHP クローラーの最初の選択肢です。まずそれを知ってください。
0x01.curl 拡張機能のインストール:
1. php サブフォルダー ext に php_curl.dll があることを確認します (一般的に入手可能) 、環(huán)境変數(shù)は設(shè)定中に設(shè)定されます)
2. php.ini の ;extension=php_curl.dll を extension=php_curl.dll としてコメント解除します
3. Apache を再起動すると完了です。
4. それでも動作しない場合は、php5/libeay32.dll と ssleay32.dll をシステム ディレクトリ windows/ にコピーします。これら 2 つの DLL の説明は OpenSSL 共有ライブラリです。

それ以外の場合、
致命的なエラー: XX:XXXXXX.php の 3 行目で未定義の関數(shù)curl_init() を呼び出しますか?
これは未定義でライブラリが見つからないというエラーです。誰もがそれを知っています。

0x02. まず、情報を収集してクローリングする前に、curl に慣れましょう。大爆発の情報時代では、情報をクローリングするのは難しくありません。ちなみに、 ログイン、COOKIE をテストしてください。

PHP の CURL 関數(shù)ライブラリ (クライアント URL ライブラリ関數(shù)) は強力なライブラリです。

curl_close — Curl セッションを閉じる
curl_copy_handle — Curl 接続リソースのすべての內(nèi)容とパラメーターをコピーします
curl_errno — 現(xiàn)在のセッションのエラー情報を含む數(shù)値を返します
curl_error — エラーを返します現(xiàn)在のセッションの文字列を含むエラー メッセージ エラー メッセージ
curl_exec — Curl セッションを?qū)g行します
curl_getinfo — Curl 接続リソース ハンドルに関する情報を取得します
curl_init — Curl セッションを初期化します
curl_multi_add_handle — Curl バッチ セッションに追加します個々のカール ハンドル リソース
curl_multi_close — バッチ ハンドル リソースを閉じる
curl_multi_exec — Curl バッチ ハンドルを解析します
curl_multi_getcontent — 取得した出力のテキスト ストリームを返します
curl_multi_info_read — 現(xiàn)在解析されているcurlを取得します 関連送信情報
curl_multi_init — Curl バッチ ハンドル リソースを初期化します
curl_multi_remove_handle — Curl バッチ ハンドル リソース內(nèi)のハンドル リソースを削除します
curl_multi_select — cURL 拡張機能に関連付けられているすべてのソケットを取得し、「選択」できます
curl_setopt_array — Curl のセッション パラメータを配列形式で設(shè)定します
curl_setopt — Curl のセッション パラメータを設(shè)定します
curl_version — Curl 関連のバージョン情報を取得します

curl_init() 関數(shù)の役割は、curl セッションを初期化することです。curl_init() 関數(shù)の唯一のパラメータはオプションであり、URL アドレスを表します。
curl_exec() 関數(shù)は、curl セッションを?qū)g行するために使用されます。唯一のパラメーターは、curl_init() 関數(shù)によって返されるハンドルです。
curl_close() 関數(shù)は、curl セッションを閉じるために使用されます。唯一のパラメータは、curl_init() 関數(shù)によって返されるハンドルです。

簡単な例:
$url = "http://yxmhero1989.blog.163.com/";//これはお勧めしません。大規(guī)模な Web サイトをクロールします。通常、クローラー対策メカニズムが備わっています。IP がブロックされても私を責めないでください~~
$ch =curl_init($url);//初期curlセッション
$fp = fopen(" homepage.txt", "w" ); //キャプチャしたWebページの內(nèi)容をtxtファイルに書き込みます。データベースの操作方法を説明します。
curl_setopt($ch, CURLOPT_FILE, $fp);//curl のセッションパラメータを設(shè)定します
curl_setopt($ch, CURLOPT_HEADER, 0);//ヘッダーを設(shè)定します
curl_exec($ch);// Curl セッションを?qū)g行
curl_close($ch);//curl セッションを閉じる
fclose($fp);
?>

0x03. CURL_SETOPT() 関數(shù)の設(shè)定について

boolcurl_setopt (int ch,文字列オプション、混合値)

curl_setopt() 関數(shù)は、CURL セッションのオプションを設(shè)定します。 option パラメータは必要な設(shè)定であり、value はこのオプションで指定される値です。

次のオプションの値は、長整數(shù) (オプション パラメーターで指定) として使用されます:

* CURLOPT_INFILESIZE:ファイルをアップロードする リモート サイトに、このオプションはアップロードするファイルのサイズを PHP に伝えます。
* CURLOPT_VERBOSE: CURL にすべての予期しないイベントを報告させたい場合は、このオプションをゼロ以外の値に設(shè)定します。
* CURLOPT_HEADER: 出力にヘッダーを含める場合は、このオプションをゼロ以外の値に設(shè)定します。
* CURLOPT_NOPROGRESS: PHP に CURL 転送の進行狀況バーを表示させたくない場合は、このオプションをゼロ以外の値に設(shè)定します。注: PHP はこのオプションをゼロ以外の値に自動的に設(shè)定します。このオプションはデバッグ目的でのみ変更してください。
* CURLOPT_NOBODY: 出力に本文部分を含めたくない場合は、このオプションをゼロ以外の値に設(shè)定します。
* CURLOPT_FAILONERROR: エラーが発生した場合 (HTTP コードが 300 以上を返す場合)、PHP が表示されないようにするには、このオプションをゼロ以外の値に設(shè)定します。デフォルトの動作では、通常のページが返され、コードは無視されます。
* CURLOPT_UPLOAD: PHP にアップロードの準備をさせたい場合は、このオプションをゼロ以外の値に設(shè)定します。
* CURLOPT_POST: PHP で通常の HTTP POST を?qū)g行する場合は、このオプションをゼロ以外の値に設(shè)定します。この POST は通常の application/x-www-from-urlencoded タイプで、主に HTML フォームで使用されます。
* CURLOPT_FTPLISTONLY: このオプションをゼロ以外の値に設(shè)定すると、PHP は FTP のディレクトリ名をリストします。
* CURLOPT_FTPAPPEND: このオプションをゼロ以外の値に設(shè)定すると、PHP はリモート ファイルを上書きせずに適用します。
* CURLOPT_NETRC: このオプションをゼロ以外の値に設(shè)定すると、PHP は ~./netrc ファイル內(nèi)で接続先のリモート サイトのユーザー名とパスワードを検索します。
* CURLOPT_FOLLOWLOCATION: このオプションをゼロ以外のヘッダー ("Location: " など) に設(shè)定すると、サーバーはそれを HTTP ヘッダーの一部として送信します (これは再帰的であることに注意してください。PHP は "Location: " のようなものを送信します)頭)。
* CURLOPT_PUT: HTTP を使用してファイルをアップロードするには、このオプションをゼロ以外の値に設(shè)定します。このファイルをアップロードするには、CURLOPT_INFILE および CURLOPT_INFILESIZE オプションを設(shè)定する必要があります。
* CURLOPT_MUTE: このオプションをゼロ以外の値に設(shè)定すると、PHP は CURL 関數(shù)に対して完全にサイレントになります。
* CURLOPT_TIMEOUT: 最大秒數(shù)として長整數(shù)を設(shè)定します。
* CURLOPT_LOW_SPEED_LIMIT: 送信されるバイト數(shù)を制御する長整數(shù)を設(shè)定します。
* CURLOPT_LOW_SPEED_TIME: CURLOPT_LOW_SPEED_LIMIT で指定されたバイト數(shù)を送信する秒數(shù)を制御する長整數(shù)を設(shè)定します。
* CURLOPT_RESUME_FROM: バイト オフセット アドレス (転送先の開始フォーム) を含む長いパラメータを渡します。
* CURLOPT_SSLVERSION: SSL バージョンを含む長いパラメーターを渡します。デフォルトでは、PHP は獨自のハードワークを?qū)g行しますが、セキュリティを強化するには手動で設(shè)定する必要があります。
* CURLOPT_TIMECONDITION: 長いパラメーターを渡して、CURLOPT_TIMEVALUE パラメーターの処理方法を指定します。このパラメータは TIMECOND_IFMODSINCE または TIMECOND_ISUNMODSINCE に設(shè)定できます。これはHTTPのみの場合です。
* CURLOPT_TIMEVALUE: 1970 年 1 月 1 日から現(xiàn)在までの秒數(shù)を渡します。この時間は、CURLOPT_TIMEVALUE オプション、またはデフォルトの TIMECOND_IFMODSINCE によって指定された値として使用されます。

次のオプションの値は文字列として扱われます:

* CURLOPT_URL: これは、PHP を使用して取得する URL アドレスです。このオプションは、curl_init() 関數(shù)を使用した初期化中に設(shè)定することもできます。
* CURLOPT_USERPWD: [ユーザー名]:[パスワード] の形式で文字列を渡し、PHP を使用して接続します。
* CURLOPT_PROXYUSERPWD: [ユーザー名]:[パスワード] の形式で文字列を渡し、HTTP プロキシに接続します。
* CURLOPT_RANGE: 指定したい範囲を渡します。 X または Y を除いた「X-Y」形式である必要があります。 HTTP 転送では、カンマ (X-Y、N-M) で區(qū)切られた複數(shù)の間隔もサポートされます。
* CURLOPT_POSTFIELDS: すべてのデータを含む文字列を HTTP "POST" 操作として渡します。
* CURLOPT_REFERER: HTTP リクエスト內(nèi)の「リファラー」ヘッダーを含む文字列。
* CURLOPT_USERAGENT: HTTP リクエスト內(nèi)の「user-agent」ヘッダーを含む文字列。
* CURLOPT_FTPPORT: ftp の「POST」コマンドで使用される IP アドレスを含む IP アドレスを渡します。この POST 命令は、指定した IP アドレスに接続するようにリモート サーバーに指示します。この文字列には、IP アドレス、ホスト名、ネットワーク インターフェイス名 (UNIX の場合)、または「-」 (システムのデフォルトの IP アドレスを使用) を指定できます。
* CURLOPT_COOKIE: HTTP Cookie を含むヘッダー接続を渡します。
* CURLOPT_SSLCERT: 証明書を含む文字列を PEM 形式で渡します。
* CURLOPT_SSLCERTPASSWD: CURLOPT_SSLCERT 証明書を使用するために必要なパスワードを含むパスワードを渡します。
* CURLOPT_COOKIEFILE: Cookie データを含むファイルの名前を含む文字列を渡します。この Cookie ファイルは、Netscape 形式であることも、ファイルに保存されている HTTP スタイルのヘッダーのスタックであることもできます。
* CURLOPT_CUSTOMREQUEST: HTTP リクエストを行う際に、GET または HEAD で使用する文字を渡します。 HTTP リクエストを?qū)g行するときに GET または HEAD の代わりに使用される文字列を渡します。これは、HTTP リクエストを?qū)g行する場合や、よりわかりにくい別の HTTP リクエストを?qū)g行する場合に便利です。次のオプションには、ファイルの説明 (fopen() 関數(shù)を使用して取得) が必要です。
* CURLOPT_FILE: このファイルは、配置および送信する出力ファイルになります。
* CURLOPT_INFILE: このファイルは、配置して送信する出力ファイルになります。
* CURLOPT_WRITEHEADER: このファイルには出力のヘッダー部分が含まれます。
* CURLOPT_STDERR: このファイルには、stderr の代わりにエラーが書き込まれています。ログインが必要なページを取得する例。現(xiàn)在の方法は、必要な人が毎回ログインする方法です。

PHP は最も単純なクローラー プロトタイプを?qū)g裝します (原作者の通常のコメントが逆になり、エラーが発生します (笑))


コードは次のとおりです

function _getUrlContent($url){
$handle = fopen($url, "r");
if($handle){
$content = stream_get_contents($handle,1024*1024);
return $content;
}else{
return false;
}
}

関數(shù)_filterUrl($web_content){
$reg_tag_a = "/<[a|A].*?href=['"]{0,1}([^>' " ]*).*?>/";
//$result = preg_match_all($reg_tag_a,$web_content,$match_result);
$result = preg_match_all("/]*?name=['"]?description['"]?[^>]*?>/is",$web_content,$ match_result);
if($result){
return $match_result[1];
}
}


function _reviseUrl($base_url,$url_list){
$url_info = parse_url($base_url);
$base_url = $url_info["scheme"].'://';
if($ url_info["user"]&&$url_info["pass"]){
$base_url .= $url_info["user"]。" :".$url_info["pass"]."@";
}
$base_url .= $url_info["host" ];
if($url_info["port"]){
$base_url .= ":".$url_info["port"];
}
$base_url .= $url_info["path"];
print_r($base_url);
if(is_array($url_list)){
foreach ($url_list as $url_item) {
if( preg_match('/^http/',$url_item)){
//已經(jīng)是完全的url
$ result[] = $url_item;
}else {
//不完全なurl
$real_url = $base_url.'/'.$url_item;
$result[] = $real_url;
}
}
return $result;
}else {
return;
}
}

関數(shù)クローラ($url){
$content = _getUrlContent($url) ;
if($content){
$url_list = _reviseUrl($url,_filterUrl( $content));
if($url_list){
return $url_list;
}else {
return ;
}
}else{
return ;
}
}

function main(){
$current_url = "http://hao123.com/";//最初のurl
$fp_puts = fopen("url.txt","ab");//記錄url列表
$fp_gets = fopen("url.txt","r");//保存url列表
do{
このウェブサイトの聲明
この記事の內(nèi)容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰屬します。このサイトは、それに相當する法的責任を負いません。盜作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡(luò)ください。

ホットAIツール

Undress AI Tool

Undress AI Tool

脫衣畫像を無料で

Undresser.AI Undress

Undresser.AI Undress

リアルなヌード寫真を作成する AI 搭載アプリ

AI Clothes Remover

AI Clothes Remover

寫真から衣服を削除するオンライン AI ツール。

Clothoff.io

Clothoff.io

AI衣類リムーバー

Video Face Swap

Video Face Swap

完全無料の AI 顔交換ツールを使用して、あらゆるビデオの顔を簡単に交換できます。

ホットツール

メモ帳++7.3.1

メモ帳++7.3.1

使いやすく無料のコードエディター

SublimeText3 中國語版

SublimeText3 中國語版

中國語版、とても使いやすい

ゼンドスタジオ 13.0.1

ゼンドスタジオ 13.0.1

強力な PHP 統(tǒng)合開発環(huán)境

ドリームウィーバー CS6

ドリームウィーバー CS6

ビジュアル Web 開発ツール

SublimeText3 Mac版

SublimeText3 Mac版

神レベルのコード編集ソフト(SublimeText3)

Windows 11 でウィンドウの境界線の設(shè)定を調(diào)整する方法: 色とサイズを変更する Windows 11 でウィンドウの境界線の設(shè)定を調(diào)整する方法: 色とサイズを変更する Sep 22, 2023 am 11:37 AM

Windows 11 では、新鮮でエレガントなデザインが前面に押し出されており、最新のインターフェイスにより、ウィンドウの境界線などの細部をカスタマイズして変更することができます。このガイドでは、Windows オペレーティング システムで自分のスタイルを反映した環(huán)境を作成するのに役立つ手順について説明します。ウィンドウの境界線の設(shè)定を変更するにはどうすればよいですか? + を押して設(shè)定アプリを開きます。 Windows [個人用設(shè)定] に移動し、[色の設(shè)定] をクリックします。ウィンドウの境界線の色の変更設(shè)定ウィンドウ 11" width="643" height="500" > [タイトル バーとウィンドウの境界線にアクセント カラーを表示する] オプションを見つけて、その橫にあるスイッチを切り替えます。 [スタート] メニューとタスク バーにアクセント カラーを表示するにはスタート メニューとタスク バーにテーマの色を表示するには、[スタート メニューとタスク バーにテーマを表示] をオンにします。

解決策: 組織では PIN を変更する必要があります。 解決策: 組織では PIN を変更する必要があります。 Oct 04, 2023 pm 05:45 PM

ログイン畫面に「組織から PIN の変更を求められています」というメッセージが表示されます。これは、個人のデバイスを制御できる組織ベースのアカウント設(shè)定を使用しているコンピューターで PIN の有効期限の制限に達した場合に発生します。ただし、個人アカウントを使用して Windows をセットアップした場合、エラー メッセージは表示されないのが理想的です。常にそうとは限りませんが。エラーが発生したほとんどのユーザーは、個人アカウントを使用して報告します。私の組織が Windows 11 で PIN を変更するように要求するのはなぜですか?アカウントが組織に関連付けられている可能性があるため、主なアプローチはこれを確認することです。ドメイン管理者に問い合わせると解決できます。さらに、ローカル ポリシー設(shè)定が間違っていたり、レジストリ キーが間違っていたりすると、エラーが発生する可能性があります。今すぐ

Windows 11でタイトルバーの色を変更するにはどうすればよいですか? Windows 11でタイトルバーの色を変更するにはどうすればよいですか? Sep 14, 2023 pm 03:33 PM

デフォルトでは、Windows 11 のタイトル バーの色は、選択したダーク/ライト テーマによって異なります。ただし、任意の色に変更できます。このガイドでは、デスクトップ エクスペリエンスを変更し、視覚的に魅力的なものにするためにカスタマイズする 3 つの方法について、段階的な手順を説明します。アクティブなウィンドウと非アクティブなウィンドウのタイトル バーの色を変更することはできますか?はい、設(shè)定アプリを使用してアクティブなウィンドウのタイトル バーの色を変更したり、レジストリ エディターを使用して非アクティブなウィンドウのタイトル バーの色を変更したりできます。これらの手順を?qū)W習するには、次のセクションに進んでください。 Windows 11でタイトルバーの色を変更するにはどうすればよいですか? 1. 設(shè)定アプリを使用して + を押して設(shè)定ウィンドウを開きます。 Windows「個人用設(shè)定」に進み、

Windows 11 でタスクバーのサムネイル プレビューを有効または無効にする方法 Windows 11 でタスクバーのサムネイル プレビューを有効または無効にする方法 Sep 15, 2023 pm 03:57 PM

タスクバーのサムネイルは楽しい場合もありますが、気が散ったり煩わしい場合もあります。この領(lǐng)域にマウスを移動する頻度を考えると、重要なウィンドウを誤って閉じてしまったことが何度かある可能性があります。もう 1 つの欠點は、より多くのシステム リソースを使用することです。そのため、リソース効率を高める方法を探している場合は、それを無効にする方法を説明します。ただし、ハードウェアの仕様が対応可能で、プレビューが気に入った場合は、有効にすることができます。 Windows 11でタスクバーのサムネイルプレビューを有効にする方法は? 1. 設(shè)定アプリを使用してキーをタップし、[設(shè)定] をクリックします。 Windows では、「システム」をクリックし、「バージョン情報」を選択します。 「システムの詳細設(shè)定」をクリックします。 [詳細設(shè)定] タブに移動し、[パフォーマンス] の下の [設(shè)定] を選択します。 「視覚効果」を選択します

Windows 11/10修復(fù)におけるOOBELANGUAGEエラーの問題 Windows 11/10修復(fù)におけるOOBELANGUAGEエラーの問題 Jul 16, 2023 pm 03:29 PM

Windows インストーラー ページに「問題が発生しました」というメッセージとともに「OOBELANGUAGE」というメッセージが表示されますか?このようなエラーが原因で Windows のインストールが停止することがあります。 OOBE とは、すぐに使えるエクスペリエンスを意味します。エラー メッセージが示すように、これは OOBE 言語の選択に関連する問題です。心配する必要はありません。OOBE 畫面自體から気の利いたレジストリ編集を行うことで、この問題を解決できます。クイックフィックス – 1. OOBE アプリの下部にある [再試行] ボタンをクリックします。これにより、問題が発生することなくプロセスが続行されます。 2. 電源ボタンを使用してシステムを強制的にシャットダウンします。システムの再起動後、OOBE が続行されます。 3. システムをインターネットから切斷します。 OOBE のすべての側(cè)面をオフライン モードで完了する

Windows 11で明るさを調(diào)整する10の方法 Windows 11で明るさを調(diào)整する10の方法 Dec 18, 2023 pm 02:21 PM

畫面の明るさは、最新のコンピューティング デバイスを使用する上で不可欠な部分であり、特に長時間畫面を見る場合には重要です。目の疲れを軽減し、可読性を向上させ、コンテンツを簡単かつ効率的に表示するのに役立ちます。ただし、設(shè)定によっては、特に新しい UI が変更された Windows 11 では、明るさの管理が難しい場合があります。明るさの調(diào)整に問題がある場合は、Windows 11 で明るさを管理するすべての方法を次に示します。 Windows 11で明るさを変更する方法【10の方法を解説】 シングルモニターユーザーは、次の方法でWindows 11の明るさを調(diào)整できます。これには、ラップトップだけでなく、単一のモニターを使用するデスクトップ システムも含まれます。はじめましょう。方法 1: アクション センターを使用する アクション センターにアクセスできる

Windows 11 でのディスプレイ スケーリング ガイド Windows 11 でのディスプレイ スケーリング ガイド Sep 19, 2023 pm 06:45 PM

Windows 11 のディスプレイ スケーリングに関しては、好みが人それぞれ異なります。大きなアイコンを好む人もいれば、小さなアイコンを好む人もいます。ただし、適切なスケーリングが重要であることには誰もが同意します。フォントのスケーリングが不十分であったり、畫像が過度にスケーリングされたりすると、作業(yè)中の生産性が大幅に低下する可能性があるため、システムの機能を最大限に活用するためにカスタマイズする方法を知る必要があります。カスタム ズームの利點: これは、畫面上のテキストを読むのが難しい人にとって便利な機能です。一度に畫面上でより多くの情報を確認できるようになります。特定のモニターおよびアプリケーションにのみ適用するカスタム拡張プロファイルを作成できます。ローエンド ハードウェアのパフォーマンスの向上に役立ちます。畫面上の內(nèi)容をより詳細に制御できるようになります。 Windows 11の使用方法

Windows Serverでアクティベーションエラーコード0xc004f069を修正する方法 Windows Serverでアクティベーションエラーコード0xc004f069を修正する方法 Jul 22, 2023 am 09:49 AM

Windows のライセンス認証プロセスが突然切り替わり、このエラー コード 0xc004f069 を含むエラー メッセージが表示されることがあります。ライセンス認証プロセスはオンラインですが、Windows Server を?qū)g行している一部の古いシステムではこの問題が発生する可能性があります。これらの初期チェックを?qū)g行し、システムのアクティブ化に役に立たない場合は、問題を解決するための主要な解決策に進んでください。回避策 – エラー メッセージとアクティベーション ウィンドウを閉じます。次に、コンピュータを再起動します。 Windows ライセンス認証プロセスを最初から再試行します。解決策 1 – ターミナルからアクティブ化する cmd ターミナルから Windows Server Edition システムをアクティブ化します。ステージ – 1 Windows Server のバージョンを確認する 使用している W の種類を確認する必要があります

See all articles