PHP simple_html_dom.php+通常記事コード集_PHPチュートリアル
Jul 21, 2016 pm 03:41 PM
//PHP Simple html Dom クラス ライブラリ ファイルをインクルードします
include_once('./simplehtmldom/simple_html_dom.php');
// HTML を収集する
関數(shù) getwebcontent($url){
$ch =curl_init();
curl_setopt($ch, CURLOPT_URL, $url);
curl_setopt( $ch, CURLOPT_CONNECTTIMEOUT , $timeout);
curl_setopt ($ch, CURLOPT_FOLLOWLOCATION, 1);
return $contents; //タイトルと URL を取得
$string =
getwebcontent('http://www.babytree.com/learn/zhunbeihuaiyun/jijibeiyun/2');
//通常のマッチング
preg_match_all ( "/< li>(.*)/",
$string, $out,
foreach(); $out as $key => $value){
$article['title'][] = $out[$key][2] = "http://www .babytree.com /learn/article/".$out[$key][1];
}
//url
foreach($article['link'] as $key=>$)に基づいて記事のコンテンツを取得します値){
$ html = file_get_html($value);
$div = $html->find('div[id=pagenum_0]');
$article[content][] = $div[0]-> ;innertext;
}
//タイトルを変換します---実際に使用するときはこの手順は必要ありません--元々 utf8 を使用する必要があるためです
//実際にはトランスコードしないとファイルとして保存できません
foreach($article[title] as $key= >$value){
$article[title][$key] = iconv('utf-8', 'gbk', $value);//トランスコーディング
}
//ファイルに保存
$num = count ($article['title']);
for($i=0; $ifile_put_contents("{$article[title][ $i]}.txt", $article[ 'content'][$i]);
}
/*本當(dāng)は12時(shí)までに送信したかったのですが。 。でも、見下ろせばもう3時(shí)半。 。 。 昨日のことだとしても、
本來、記事の內(nèi)容を取得するには正規(guī)表現(xiàn)を使うのが一番早い方法です
正規(guī)表現(xiàn)は良いのですが、正規(guī)表現(xiàn)は本當(dāng)に難しいです!そこで調(diào)べてみたところ、
ネット上ではPHP Simple Domを使っている人も多いようですが、効率は少し落ちるものの、それでも効果は十分です
クラスライブラリファイルのインクルードからtxtファイルの作成までにかかる時(shí)間は約1時(shí)間です。 7/8 秒で、さらに最適化するため、特に記事のコンテンツを取得するための通常のルールがあまりにも不快です
少し調(diào)べてください*/
?>
http://www.bkjia.com/PHPjc/321084.html
www.bkjia.com
tru??e
http://www.bkjia.com/PHPjc/321084.html

ホットAIツール

Undress AI Tool
脫衣畫像を無料で

Undresser.AI Undress
リアルなヌード寫真を作成する AI 搭載アプリ

AI Clothes Remover
寫真から衣服を削除するオンライン AI ツール。

Clothoff.io
AI衣類リムーバー

Video Face Swap
完全無料の AI 顔交換ツールを使用して、あらゆるビデオの顔を簡単に交換できます。

人気の記事

ホットツール

メモ帳++7.3.1
使いやすく無料のコードエディター

SublimeText3 中國語版
中國語版、とても使いやすい

ゼンドスタジオ 13.0.1
強(qiáng)力な PHP 統(tǒng)合開発環(huán)境

ドリームウィーバー CS6
ビジュアル Web 開発ツール

SublimeText3 Mac版
神レベルのコード編集ソフト(SublimeText3)

n 1クエリの問題を避け、関連するデータを事前にロードすることにより、データベースクエリの數(shù)を減らします。 2.必要なフィールドのみを選択して、メモリと帯域幅を保存するために完全なエンティティをロードしないようにします。 3. DoctrineのセカンダリキャッシュやRedis Cacheの高周波クエリ結(jié)果など、キャッシュ戦略を合理的に使用します。 4.エンティティのライフサイクルを最適化し、クリア()を定期的に呼び出してメモリを解放してメモリオーバーフローを防ぎます。 5.データベースインデックスが存在し、生成されたSQLステートメントを分析して、非効率的なクエリを避けます。 6.変更が不要なシナリオで自動変更追跡を無効にし、パフォーマンスを改善するためにアレイまたは軽量モードを使用します。 ORMを正しく使用するには、SQLモニタリング、キャッシュ、バッチ処理、適切な最適化を組み合わせて、開発効率を維持しながらアプリケーションのパフォーマンスを確保する必要があります。

settings.jsonファイルは、ユーザーレベルまたはワークスペースレベルのパスにあり、VSCODE設(shè)定のカスタマイズに使用されます。 1。ユーザーレベルのパス:WindowsはC:\ users \\ appdata \ roaming \ code \ user \ settings.json、macos is/users //settings.json、linux is /home/.config/code/user/settings.json; 2。Workspace-Level Path:.vscode/settings Project Root Directoryの設(shè)定

readonlypropertiesinphp8.2canonlybeassignedonedonedontheconstructoraturatiddeclaration andcannotBemodifiedifiedifiedifiedifiedifiedifiedifiadtivedabilityattthelanguagelele.2.

まず、JavaScriptを使用して、ユーザーシステムの設(shè)定とローカルに保存されたテーマ設(shè)定を取得し、ページテーマを初期化します。 1. HTML構(gòu)造には、トピックの切り替えをトリガーするボタンが含まれています。 2。CSSの使用:rootは明るいテーマ変數(shù)を定義し、.dark-modeクラスは暗いテーマ変數(shù)を定義し、これらの変數(shù)をvar()を介して適用します。 3. JavaScript検出は、カラーのスchemeを好み、LocalStorageを読み取り、最初のテーマを決定します。 4.ボタンをクリックするときにHTML要素のダークモードクラスを切り替え、現(xiàn)在の狀態(tài)をLocalStorageに保存します。 5.すべての色の変更には、ユーザーを強(qiáng)化するために0.3秒の移行アニメーションが伴います

HTML Unoderedリストを作成するには、タグを使用してリストコンテナを定義する必要があります。各リストアイテムはタグで包まれており、ブラウザは自動的に弾丸を追加します。 1.タグを使用してリストを作成します。 2。各リスト項(xiàng)目はタグで定義されています。 3.ブラウザは、デフォルトのドットシンボルを自動的に生成します。 4。サブリストはネスティングを通じて実裝できます。 5。CSSのリストスタイルタイプの屬性を使用して、ディスク、サークル、スクエア、またはなしなどのシンボルスタイルを変更します。これらのタグを正しく使用して、標(biāo)準(zhǔn)の非秩序化リストを生成します。

パフォーマンス分析ツールを使用してボトルネックを見つけ、開発とテスト段階でVisualVMまたはJProfilerを使用し、生産環(huán)境で非同期財(cái)産を優(yōu)先します。 2。オブジェクトの作成を削減し、オブジェクトを再利用し、StringBuilderを使用して文字列のスプライシングを置き換え、適切なGC戦略を選択します。 3.コレクションの使用を最適化し、シーンに応じて初期容量を選択し、プリセットします。 4.同時(shí)性を最適化し、同時(shí)コレクションを使用し、ロックの粒度を低減し、スレッドプールを合理的に設(shè)定します。 5. JVMパラメーターを調(diào)整し、合理的なヒープサイズと低遅延のゴミコレクターを設(shè)定し、GCログを有効にします。 6.コードレベルでの反射を避け、ラッパークラスを基本タイプに置き換え、初期化を遅延させ、最終と靜的を使用します。 7。JMHと組み合わせた連続性能テストと監(jiān)視

semantichtmlimprovesbothseoandaccessibilityを使用することはできません

useguzzleforrobustttprequestswithheadersandtimeouts.2.parsehtmleffitywithsymfonydomddomedrawlerusingssseLectors.3.handlejavascript-heavysitesbyintegratingpuppeteerviaphpexec()torenderpages.4.respectrobots.txt、rotedelays.txt、adddelays.txt、adddelays.txt、
