国产av日韩一区二区三区精品,成人性爱视频在线观看,国产,欧美,日韩,一区,www.成色av久久成人,2222eeee成人天堂

<span id="vke6p"></span>

コミュニティ

學(xué)ぶ

ツールライブラリ

AIツール

レジャー

日本語(yǔ)

Python クローラーの解析効率を向上させるにはどうすればよいですか?

世界只因有你

世界只因有你 2017-06-12 09:20:36

0

3

862

現(xiàn)在、Windows 環(huán)境でマルチスレッドクロールを使用しています。
解析には beautifulsoup lxml を使用しています。

N クロールスレッド -> 解析キュー -> 1 解析スレッド -> ストレージキュー -> 1 ストレージスレッド

実行プログラム全體の効率は、計(jì)算量の多い解析スレッドに依存するため、解析スレッドの數(shù)だけを増やすと、スレッド切り替えのオーバーヘッドが増加し、速度が低下します。

解析効率を大幅に向上させる方法はありますか?

2 つの太ももの指示に従って、使用する準(zhǔn)備をします
非同期クローリング -> 解析キュー -> N 解析プロセス -> ストレージキュー -> ストレージスレッド

仕事を始める準(zhǔn)備ができました

世界只因有你

世界只因有你

全員に返信(3)

為情所困

為情所困2017-06-12 09:22:36 3棟

実際、あなたが先に書(shū)き直したかと思いますN個(gè)爬取線程 可以換成協(xié)程/線程池實(shí)現(xiàn), 因?yàn)槟阍陬l繁創(chuàng)建線程本省一種性能耗費(fèi), 用線程池雖然可以減少這部分的損耗, 但是上下文切換還是無(wú)法避免, 所以協(xié)程這方面, 應(yīng)該是比較合適的.
1個(gè)解析線程 換成 進(jìn)程池,多開(kāi)幾個(gè)進(jìn)程去計(jì)算密集處理, 其余應(yīng)該可以不用改, 如果還想再搞, 將核心部分用c/c++、お役に立てれば幸いです

いいねを押す +0

返信を追加

劉奇2017-06-12 09:22:36 2棟

私のアプローチはマルチプロセスです。マルチプロセスの利點(diǎn)は、単一マシンのパフォーマンスが十分ではない場(chǎng)合に、いつでも分散クローラに切り替えることができることです。

いいねを押す +0

返信を追加

淡淡煙草味

淡淡煙草味2017-06-12 09:22:36 1棟

tornade 非同期クローラーはオンラインで見(jiàn)つけることができます。私はこれを使用しています

いいねを押す +0

返信を追加

人気のトピック

詳細(xì)>

人気の記事

人気のチュートリアル

詳細(xì)>

関連するチュートリアル

人気のおすすめ

最新のコース

最新のダウンロード

詳細(xì)>

ウェブエフェクト

公式サイト

サイト素材

フロントエンドテンプレート

<center id="cwmmq"><optgroup id="cwmmq"><center id="cwmmq"></center></optgroup></center>

<span id="cwmmq"><nav id="cwmmq"></nav></span>

<bdo id="cwmmq"><tbody id="cwmmq"></tbody></bdo>