使用phpQuery輕巧采集網(wǎng)頁內(nèi)容
Jun 13, 2016 pm 12:12 PM
使用phpQuery輕松采集網(wǎng)頁內(nèi)容
phpQuery是一個(gè)基于PHP的服務(wù)端開源項(xiàng)目,它可以讓PHP開發(fā)人員輕松處理DOM文檔內(nèi)容,比如獲取某新聞網(wǎng)站的頭條信息。更有意思的是,它采用了jQuery的思想,你可以像使用jQuery一樣處理頁面內(nèi)容,獲取你想要的頁面信息。
采集頭條
先看一實(shí)例,現(xiàn)在我要采集新浪網(wǎng)國(guó)內(nèi)新聞的頭條,代碼如下:
<span style="color: #0000ff;">include</span> 'phpQuery/phpQuery.php'<span style="color: #000000;">; phpQuery</span>::newDocumentFile('http://news.sina.com.cn/china'<span style="color: #000000;">); </span><span style="color: #0000ff;">echo</span> pq(".blkTop h1:eq(0)")->html();
簡(jiǎn)單的三行代碼,就可以獲取頭條內(nèi)容。首先在程序中包含phpQuery.php核心程序,然后調(diào)用讀取目標(biāo)網(wǎng)頁,最后輸出對(duì)應(yīng)標(biāo)簽下的內(nèi)容。
pq()是一個(gè)功能強(qiáng)大的方法,跟jQuery的$()如出一轍,jQuery的選擇器基本上都能使用在phpQuery上,只要把“.”變成“->”。如上例中,pq(".blkTop h1:eq(0)")抓取了頁面class屬性為blkTop的DIV元素,并找到該DIV內(nèi)部的第一個(gè)h1標(biāo)簽,然后用html()方法獲取h1標(biāo)簽里的內(nèi)容(帶html標(biāo)簽),也就是我們要獲取的頭條信息,如果使用text()方法,則只獲取頭條的文本內(nèi)容。當(dāng)然要使用好phpQuery,關(guān)鍵是要找對(duì)文檔中對(duì)應(yīng)內(nèi)容的節(jié)點(diǎn)。
采集文章列表
下面再來看一個(gè)例子,獲取helloweba.com網(wǎng)站的blog列表,請(qǐng)看代碼:
<span style="color: #0000ff;">include</span> 'phpQuery/phpQuery.php'<span style="color: #000000;">; phpQuery</span>::newDocumentFile('http://www.helloweba.com/blog.html'<span style="color: #000000;">); </span><span style="color: #800080;">$artlist</span> = pq(".blog_li"<span style="color: #000000;">); </span><span style="color: #0000ff;">foreach</span>(<span style="color: #800080;">$artlist</span> <span style="color: #0000ff;">as</span> <span style="color: #800080;">$li</span><span style="color: #000000;">){ </span><span style="color: #0000ff;">echo</span> pq(<span style="color: #800080;">$li</span>)->find('h2')->html().""<span style="color: #000000;">; } </span>
通過循環(huán)列表中的DIV,找出文章標(biāo)題并輸出,就是這么簡(jiǎn)單。
解析XML文檔
假設(shè)現(xiàn)在有一個(gè)這樣的test.xml文檔:
<?xml version="1.0" encoding="utf-8"?> <root> <contact> <name>張三</name> <age>22</age> </contact> <contact> <name>王五</name> <age>18</age> </contact> </root>
現(xiàn)在我要獲取名字為張三的聯(lián)系人的年齡,代碼如下:
<span style="color: #0000ff;">include</span> 'phpQuery/phpQuery.php'<span style="color: #000000;">; phpQuery</span>::newDocumentFile('test.xml'<span style="color: #000000;">); </span><span style="color: #0000ff;">echo</span> pq('contact > age:eq(0)');
結(jié)果輸出:22
像jQuery一樣,精準(zhǔn)查找文檔節(jié)點(diǎn),輸出節(jié)點(diǎn)下的內(nèi)容,解析一個(gè)XML文檔就是這么簡(jiǎn)單?,F(xiàn)在你不必為采集網(wǎng)站內(nèi)容而使用那些頭疼的正則算法、內(nèi)容替換等繁瑣的代碼了,有了phpQuery,一切就變得輕松多了。
項(xiàng)目官網(wǎng)地址:http://code.google.com/p/phpquery/

Hei?e KI -Werkzeuge

Undress AI Tool
Ausziehbilder kostenlos

Undresser.AI Undress
KI-gestützte App zum Erstellen realistischer Aktfotos

AI Clothes Remover
Online-KI-Tool zum Entfernen von Kleidung aus Fotos.

Clothoff.io
KI-Kleiderentferner

Video Face Swap
Tauschen Sie Gesichter in jedem Video mühelos mit unserem v?llig kostenlosen KI-Gesichtstausch-Tool aus!

Hei?er Artikel

Hei?e Werkzeuge

Notepad++7.3.1
Einfach zu bedienender und kostenloser Code-Editor

SublimeText3 chinesische Version
Chinesische Version, sehr einfach zu bedienen

Senden Sie Studio 13.0.1
Leistungsstarke integrierte PHP-Entwicklungsumgebung

Dreamweaver CS6
Visuelle Webentwicklungstools

SublimeText3 Mac-Version
Codebearbeitungssoftware auf Gottesniveau (SublimeText3)

Detaillierte Erl?uterung der jQuery-Referenzmethode: Kurzanleitung jQuery ist eine beliebte JavaScript-Bibliothek, die h?ufig in der Website-Entwicklung verwendet wird. Sie vereinfacht die JavaScript-Programmierung und bietet Entwicklern umfangreiche Funktionen und Features. In diesem Artikel wird die Referenzmethode von jQuery ausführlich vorgestellt und spezifische Codebeispiele bereitgestellt, um den Lesern einen schnellen Einstieg zu erleichtern. Einführung in jQuery Zuerst müssen wir die jQuery-Bibliothek in die HTML-Datei einführen. Es kann über einen CDN-Link eingeführt oder heruntergeladen werden

Wie verwende ich die PUT-Anfragemethode in jQuery? In jQuery ?hnelt die Methode zum Senden einer PUT-Anfrage dem Senden anderer Arten von Anfragen, Sie müssen jedoch auf einige Details und Parametereinstellungen achten. PUT-Anfragen werden normalerweise zum Aktualisieren von Ressourcen verwendet, beispielsweise zum Aktualisieren von Daten in einer Datenbank oder zum Aktualisieren von Dateien auf dem Server. Das Folgende ist ein spezifisches Codebeispiel, das die PUT-Anforderungsmethode in jQuery verwendet. Stellen Sie zun?chst sicher, dass Sie die jQuery-Bibliotheksdatei einschlie?en. Anschlie?end k?nnen Sie eine PUT-Anfrage senden über: $.ajax({u

Titel: jQuery-Tipps: ?ndern Sie schnell den Text aller Tags auf der Seite. In der Webentwicklung müssen wir h?ufig Elemente auf der Seite ?ndern und bedienen. Wenn Sie jQuery verwenden, müssen Sie manchmal den Textinhalt aller a-Tags auf der Seite gleichzeitig ?ndern, was Zeit und Energie sparen kann. Im Folgenden wird erl?utert, wie Sie mit jQuery den Text aller Tags auf der Seite schnell ?ndern k?nnen, und es werden spezifische Codebeispiele angegeben. Zuerst müssen wir die jQuery-Bibliotheksdatei einführen und sicherstellen, dass der folgende Code in die Seite eingefügt wird: <

Titel: Verwenden Sie jQuery, um den Textinhalt aller Tags zu ?ndern. jQuery ist eine beliebte JavaScript-Bibliothek, die h?ufig zur Verarbeitung von DOM-Operationen verwendet wird. Bei der Webentwicklung müssen wir h?ufig den Textinhalt des Link-Tags (eines Tags) auf der Seite ?ndern. In diesem Artikel wird erl?utert, wie Sie mit jQuery dieses Ziel erreichen, und es werden spezifische Codebeispiele bereitgestellt. Zuerst müssen wir die jQuery-Bibliothek in die Seite einführen. Fügen Sie den folgenden Code in die HTML-Datei ein:

Wie entferne ich das H?henattribut eines Elements mit jQuery? Bei der Front-End-Entwicklung müssen wir h?ufig die H?henattribute von Elementen manipulieren. Manchmal müssen wir m?glicherweise die H?he eines Elements dynamisch ?ndern, und manchmal müssen wir das H?henattribut eines Elements entfernen. In diesem Artikel wird erl?utert, wie Sie mit jQuery das H?henattribut eines Elements entfernen, und es werden spezifische Codebeispiele bereitgestellt. Bevor wir jQuery zum Betreiben des H?henattributs verwenden, müssen wir zun?chst das H?henattribut in CSS verstehen. Das H?henattribut wird verwendet, um die H?he eines Elements festzulegen

jQuery ist eine beliebte JavaScript-Bibliothek, die h?ufig zur DOM-Manipulation und Ereignisbehandlung in Webseiten verwendet wird. In jQuery wird die Methode eq() verwendet, um Elemente an einer bestimmten Indexposition auszuw?hlen. Die spezifischen Verwendungs- und Anwendungsszenarien sind wie folgt. In jQuery w?hlt die Methode eq() das Element an einer angegebenen Indexposition aus. Indexpositionen beginnen bei 0 zu z?hlen, d. h. der Index des ersten Elements ist 0, der Index des zweiten Elements ist 1 und so weiter. Die Syntax der eq()-Methode lautet wie folgt: $("s

jQuery ist eine beliebte JavaScript-Bibliothek, die h?ufig in der Webentwicklung verwendet wird. W?hrend der Webentwicklung ist es h?ufig erforderlich, mithilfe von JavaScript dynamisch neue Zeilen zu Tabellen hinzuzufügen. In diesem Artikel wird erl?utert, wie Sie mit jQuery neue Zeilen zu einer Tabelle hinzufügen, und es werden spezifische Codebeispiele bereitgestellt. Zuerst müssen wir die jQuery-Bibliothek in die HTML-Seite einführen. Die jQuery-Bibliothek kann über den folgenden Code in das Tag eingeführt werden:

Wie kann man feststellen, ob ein jQuery-Element ein bestimmtes Attribut hat? Wenn Sie jQuery zum Betreiben von DOM-Elementen verwenden, sto?en Sie h?ufig auf Situationen, in denen Sie feststellen müssen, ob ein Element ein bestimmtes Attribut hat. In diesem Fall k?nnen wir diese Funktion einfach mit Hilfe der von jQuery bereitgestellten Methoden implementieren. Im Folgenden werden zwei h?ufig verwendete Methoden vorgestellt, um festzustellen, ob ein jQuery-Element über bestimmte Attribute verfügt, und um spezifische Codebeispiele anzuh?ngen. Methode 1: Verwenden Sie die Methode attr() und den Operator typeof //, um zu bestimmen, ob das Element ein bestimmtes Attribut hat
