使用php simple html dom parser解析html標簽
Jun 13, 2016 am 10:53 AM
?
?
使用php simple html dom parser解析html標簽
用了一下
PHP Simple HTML DOM Parser?
解析HTML頁面,感覺還不錯,它能創(chuàng)建一個DOM tree方便你解析html里面的內容。用來抓東西挺好的。
?
附帶一個例子,你也到sourceforge下載壓縮包看里面的例子:
Scraping data with PHP Simple HTML DOM Parser?
?
PHP Simple HTML DOM Parser , written in PHP5+, allows you to manipulate HTML in a very easy way. Supporting invalid HTML, this parser is better then other PHP scripts using complicated regexes to extract information from web pages.
Before getting the necessary info, a DOM should be created from either URL or file. The following script extracts links & images from a website:
view plain copy to clipboard print ??
?
Php代碼 // Create DOM from URL or file ? ?
$html = file_get_html('http://www.microsoft.com/'); ? ?
? ?
// Extract links ? ?
foreach($html->find('a') as $element) ? ?
? ? ? ?echo $element->href . '
'; ? ??
? ?
// Extract images ? ?
foreach($html->find('img') as $element) ? ?
? ? ? ?echo $element->src . '
'; ?
[php]?
// Create DOM from URL or file ??
$html = file_get_html('http://www.microsoft.com/'); ?
// Extract links ??
foreach($html->find('a') as $element) ?
? ? ? ?echo $element->href . '
'; ??
// Extract images ??
foreach($html->find('img') as $element) ?
? ? ? ?echo $element->src . '
'; ?
?
// Create DOM from URL or file
$html = file_get_html('http://www.microsoft.com/');
// Extract links
foreach($html->find('a') as $element)
? ? ? ?echo $element->href . '
';?
// Extract images
foreach($html->find('img') as $element)
? ? ? ?echo $element->src . '
';
The parser can also be used to modify HTML elements:
view plain copy to clipboard print ??
?
Php代碼 // Create DOM from string ? ?
$html = str_get_html('
? ?
$html->find('div', 1)->class = 'bar'; ? ?
? ?
$html->find('div[id=simple]', 0)->innertext = 'Foo'; ? ?
? ?
// Output:
echo $html; ?
[php]?
// Create DOM from string ??
$html = str_get_html('
$html->find('div', 1)->class = 'bar'; ?
$html->find('div[id=simple]', 0)->innertext = 'Foo'; ?
// Output:
echo $html; ?
?
// Create DOM from string
$html = str_get_html('
$html->find('div', 1)->class = 'bar';
$html->find('div[id=simple]', 0)->innertext = 'Foo';
// Output:
echo $html;
Do you wish to retrieve content without any tags?
view plain copy to clipboard print ??
?
Php代碼 echo file_get_html('http://www.yahoo.com/')->plaintext; ?
[php]?
echo file_get_html('http://www.yahoo.com/')->plaintext; ?
?
echo file_get_html('http://www.yahoo.com/')->plaintext;In the package files of this parser ([url]http://simplehtmldom.sourceforge.net/[/url]) you can find some scraping examples from digg, imdb, slashdot. Let’s create one that extracts the first 10 results (titles only) for the keyword “php” from Google:
view plain copy to clipboard print ??
?
Php代碼 $url = 'http://www.google.com/search?hl=en&q=php&btnG=Search'; ? ?
? ?
// Create DOM from URL ? ?
$html = file_get_html($url); ? ?
? ?
// Match all 'A' tags that have the class attribute equal with 'l' ? ?
foreach($html->find('a[class=l]') as $key => $info) ? ?
{ ? ?
echo ($key + 1).'. '.$info->plaintext."
\n"; ? ?
} ?
[php]?
$url = 'http://www.google.com/search?hl=en&q=php&btnG=Search'; ?
// Create DOM from URL ??
$html = file_get_html($url); ?
// Match all 'A' tags that have the class attribute equal with 'l' ??
foreach($html->find('a[class=l]') as $key => $info) ?
{ ?
echo ($key + 1).'. '.$info->plaintext."
\n"; ?
} ?
?
$url = 'http://www.google.com/search?hl=en&q=php&btnG=Search';
// Create DOM from URL
$html = file_get_html($url);
// Match all 'A' tags that have the class attribute equal with 'l'
foreach($html->find('a[class=l]') as $key => $info)
{
echo ($key + 1).'. '.$info->plaintext."
\n";
}NOTE Make sure to include the parser before using any functions of it:
view plain copy to clipboard print ??
Php代碼?
include 'simple_html_dom.php'; ?
[php]?
include 'simple_html_dom.php'; ?
?
include 'simple_html_dom.php';For more information regarding the usage of this function consider checking the ‘PHP Simple HTML Dom Parser’ Manual. To download the package files use the following URL: [url]
分享到:?

Alat AI Hot

Undress AI Tool
Gambar buka pakaian secara percuma

Undresser.AI Undress
Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover
Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Clothoff.io
Penyingkiran pakaian AI

Video Face Swap
Tukar muka dalam mana-mana video dengan mudah menggunakan alat tukar muka AI percuma kami!

Artikel Panas

Alat panas

Notepad++7.3.1
Editor kod yang mudah digunakan dan percuma

SublimeText3 versi Cina
Versi Cina, sangat mudah digunakan

Hantar Studio 13.0.1
Persekitaran pembangunan bersepadu PHP yang berkuasa

Dreamweaver CS6
Alat pembangunan web visual

SublimeText3 versi Mac
Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

Elakkan masalah pertanyaan n 1, mengurangkan bilangan pertanyaan pangkalan data dengan memuatkan data yang berkaitan terlebih dahulu; 2. Pilih hanya medan yang diperlukan untuk mengelakkan memuat entiti lengkap untuk menjimatkan memori dan jalur lebar; 3. Gunakan strategi cache yang munasabah, seperti cache sekunder doktrin atau hasil pertanyaan frekuensi tinggi Cache; 4. Mengoptimumkan kitaran hayat entiti dan panggilan jelas () secara teratur untuk membebaskan memori untuk mengelakkan limpahan memori; 5. Memastikan indeks pangkalan data wujud dan menganalisis penyata SQL yang dihasilkan untuk mengelakkan pertanyaan yang tidak cekap; 6. Lumpuhkan penjejakan perubahan automatik dalam senario di mana perubahan tidak diperlukan, dan gunakan array atau mod ringan untuk meningkatkan prestasi. Penggunaan ORM yang betul memerlukan menggabungkan pemantauan SQL, caching, pemprosesan batch dan pengoptimuman yang sesuai untuk memastikan prestasi aplikasi sambil mengekalkan kecekapan pembangunan.

Fail Tetapan.JSON terletak di laluan peringkat pengguna atau ruang kerja dan digunakan untuk menyesuaikan tetapan vscode. 1. Laluan peringkat pengguna: Windows adalah C: \ Users \\ AppData \ Roaming \ code \ user \ settings.json, macOS adalah /users//library/applicationsupport/code/user/settings.json, linux adalah/ 2. Laluan Tahap Ruang Kerja: .VSCODE/Tetapan dalam Direktori Root Projek

ReadonlypropertiesinPHP8.2canonlybeassignedonceintheconstructororatdeclarationandcannotbemodifiedafterward,enforcingimmutabilityatthelanguagelevel.2.Toachievedeepimmutability,wrapmutabletypeslikearraysinArrayObjectorusecustomimmutablecollectionssucha

Pertama, gunakan JavaScript untuk mendapatkan pilihan sistem pengguna dan tetapan tema yang disimpan di dalam negara, dan memulakan tema halaman; 1. Struktur HTML mengandungi butang untuk mencetuskan Topik Switching; 2. CSS menggunakan: Root untuk menentukan pembolehubah tema yang cerah, kelas mod-mode mentakrifkan pembolehubah tema gelap, dan menggunakan pembolehubah ini melalui VAR (); 3. JavaScript mengesan lebih suka skema-skema dan membaca LocalStorage untuk menentukan tema awal; 4. Tukar kelas mod gelap pada elemen HTML apabila mengklik butang, dan menjimatkan keadaan semasa ke LocalStorage; 5. Semua perubahan warna disertakan dengan animasi peralihan 0.3 saat untuk meningkatkan pengguna

Untuk membuat senarai HTML yang tidak teratur, anda perlu menggunakan tag untuk menentukan bekas senarai. Setiap item senarai dibalut dengan tag, dan penyemak imbas secara automatik akan menambah peluru; 1. Buat senarai dengan tag; 2. Setiap item senarai ditakrifkan dengan tag; 3. Penyemak imbas secara automatik menjana simbol titik lalai; 4. Sublists boleh dilaksanakan melalui bersarang; 5. Gunakan atribut jenis gaya CSS untuk mengubah suai gaya simbol, seperti cakera, bulatan, persegi, atau tidak; Gunakan tag ini dengan betul untuk menghasilkan senarai yang tidak teratur standard.

Gunakan alat analisis prestasi untuk mencari kesesakan, gunakan VisualVM atau JProfiler dalam peringkat pembangunan dan ujian, dan memberi keutamaan kepada async-profiler dalam persekitaran pengeluaran; 2. Mengurangkan penciptaan objek, menggunakan semula objek, gunakan StringBuilder untuk menggantikan splicing rentetan, dan pilih strategi GC yang sesuai; 3. Mengoptimumkan penggunaan koleksi, pilih dan preset kapasiti awal mengikut tempat kejadian; 4. Mengoptimumkan keserasian, gunakan koleksi serentak, mengurangkan granulariti kunci, dan tetapkan kolam benang dengan munasabah; 5. Tune Parameter JVM, tetapkan saiz timbunan yang munasabah dan pemungut sampah rendah dan membolehkan log GC; 6. Elakkan refleksi di peringkat kod, ganti kelas pembalut dengan jenis asas, penangguhan permulaan, dan gunakan akhir dan statik; 7. Ujian dan Pemantauan Prestasi Berterusan, digabungkan dengan JMH

Semantichtmlimprovesbothseoandaccessibilitybyingingmeaningfultagsthatconveycontentstructure.1) itenhancesseothroughbettercontenthierarchywithproperheadinglevels, ImprovedIndexingViaelementsLikeAnd, andsupportforrichssoShorseShorseShorseShorseSnipsoSnipsOringsAnpetAnd

USETHELEMENTWITHINATAGTOCREATEASEMANTICSEVELEFIELD.2.IncludeAforAccessibility, setTheForm'sActionandMethod = "GET" ATTRIBUTESTOSENDDATATOSearchendWithAphareabeBel.3.addname = "q" TODineThequeryParameter, UsePlaceShernerToguuse
