PHP analysiert die HTML-Klassenbibliothek simple_html_dom
Aug 08, 2016 am 09:28 AMDownload-Adresse: https://github.com/samacs/simple_html_dom
Der Parser hilft uns nicht nur bei der überprüfung von HTML-Dokumenten; er kann auch nicht konforme W3C-Dokumente analysieren Standards-HTML-Dokument. Es verwendet einen jQuery-?hnlichen Elementselektor, um Elemente anhand ihrer ID, Klasse, Tag usw. zu finden und zu lokalisieren. Au?erdem bietet es die Funktionen zum Hinzufügen, L?schen und ?ndern des Dokumentbaums. Natürlich ist ein so leistungsstarker HTML-Dom-Parser nicht perfekt; Sie müssen w?hrend der Verwendung sehr vorsichtig mit dem Speicherverbrauch sein. Aber keine Sorge; in diesem Artikel erkl?re ich Ihnen am Ende, wie Sie vermeiden, zu viel Speicher zu verbrauchen.
Beginne mit
Nach dem Hochladen einer Klassendatei gibt es drei M?glichkeiten, diese Klasse aufzurufen:
HTML-Dokument aus URL laden
HTML aus String laden Dokument
HTML-Dokument aus Datei laden
.Der Code lautet wie folgt:
< ;? php
// Eine neue Dom-Instanz erstellen
$html = new simple_html_dom();
// Von URL laden
$html->load_file('http://www.jb51 .net ');
//Aus String laden
$html->load('
//Aus Datei laden
$html->load_file('path/file/test.html');
?>
Wenn Sie laden Um ein HTML-Dokument aus einer Zeichenfolge zu erstellen, müssen Sie es zun?chst aus dem Internet herunterladen. Es wird empfohlen, cURL zu verwenden, um HTML-Dokumente abzurufen und in das DOM zu laden.
HTML-Elemente suchen
Sie k?nnen die Suchfunktion verwenden, um Elemente im HTML-Dokument zu finden. Das zurückgegebene Ergebnis ist ein Array mit Objekten. Wir verwenden die Funktionen in der HTML-DOM-Parsing-Klasse, um auf diese Objekte zuzugreifen. Hier einige Beispiele:
.Der Code lautet wie folgt:
//Suchen Sie das Hyperlink-Element im HTML-Dokument
$a = $html->find('a');
//Suchen Sie das ( N) Hyperlinks, wenn nicht gefunden, wird ein leeres Array zurückgegeben.
$a = $html->find('a', 0);
// Finde das div-Element mit der ID von main
$ main = $html->find('div[id=main]',0);
// Alle div-Elemente finden, die das id-Attribut enthalten
$divs = $html->find( 'div [id]');
//Alle Elemente finden, die das id-Attribut enthalten
$divs = $html->find('[id]');
?>
Sie k?nnen auch einen jQuery-?hnlichen Selektor verwenden, um positionierte Elemente zu finden:
.Der Code lautet wie folgt:
// Elemente mit id='#container' finden
$ret = $html->find('#container');
/ / Finde alle class= Elemente von foo
$ret = $html->find('.foo');
// Finde mehrere HTML-Tags
$ret = $html->find(' a, img' );
// Sie k?nnen es auch so verwenden
$ret = $html->find('a[title], img[title]');
?>
Der Parser unterstützt die Suche nach Unterelementen
.Der Code lautet wie folgt:
php
//Alle li-Elemente in der ul-Liste finden
$ret = $html->find('ul li');
//Finde die li-Elemente mit angegebener Klasse=ausgew?hlt in der ul-Liste
$ret = $html->find('ul li.selected');
?>
Wenn Sie der Meinung sind, dass die Verwendung schwierig ist, k?nnen Sie einfach die integrierte Funktion verwenden. Das übergeordnete Element, das untergeordnete Element und das angrenzende Element des positionierten Elements
. Der Code lautet wie folgt:
// Gibt das übergeordnete Element zurück
$e->parent;
// Gibt das Array von zurück untergeordnete Elemente
$e->children;
// Gibt das angegebene untergeordnete Element nach Indexnummer zurück
$e->children(0);
// Gibt die erste Ressourcengeschwindigkeit zurück
$e->first_child ();
// Das letzte untergeordnete Element zurückgeben
$e ->last _child ();
// Das vorherige angrenzende Element zurückgeben
$e-> ;prev_sibling ();
//Gib das n?chste angrenzende Element zurück
$e-> next_sibling ();
?>
Elementattributoperationen
Verwenden Sie einfache regul?re Ausdrücke, um Attributselektoren zu bedienen.
[attribute] – w?hlt HTML-Elemente aus, die ein bestimmtes Attribut enthalten
[attribute=value] – w?hlt alle HTML-Elemente mit dem angegebenen Wertattribut
aus [Attribut!=Wert] – W?hlen Sie alle HTML-Elemente mit anderen Attributen als dem angegebenen Wert aus.
[Attribut^=Wert] – W?hlen Sie alle HTML-Elemente mit Attributen aus, die mit dem angegebenen Wert beginnen
[attribute$=value] W?hlt alle HTML-Elemente aus
[attribute*=value] – W?hlt alle HTML-Elemente aus
Elementattribute aufrufen in der Parser
Elementattribute im DOM sind auch Objekte:
.Der Code lautet wie folgt:
// In diesem Beispiel wird der Ankerlinkwert von $a der $link-Variablen zugewiesen
$link = $a->href;
? > $link = $html->find('a',0)->href;
?
Jedes Objekt hat 4 grundlegende Objektattribute:
tag – gibt den HTML-Tag-Namen zurück
innertext – gibt innerHTML zurück
Outertext – gibt OuterHTML zurück
Plaintext – gibt den Text im HTML-Tag zurück
Element im Parser bearbeiten
The Die Verwendung der Bearbeitungselementattribute ?hnelt dem Aufruf:
.Der Code lautet wie folgt:
< ?php
//Weisen Sie dem Ankerlink von $a einen neuen Wert zu
$a->;
// L?schen Sie den Ankerlink
$ a->href = null;
//Erkennen, ob ein Ankerlink vorhanden ist
if(isset($a->href)) {
//Code
}
?>
Es gibt keine spezielle Methode zum Hinzufügen oder L?schen von Elementen im Parser, aber Sie k?nnen sie anders verwenden:
. Der Code lautet wie folgt:
// Kapselungselement
$e->outertext = '
// Element l?schen
$e->outertext = '';
// Element hinzufügen
$e- >outertext = $e->outertext . '
// Element einfügen
$e->outertext = '
?
Das Speichern des ge?nderten HTML-DOM-Dokuments ist ebenfalls sehr einfach:
. Der Code lautet wie folgt:
$doc = $html;
// Ausgabe
echo $doc;
?>
Wie vermeide ich, dass der Parser zu viel Speicher verbraucht
Am Anfang dieses Artikels erw?hnte der Autor das Problem des Simple HTML DOM Parser verbraucht zu viel Speicher. Wenn das PHP-Skript zu viel Speicher beansprucht, führt dies dazu, dass die Website nicht mehr reagiert und eine Reihe schwerwiegender Probleme auftritt. Die L?sung ist ebenfalls sehr einfach. Denken Sie daran, dieses Objekt zu bereinigen, nachdem der Parser das HTML-Dokument geladen und verwendet hat. Nehmen Sie das Problem natürlich nicht zu ernst. Wenn nur 2 oder 3 Dokumente eingelegt sind, macht die Reinigung oder Nichtreinigung keinen gro?en Unterschied. Wenn Sie 5, 10 oder mehr Dokumente laden, liegt es absolut in Ihrer Verantwortung, den Speicher nach der Verwendung eines ^_^
zu l?schen.Der Code lautet wie folgt:
$html->clear();
?>
Das Obige stellt die PHP-Parsing-HTML-Klassenbibliothek simple_html_dom vor, einschlie?lich des Inhalts. Ich hoffe, dass es für Freunde hilfreich ist, die sich für PHP-Tutorials interessieren.

Hei?e KI -Werkzeuge

Undress AI Tool
Ausziehbilder kostenlos

Undresser.AI Undress
KI-gestützte App zum Erstellen realistischer Aktfotos

AI Clothes Remover
Online-KI-Tool zum Entfernen von Kleidung aus Fotos.

Clothoff.io
KI-Kleiderentferner

Video Face Swap
Tauschen Sie Gesichter in jedem Video mühelos mit unserem v?llig kostenlosen KI-Gesichtstausch-Tool aus!

Hei?er Artikel

Hei?e Werkzeuge

Notepad++7.3.1
Einfach zu bedienender und kostenloser Code-Editor

SublimeText3 chinesische Version
Chinesische Version, sehr einfach zu bedienen

Senden Sie Studio 13.0.1
Leistungsstarke integrierte PHP-Entwicklungsumgebung

Dreamweaver CS6
Visuelle Webentwicklungstools

SublimeText3 Mac-Version
Codebearbeitungssoftware auf Gottesniveau (SublimeText3)

Vermeiden Sie N 1 Abfrageprobleme, reduzieren Sie die Anzahl der Datenbankabfragen, indem Sie die zugeh?rigen Daten im Voraus laden. 2. W?hlen Sie nur die erforderlichen Felder aus, um das Laden vollst?ndiger Entit?ten zu vermeiden, um Speicher und Bandbreite zu sparen. 3.. Verwenden Sie Cache-Strategien vernünftigerweise, z. 4. Optimieren Sie den Lebenszyklus der Entit?t und rufen Sie Clear () regelm??ig an, um den Speicher freizugeben, um den Speicherüberlauf zu verhindern. 5. Stellen Sie sicher, dass der Datenbankindex die generierten SQL -Anweisungen existiert und analysiert, um ineffiziente Abfragen zu vermeiden. 6. Deaktivieren Sie die automatische ?nderungsverfolgung in Szenarien, in denen ?nderungen nicht erforderlich sind, und verwenden Sie Arrays oder Leichtgewichtsmodi, um die Leistung zu verbessern. Die korrekte Verwendung von ORM erfordert die Kombination der SQL -überwachung, -gespeicherung, der Stapelverarbeitung und der geeigneten Optimierung, um die Anwendungsleistung zu gew?hrleisten und gleichzeitig die Entwicklungseffizienz beizubehalten.

Die Datei "Settings.JSON" befindet sich auf dem Pfad auf Benutzerebene oder Arbeitsbereichsebene und wird verwendet, um die VSCODE-Einstellungen anzupassen. 1. Benutzer-Level-Pfad: Windows ist C: \ Benutzer \\ AppData \ Roaming \ Code \ User \ Settings.json, MacOS is /users//library/applicationsupport/code/user/settings.json, Linux is /home/.config/code/usser/setings.json; 2. Pfad auf Arbeitsbereichsebene: .VSCODE/Einstellungen im Projekt Root Directory

ReadOmpropertiesinphp8.2canonlyBeSignedoncinstructororatDeklarationandCannotBemodifiedAfterward, durchsetzungsvermutbarkeitatheluagelevel.2.ToachedevimmiMmutability, WrapMutabletypesLikearrayObjecustomimmutablecollections

Verwenden Sie zun?chst JavaScript, um die Einstellungen für Benutzersysteme und lokal gespeicherte Themeneinstellungen zu erhalten und das Seitenthema zu initialisieren. 1. Die HTML -Struktur enth?lt eine Schaltfl?che zum Ausl?sen von Themenwechsel. 2. CSS verwendet: root, um helle Themenvariablen zu definieren, .Dark-Mode-Klasse definiert dunkle Themenvariablen und wendet diese Variablen über var () an. 3.. JavaScript erkennt bevorzuge-farbige Scheme und liest LocalStorage, um das ursprüngliche Thema zu bestimmen. 4. Schalten Sie die Dark-Mode-Klasse im HTML-Element beim Klicken auf die Schaltfl?che und speichern Sie den aktuellen Status vor LocalStorage. 5. Alle Farb?nderungen werden mit einer übergangsanimation von 0,3 Sekunden begleitet, um den Benutzer zu verbessern

Um eine nicht ordnungsgem??e HTML -Liste zu erstellen, müssen Sie ein Tag verwenden, um einen Listencontainer zu definieren. Jedes Listenelement ist mit einem Tag verpackt, und der Browser fügt automatisch Kugeln hinzu. 1. Erstellen Sie eine Liste mit einem Tag; 2. Jedes Listenelement ist mit einem Tag definiert. 3. Der Browser generiert automatisch Standard -Punkt -Symbole. 4. Unterverschiedene k?nnen durch Verschachtelung implementiert werden. 5. Verwenden Sie das Attribut vom Typ Listenstil von CSS, um den Symbolstil wie Scheibe, Kreis, Quadrat oder keine zu ?ndern. Verwenden Sie diese Tags korrekt, um eine nicht ordnungsgem??e Standardliste zu generieren.

Verwenden Sie Leistungsanalyse-Tools, um Engp?sse zu lokalisieren, VisualVM oder JProfiler in der Entwicklung und Testphase zu verwenden und Async-Profiler in der Produktionsumgebung Priorit?t zu geben. 2. Reduzieren Sie die Objekterstellung, verwenden Sie Objekte wieder, verwenden Sie StringBuilder, um String -Splei?en zu ersetzen und entsprechende GC -Strategien auszuw?hlen. 3.. Optimieren Sie die Auswahl der Sammlung, w?hlen Sie die Anfangskapazit?t gem?? der Szene aus; V. 5. Tune JVM-Parameter, festlegen, angemessene Haufengr??e und Müllsammler mit geringer Latenz einstellen und GC-Protokolle aktivieren; 6. Vermeiden Sie die Reflexion auf Codeebene, ersetzen Sie Wrapper -Klassen durch Grundtypen, Verz?gerungsinitialisierung und verwenden Sie endgültige und statische. 7. Kontinuierliche Leistungstest und überwachung, kombiniert mit JMH

SemantichtmlimprovesbothseoandAccessibilityByuseing -meaningfulTagSthatConveyContentStructure.1) iTenhancesseothroughbetterContentHierarchyWithProperHeadinglevels, verbesserteIndexingviaelementSlikaND und -SupportforrichsnippetsususingStrostStrostStrostStrostStrostStrostStrostaustaustaustrota.2)

UseGuzzleForrobUtttprequestswithheaderStimeouts.2.ParsehtmleffictionLyWithSymfonydomcrawleruSusectors.3.HandlejavaScript-HeavysitesByintegratingPuppeteerviaPexec () torenderpages.4.respactroboBoBoBoBoThoter- und addDelays, addDelays, rotdelayents, rotateuseragents und rotateuseragents und ushEdelays, usaDelays, rot
