PHP XML Expat 解析器
PHP XML Expat 解析器
內(nèi)建的 Expat 解析器使在 PHP 中處理 XML 文檔成為可能。
XML 是什么?
XML即可擴展標記語言(eXtensible Markup Language)。標記是指計算機所能理解的信息符號,通過此種標記,計算機之間可以處理包含各種信息的文章等。如何定義這些標記,既可以選擇國際通用的標記語言,比如HTML,也可以使用象XML這樣由相關人士自由決定的標記語言,這就是語言的可擴展性。XML是從SGML中簡化修改出來的。它主要用到的有XML、XSL和XPath等。
上面這段是對XML的一個基本定義,一個被廣泛接受的說明。簡單說,XML就是一種數(shù)據(jù)的描述語言,雖然它是語言,但是通常情況下,它并不具備常見語言的基本功能——被計算機識別并運行。只有依靠另一種語言,來解釋它,使它達到你想要的效果或被計算機所接受。
假如你是剛接觸XML的新手,那么可能并無法從定義上是了解XML是什么。也許,你可以換個角度來認識XML是什么;從應用面來認識XML,從XML可以做些什么來認識它,這應該能比那更空洞的定義對你更有幫助。
XML應用面主要分為兩種類型,文檔型和數(shù)據(jù)型。下面介紹一下幾種常見的XML應用:
1、自定義XML+XSLT=>HTML,最常見的文檔型應用之一。XML存放整個文檔的XML數(shù)據(jù),然后XSLT將XML轉換、解析,結合XSLT中的HTML標簽,最終成為HTML,顯示在瀏覽器上。典型的例子就是CSDN上的帖子。
2、XML作為微型數(shù)據(jù)庫,這是最常見的數(shù)據(jù)型應用之一。我們利用相關的XML API(MSXML DOM、JAVA DOM等)對XML進行存取和查詢。留言板的實現(xiàn)中,就經(jīng)??梢钥吹接肵ML作為數(shù)據(jù)庫。
3、作為通信數(shù)據(jù)。最典型的就是WEB SERVICE,利用XML來傳遞數(shù)據(jù)。
4、作為一些應用程序的配置信息數(shù)據(jù)。常見的如J2EE配置WEB服務器時用的web.XML。
5、其他一些文檔的XML格式。如WORD、EXCEL等。
6、保存數(shù)據(jù)間的映射關系。如Hibernate。
這里介紹的6種應用,基本涵蓋了XML的主要用途??傊琗ML是一種抽象的語言,它不如傳統(tǒng)的程序語言那么具體。要深入的認識它,應該先從它的應用入手,選擇一種你需要的用途,然后再學習如何使用。
XML 用于描述數(shù)據(jù),其焦點是數(shù)據(jù)是什么。XML 文件描述了數(shù)據(jù)的結構。
在 XML 中,沒有預定義的標簽。您必須定義自己的標簽。
如需學習更多關于 XML 的知識,請訪問我們的 XML 教程。
Expat 是什么?
Expat是一個面向流的解析器。您注冊的解析器回調(diào)(或handler)功能,然后開始搜索它的文檔。當解析器識別該文件的指定的位置,它會調(diào)用該部分相應的處理程序(如果您已經(jīng)注冊的一個)。該文件被輸送到解析器,會被分割成多個片斷,并分段裝到內(nèi)存中。因此expat可以解析那些巨大的文件。
如需讀取和更新 - 創(chuàng)建和處理 - 一個 XML 文檔,您需要 XML 解析器。
有兩種基本的 XML 解析器類型:
· 基于樹的解析器:這種解析器把 XML 文檔轉換為樹型結構。它分析整篇文檔,并提供了對樹中元素的訪問,例如文檔對象模型 (DOM)。
· 基于事件的解析器:將 XML 文檔視為一系列的事件。當某個具體的事件發(fā)生時,解析器會調(diào)用函數(shù)來處理。
Expat 解析器是基于事件的解析器。
基于事件的解析器集中在 XML 文檔的內(nèi)容,而不是它們的結構。正因為如此,基于事件的解析器能夠比基于樹的解析器更快地訪問數(shù)據(jù)。
請看下面的 XML 片段:
<from>Jani</from>
基于事件的解析器把上面的 XML 報告為一連串的三個事件:
· 開始元素:from
· 開始 CDATA 部分,值:Jani
· 關閉元素:from
上面的 XML 實例包含了形式良好的 XML。不過這個實例是無效的 XML,因為沒有與它關聯(lián)的文檔類型聲明 (DTD)。
然而,在使用 Expat 解析器時,這沒有區(qū)別。Expat 是不檢查有效性的解析器,忽略任何 DTD。
作為一款基于事件、非驗證的 XML 解析器,Expat 快速且輕巧,十分適合 PHP 的 Web 應用程序。
注釋:XML 文檔必須形式良好,否則 Expat 會生成錯誤。
安裝
XML Expat 解析器函數(shù)是 PHP 核心的組成部分。無需安裝就可以使用這些函數(shù)。
XML 文件
下面的 XML 文件將應用在我們的實例中:
<?xml version="1.0" encoding="ISO-8859-1"?>
<note>
<to>Tove</to>
<from>Jani</from>
<heading>Reminder</heading>
<body>Don't forget me this weekend!</body>
</note>
初始化 XML 解析器
我們要在 PHP 中初始化 XML 解析器,為不同的 XML 事件定義處理器,然后解析這個 XML 文件。
實例
<?php //Initialize the XML parser $parser=xml_parser_create(); //Function to use at the start of an element function start($parser,$element_name,$element_attrs) { switch($element_name) { case "NOTE": echo "-- Note --<br>"; break; case "TO": echo "To: "; break; case "FROM": echo "From: "; break; case "HEADING": echo "Heading: "; break; case "BODY": echo "Message: "; } } //Function to use at the end of an element function stop($parser,$element_name) { echo "<br>"; } //Function to use when finding character data function char($parser,$data) { echo $data; } //Specify element handler xml_set_element_handler($parser,"start","stop"); //Specify data handler xml_set_character_data_handler($parser,"char"); //Open XML file $fp=fopen("test.xml","r"); //Read data while ($data=fread($fp,4096)) { xml_parse($parser,$data,feof($fp)) or die (sprintf("XML Error: %s at line %d", xml_error_string(xml_get_error_code($parser)), xml_get_current_line_number($parser))); } //Free the XML parser xml_parser_free($parser); ?>
以上代碼將輸出:
-- Note --
To: Tove
From: Jani
Heading: Reminder
Message: Don't forget me this weekend!
工作原理:
1. 通過 xml_parser_create() 函數(shù)初始化 XML 解析器
2. 創(chuàng)建配合不同事件處理程序的的函數(shù)
3. 添加 xml_set_element_handler() 函數(shù)來定義,當解析器遇到開始和結束標簽時執(zhí)行哪個函數(shù)
4. 添加 xml_set_character_data_handler() 函數(shù)來定義,當解析器遇到字符數(shù)據(jù)時執(zhí)行哪個函數(shù)
5. 通過 xml_parse() 函數(shù)來解析文件 "test.xml"
6. 萬一有錯誤的話,添加 xml_error_string() 函數(shù)把 XML 錯誤轉換為文本說明
7. 調(diào)用 xml_parser_free() 函數(shù)來釋放分配給 xml_parser_create() 函數(shù)的內(nèi)存
更多 PHP Expat 解析器的信息
如需了解更多關于 PHP Expat 函數(shù)的信息,請訪問我們的 PHP XML Parser 參考手冊。
看透不說透
可擴展標記語言,標準通用標記語言的子集,是一種用于標記電子文件使其具有結構性的標記語言。
8年前 添加回復 0