㈠ 在java中xml有哪些解析技術
1.DOM生成和解析XML文檔
為 XML 文檔的已解析版本定義了一組介面。解析器讀入整個文檔,然後構建一個駐留內存的樹結構,然後代碼就可以使用 DOM
介面來操作這個樹結構。優點:整個文檔樹在內存中,便於操作;支持刪除、修改、重新排列等多種功能;缺點:將整個文檔調入內存(包括無用的節點),浪費時間和空間;使用場合:一旦解析了文檔還需多次訪問這些數據;硬體資源充足(內存、CPU)。
2.SAX生成和解析XML文檔
為解決DOM的問題,出現了SAX。SAX
,事件驅動。當解析器發現元素開始、元素結束、文本、文檔的開始或結束等時,發送事件,程序員編寫響應這些事件的代碼,保存數據。優點:不用事先調入整個文檔,佔用資源少;SAX解析器代碼比DOM解析器代碼小,適於Applet,下載。缺點:不是持久的;事件過後,若沒保存數據,那麼數據就丟了;無狀態性;從事件中只能得到文本,但不知該文本屬於哪個元素;使用場合:Applet;只需XML文檔的少量內容,很少回頭訪問;機器內存少;
3.DOM4J生成和解析XML文檔
DOM4J 是一個非常非常優秀的Java XML
API,具有性能優異、功能強大和極端易用使用的特點,同時它也是一個開放源代碼的軟體。如今你可以看到越來越多的 Java 軟體都在使用 DOM4J 來讀寫
XML,特別值得一提的是連 Sun 的 JAXM 也在用 DOM4J。
4.JDOM生成和解析XML
為減少DOM、SAX的編碼量,出現了JDOM;優點:20-80原則,極大減少了代碼量。使用場合:要實現的功能簡單,如解析、創建等,但在底層,JDOM還是使用SAX(最常用)、DOM、Xanan文檔。
新技術目前還木有,就是有了也不穩定,你也不敢用阿。
㈡ 如何利用Java語言進行XML編程
為了簡化編寫處理 XML 的 Java 程序,已經建立了多種編程介面。這些介面或者由公司定義,或者由標准體或用戶組定義,以滿足 XML 程序員的需要。本教程將討論以下介面:
Document Object Model (DOM,文檔對象模型),Level 2
Simple API for XML (SAX), Version 2.0
JDOM, Jason Hunter 和 Brett McLaughlin 創立的一種簡單 Java API
Java API for XML Processing (JAXP)
這四種介面中前三個(DOM、SAX
和 JDOM)定義了如何訪問與表示 XML 文檔的內容。JAXP 包含創建解析器對象的類。要創建 DOM 或 SAX 解析器,您需要使用
JAXP。如果使用 JDOM,JDOM 庫將在幕後使用 JAXP 為您創建一個解析器。總之:
使用 DOM、SAX 或 JDOM 處理 XML 文檔的內容。
如果使用 DOM 或 SAX,則使用 JAXP 創建解析器。
如果使用 JDOM,則 JDOM 庫為您創建解析器。
我將考察上述每種 API 的設計目標、長處和缺點,同時還涉及到一點它們的歷史以及創建這些 API 的標准體。
關於例子
本教程中包含多個使用 DOM、SAX 和 JDOM API 的示常式序。所有這些程序都使用 XML 標記的莎士比亞十四行詩。十四行詩的結構如下:
<sonnet>
<author>
<lastName>
<firstName>
<nationality>
<yearOfBirth>
<yearOfDeath>
</author>
<lines>
[14 <line> elements]
</lines>
</sonnet>
設置機器
在運行這些例子之前,需要對您的機器作一些設置。
(假設您知道如何編譯和運行 Java 程序,並了解如何設置 CLASSPATH變數。)
首先請訪問 Apache XML Project (http://xml.apache.org/xerces2-j/) 上的 Xerces XML 解析器主頁。
您也可以直接去 下載頁面 (http://xml.apache.org/xerces2-j/download.cgi)。
解壓從 Apache 下載的文件。根據解析器版本的不同,這樣將會創建名為 xerces-2_5_0或者類似名稱的目錄。
所需要的 JAR 文件(xercesImpl.jar和xml-apis.jar)應該出現在 Xerces 根目錄下。
訪問 JDOM 項目站點 並下載最新版本的 JDOM (http://jdom.org/)。
解壓從 JDOM 下載的文件,這樣將建立名為 jdom-b9或者類似名稱的目錄。
所需要的 JAR 文件(jdom.jar)應該在build目錄中。
最後請下載本教程的示例壓縮文件 ,並解壓該文件。
把當前目錄 (.)、xercesImpl.jar、xml-apis.jar和jdom.jar添加到CLASSPATH變數中。
基礎
XML 解析器是讀取 XML 文檔並分析其結構的一段代碼。這一部分將介紹 XML 解析器是如何工作的。
我將討論不同類型的 XML 解析器以及何時使用它們。
本教程後面的章節將討論如何創建解析器以及如何處理解析器給出的結果。
如何使用解析器
我將在後面的章節對此詳細討論,一般而言使用解析器需要以下步驟:
創建一個解析器對象
使解析器指向您的 XML 文檔
處理結果
顯然第三步最為復雜。一旦知道了 XML 文檔的內容,比方說,您可能希望生成一個 Web 頁面、創建一個訂單或者做一個餅圖。
考慮到 XML 文檔所含數據的多樣性,編寫一個應用程序處理所有可能的輸入是一項艱巨的任務。
所幸的是,這里討論的常見 XML 解析工具使這項工作大大簡化了。