dom4j解析

DodderB

2017-10-19

关注关注

一：构建dom4j树（表示为Document元素）

常用方法:

方式一：直接创建所有元素：dom4j为我们准备了工具类DocumentHelper，该类的所有的方法都是静态方法，用来创建xml文档的各个组成部分。

1.1.1创建Document和Element对象：

Documentdoc=DocumentHelper.createDocument();

ElementeltRoot=DocumentHelper.createElement(“student”);

doc.setEltRootElement(eltRoot);

1.1.2或者先准备好根元素，使用有参数的构造方法创建Document对象。

ElementeltRoot=DocumentHelper.createElement(“student”);

Documentdoc=DocumentHelper.createDocument(eltRoot);

1.2：添加节点和设置节点内容：

方法：Branch接口中定义的方法；

publicElementaddElemen(Stringname)//以指定的name为当前节点创建一个子节点,并返回新节点的引用

publicvoidsetText(Stringtext)//将content设置为节点的内容

示例如下：

ElementeltName=eltRoot.addElement(“name”);

ElementeltAge=eltRoot.addElement(“age”);

eltName.setText(“张三”);

eltAge.setText(“18”);

1.3：添加属性

方法：publicElementaddAttribute(Stringname,Stringvalue)

示例如下：

eltRoot.addAttribute(“sn”,”01”);

方式2：

2.1：org.dom4j.io提供了两个类：SAXReader和DOMReader,前者从一个现有的w3cDOM树构建dom4j树，而SAXReader则使用SAX解析器，从不同的输入源构建dom4j树。

2.1.1:使用SAXReader构建dom4j文档对象：示例如下：

SAXReadersaxReader=newSAXReader();

Filefile=newFile(“student.xml”);

Documentdoc=saxReader.read(file);

2.2.1:使用DOMReader构建dom4j文档对象.

DocumentBuilderFactorydbf=newDocumentBuilderFactory.newInstance();

DocumentBuilderdb=dbf.newDocumentBuilder();

Filefile=newFile(“student.xml”);

org.w3c.dom.Documentdocument=db.parse(file);

DOMReaderdomReader=newDOMReader();

org.dom4j.Documentdoc=domReader.read(document);

访问根节点：

Elementroot=doc.getRootElement();

访问节点：

访问所有节点:

java.util.ListchildrenList=elt.elements();

访问指定名称的所有节点

java.util.LiatchildrenList=elt.elements(“student”);

访问指定名称第一个节点

ElementeltChild=elt.element(“student”);

要迭代某个元素的所有子元素：

for(java.util.Iteratorit=root.elementIterator();it.hasNext()){

Elementelement=it.hasNext();

……

}

Dom4j中集成了对XPath的支持。在选择节点时，可以直接使用XPath表达式，例如：

要选择例子文件students.xml中的所有的<name>元素，代码如下：

java.util.Listl=root.selectNodes(“//name”);

要选择属性sn的值等于01的<student>元素，代码如下：

java.util.Listl=root.selectNodes(“//student[@sn=’01’]”);

注意:为了能够编译执行上述使用XPath表达式的代码，需要配置dom4j安装包中自带的jaxen包，你也可以从http://sourceforge.net/products/jaxen/上下载jaxen。jaxen是一个用java开发的XPath引擎，用于配合各种基于XML的对象模型，如DOM,dom4j和JDOM。在dom4-1.6.1目录下，有一个lib子目录，其中有个jaxen-1.1-beta-6.jar文件，需要在classpath环境变量中配置该文件的全路径名。

访问属性：

要得到某个元素的所有属性，，如下：

java.util.ListattrList=elt.attributes();

要得到指定的属性，如下：

Attributeattr=elt.attribute(“sn”);

要得到某个属性的值；如下：

StringattrValue=elt.attributeValue(“sn”);

删除节点和节点的属性：

要删除某个元素:：可以用Branch接口中定义的remove()方法，如下：

ElementeltStu=root.element(“student”);

root.remove(eltStu);

要删除某个属性；如下：

elt.remove(elt.attribute(“sn”));

输出文档：

对象：XMLWriter实例方法：write（Documentdoc）

常用的几种构造方法总结：

1：无参数：

2:字节流参数

3：字符流参数。

4：文档输出格式类参数。

示例代码1：

输出文档内容到控制台

XMLWriterxw=newXMLWriter();

xw.write(doc);

示例代码2:

输出文档内容到文件。构造XMLWriter对象的时候，可以传递字节流参数。其底层代码设置了自动刷新机制。

XMLWriterxw=newXMLWriter(newjava.io.FileOutputStream(“student.xml”));

xw.write(doc);

示例代码3：

构造XMLWriter对象的时候，可以传递java.io.Writer对象。

XMLWriterxw=newXMLWriter(newjava.io.FileWriter(“student.xml”));

xw.write(doc);

xw.close();

注意：使用java.io.Writer对象构建的XMLWriter对象，则没有设置自动刷新机制，所以在调用write()方法之后，还要调用xw.close()或者xw.flush()方法。并且XMLWriter继承自org.xml.sax.helpers.XMLFilterImpl类。它所提供的close()和flush()方法只是其内部java.io.Writer对象的flush()和close()方法的封装方法。

示例代码4：

构造XMLWriter对象的时候,可以传递文档输出格式类org.dom4j.io.OutputFormat,利用这个类，可以设置输出文档的字符编码，设置行分割符以及控制使用的缩进字符串等。

下面的代码输出格式使用4个空格作为缩进字符串，元素之间添加新行。

OutputFormatoutFmt=newOutputFormat(“”,true);

XMLWriterxw=newXMLWriter(outFmt);

xw.write(doc);

下面的代码采用美化的格式输出文档，设置字符串编码为GB2312,并且用4个空格作为缩进。

OutputFormatoutFmt=OutputFormat.createPrettyPrint();

outFmt.setEncoding(“GB2312”);

outFmt.setIndent(“”);

XMLWriterxw=newXMLWriter(outFmt);

xw.write(doc);

dom4j的名称空间信息api

常用的方法有8个。

dom4j在Element和Attribute接口中定义了获取名称空间信息的方法，这些方法和JDOM中的方法相同。如下所示：

publicjava.lang.StringgetNamespacePrefix()

该方法返回元素（属性）的名称空间前缀

publicjava.lang.StringgetNamespaceURI()

该方法返回元素（属性）的名称空间URI

publicjava.lang.StringgetName()

该方法返回元素（属性）的本地名

publicjava.lang.StringgetQualifiedName()

该方法返回元素（属性）的限定名

publicNamespacegetNamespace()

该方法返回元素本身的名称空间

publicjava.util.ListadditionalNamespaces()

返回某元素上附加的名称空间声明列表，列表中的每一个对象都是Namespace类型。这个类的方法提供了两个方法分别获得名称空间前缀和本地名。如下：

publicjava.lang.StringgetPrefix()

该方法返回名称空间前缀。

publicjava.lang.StringgetURI()

该方法返回名称空间的URI。

---------------------------------------------------

DOM4J解析技术

一.Document对象相关

(1)读取XML文件,获得document对象

eg->

SAXReaderreader=newSAXReader();

Documentdocument=reader.read(newFile(emp.xml"));

(2)解析XML形式的文本,得到document对象

eg->

Stringtext="元素";

Documentdocument=DocumentHelper.parseText(text);

(3)主动创建document对象

eg->

Documentdocument=DocumentHelper.createDocument();

Elementroot=document.addElement("members");//创建根节点

二.节点相关

(1)获取文档的根节点.

eg->

SAXReaderreader=newSAXReader();

Documentdocument=reader.read(newFile(emp.xml"));

(2)取得某节点的单个子节点

eg->

ElementmemberElm=root.element("member");//"member"是节点名

(3)取得节点的文字

eg->

DStringtext=memberElm.getText();

或者：

eg->

Stringtext=root.elementText("name");//这个是取得根节点下的name字节点的文字

(4)取得某节点下名为"member"的所有字节点并进行遍历

eg->

Listnodes=rootElm.elements("member");

for(Iteratorit=nodes.iterator();it.hasNext();){

Elementelm=(Element)it.next();//dosomething

}

(5)对某节点下的所有子节点进行遍历

eg->

for(Iteratorit=root.elementIterator();it.hasNext();){

Elementelement=(Element)it.next();//dosomething

}

(6)在某节点下添加子节点

eg->

ElementageElm=newMemberElm.addElement("age");

(7)设置节点文字.

eg->

ageElm.setText("29");

(8)删除某节点

eg->

parentElm.remove(childElm);//childElm是待删除的节点,parentElm是其父节点

(9)添加一个CDATA节点

eg->

ElementcontentElm=infoElm.addElement("content");

contentElm.addCDATA(diary.getContent());

contentElm.getText();//特别说明：获取节点的CDATA值与获取节点的值是一个方法

contentElm.clearContent();//清除节点中的内容，CDATA亦可

三.属性相关

(1)取得某节点下的某属性

eg->

Elementroot=document.getRootElement();

Attributeattribute=root.attribute("size");//属性名name

(2)取得属性的文字

eg->

Stringtext=attribute.getText();

或者:eg->

Stringtext2=root.element("name").attributeValue("firstname");//这个是取得根节点下name字节点的属性firstname的值.

(3)遍历某节点的所有属性

eg->

Elementroot=document.getRootElement();

for(Iteratorit=root.attributeIterator();it.hasNext();){

Attributeattribute=(Attribute)it.next();

Stringtext=attribute.getText();

System.out.println(text);

}

(4)设置某节点的属性和文字

eg->

newMemberElm.addAttribute("name","sitinspring");

(5)设置属性的文字

eg->

Attributeattribute=root.attribute("name");

attribute.setText("sitinspring");

(6)删除某属性

eg->

Attributeattribute=root.attribute("size");//属性名name

root.remove(attribute);

四.将文档写入XML文件

(1)文档中全为英文,不设置编码,直接写入的形式

eg->

XMLWriterwriter=newXMLWriter(newFileWriter("output.xml"));

writer.write(document);

writer.close();

(2)文档中含有中文,设置编码格式写入的形式

eg->

OutputFormatformat=OutputFormat.createPrettyPrint();

format.setEncoding("GBK");//指定XML编码

XMLWriterwriter=newXMLWriter(newFileWriter("output.xml"),format);

writer.write(document);

writer.close();

五.字符串与XML的转换

(1)将字符串转化为XML

eg->

Stringtext="sitinspring";

Documentdocument=DocumentHelper.parseText(text);

(2)将文档或节点的XML转化为字符串

eg->

SAXReaderreader=newSAXReader();

Documentdocument=reader.read(newFile("input.xml"));

Elementroot=document.getRootElement();

StringdocXmlText=document.asXML();

StringrootXmlText=root.asXML();

ElementmemberElm=root.element("member");

StringmemberXmlText=memberElm.asXML();

dom4j

安科网

dom4j解析

DodderB

DodderB

相关推荐

JavaWeb--XML的解析(2)

（一）dom4j解析（利用迭代器从根节点遍历）

读取XML文件 Dom4j

DOM4J

使用Dom4j操作XML

Dom4j 生成xml并格式化输出

dom4j 生成xml时,属性值中的回车换行问题

dom4j下载地址

DOM4J和JDOM

使用Dom4j操作XML

Java解析XML对比（DOM/SAX/JDOM/DOM4j/XPath）

dom4j通过xpath查询xml

dom4j saxReader解析xml

Dom4j高级应用：遍历节点信息与实体类的存储

dom4j的全面分析与应用

[转]Dom4j下载及使用Dom4j读写XML简介

dom4j通过xpath查询xml

Java操作XML文件 dom4j

readXML&writeXML(dom4j)

使用DOM4J来操作的XML文件(Tools)

DodderB