xml

xml——eXtendsible markup language可扩展的标记语言

作用:

1、可以用来保存数据

2、可以用来配置文件

3、数据传输载体

文档结构:倒树状图结构

<?xml version="1.0" encoding="UTF-8"?>

<stu>

  <name>zhangsan</name>

  <age>19</age>

</stu>

xml

文档声明He :<?xml version="1.0"  encoding="UTF-8"  standalon="no"?>

version解析这个xml的时候,使用什么版本的解析器解析

encoding解析xml中的文字的时候,使用什么编码来翻译,保存的xml的时候编码格式要和这个属性一样,否则会出错

standalon写no的时候代表有依赖关联其他的文档,yes为没有,独立的,毕竟少用

元素定义:

1、其实就是里面的标签,<>尖括号括起来的都叫元素,承兑出现

2、文档声明下来的第一个元素叫做根标签

3、标签里面可以嵌套标签

4、空标签<age id="123"/>即是开始,也是结束,一般配合属性使用

5、不能以数字、标点符号开始,也不能含有xml和空格

简单元素:里面只包含文本

复制元素:元素里面还包含其他元素

注释:<!-- 注释内容 -->不能写在第一行

CDATA区:不要解析里面的内容,

<![CDATA[字符]]>,可以将非法字体不转义,或者说不解析

非法字符:严格的讲,在xml中仅含有字符"<"和"&"是非法的,省略号、引号和大于号是合法的,但是把它们替换为实体引用是个好的习惯

<  &lt;     >  &gt;    &  &amp;    .  &apos;    "  &quot; 

xml解析:获取元素里面的字符数据或者属性数据,常用DOM解析和SAX解析

xml

针对以上两种解析方式,有:

jaxp,sun公司,比较繁琐

dom4j,使用比较广泛

dom4j:

1、创建sax读取对象

SAXReader reader = new SAXReader();

2、指定解析的xml源

Document document = reader.read(new File("路径,通常以项目根目录开始"));

3、得到标签

Element rootElement = document.getRootElement();——获取根标签

rootElement.getName();——获取该标签的名字

Element element = rootElement.element("子标签")——获取子标签对象

String str = element.getStringValue();——获取文本里面的内容

String str2 = element.getText();——获取文本里面的内容

List<Element> elements = rootElement.elements("子标签");——获取根标签下的所有子标签

dom4j里面支持Xpath的写法,xpath其实是xml的路径语言,支持我们在解析xml的时候,能够快速的定位倒具体的某一个标签

List<Element> element = (Element)element.seletcSingleNodes("xpath路径");——获取单个

List<Element> elements = element.seletcNodes("xpath路径");——获取多个

xml文档约束:

DTD:语法自成一派,早期出现,可读性比较差

新建dtd文件,通常名字与要约束的xml文件同名,基本的约束如下,约束为以下规则

<!ELEMENT 元素的名称 元素的类型>

<!ELEMENT stus (sty)>——复杂元素就这样写

<!ELEMENT stu (name,age)>

<!ELEMENT name (#PCDATA)>——简单元素就使用(#PCDATA)

<!ELEMENT age (#PCDATA)>——parser charcter data被解析的文本数据

在需要被约束的xml文件里面加入下面句子

走网络上的:<!DOCTYPE stus PUBLIC "//UNKNOW" unknow.dtd>

               文件类型  根标签名字  网络上的dtd  dtd的名称   dtd的路径

  走本地的:<!DOCTYPE stus SYSTEM "stus.dtd">

              引入本地的dtd  dtd位置

  内嵌dtd:<!DOCTYPE[

        <!ELEMENT 元素的名称 元素的类型>

      ]>

Schema:其实就是一个xml,使用xml的语法规则,xml解析器比较方便,为了替代DTD,但是Schema约束文本内容比DTD的内容要多,所以目前也没有真正意义上的替代DTD 

相关推荐