xml解析

python XML解析

偶尔善良 提交于 2020-02-21 23:32:56
阅读目录 1. 什么是xml?有何特征? 2. 获得标签属性 3. 获得子标签 4. 获得标签属性值 5. 获得标签对之间的数据 6. 例子 7. 总结 回到顶部 1. 什么是xml?有何特征? xml即 可扩展标记语言 ,它可以用来标记数据、定义数据类型,是一种允许用户对自己的标记语言进行定义的源语言。 例子:del.xml <?xml version="1.0" encoding="utf-8"?> <catalog> <maxid>4</maxid> <login username="pytest" passwd='123456'> <caption>Python</caption> <item id="4"> <caption>test</caption> </item> </login> <item id="2"> <caption>Zope</caption> </item> </catalog> 从结构上,很像HTML超文本标记语言。但他们被设计的目的是不同的,超文本标记语言被设计用来显示数据,其焦点是数据的外观。它被设计用来 传输 和 存储 数据,其焦点是数据的 内容 。 那么它有如下特征: 它是有 标签对 组成,<aa></aa> 标签可以有属性:<aa id='123'></aa> 标签对可以嵌入数据:<aa>abc</aa> 标签可以嵌入子标签(具有层级关系)

python xml.dom模块解析xml

為{幸葍}努か 提交于 2020-02-21 23:32:20
阅读目录 1. 什么是xml?有何特征? 2. 获得标签属性 3. 获得子标签 4. 获得标签属性值 5. 获得标签对之间的数据 6. 例子 7. 总结 回到顶部 1. 什么是xml?有何特征? xml即 可扩展标记语言 ,它可以用来标记数据、定义数据类型,是一种允许用户对自己的标记语言进行定义的源语言。 例子:del.xml <?xml version="1.0" encoding="utf-8"?> <catalog> <maxid>4</maxid> <login username="pytest" passwd='123456'> <caption>Python</caption> <item id="4"> <caption>test</caption> </item> </login> <item id="2"> <caption>Zope</caption> </item> </catalog> 从结构上,很像HTML超文本标记语言。但他们被设计的目的是不同的,超文本标记语言被设计用来显示数据,其焦点是数据的外观。它被设计用来 传输 和 存储 数据,其焦点是数据的 内容 。 那么它有如下特征: 它是有 标签对 组成,<aa></aa> 标签可以有属性:<aa id='123'></aa> 标签对可以嵌入数据:<aa>abc</aa> 标签可以嵌入子标签(具有层级关系)

python之shelve模块、xml模块

南笙酒味 提交于 2020-02-21 23:25:54
shevle模块比pickle模块简单,只要一个open模式,返回类似字典的对象,可读可写;key必须为字符串,而值可以是python所支持的数据类型 如下例题: import shelve # dic1={'pwd':'alex3714','age':18,'sex':'male'} # dic2={'pwd':'alex3715','age':73,'sex':'male'} d=shelve.open('db.txt',writeback=True) d['egon']=dic1 d['alex']=dic2 d['egon']['age']=19 print(d['egon']) d.close() xml是实现不同语言或程序之间进行数据交换的协议,跟json差不多,单json使用起来更简单 <?xml version="1.0"?> <data> <country name="Liechtenstein"> <rank updated="yes">2</rank> <year>2008</year> <gdppc>141100</gdppc> <neighbor name="Austria" direction="E"/> <neighbor name="Switzerland" direction="W"/> </country> <country name=

Schema技术

天涯浪子 提交于 2020-02-19 21:44:03
DTD 验证 概念: DTD 文档类型定义 作用:验证是否是“有效”的 XML PCDATA(Parsed Character DATA) 的意思是被解析的字符 数据 CDATA ( Unparsed Character Data )不应由 XML 解析 器进行解析的文本数据 使用 DTD 的局限性 1) DTD 不遵守 XML 语法 2) DTD 数据类型有限 3) DTD 不可扩展 4) DTD 不支持命名空间 Schema 技术 Schema 是 DTD 的代替者,名称为 XML Schema ,用于描述 XML 文档结构,比 DTD 更加强大,最主要的特征之一就是XML Schema 支持数据类型 1) Schema 是用 XML 验证 XML 遵循 XML 的语法 2) Schema 可以用能处理 XML 文档的工具处理 3) Schema 大大扩充了数据类型,而且还可以自定义数据类型 4) Schema 支持元素的继承 5) Schema 支持属性组 Schema 的文档结构 所有的 Schema 文档使用 schema 作为其根元素 http://www.w3.org/2001/XMLSchema : 用于验证当前 Schema 文档的命名空间( 用于验证 Schema 本身 ) 同时它还规定了来自 命名空间 http://www.w3.org/2001

XML的打包与解析

本小妞迷上赌 提交于 2020-02-19 14:45:36
XML的打包与解析 一、XML语言的特点 1、XML独立于任何编程语言,允许人们按接收者容易解析的方式,对复杂数据进行编码。先来看一个简单的XML格式的文件: [XML] 纯文本查看 复制代码 ? 1 2 3 4 5 6 < note > < to >George</ to > < from >John</ from > < heading >Reminder</ heading > < body >Don't forget the meeting!</ body > </ note > 对于程序员来说,很容易读懂这是什么意思,很明显这是传递给他人的一个便签,如果我们写出下面这样: George John Reminder Don't forget the meeting! 虽然最终从XML中提取出来就是上面的内容,但是我们从上面的内容根本看不出这是什么。 2、数据做成XML有助于改变其内容 如果我们现在想再添加一项:时间。在XML中我们可以这样: [XML] 纯文本查看 复制代码 ? 1 2 3 4 5 6 7 < note > < to >George</ to > < from >John</ from > < heading >Reminder</ heading > < body >Don't forget the meeting!</ body > < time

[web安全原理分析]-XEE漏洞入门

微笑、不失礼 提交于 2020-02-18 21:27:38
前言 1 前言 XXE漏洞 XXE漏洞全称(XML External Entity Injection)即xml外部实体注入漏洞,XXE漏洞发生在应用程序解析XML输入时,没有禁止外部实体的加载,导致可加载恶意外部文件,造成文件读取、命令执行、内网端口扫描、攻击内网网站、发起dos攻击等危害。xxe漏洞触发的点往往是可以上传xml文件的位置,没有对上传的xml文件进行过滤,导致可上传恶意xml文件。 XML基础 XML XML(EXtensible Markup Language,可扩展标记语言)用来结构化、存储以及传输信息。 XML文档结构包括3部分:XML声明、文档类型定义(可选)和文档元素 1 <!-- XML声明(定义了XML的版本和编码) --> 2 <?xml version="1.0" encoding="ISO-8859-1"?> 3 4 <!-- 文档类型定义 --> 5 <!DOCTYPE note [ 6 <!ELEMENT note (to,from,heading,body)> 7 <!ELEMENT to (#PCDATA)> 8 <!ELEMENT from (#PCDATA)> 9 <!ELEMENT heading (#PCDATA)> 10 <!ELEMENT body (#PCDATA)> 11 ]> 12 13 <!-- 文档元素 -->

XMl入门介绍及php操作XML

落爺英雄遲暮 提交于 2020-02-18 13:33:23
一、什么是XML XML全称: Extensible Markup Language 中文名: 可扩展标记语言 用于标记电子文件使其具有结构性的标记语言,可以用来标记数据,定义数据类型,允许用户对自己的标记语言进行定义的源语言。 用于传输数据与存储数据 [html] view plain copy <? xml version = "1.0" encoding = "utf-8" ?> <!-- 这是xml--> < libray > < book id = "1" > < title > < 三国演义 > </ title > < author > 罗贯中 </ author > < price > 82 </ price > </ book > < book id = "2" > < title > < 水浒传 > </ title > < author > 施耐庵 </ author > < price > 78 </ price > </ book > </ libray > 二、XML和html、json的对比 xml与html对比: 超级文本标记语言 HyperText Markup Language 超文本标记语言的结构包括“头”部分(英语:Head)、和“主体”部分(英语:Body),其中“头”部提供关于网页的信息,“主体”部分提供网页的具体内容。 [html]

廖雪峰Java14Java操作XML和JSON-1XML-2DOM

耗尽温柔 提交于 2020-02-18 13:33:05
XML是一种数据表示形式。 可以描述非常复杂的数据数据结构 用于传输和传输数据 DOM:Document Object Model DOM模型就是把XML文档作为一个树形结构,从根结点开始,每个节点都可以包含任意个字节点。 用Java解析XML时, Document代表整个XML文档 Element表示元素 Attribute:属性 Comment表示注释 Java DOM核心API: DocumentBuilderFactory dbf = DocumentBuilderFactory.newInstance(); DocumentBuilder db = dbf.newDocumentBuilder(); Document doc = db.parse(XML_URL); Element root = doc.getDocumentElement(); //获取根结点的元素 //从根结点document出发,可以便利所有的子节点,获取所有元素、属性、文本、数据、注释。每个Node都有自己的type,根据type来区分一个Node到底是元素,还是属性,还是文本。 遍历XML文件 import org.w3c.dom.Document; import org.w3c.dom.Node; import javax.xml.parsers.DocumentBuilder; import

关于C#对Xml数据解析

邮差的信 提交于 2020-02-18 13:26:39
首先进行简单说明Xml 与Html 和 XAML数据标签的差别。 1.Xml属于数据文本, 被设计为传输和存储数据,其焦点是数据的内容。它与json格式数据相似,可作为服务数据传输类型。 其中XML是标准通用标记语言 (SGML) 的子集,非常适合 Web 传输。XML 提供统一的方法来描述和交换独立于应用程序或供应商的结构化数据。 (1).XML的优缺点 <1>.XML的优点   A.格式统一,符合标准;   B.容易与其他系统进行远程交互,数据共享比较方便。 <2>.XML的缺点   A.XML文件庞大,文件格式复杂,传输占带宽;   B.服务器端和客户端都需要花费大量代码来解析XML,导致服务器端和客户端代码变得异常复杂且不易维护;   C.客户端不同浏览器之间解析XML的方式不一致,需要重复编写很多代码;   D.服务器端和客户端解析XML花费较多的资源和时间。 (2).JSON的优缺点 <1>.JSON的优点:   A.数据格式比较简单,易于读写,格式都是压缩的,占用带宽小;   B.易于解析,客户端JavaScript可以简单的通过eval()进行JSON数据的读取;   C.支持多种语言,包括ActionScript, C, C#, ColdFusion, Java, JavaScript, Perl, PHP, Python, Ruby等服务器端语言

JSON与XML的区别比较

試著忘記壹切 提交于 2020-02-18 13:21:17
JSON与XML的区别比较 1.定义介绍 (1).XML定义 扩展标记语言 (Extensible Markup Language, XML) ,用于标记电子文件使其具有结构性的标记语言,可以用来标记数据、定义数据类型,是一种允许用户对自己的标记语言进行定义的源语言。 XML使用DTD(document type definition)文档类型定义来组织数据;格式统一,跨平台和语言,早已成为业界公认的标准。 XML是标准通用标记语言 (SGML) 的子集,非常适合 Web 传输。XML 提供统一的方法来描述和交换独立于应用程序或供应商的结构化数据。 (2).JSON定义 JSON(JavaScript Object Notation)一种轻量级的数据交换格式,具有良好的可读和便于快速编写的特性。可在不同平台之间进行数据交换。JSON采用兼容性很高的、完全独立于语言文本格式,同时也具备类似于C语言的习惯(包括C, C++, C#, Java, JavaScript, Perl, Python等)体系的行为。这些特性使JSON成为理想的数据交换语言。 JSON基于JavaScript Programming Language , Standard ECMA-262 3rd Edition - December 1999 的一个子集。 2.XML和JSON优缺点 (1).XML的优缺点