导航:首页 > 版本升级 > python获取xml文件内容

python获取xml文件内容

发布时间:2024-10-30 08:21:15

A. 1、使用python读取依据生成的xml文件,添加样式表,最中生成一个html文件

#coding=utf8

#引入要用到的xml解析库这里我们用比较轻量级的minidom就行了
importxml.dom.minidom

#定义一个html输出模板
#后面我们只是要把这段html中的学生数据部分(<student_trs/>)换成xml中读到的数据
template="""
<html>
<tableborder="1"style="width:100%;text-align:center;">
<tr>
<tdcolspan="4">学生信息</td>
</tr>
<student_trs/>
</table>
</html>
"""

#读取xml文档内容,这里假设是a.xml
dom=xml.dom.minidom.parse('a.xml')

#获取xml中的所有student节点
student_nodes=dom.getElementsByTagName('student')

#初始化student_trs为空
student_trs=""

#遍历每一条学生信息
fornodeinstudent_nodes:
#getAttribute用户获取节点的属性,得到id属性值即学号
#因为xml解析后是Unicode编码的,所以这里要转成utf8编码,下面同理
sid=node.getAttribute("id").encode('utf-8')
#获取所有子节点
children=node.childNodes
forchildinchildren:
#判断子节点的名字为姓名、性别、专业的话,就采集其对应文本
ifchild.nodeName.encode('utf-8')=="姓名":
#使用。childNodes[0].nodeValue的方法得到节点的文本
name=child.childNodes[0].nodeValue.encode('utf-8')
ifchild.nodeName.encode('utf-8')=="性别":
sex=child.childNodes[0].nodeValue.encode('utf-8')
ifchild.nodeName.encode('utf-8')=="专业":
specialty=child.childNodes[0].nodeValue.encode('utf-8')
#组成html中的一行学生数据
student_tr="<tr><td>%s</td><td>%s</td><td>%s</td><td>%s</td></tr>"%(sid,name,sex,specialty)
#将这一行数据添加到总数据中
student_trs+=student_tr

#替换模板的<student_trs/>为我们上面所得到的html数据
html=template.replace("<student_trs/>",student_trs)

#输入html结果到output.html
open("output.html","w").write(html)


#PS:你提供的xml数据有问题,确实了一个</students>标记
#正确的xml应该如下
"""
<?xmlversion="1.0"encoding="UTF-8"?>
<person>
<students>
<studentid="20140711">
<姓名>三</姓名>
<性别>男</性别>
<专业>计算机</专业>
</student>
</students>
</person>
"""

B. python读取xml文件有哪些方法

1、以下几种方法建议初学者使用:

下面的方法涉及知识比较多,熟练掌握上面方法后可以了解使用:

2、Dom读取

3、Dom4j读取
使用dom4j需要导入相关的jar包

import java.io.File;
import java.util.Iterator;
import java.util.List;


4、JDom读取
使用jdom需要导入相关的jar包

import java.io.FileInputStream;

import java.io.InputStream;

5、Sax读取

6、properties的读取

C. python xml文件怎么打开方式

关于python读取xml文章很多,但大多文章都是贴一个xml文件,然后再贴个处理文件的代码。这样并不利于初学者的学习,希望这篇文章可以更通俗易懂的教如何使用python来读取xml文件。

什么是xml?

xml即可扩展标记语言,它可以用来标记数据、定义数据类型,是一种允许用户对自己的标记语言进行定义的源语言。

abc.xml

mxl.dom.minidom模块被用来处理xml文件,所以要先引入。

xml.dom.minidom.parse()用于打开一个xml文件,并将这个文件对象dom变量。

documentElement用于得到dom对象的文档元素,并把获得的对象给root

每一个结点都有它的nodeName,nodeValue,nodeType属性。

nodeName为结点名字。

nodeValue是结点的值,只对文本结点有效。

nodeType是结点的类型。catalog是ELEMENT_NODE类型

现在有以下几种:

'ATTRIBUTE_NODE'
'CDATA_SECTION_NODE'
'COMMENT_NODE'
'DOCUMENT_FRAGMENT_NODE'
'DOCUMENT_NODE'
'DOCUMENT_TYPE_NODE'
'ELEMENT_NODE'
'ENTITY_NODE'
'ENTITY_REFERENCE_NODE'
'NOTATION_NODE'
'PROCESSING_INSTRUCTION_NODE'
'TEXT_NODE'

NodeTypes-有名常数

阅读全文

与python获取xml文件内容相关的资料

热点内容
路由器没网络怎么弄 浏览:661
恋舞如何升级快 浏览:980
用什么直播app 浏览:891
求必应公司微信号 浏览:763
qq好友发的视频保存在哪个文件里 浏览:630
手机怎么删除更新文件夹在哪里设置 浏览:990
手机复制文件内容 浏览:446
电脑qq压缩文件设置打开方式 浏览:742
iphone4s4013硬盘 浏览:700
win10休眠快捷方式 浏览:815
linux查看文件当前属性 浏览:342
pc的压缩文件后缀 浏览:554
佳能r6视频在哪个文件夹 浏览:570
dev文件系统 浏览:561
360如何一键安装win10 浏览:699
阳光养猪下载的软件在哪个文件夹 浏览:48
少儿编程与机器人有什么区别 浏览:317
莱芜数控编程培训怎么学 浏览:989
淘宝自适应代码 浏览:970
云计算面试题文件定位路径 浏览:407

友情链接