⑴ python怎么匹配txt文件中的某一行的第一个数据,如果匹配,则将这行数据按格式打印出来
importre
yourfile="a.txt"
yourtarget="xxx"
withopen(yourfile,"r")asfi:
forlineinfi:
ifline.strip():
tmp=re.split("s+",line.strip())
iftmp[0]==yourtarget:
print("|"+"|".join(tmp)+"|")
⑵ python脚本,如何将读取的一个文本文件,和一个词库中的单词进行匹配求指导
当然这只是简单的实现,算基本原理。
如果要投入项目中使用,实际文本和词库可能比较大,还需要一些处理,比如使用迭代器,防止内存溢出。
⑶ Python程序,要求打开一个文本文件,从固定行开始读取一直读取某一匹配结果的前一行
实现此功能的代码如下:
f = open('xx.txt')
lines = f.readlines()
f.close()
l_list = lines[1:] #从第二行开始
for l in l_list:
if l.find('a') ==-1:
print l #在没有找到a之前一直打印
else:
break #如果找到,则跳出循环
(3)匹配文件内容python扩展阅读:
用python读取文本文件,对读出的每一行进行操作的实现方式如下:
f=open("test.txt","r")
whileTrue:
line=f.readline()
ifline:
pass
line=line.strip()
p=line.rfind('.')
filename=line[0:p]
print"create%s"%line
else:
break
f.close()
⑷ python怎么样使用正则表达式匹配用户输入的为文件路径 就譬如像: E:\index.ph
你好:
正则表达式语法:
##总结
##^匹配字符串的开始。
##$匹配字符串的结尾。
##匹配一个单词的边界。
##d匹配任意数字。
##D匹配任意非数字字符。
##x?匹配一个可选的x字符(换言之,它匹配1次或者0次x字符)。
##x*匹配0次或者多次x字符。
##x+匹配1次或者多次x字符。
##x{n,m}匹配x字符,至少n次,至多m次。
##(a|b|c)要么匹配a,要么匹配b,要么匹配c。
##(x)一般情况下表示一个记忆组(rememberedgroup)。你可以利用re.search函数返回对
##象的groups()函数获取它的值。
##正则表达式中的点号通常意味着“匹配任意单字符”
⑸ Python程序,要求打开一个文本文件,从固定行开始读取一直读取某一匹配结果的前一行
实现此功能的代码如下:
f = open('xx.txt')
lines = f.readlines()
f.close()
l_list = lines[1:] #从第二行开始
for l in l_list:
if l.find('a') ==-1:
print l #在没有找到a之前一直打印
else:
break #如果找到,则跳出循环
(5)匹配文件内容python扩展阅读:
用python读取文本文件,对读出的每一行进行操作的实现方式如下:
f=open("test.txt","r")
whileTrue:
line=f.readline()
ifline:
pass
line=line.strip()
p=line.rfind('.')
filename=line[0:p]
print"create%s"%line
else:
break
f.close()
⑹ 用“python”怎么提取文件里的指定内容
python读取文件内容的方法:
一.最方便的方法是一次性读取文件中的所有内容并放置到一个大字符串中:
all_the_text = open('thefile.txt').read( )
# 文本文件中的所有文本
all_the_data = open('abinfile','rb').read( )
# 二进制文件中的所有数据
为了安全起见,最好还是给打开的文件对象指定一个名字,这样在完成操作之后可以迅速关闭文件,防止一些无用的文件对象占用内存。举个例子,对文本文件读取:
file_object = open('thefile.txt')
try:
all_the_text = file_object.read( )
finally:
file_object.close( )
不一定要在这里用Try/finally语句,但是用了效果更好,因为它可以保证文件对象被关闭,即使在读取中发生了严重错误。
二.最简单、最快,也最具Python风格的方法是逐行读取文本文件内容,并将读取的数据放置到一个字符串列表中:list_of_all_the_lines = file_object.readlines( )
这样读出的每行文本末尾都带有"
"符号;如果你不想这样,还有另一个替代的办法,比如:
list_of_all_the_lines = file_object.read( ).splitlines( )
list_of_all_the_lines = file_object.read( ).split('
')
list_of_all_the_lines = [L.rstrip('
') for L in file_object]
⑺ python文件中读取某一列数据然后输出数组匹配到另外一个文件中
我可以认为你是准备用这个文件第五列数据替换另一个文件的第五列数据么?
#下面的split里面我些的是空格,若不是空格分割,请替换
data1 = map(lambda x:x.strip().split(" ")[4],open("oct4.txt").readlines())
#这里我假设你要替换的文件是oct5.txt
data2 = map(lambda x:x.strip().split(" "),open("oct5.txt").readlines())
data2_new = []
for line in data2:
line[4] = data1.pop(0)
data2_new.append(line)
file("oct5_new.txt"."w").writelines(data2_new)
⑻ python 匹配两个文件
希望你能提供测试用便例,还有tgt_file也是多个句子吗?句子是按行来分还是按标点符号等等。
提供一个简单的思路,把tgt_file读到一个数组里,依次读src_file,再建一个字典{},以src_file为key,读一行对比一下是否存在于tgt_file读出的那个数组,如果存在则在字典相应key的值加1,再用临时变量统计哪个文件出现最多,最后读完所以文件,输出字典内容,和最高多是哪个文件。