① python文件中读取某一列数据然后输出数组匹配到另外一个文件中
我可以认为你是准备用这个文件第五列数据替换另一个文件的第五列数据么?
#下面的split里面我些的是空格,若不是空格分割,请替换
data1 = map(lambda x:x.strip().split(" ")[4],open("oct4.txt").readlines())
#这里我假设你要替换的文件是oct5.txt
data2 = map(lambda x:x.strip().split(" "),open("oct5.txt").readlines())
data2_new = []
for line in data2:
line[4] = data1.pop(0)
data2_new.append(line)
file("oct5_new.txt"."w").writelines(data2_new)
② python 匹配两个文件
希望你能提供测试用便例,还有tgt_file也是多个句子吗?句子是按行来分还是按标点符号等等。
提供一个简单的思路,把tgt_file读到一个数组里,依次读src_file,再建一个字典{},以src_file为key,读一行对比一下是否存在于tgt_file读出的那个数组,如果存在则在字典相应key的值加1,再用临时变量统计哪个文件出现最多,最后读完所以文件,输出字典内容,和最高多是哪个文件。
③ python 2个文件比对
先把文件能正常解析成结构化数据再说,我建议用正则表达式。把每个结构匹配出来,然后做后继工作。