⑴ python怎麼匹配txt文件中的某一行的第一個數據,如果匹配,則將這行數據按格式列印出來
importre
yourfile="a.txt"
yourtarget="xxx"
withopen(yourfile,"r")asfi:
forlineinfi:
ifline.strip():
tmp=re.split("s+",line.strip())
iftmp[0]==yourtarget:
print("|"+"|".join(tmp)+"|")
⑵ python腳本,如何將讀取的一個文本文件,和一個詞庫中的單詞進行匹配求指導
當然這只是簡單的實現,算基本原理。
如果要投入項目中使用,實際文本和詞庫可能比較大,還需要一些處理,比如使用迭代器,防止內存溢出。
⑶ Python程序,要求打開一個文本文件,從固定行開始讀取一直讀取某一匹配結果的前一行
實現此功能的代碼如下:
f = open('xx.txt')
lines = f.readlines()
f.close()
l_list = lines[1:] #從第二行開始
for l in l_list:
if l.find('a') ==-1:
print l #在沒有找到a之前一直列印
else:
break #如果找到,則跳出循環
(3)匹配文件內容python擴展閱讀:
用python讀取文本文件,對讀出的每一行進行操作的實現方式如下:
f=open("test.txt","r")
whileTrue:
line=f.readline()
ifline:
pass
line=line.strip()
p=line.rfind('.')
filename=line[0:p]
print"create%s"%line
else:
break
f.close()
⑷ python怎麼樣使用正則表達式匹配用戶輸入的為文件路徑 就譬如像: E:\index.ph
你好:
正則表達式語法:
##總結
##^匹配字元串的開始。
##$匹配字元串的結尾。
##匹配一個單詞的邊界。
##d匹配任意數字。
##D匹配任意非數字字元。
##x?匹配一個可選的x字元(換言之,它匹配1次或者0次x字元)。
##x*匹配0次或者多次x字元。
##x+匹配1次或者多次x字元。
##x{n,m}匹配x字元,至少n次,至多m次。
##(a|b|c)要麼匹配a,要麼匹配b,要麼匹配c。
##(x)一般情況下表示一個記憶組(rememberedgroup)。你可以利用re.search函數返回對
##象的groups()函數獲取它的值。
##正則表達式中的點號通常意味著「匹配任意單字元」
⑸ Python程序,要求打開一個文本文件,從固定行開始讀取一直讀取某一匹配結果的前一行
實現此功能的代碼如下:
f = open('xx.txt')
lines = f.readlines()
f.close()
l_list = lines[1:] #從第二行開始
for l in l_list:
if l.find('a') ==-1:
print l #在沒有找到a之前一直列印
else:
break #如果找到,則跳出循環
(5)匹配文件內容python擴展閱讀:
用python讀取文本文件,對讀出的每一行進行操作的實現方式如下:
f=open("test.txt","r")
whileTrue:
line=f.readline()
ifline:
pass
line=line.strip()
p=line.rfind('.')
filename=line[0:p]
print"create%s"%line
else:
break
f.close()
⑹ 用「python」怎麼提取文件里的指定內容
python讀取文件內容的方法:
一.最方便的方法是一次性讀取文件中的所有內容並放置到一個大字元串中:
all_the_text = open('thefile.txt').read( )
# 文本文件中的所有文本
all_the_data = open('abinfile','rb').read( )
# 二進制文件中的所有數據
為了安全起見,最好還是給打開的文件對象指定一個名字,這樣在完成操作之後可以迅速關閉文件,防止一些無用的文件對象佔用內存。舉個例子,對文本文件讀取:
file_object = open('thefile.txt')
try:
all_the_text = file_object.read( )
finally:
file_object.close( )
不一定要在這里用Try/finally語句,但是用了效果更好,因為它可以保證文件對象被關閉,即使在讀取中發生了嚴重錯誤。
二.最簡單、最快,也最具Python風格的方法是逐行讀取文本文件內容,並將讀取的數據放置到一個字元串列表中:list_of_all_the_lines = file_object.readlines( )
這樣讀出的每行文本末尾都帶有"
"符號;如果你不想這樣,還有另一個替代的辦法,比如:
list_of_all_the_lines = file_object.read( ).splitlines( )
list_of_all_the_lines = file_object.read( ).split('
')
list_of_all_the_lines = [L.rstrip('
') for L in file_object]
⑺ python文件中讀取某一列數據然後輸出數組匹配到另外一個文件中
我可以認為你是准備用這個文件第五列數據替換另一個文件的第五列數據么?
#下面的split裡面我些的是空格,若不是空格分割,請替換
data1 = map(lambda x:x.strip().split(" ")[4],open("oct4.txt").readlines())
#這里我假設你要替換的文件是oct5.txt
data2 = map(lambda x:x.strip().split(" "),open("oct5.txt").readlines())
data2_new = []
for line in data2:
line[4] = data1.pop(0)
data2_new.append(line)
file("oct5_new.txt"."w").writelines(data2_new)
⑻ python 匹配兩個文件
希望你能提供測試用便例,還有tgt_file也是多個句子嗎?句子是按行來分還是按標點符號等等。
提供一個簡單的思路,把tgt_file讀到一個數組里,依次讀src_file,再建一個字典{},以src_file為key,讀一行對比一下是否存在於tgt_file讀出的那個數組,如果存在則在字典相應key的值加1,再用臨時變數統計哪個文件出現最多,最後讀完所以文件,輸出字典內容,和最高多是哪個文件。