❶ python 操作excel 讀 寫 xlsx
原文非常清晰,全程無bug,調試通過,留作記錄以防丟失
一、xlrd和xlwt
使用之前需要先安裝,windows上如果直接在cmd中運行python則需要先執行pip3 install xlrd和pip3 install xlwt,如果使用pycharm則需要在項目的解釋器中安裝這兩個模塊,File-Settings-Project:layout-Project Interpreter,點擊右側界面的+號,然後搜索xlrd和xlwt,然後點擊Install Package進行安裝。
對於excel來說,整個excel文件稱為工作簿,工作簿中的每個頁稱為工作表,工作表又由單元格組成。
對於xlrd和xlwt,行數和列數從0開始,單元格的行和列也從0開始,例如sheet.row_values(2)表示第三行的內容,sheet.cell(1,2).value表示第二行第三列單元格的內容。
1.xlrd模塊讀取excel文件
使用xlrd模塊之前需要先導入import xlrd,xlrd模塊既可讀取xls文件也可讀取xlsx文件。
獲取工作簿對象 :book = xlrd.open_workbook('excel文件名稱')
獲取所有工作表名稱 :names = book.sheet_names(),結果為列表
根據索引獲取工作表對象 :sheet = book.sheet_by_index(i)
根據名稱獲取工作表對象 :sheet = book.sheet_by_name('工作表名稱')
獲取工作錶行數 :rows = sheet.nrows
獲取工作表列數 :cols = sheet.ncols
獲取工作表某一行的內容 :row = sheet.row_values(i) ,結果為列表 【sheet.row(i),列表】
獲取工作表某一列的內容 :col = sheet.col_values(i) 結果為列表 【sheet.col(i),列表】
獲取工作表某一單元格的內容 :cell = sheet.cell_value(m,n)、 sheet.cell(m,n).value、sheet.row(m)[n].value,sheet.col(n)[m].value,結果為字元串或數值 【sheet.cell(0,0),xlrd.sheet.Cell對象】
示例:假設在py執行文件同層目錄下有一fruit.xls文件,有三個sheet頁Sheet1、Sheet2、Sheet3,其中Sheet1內容如下:
import xlrd
book = xlrd.open_workbook('fruit.xls')print('sheet頁名稱:',book.sheet_names())
sheet = book.sheet_by_index(0)
rows = sheet.nrows
cols = sheet.ncolsprint('該工作表有%d行,%d列.'%(rows,cols))print('第三行內容為:',sheet.row_values(2))print('第二列內容為%s,數據類型為%s.'%(sheet.col_values(1),type(sheet.col_values(1))))print('第二列內容為%s,數據類型為%s.'%(sheet.col(1),type(sheet.col(1))))print('第二行第二列的單元格內容為:',sheet.cell_value(1,1))print('第三行第二列的單元格內容為:',sheet.cell(2,1).value)print('第五行第三列的單元格內容為:',sheet.row(4)[2].value)print('第五行第三列的單元格內容為%s,數據類型為%s'%(sheet.col(2)[4].value,type(sheet.col(2)[4].value)))print('第五行第三列的單元格內容為%s,數據類型為%s'%(sheet.col(2)[4],type(sheet.col(2)[4])))# 執行結果# sheet頁名稱: ['Sheet1', 'Sheet2', 'Sheet3']# 該工作表有5行,3列.# 第三行內容為: ['梨', 3.5, 130.0]# 第二列內容為['單價/元', 8.0, 3.5, 4.5, 3.8],數據類型為<class 'list'>.# 第二列內容為[text:'單價/元', number:8.0, number:3.5, number:4.5, number:3.8],數據類型為<class 'list'>.# 第二行第二列的單元格內容為: 8.0# 第三行第二列的單元格內容為: 3.5# 第五行第三列的單元格內容為: 300.0# 第五行第三列的單元格內容為300.0,數據類型為<class 'float'># 第五行第三列的單元格內容為number:300.0,數據類型為<class 'xlrd.sheet.Cell'>
可以看出通過sheet.row(i)、sheet.col(i)也可獲取行或列的內容,並且結果也是一個列表,但是列表中的每一項類似字典的鍵值對,形式為數據類型:值。
而sheet.cell(0,0)獲取單元格內容,結果是一個鍵值對,並且是一個xlrd.sheet.Cell對象。
2.xlwt寫入excel文件
使用xlwt模塊之前需要先導入import xlwt,xlwt模塊只能寫xls文件,不能寫xlsx文件(寫xlsx程序不會報錯,但最後文件無法直接打開,會報錯)。
創建工作簿 :book = xlwt.Workbook(),如果寫入中文為亂碼,可添加參數encoding = 'utf-8'
創建工作表 :sheet = book.add_sheet('Sheet1')
向單元格寫入內容 :sheet.write(m,n,'內容1')、sheet.write(x,y,'內容2')
保存工作簿 :book.save('excel文件名稱'),默認保存在py文件相同路徑下,如果該路徑下有相同文件,會被新創建的文件覆蓋,即xlwt不能修改文件。
import xlwt
book = xlwt.Workbook()
sheet = book.add_sheet('Sheet1')
sheet.write(0,0,'hello')
sheet.write(1,0,'你好')
book.save('hello.xls')
逐個單元格寫入excel比較麻煩,可以按行或者列寫入。
import xlwt
proj = ['名稱','單價/元','庫存/kg']
fruit = ['蘋果','梨','香蕉','橘子']
price = [8,3.5,4.5,3.8]
storage = [150,130,100,300]
book = xlwt.Workbook()
sheet = book.add_sheet('Sheet1')foriin range(0,len(proj)):
sheet.write(0,i,proj[i]) #按行插入行標題foriin range(0,len(fruit)):
sheet.write(i+1,0,fruit[i])#插入第一列水果名稱foriin range(0,len(price)):
sheet.write(i+1,1,price[i])#插入第二列單價foriin range(0,len(storage)):
sheet.write(i+1,2,storage[i])#插入第三列庫存book.save('fruit2.xls')
二、openpyxl模塊
openpyxl模塊可實現對excel文件的讀、寫和修改,只能處理xlsx文件,不能處理xls文件,使用之前同樣需要先安裝該模塊,再導入 import openpyxl。
對於openpyxl,行數和列數都從1開始,單元格的行和列也從1開始。例如sheet.cell(1,2).value表示第一行第二列單元格的內容
1.openpyxl讀取excel文件
獲取工作簿對象:book = openpyxl.load_workbook('excel文件名稱')
獲取所有工作表名稱:names = book.sheetnames
獲取工作表對象:sheet1 = book.worksheets[n]、sheet2 = book['工作表名稱']、sheet3 = book[book.sheetnames[n]]
獲取工作表名稱:title = sheet1.title
獲取工作錶行數:rows = sheet1.max_row
獲取工作表列數:cols = sheet1.max_column
獲取某一單元格內容:cell = sheet.cell(1,2).value、sheet['單元格'].value例如sheet['B1'].value
假設有一fruit2.xlsx,除後綴名其他與上述fruit.xls完全一樣
import openpyxl
book = openpyxl.load_workbook('fruit2.xlsx')print('所有sheet頁名稱:',book.sheetnames)
sheet = book.worksheets[0]
sheet2 = book['Sheet1']
sheet3 = book[book.sheetnames[0]]print('工作表名稱:',sheet3.title)
rows = sheet.max_row
cols = sheet.max_columnprint('該工作表有%d行,%d列.'%(rows,cols))# 執行結果# 所有sheet頁名稱: ['Sheet1', 'Sheet2', 'Sheet3']# 工作表名稱: Sheet1# 該工作表有5行,3列.
2.行和列生成器
對於xlrd模塊來說,可直接通過sheet.row[i]和sheet.col[i]獲取行和列的內容,但是對於openpyxl模塊來說,無法直接獲取某一行或列的內容,openpyxl模塊的sheet.rows和sheet.columns表示行和列的生成器,即generator object,需要通過循環或轉換成列表、元組的形式得到行或列的值。
print(sheet.rows,sheet.columns)forcolin sheet.columns:
print(col)forrowin sheet.rows:
foriin row:
print(i.value,end='')
print()# 執行結果# <generator object Worksheet._cells_by_row at 0x00000230E011A2A0> <generator object Worksheet._cells_by_col at 0x00000230E102FC00># (<Cell 'Sheet1'.A1>, <Cell 'Sheet1'.A2>, <Cell 'Sheet1'.A3>, <Cell 'Sheet1'.A4>, <Cell 'Sheet1'.A5>)# (<Cell 'Sheet1'.B1>, <Cell 'Sheet1'.B2>, <Cell 'Sheet1'.B3>, <Cell 'Sheet1'.B4>, <Cell 'Sheet1'.B5>)# (<Cell 'Sheet1'.C1>, <Cell 'Sheet1'.C2>, <Cell 'Sheet1'.C3>, <Cell 'Sheet1'.C4>, <Cell 'Sheet1'.C5>)# 名稱 單價/元 庫存/kg# 蘋果 8 150# 梨 3.5 130# 香蕉 4.5 100# 橘子 3.8 300
如果要獲取某一行或者列的內容,可將行、列生成器對象轉換成列表或者元組,再循環列表或者元組得到內容。
前面說過openpyxl模塊的行和列都從1開始,但是由於將生成器轉化成了列表list(sheet.rows),而列表的索引從0開始,因此list(sheet.rows)[1]還是表示第二行的內容,不是第一行的內容。
foriinlist(sheet.rows)[1]:
print(i.value,end='')print()foriin list(sheet.columns)[0]:
print(i.value,end='')# 執行結果# 蘋果 8 150# 名稱 蘋果 梨 香蕉 橘子
獲取單元格的內容
print(sheet.cell(1,2).value)#第一行第二列單元格的內容print(sheet['a2'].value)#使用excel單元格的表示法,字母不區分大小寫
3.openpyxl寫excel文件
創建工作簿 :book = openpyxl.Workbook(),如果寫入中文為亂碼,可添加參數encoding = 'utf-8'
創建工作表: sheet = book.create_sheet('工作表名稱',0),0表示創建的工作表在工作薄最前面
向單元格寫入內容 :sheet.cell(m,n,'內容1')、sheet.cell(x,y,'內容2')
保存工作簿 :book.save('excel文件名稱'),默認保存在py文件相同路徑下,如果該路徑下有相同文件,會被新創建的文件覆蓋。
book = openpyxl.Workbook()
sheet = book.create_sheet('Sheet1',0)
proj = ['名稱','單價/元','庫存/kg']
fruit = ['蘋果','香蕉','梨','橘子']
price = [8,3.5,4.5,3.8]
storage = [150,130,300,100]foriin range(len(proj)):
sheet.cell(1,i+1,proj[i])foriin range(len(fruit)):
sheet.cell(i+2,1,fruit[i])foriin range(len(price)):
sheet.cell(i+2,2,price[i])foriin range(len(storage)):
sheet.cell(i+2,3,storage[i])
book.save('fruit2.xlsx')
4.openpyxl修改excel文件
sheet.insert_rows(m)和sheet.insert_cols(n)分別表示在第m行、第n列前面插入行、列
sheet.delete_rows(m)和sheet.delete_cols(n)分別表示刪除第m行、第n列
rows = sheet.max_row
sheet.insert_rows(rows+2)
cherry = ['櫻桃',17,80] forjin cherry:
sheet.cell(rows+1,cherry.index(j)+1,j)
book.save('fruit2.xlsx')
修改單元格內容:sheet.cell(m,n) = '內容1'或者sheet['B3'] = '內容2'
sheet.cell(3,2,4)
sheet['B3'] = 5book.save('fruit2.xlsx')
在最後追加行:sheet.append(可迭代對象)
straberry = ['草莓',20,50]
sheet.append(straberry)
book.save('fruit2.xlsx')
三、xlsxwriter 模塊
只能操作xlsx,只能寫。在excel中插入圖片
import matplotlib.pyplot as plt
2 import pandas as pd
3 import random
4 import xlsxwriter
5
6 ts = pd.Series(random.randrange(10))
7 fig = plt.figure()
8 ax = fig.add_subplot(1,1,1)
9 ts.plot(ax=ax)
10 fig.savefig('foo.png')
11
12 workbook = xlsxwriter.Workbook('pngxls.xlsx') # 創建excel文件
13 worksheet1 = workbook.add_worksheet('png') # 括弧內為工作表表名
14 # 第一個參數是插入的起始單元格,第二個參數是圖片你文件的絕對路徑
15 worksheet1.write('A1','hello')
16 worksheet1.insert_image('B2','foo.png')
18 workbook.close()
xlrd、xlwt和openpyxl處理excel文件,在寫入文件的時候不如pandas簡單,pandas處理excel文件見另外一篇博客 https://www.cnblogs.com/Forever77/p/11298173.html
❷ 用python操作excel數據之避坑秘技
用python操作excel表裡的數據非常方便,可以把不同報表,不同類型的數據各種乾坤大挪移,匯集到一起進行展示。但初學者可能會遇到一些大坑,百思不得其解,而不得不放棄這個神器。現把我在自學過程中遇到的一些坑與大家分享,給初學者參考,歡迎批評指正!
坑一:用pandas的to_excel寫入EXCEL時,會把原數據清空。
解決方案:先用openpyxl的load_workbook打開工作薄,再用pandas的ExcelWriter新建寫入器,把之前打開的工作薄賦值給寫入器的工作薄。
坑二:把帶有公式的sheet1數據導入再寫入sheet2時,會發現帶公式的數據全部為空。
解決方案:可用win32com.client中的Dispatch把EXCEL表打開再保存。
坑三:當把復制文件,新建文件,打開保存文件,數據寫入都寫在一個程序時,往往由於EXCEL打開保存時間較長而與後續程序沖突報錯。
解決方案:每個環節建模塊順序執行,各環節間用time.sleep隔開。
❸ python如何對excel數據進行處理
在python語言中,可以使用xlrd和xlwt兩個庫操作excel。
在python語言中處理Excel的方法:
在python項目中,新建python文件,並依次導入xlrd和xlwt。
接著調用open_workbook()方法,打開一個excel文件
調用sheet_by_name()方法,讀取文件的sheet頁
如果是後面加了個s,sheet_names表示獲取excel中所有的sheet頁
利用sheets()方法加序號,可以獲取某個sheet頁對象
如果想要獲取excel某個sheet頁中記錄的總數,使用nrows
在cell()中傳入兩個值,一個行一個列,然後value獲取對應單元格的值
推薦:python視頻教程以上就是小編分享的關於python如何對excel數據進行處理的詳細內容希望對大家有所幫助,更多有關python教程請關注環球青藤其它相關文章!
❹ Python處理Excel文件(csv, xls, xlsx)
Excel文件格式主要有csv,xlsx和xlsx,對於不同的格式,我們使用不同的包來進行處理。
其中, encoding='utf-8-sig' 是為了編碼正常可以正確顯示中文, spamreader 中的每一個 row 為list格式,可以循環取出每個單元格的值。
結果:
如果csv文件是數據類的,那麼使用 pandas 包讀寫數據會更方便。
結果:
參數:
結果:
參數:
Excel文件有三層對象:工作薄、工作表和三元格,分別對應 openpyxl 包中的workbook、sheet和cell。
注 : openpyxl 功能全面,還支持:合並單元格、數學運算、單元格格式、迭代器 ws.iter_rows() 操作等。
注 : xlrd 打開為只讀模式,不可修改。
結果:
結果:
❺ python如何操作當前已經打開的excel
讀取一個Excel的基本流程
1. 雙擊打開一個Excel文件
2. 選擇sheet
3. 對sheet裡面的東西進行操作
在python中我們使用第三方模塊 openpyxl模塊操作Excel
ps:這個模塊不是python自帶的 是第三方模塊需要我們下載的
進入終端輸入: pip install openpyxl
如果想要下載快點:網路搜索 python第三方源
from openpyxl import load_workbook
# 1. 打開Excel文件
workbook = load_workbook("p1.xlsx")
# 2. 選擇sheet
# 2.1 獲取所有sheet
# print(workbook.sheetnames)
# 2.2 選擇sheet
sheet = workbook["Sheet1"]
print(sheet.max_row) # 最大行號
print(sheet.max_column) # 最大列號
# 2.3 我們選擇了sheet後就可以去操作數據了
# cell = sheet.cell(1, 1) # 獲取到單元格
# print(cell.value)
sheet 相關操作
from openpyxl import load_workbook
# 1. 打開Excel文件
workbook = load_workbook("p1.xlsx")
# 2. 選擇sheet
# 2.1 獲取所有sheet
# print(workbook.sheetnames)
# 2.2 選擇sheet
# sheet = workbook["Sheet1"]
# 2.3 基於索引的方式獲取sheet
# sheet = workbook.worksheets[0]
# 3. 獲取到所有的sheet
# for name in workbook.sheetnames:
# sheet = workbook[name]
# cell = sheet.cell(1, 1)
# print(cell.value)
讀單元格的數據
from openpyxl import load_workbook
# 1. 打開Excel文件
workbook = load_workbook("p1.xlsx")
# 2 獲取sheet
sheet = workbook.worksheets[0]
# 獲取到第N行第N列的單元格
# cell = sheet.cell(1, 2)
# print(cell.value)
# 獲取到某個單元格
# cell = sheet['A2']
# print(cell.value)
# print()
# for cell in sheet[1]: # 獲取到第一行的內容
# print(cell.value)
# 獲取到所有的行的數據 獲取到一列的值
# for row in sheet.rows:
# print(row[0].value)
# 獲取到所有的列的數據 獲取到一行的值
for col in sheet.columns:
print(col[0].value)
寫Excel
# 在Excel中想要寫文件 大致可以分為兩種
# 1. 在原有的Excel的基礎上寫內容
# 2. 在一個新的Excel裡面寫內容
1. 打開Excel表格
2. 找到單元格 修改寫入內容
3. 保存
# from openpyxl import load_workbook
#
# # 1. 打開Excel文件
# workbook = load_workbook("p1.xlsx")
# # 2 獲取sheet
# sheet = workbook.worksheets[0]
#
# # 獲取到第N行第N列的單元格
# # cell = sheet.cell(1, 2)
# # print(cell.value)
#
# # 獲取到某個單元格
#
# # cell = sheet['A2']
# # print(cell.value)
#
# # print()
# # for cell in sheet[1]: # 獲取到第一行的內容
# # print(cell.value)
#
#
# # 獲取到所有的行的數據 獲取到一列的值
# # for row in sheet.rows:
# # print(row[0].value)
#
# # 獲取到所有的列的數據 獲取到一行的值
# for col in sheet.columns:
# print(col[0].value)
# from openpyxl import workbook
# wb = workbook.Workbook() # 創建一個Excel會默認有一個sheet 就叫 Sheet
# 1. 修改sheet名稱
# sheet = wb.worksheets[0]
# sheet.title = '數據集'
# wb.save('p2.xlsx')
# 2. 創建一個新的sheet 還可以設置顏色
# sheet = wb.create_sheet('工作計劃', 1)
# sheet.sheet_properties.tabColor = 'FFB6C1'
# wb.save('p2.xlsx')
# 3. sheet
# sheet = wb.create_sheet('工作計劃')
# sheet.sheet_properties.tabColor = 'FFB6C1'
#
# new_sheet = wb._worksheet(wb['Sheet'])
# new_sheet.title = '新的計劃'
# wb.save('p2.xlsx')
# print(wb.sheetnames)
# sheet = wb.worksheets[0]
# cell = sheet.cell(1, 1)
# cell.value = '哈哈哈'
#
# wb.save('p2.xlsx')
from openpyxl import load_workbook
# 1. 打開Excel文件
workbook = load_workbook("p2.xlsx")
# 2 獲取sheet
sheet = workbook.worksheets[0]
# 1. 獲取某個單元格 修改值
# cell = sheet.cell(1, 1)
# cell.value = '哈哈哈'
# wb.save('p2.xlsx')
# 2. 獲取某個單元格 修改值
# sheet['B3'] = '光'
# workbook.save('p2.xlsx')
# cell_list = sheet["B2": 'C3']
# for row in cell_list:
# for cell in row:
# cell.value = '新的值'
# workbook.save('p1.xlsx')
for row in sheet.iter_rows(min_row=5, min_col=1, max_col=7, max_row=10):
for cell in row:
cell.value = 'oo'
workbook.save('p1.xlsx')
r row in sheet.iter_rows(min_row=5, min_col=1, max_col=7, max_row=10):
for cell in row:
cell.value = 『oo』
workbook.save(『p1.xlsx』)
❻ python如何讀取excel裡面某一整列內容並修改
可以使用 Python 中的 pandas 庫來讀取 Excel 文件裡面某一整列內容並修改。
首先,需要安裝 pandas 庫。在命令行中輸入:
pip install pandas
然後可以使用 pandas 的 read_excel 函數讀取 Excel 文件,並使用 iloc 屬性獲取某一整列內容。下面是一個示例代碼:
import pandas as pd
# 讀取 Excel 文件
df = pd.read_excel("your_file.xlsx")
# 獲取某一整列內容
column_data = df.iloc[:, 2]
# 2 是列的編號,從 0 開始# 修改某一整列內容
column_data = column_data + 1
# 更新到 Excel 文件
df.iloc[:, 2] = column_data
df.to_excel("your_file.xlsx", index=False)
上面的代碼會讀取「your_file.xlsx」這個excel文件,獲取第3列的內容並修改,最後將修改後的內容重新寫入到excel文件中,注意這里沒有保留原來的數據,如果需要保留原來的數據需要另外操作。
需要注意的是,若要讀取的excel文件中有多個工作表,需要使用 pd.read_ex