pythonexcel文件操作_python如何对excel数据进行处理

❶ python 操作excel 读写 xlsx

原文非常清晰，全程无bug，调试通过，留作记录以防丢失

一、xlrd和xlwt

使用之前需要先安装，windows上如果直接在cmd中运行python则需要先执行pip3 install xlrd和pip3 install xlwt，如果使用pycharm则需要在项目的解释器中安装这两个模块，File-Settings-Project:layout-Project Interpreter，点击右侧界面的＋号，然后搜索xlrd和xlwt，然后点击Install Package进行安装。

对于excel来说，整个excel文件称为工作簿，工作簿中的每个页称为工作表，工作表又由单元格组成。

对于xlrd和xlwt，行数和列数从0开始，单元格的行和列也从0开始，例如sheet.row_values(2)表示第三行的内容，sheet.cell(1,2).value表示第二行第三列单元格的内容。

1.xlrd模块读取excel文件

使用xlrd模块之前需要先导入import xlrd，xlrd模块既可读取xls文件也可读取xlsx文件。

获取工作簿对象：book = xlrd.open_workbook('excel文件名称')

获取所有工作表名称：names = book.sheet_names()，结果为列表

根据索引获取工作表对象：sheet = book.sheet_by_index(i)

根据名称获取工作表对象：sheet = book.sheet_by_name('工作表名称')

获取工作表行数：rows = sheet.nrows

获取工作表列数：cols = sheet.ncols

获取工作表某一行的内容：row = sheet.row_values(i) ，结果为列表【sheet.row(i)，列表】

获取工作表某一列的内容：col = sheet.col_values(i) 结果为列表【sheet.col(i)，列表】

获取工作表某一单元格的内容：cell = sheet.cell_value(m,n)、 sheet.cell(m,n).value、sheet.row(m)[n].value，sheet.col(n)[m].value，结果为字符串或数值【sheet.cell(0,0)，xlrd.sheet.Cell对象】

示例：假设在py执行文件同层目录下有一fruit.xls文件，有三个sheet页Sheet1、Sheet2、Sheet3，其中Sheet1内容如下：

import xlrd

book = xlrd.open_workbook('fruit.xls')print('sheet页名称:',book.sheet_names())

sheet = book.sheet_by_index(0)

rows = sheet.nrows

cols = sheet.ncolsprint('该工作表有%d行，%d列.'%(rows,cols))print('第三行内容为:',sheet.row_values(2))print('第二列内容为%s,数据类型为%s.'%(sheet.col_values(1),type(sheet.col_values(1))))print('第二列内容为%s,数据类型为%s.'%(sheet.col(1),type(sheet.col(1))))print('第二行第二列的单元格内容为:',sheet.cell_value(1,1))print('第三行第二列的单元格内容为:',sheet.cell(2,1).value)print('第五行第三列的单元格内容为:',sheet.row(4)[2].value)print('第五行第三列的单元格内容为%s,数据类型为%s'%(sheet.col(2)[4].value,type(sheet.col(2)[4].value)))print('第五行第三列的单元格内容为%s,数据类型为%s'%(sheet.col(2)[4],type(sheet.col(2)[4])))# 执行结果# sheet页名称: ['Sheet1', 'Sheet2', 'Sheet3']# 该工作表有5行，3列.# 第三行内容为: ['梨', 3.5, 130.0]# 第二列内容为['单价/元', 8.0, 3.5, 4.5, 3.8],数据类型为<class 'list'>.# 第二列内容为[text:'单价/元', number:8.0, number:3.5, number:4.5, number:3.8],数据类型为<class 'list'>.# 第二行第二列的单元格内容为: 8.0# 第三行第二列的单元格内容为: 3.5# 第五行第三列的单元格内容为: 300.0# 第五行第三列的单元格内容为300.0,数据类型为<class 'float'># 第五行第三列的单元格内容为number:300.0,数据类型为<class 'xlrd.sheet.Cell'>

可以看出通过sheet.row(i)、sheet.col(i)也可获取行或列的内容，并且结果也是一个列表，但是列表中的每一项类似字典的键值对，形式为数据类型:值。

而sheet.cell(0,0)获取单元格内容，结果是一个键值对，并且是一个xlrd.sheet.Cell对象。

2.xlwt写入excel文件

使用xlwt模块之前需要先导入import xlwt，xlwt模块只能写xls文件，不能写xlsx文件(写xlsx程序不会报错，但最后文件无法直接打开，会报错)。

创建工作簿：book = xlwt.Workbook()，如果写入中文为乱码，可添加参数encoding = 'utf-8'

创建工作表：sheet = book.add_sheet('Sheet1')

向单元格写入内容：sheet.write(m,n,'内容1')、sheet.write(x,y,'内容2')

保存工作簿：book.save('excel文件名称')，默认保存在py文件相同路径下，如果该路径下有相同文件，会被新创建的文件覆盖，即xlwt不能修改文件。

import xlwt

book = xlwt.Workbook()

sheet = book.add_sheet('Sheet1')

sheet.write(0,0,'hello')

sheet.write(1,0,'你好')

book.save('hello.xls')

逐个单元格写入excel比较麻烦，可以按行或者列写入。

import xlwt

proj = ['名称','单价/元','库存/kg']

fruit = ['苹果','梨','香蕉','橘子']

price = [8,3.5,4.5,3.8]

storage = [150,130,100,300]

book = xlwt.Workbook()

sheet = book.add_sheet('Sheet1')foriin range(0,len(proj)):

sheet.write(0,i,proj[i]) #按行插入行标题foriin range(0,len(fruit)):

sheet.write(i+1,0,fruit[i])#插入第一列水果名称foriin range(0,len(price)):

sheet.write(i+1,1,price[i])#插入第二列单价foriin range(0,len(storage)):

sheet.write(i+1,2,storage[i])#插入第三列库存book.save('fruit2.xls')

二、openpyxl模块

openpyxl模块可实现对excel文件的读、写和修改，只能处理xlsx文件，不能处理xls文件，使用之前同样需要先安装该模块，再导入 import openpyxl。

对于openpyxl，行数和列数都从1开始，单元格的行和列也从1开始。例如sheet.cell(1,2).value表示第一行第二列单元格的内容

1.openpyxl读取excel文件

获取工作簿对象：book = openpyxl.load_workbook('excel文件名称')

获取所有工作表名称：names = book.sheetnames

获取工作表对象：sheet1 = book.worksheets[n]、sheet2 = book['工作表名称']、sheet3 = book[book.sheetnames[n]]

获取工作表名称：title = sheet1.title

获取工作表行数：rows = sheet1.max_row

获取工作表列数：cols = sheet1.max_column

获取某一单元格内容：cell = sheet.cell(1,2).value、sheet['单元格'].value例如sheet['B1'].value

假设有一fruit2.xlsx，除后缀名其他与上述fruit.xls完全一样

import openpyxl

book = openpyxl.load_workbook('fruit2.xlsx')print('所有sheet页名称：',book.sheetnames)

sheet = book.worksheets[0]

sheet2 = book['Sheet1']

sheet3 = book[book.sheetnames[0]]print('工作表名称：',sheet3.title)

rows = sheet.max_row

cols = sheet.max_columnprint('该工作表有%d行，%d列.'%(rows,cols))# 执行结果# 所有sheet页名称： ['Sheet1', 'Sheet2', 'Sheet3']# 工作表名称： Sheet1# 该工作表有5行，3列.

2.行和列生成器

对于xlrd模块来说，可直接通过sheet.row[i]和sheet.col[i]获取行和列的内容，但是对于openpyxl模块来说，无法直接获取某一行或列的内容，openpyxl模块的sheet.rows和sheet.columns表示行和列的生成器，即generator object，需要通过循环或转换成列表、元组的形式得到行或列的值。

print(sheet.rows,sheet.columns)forcolin sheet.columns:

print(col)forrowin sheet.rows:

foriin row:

print(i.value,end='')

print()# 执行结果# <generator object Worksheet._cells_by_row at 0x00000230E011A2A0> <generator object Worksheet._cells_by_col at 0x00000230E102FC00># (<Cell 'Sheet1'.A1>, <Cell 'Sheet1'.A2>, <Cell 'Sheet1'.A3>, <Cell 'Sheet1'.A4>, <Cell 'Sheet1'.A5>)# (<Cell 'Sheet1'.B1>, <Cell 'Sheet1'.B2>, <Cell 'Sheet1'.B3>, <Cell 'Sheet1'.B4>, <Cell 'Sheet1'.B5>)# (<Cell 'Sheet1'.C1>, <Cell 'Sheet1'.C2>, <Cell 'Sheet1'.C3>, <Cell 'Sheet1'.C4>, <Cell 'Sheet1'.C5>)# 名称单价/元库存/kg# 苹果 8 150# 梨 3.5 130# 香蕉 4.5 100# 橘子 3.8 300

如果要获取某一行或者列的内容，可将行、列生成器对象转换成列表或者元组，再循环列表或者元组得到内容。

前面说过openpyxl模块的行和列都从1开始，但是由于将生成器转化成了列表list(sheet.rows)，而列表的索引从0开始，因此list(sheet.rows)[1]还是表示第二行的内容，不是第一行的内容。

foriinlist(sheet.rows)[1]:

print(i.value,end='')print()foriin list(sheet.columns)[0]:

print(i.value,end='')# 执行结果# 苹果 8 150# 名称苹果梨香蕉橘子

获取单元格的内容

print(sheet.cell(1,2).value)#第一行第二列单元格的内容print(sheet['a2'].value)#使用excel单元格的表示法，字母不区分大小写

3.openpyxl写excel文件

创建工作簿：book = openpyxl.Workbook()，如果写入中文为乱码，可添加参数encoding = 'utf-8'

创建工作表： sheet = book.create_sheet('工作表名称',0)，0表示创建的工作表在工作薄最前面

向单元格写入内容：sheet.cell(m,n,'内容1')、sheet.cell(x,y,'内容2')

保存工作簿：book.save('excel文件名称')，默认保存在py文件相同路径下，如果该路径下有相同文件，会被新创建的文件覆盖。

book = openpyxl.Workbook()

sheet = book.create_sheet('Sheet1',0)

proj = ['名称','单价/元','库存/kg']

fruit = ['苹果','香蕉','梨','橘子']

price = [8,3.5,4.5,3.8]

storage = [150,130,300,100]foriin range(len(proj)):

sheet.cell(1,i+1,proj[i])foriin range(len(fruit)):

sheet.cell(i+2,1,fruit[i])foriin range(len(price)):

sheet.cell(i+2,2,price[i])foriin range(len(storage)):

sheet.cell(i+2,3,storage[i])

book.save('fruit2.xlsx')

4.openpyxl修改excel文件

sheet.insert_rows(m)和sheet.insert_cols(n)分别表示在第m行、第n列前面插入行、列

sheet.delete_rows(m)和sheet.delete_cols(n)分别表示删除第m行、第n列

rows = sheet.max_row

sheet.insert_rows(rows+2)

cherry = ['樱桃',17,80] forjin cherry:

sheet.cell(rows+1,cherry.index(j)+1,j)

book.save('fruit2.xlsx')

修改单元格内容：sheet.cell(m,n) = '内容1'或者sheet['B3'] = '内容2'

sheet.cell(3,2,4)

sheet['B3'] = 5book.save('fruit2.xlsx')

在最后追加行：sheet.append(可迭代对象)

straberry = ['草莓',20,50]

sheet.append(straberry)

book.save('fruit2.xlsx')

三、xlsxwriter 模块

只能操作xlsx，只能写。在excel中插入图片

import matplotlib.pyplot as plt

2 import pandas as pd

3 import random

4 import xlsxwriter

5

6 ts = pd.Series(random.randrange(10))

7 fig = plt.figure()

8 ax = fig.add_subplot(1,1,1)

9 ts.plot(ax=ax)

10 fig.savefig('foo.png')

11

12 workbook = xlsxwriter.Workbook('pngxls.xlsx') # 创建excel文件

13 worksheet1 = workbook.add_worksheet('png') # 括号内为工作表表名

14 # 第一个参数是插入的起始单元格，第二个参数是图片你文件的绝对路径

15 worksheet1.write('A1','hello')

16 worksheet1.insert_image('B2','foo.png')

18 workbook.close()

xlrd、xlwt和openpyxl处理excel文件，在写入文件的时候不如pandas简单，pandas处理excel文件见另外一篇博客 https://www.cnblogs.com/Forever77/p/11298173.html

❷ 用python操作excel数据之避坑秘技

用python操作excel表里的数据非常方便，可以把不同报表，不同类型的数据各种乾坤大挪移，汇集到一起进行展示。但初学者可能会遇到一些大坑，百思不得其解，而不得不放弃这个神器。现把我在自学过程中遇到的一些坑与大家分享，给初学者参考，欢迎批评指正！

坑一：用pandas的to_excel写入EXCEL时，会把原数据清空。

解决方案：先用openpyxl的load_workbook打开工作薄，再用pandas的ExcelWriter新建写入器，把之前打开的工作薄赋值给写入器的工作薄。

坑二：把带有公式的sheet1数据导入再写入sheet2时，会发现带公式的数据全部为空。

解决方案：可用win32com.client中的Dispatch把EXCEL表打开再保存。

坑三：当把复制文件，新建文件，打开保存文件，数据写入都写在一个程序时，往往由于EXCEL打开保存时间较长而与后续程序冲突报错。

解决方案：每个环节建模块顺序执行，各环节间用time.sleep隔开。

❸ python如何对excel数据进行处理

在python语言中，可以使用xlrd和xlwt两个库操作excel。
在python语言中处理Excel的方法：
在python项目中，新建python文件，并依次导入xlrd和xlwt。
接着调用open_workbook()方法，打开一个excel文件
调用sheet_by_name()方法，读取文件的sheet页
如果是后面加了个s，sheet_names表示获取excel中所有的sheet页
利用sheets()方法加序号，可以获取某个sheet页对象
如果想要获取excel某个sheet页中记录的总数，使用nrows
在cell()中传入两个值，一个行一个列，然后value获取对应单元格的值
推荐：python视频教程以上就是小编分享的关于python如何对excel数据进行处理的详细内容希望对大家有所帮助，更多有关python教程请关注环球青藤其它相关文章！

❹ Python处理Excel文件(csv, xls, xlsx)

Excel文件格式主要有csv，xlsx和xlsx，对于不同的格式，我们使用不同的包来进行处理。

其中， encoding='utf-8-sig' 是为了编码正常可以正确显示中文， spamreader 中的每一个 row 为list格式，可以循环取出每个单元格的值。

结果：

如果csv文件是数据类的，那么使用 pandas 包读写数据会更方便。

结果：

参数：

结果：

参数：

Excel文件有三层对象：工作薄、工作表和三元格，分别对应 openpyxl 包中的workbook、sheet和cell。

注： openpyxl 功能全面，还支持：合并单元格、数学运算、单元格格式、迭代器 ws.iter_rows() 操作等。

注： xlrd 打开为只读模式，不可修改。

结果：

❺ python如何操作当前已经打开的excel

读取一个Excel的基本流程
1. 双击打开一个Excel文件
2. 选择sheet
3. 对sheet里面的东西进行操作
在python中我们使用第三方模块 openpyxl模块操作Excel
ps:这个模块不是python自带的是第三方模块需要我们下载的
进入终端输入: pip install openpyxl
如果想要下载快点:网络搜索 python第三方源
from openpyxl import load_workbook

# 1. 打开Excel文件
workbook = load_workbook("p1.xlsx")
# 2. 选择sheet
# 2.1 获取所有sheet
# print(workbook.sheetnames)

# 2.2 选择sheet
sheet = workbook["Sheet1"]
print(sheet.max_row) # 最大行号
print(sheet.max_column) # 最大列号

# 2.3 我们选择了sheet后就可以去操作数据了
# cell = sheet.cell(1, 1) # 获取到单元格
# print(cell.value)

sheet 相关操作
from openpyxl import load_workbook

# 1. 打开Excel文件
workbook = load_workbook("p1.xlsx")
# 2. 选择sheet
# 2.1 获取所有sheet
# print(workbook.sheetnames)

# 2.2 选择sheet
# sheet = workbook["Sheet1"]
# 2.3 基于索引的方式获取sheet
# sheet = workbook.worksheets[0]
# 3. 获取到所有的sheet
# for name in workbook.sheetnames:
# sheet = workbook[name]
# cell = sheet.cell(1, 1)
# print(cell.value)

读单元格的数据
from openpyxl import load_workbook

# 1. 打开Excel文件
workbook = load_workbook("p1.xlsx")
# 2 获取sheet
sheet = workbook.worksheets[0]

# 获取到第N行第N列的单元格
# cell = sheet.cell(1, 2)
# print(cell.value)

# 获取到某个单元格

# cell = sheet['A2']
# print(cell.value)

# print()
# for cell in sheet[1]: # 获取到第一行的内容
# print(cell.value)

# 获取到所有的行的数据获取到一列的值
# for row in sheet.rows:
# print(row[0].value)

# 获取到所有的列的数据获取到一行的值
for col in sheet.columns:
print(col[0].value)

写Excel
# 在Excel中想要写文件大致可以分为两种
# 1. 在原有的Excel的基础上写内容
# 2. 在一个新的Excel里面写内容

1. 打开Excel表格
2. 找到单元格修改写入内容
3. 保存

# from openpyxl import load_workbook
#
# # 1. 打开Excel文件
# workbook = load_workbook("p1.xlsx")
# # 2 获取sheet
# sheet = workbook.worksheets[0]
#
# # 获取到第N行第N列的单元格
# # cell = sheet.cell(1, 2)
# # print(cell.value)
#
# # 获取到某个单元格
#
# # cell = sheet['A2']
# # print(cell.value)
#
# # print()
# # for cell in sheet[1]: # 获取到第一行的内容
# # print(cell.value)
#
#
# # 获取到所有的行的数据获取到一列的值
# # for row in sheet.rows:
# # print(row[0].value)
#
# # 获取到所有的列的数据获取到一行的值
# for col in sheet.columns:
# print(col[0].value)

# from openpyxl import workbook
# wb = workbook.Workbook() # 创建一个Excel会默认有一个sheet 就叫 Sheet

# 1. 修改sheet名称
# sheet = wb.worksheets[0]
# sheet.title = '数据集'
# wb.save('p2.xlsx')

# 2. 创建一个新的sheet 还可以设置颜色
# sheet = wb.create_sheet('工作计划', 1)
# sheet.sheet_properties.tabColor = 'FFB6C1'
# wb.save('p2.xlsx')

# 3. sheet
# sheet = wb.create_sheet('工作计划')
# sheet.sheet_properties.tabColor = 'FFB6C1'
#
# new_sheet = wb._worksheet(wb['Sheet'])
# new_sheet.title = '新的计划'
# wb.save('p2.xlsx')
# print(wb.sheetnames)
# sheet = wb.worksheets[0]
# cell = sheet.cell(1, 1)
# cell.value = '哈哈哈'
#
# wb.save('p2.xlsx')

from openpyxl import load_workbook

# 1. 打开Excel文件
workbook = load_workbook("p2.xlsx")
# 2 获取sheet
sheet = workbook.worksheets[0]
# 1. 获取某个单元格修改值
# cell = sheet.cell(1, 1)
# cell.value = '哈哈哈'
# wb.save('p2.xlsx')
# 2. 获取某个单元格修改值
# sheet['B3'] = '光'
# workbook.save('p2.xlsx')

# cell_list = sheet["B2": 'C3']
# for row in cell_list:
# for cell in row:
# cell.value = '新的值'
# workbook.save('p1.xlsx')

for row in sheet.iter_rows(min_row=5, min_col=1, max_col=7, max_row=10):
for cell in row:
cell.value = 'oo'
workbook.save('p1.xlsx')

r row in sheet.iter_rows(min_row=5, min_col=1, max_col=7, max_row=10):
for cell in row:
cell.value = ‘oo’
workbook.save(‘p1.xlsx’)

❻ python如何读取excel里面某一整列内容并修改

可以使用 Python 中的 pandas 库来读取 Excel 文件里面某一整列内容并修改。
首先，需要安装 pandas 库。在命令行中输入：
pip install pandas
然后可以使用 pandas 的 read_excel 函数读取 Excel 文件，并使用 iloc 属性获取某一整列内容。下面是一个示例代码：
import pandas as pd
# 读取 Excel 文件
df = pd.read_excel("your_file.xlsx")
# 获取某一整列内容
column_data = df.iloc[:, 2]
# 2 是列的编号，从 0 开始# 修改某一整列内容
column_data = column_data + 1
# 更新到 Excel 文件
df.iloc[:, 2] = column_data
df.to_excel("your_file.xlsx", index=False)

上面的代码会读取“your_file.xlsx”这个excel文件，获取第3列的内容并修改，最后将修改后的内容重新写入到excel文件中，注意这里没有保留原来的数据，如果需要保留原来的数据需要另外操作。
需要注意的是，若要读取的excel文件中有多个工作表，需要使用 pd.read_ex

导航:首页 > 文件类型 > pythonexcel文件操作

pythonexcel文件操作

与pythonexcel文件操作相关的资料

友情链接