Python 读取 Excel 文件的方法主要有以下几种:

  1. Pandas库:Pandas 是一个强大的数据处理库,它提供了方便的方法来读取和处理 Excel 文件。
  • 优点:Pandas 是一个非常强大的数据处理库,可以方便地读取、处理和分析Excel文件。它支持多种数据结构和数据操作,可以进行数据的过滤、分组、排序和统计等。Pandas 对Excel文件的读取支持非常友好,可以轻松读取各种类型的Excel文件。
  • 缺点:Pandas读取Excel文件时,对于一些特殊的Excel功能(如复杂公式、图片等)可能支持不够完全。

import pandas as pd df = pd.read_excel('file.xlsx') # 读取 Excel 文件 print(df) # 打印 DataFrame

  1. openpyxl库:openpyxl 是一个专门用于处理 Excel 2010 xlsx/xlsm/xltx/xltm 文件的库。
  • 优点:openpyxl专门用于处理Excel 2010的.xlsx/.xlsm/.xltx/.xltm文件,可以很好地支持这些文件的各种读写操作。它支持读取和修改单元格的格式、字体、颜色等,还支持图表的读写。
  • 缺点:openpyxl对于一些较老的.xls格式的文件支持不够好。

from openpyxl import load_workbook workbook = load_workbook(filename="file.xlsx") # 加载工作簿 sheet = workbook.active # 获取活动工作表 for row in sheet.iter_rows(values_only=True): # 迭代行 print(row) # 打印整行数据

  1. xlrd库:xlrd 是一个用于读取 Excel 文件的库,支持 .xls 格式。
  • 优点:xlrd是专门用于读取Excel文件的库,能很好地支持.xls文件的读取。它的读取速度快,内存占用少,可以轻松读取大型Excel文件。
  • 缺点:xlrd只支持.xls文件,对于.xlsx文件支持不够好。同时对于一些特殊的Excel功能(如复杂公式、图片等)也可能支持不够完全。

import xlrd workbook = xlrd.open_workbook('file.xls') # 打开工作簿 sheet = workbook.sheet_by_index(0) # 获取第一个工作表 for row in range(sheet.nrows): # 迭代行 print(sheet.row_values(row)) # 打印整行数据

  1. csv库:如果你的 Excel 文件保存为 .csv 格式,你可以使用 Python 的 csv 库来读取。
  • 优点:csv库对于.csv格式的Excel文件读取非常友好,可以轻松读取这种类型的文件。csv库是Python标准库之一,使用简单方便。
  • 缺点:csv库对于.xls或.xlsx格式的Excel文件支持不够好。它只支持纯文本的数据读取,无法处理一些Excel特有的数据格式。

import csv with open('file.csv', 'r') as file: # 打开文件 reader = csv.reader(file) # 创建 csv reader 对象 for row in reader: # 迭代行 print(row) # 打印整行数据

以上都是每种读取Excel方式的优点,但具体使用哪种方式取决于你的实际需求和环境。