该Python脚本主要用于将一个文件夹中的多个Excel文件合并到一个单一的Excel文件中,每个原始Excel文件将作为一个单独的Sheet保存。这样做的目的是为了更方便地管理和分析多个数据集,特别是当这些数据集具有相似的结构或者需要进行整体分析时。
安装依赖
首先,确保你已经安装了pandas
和openpyxl
库。如果没有,可以通过以下命令安装
pip install pandas openpyxl
import os import pandas as pd # 指定包含Excel文件的文件夹路径 folder_path = 'your_folder_path_here' # 创建一个空的Excel写入对象 xpanx.com writer = pd.ExcelWriter('Merged_Excel_File.xlsx', engine='openpyxl') # 遍历文件夹中的所有Excel文件 for filename in os.listdir(folder_path): if filename.endswith('.xlsx'): # 读取Excel文件 df = pd.read_excel(os.path.join(folder_path, filename)) # 将DataFrame写入到新的Excel文件的不同Sheet中 # Sheet的名称为原Excel文件的名称(不包括扩展名) df.to_excel(writer, sheet_name=os.path.splitext(filename)[0], index=False) # 保存合并后的Excel文件 writer.save()
用到的知识点
- Python基础: 脚本使用Python编程语言,需要基础的Python编程知识,如循环、条件语句和函数。
- 文件操作: 使用Python的
os
库来遍历指定文件夹中的所有Excel文件。 - Pandas库: 使用
pandas
库来读取和写入Excel文件。Pandas是一个强大的数据分析库,能够方便地处理数据表格。pd.read_excel()
: 用于读取Excel文件并将其转换为DataFrame。DataFrame.to_excel()
: 用于将DataFrame写入Excel文件。
- Openpyxl库: 作为Pandas写入Excel文件的引擎。这是一个用于读取和写入Excel xlsx/xlsm/xltx/xltm文件的库。
- 字符串操作: 使用
os.path.splitext()
来获取文件名,以便用作新Excel文件中的Sheet名称。 - 文件路径: 使用
os.path.join()
来正确地合并文件夹路径和文件名,以便在不同操作系统上都能正常工作。
https://xpanx.com/
评论