【数模技巧】使用python将.xlsx文件转换为CSV文件
摘要:在数据建模中使用Cursor时,由于无法直接读取xlsx文件,需要通过pandas将其转换为csv格式。具体步骤包括:使用pandas读取Excel文件并获取工作表名称,然后将各工作表数据保存为DataFrame格式;由于LLM仍无法直接处理,需将每个DataFrame转换为csv文件并填充空值为空字符串。最终通过循环将所有工作表导出为独立的csv文件,实现数据格式转换。
·
若在数模之中使用cursor,我们常常需要读取xlsx文件,但是在cursor之中通常不允许xlsx的直接读取,只能转换为csv文件读取
于是我们先使用pandas转换格式为pd,然后再导出为csv文件
import pandas as pd
import os
basepath = os.path.dirname(os.path.abspath(__file__))
# 自行设置路径
excel_path = os.path.join(basepath, "C题", "附件.xlsx")
xls = pd.ExcelFile(excel_path)
print("工作表:", xls.sheet_names)
# 2) 读取整本工作簿:返回 {sheet_name: DataFrame}
all_sheets = pd.read_excel(
excel_path,
sheet_name=None, # None 表示读取所有表
engine="openpyxl",
# keep_default_na=False, # 空单元不变成NaN,留空
# dtype=str, # 全部按文本读,避免类型混杂
)
这样就存在了all_sheets文件当中,但是llm仍然无法读取,只能转为csv文件
for name, df in all_sheets.items():
df.fillna("").to_csv(f"{name}.csv", index=False, encoding="utf-8-sig")
这样就可自动转换了
火山引擎开发者社区是火山引擎打造的AI技术生态平台,聚焦Agent与大模型开发,提供豆包系列模型(图像/视频/视觉)、智能分析与会话工具,并配套评测集、动手实验室及行业案例库。社区通过技术沙龙、挑战赛等活动促进开发者成长,新用户可领50万Tokens权益,助力构建智能应用。
更多推荐

所有评论(0)