🔥🔥🔥 还在为这些场景头秃吗?

  • 看着 excel 表格不知从何下手 ?
  • 写 groupby 总要查半天文档 ?
  • 画个折线图要调试半小时格式 ?
  • 处理缺失值总是逻辑混乱 ?

pandasAI 用自然语言处理技术(NLP) + 大语言模型(LLM),让你用"说人话"的方式完成数据分析!

这篇文章就手把手教你快速入门上手使用 pandasAI ,记得看到最后,有粉丝福利 🎁 🎁 🎁 !

1、Pandas AI 安装

我们使用 pip 安装 Pandas AI,命令如下所示

pip install "pandasai>=3.0.0b2" -U -i https://pypi.tuna.tsinghua.edu.cn/simple/
2、API key 获取

可以登录 PandaBI 注册免费的 API Keys

3、Pandas AI 实践

初始化 PandasAI 并提问,如下所示

import pandasai as pai

# 数据
df = pai.DataFrame({
    "country": ["中国", "美国", "英国", "法国", "德国", "意大利", "西班牙", "加拿大", "澳大利亚", "日本"],
    "revenue": [7000, 5000, 3200, 2900, 4100, 2300, 2100, 2500, 2600, 4500],
    "happiness": [8.0, 7.3, 7.2, 6.5, 7.0, 6.0, 6.3, 7.3, 7.3, 5.9]
})

# 默认使用 pandasai 提供的 BambooLLM 模型,专为数据分析而训练
pai.api_key.set("PAI-xxxxxxxxxxxxxxxxxxxxxx")

df.chat('收入最高的是哪五个国家')

PandasAI 能读懂我们的自然语言输入,并转为数据分析,输出如下所示

我们问下更复杂些的问题,如下所示,它也能准确回答!

当然,我们还可以让 PandasAI 帮助我们绘制可视化图表!

df.chat(
    "绘制各国柱状图,显示每个国家的收入,每个国家使用不同的颜色",
)

4、高阶玩家秘籍

如果你是 Python 高阶玩家,那你可以继续探索使用以下高阶玩法。

1、多表联查:连接数据库直接分析

agent = SmartDataframe(
    conn_url="postgresql://user:pass@localhost:5432/db",
    config={"table": "orders"}
)

2、定制回复:控制输出格式

response = agent.chat("总结数据特征",
                      output_type="dict")  # 可选json/html/markdown

3、记忆对话:实现连续分析

agent.chat("看下北京地区的销售情况")
agent.chat("对比上个月的同期数据")  # 自动关联上下文

4、私有化部署:使用本地大模型

from pandasai.llm import Starcoder
llm = Starcoder(api_base="http://localhost:8080")
agent = SmartDataframe(df, config={"llm": llm})
5、避坑指南

当然 pandasAI 也不是无所不能,我们如果要想更好驾驭它,需要避免以下坑点:

  1. 自然语言要具体:"分析" → "按省份统计退货率TOP5"
  2. 复杂逻辑需分步:先"处理缺失值"再"计算指标"
  3. 隐私数据用本地模型
  4. 关键结果建议人工复核

🎁 【福利】文章转发、点赞、在看三连,如果要获取 PandasAI 官方示例库,可以去 PandasAI 仓库获取: https://github.com/sinaptik-ai/pandas-ai


如果你喜欢本文,欢迎点赞,并且关注我们的微信公众号:Python技术极客,我们会持续更新分享 Python 开发编程、数据分析、数据挖掘、AI 人工智能、网络爬虫等技术文章!让大家在Python 技术领域持续精进提升,成为更好的自己!

添加作者微信(coder_0101),拉你进入行业技术交流群,进行技术交流!!

Logo

火山引擎开发者社区是火山引擎打造的AI技术生态平台,聚焦Agent与大模型开发,提供豆包系列模型(图像/视频/视觉)、智能分析与会话工具,并配套评测集、动手实验室及行业案例库。社区通过技术沙龙、挑战赛等活动促进开发者成长,新用户可领50万Tokens权益,助力构建智能应用。

更多推荐