智能 PPT 工具 banana-slides(持续更新)

banana-slides 基于 nano banana pro 图像生成模型,是一款原生 AI PPT 应用,支持一句话/大纲/页面描述生成完整演示文稿,支持口头修改、框选编辑、导出可编辑 PPTX,适合快速制作专业幻灯片。

核心特性

  • 多种创作入口:一句话主题、大纲、逐页描述
  • 自然语言编辑:口头修改(如“把第三页改成案例分析”)
  • 素材解析:上传 PDF/Docx/MD/Txt 自动解析并用于生成
  • 风格参考:上传模板或参考图定制风格
  • 可编辑导出:导出 PPTX、PDF,支持二次编辑(Beta)

适用场景

用户 场景
小白 零门槛生成 PPT,减少模板选择
专业人士 获取布局和设计灵感
教师 教案快速可视化
学生 作业 Pre、答辩 slides
职场 商业提案、产品介绍

部署方式

Docker Compose(推荐)

git clone https://github.com/Anionex/banana-slides
cd banana-slides

# 配置 .env
cp .env.example .env
# 编辑 .env,填写 GOOGLE_API_KEY 或 OPENAI_API_KEY

# 使用预构建镜像快速启动
docker compose -f docker-compose.prod.yml up -d

# 或从头构建
docker compose up -d

国内网络

.env 中启用镜像源:

DOCKER_REGISTRY=docker.1ms.run/
GHCR_REGISTRY=ghcr.nju.edu.cn/
APT_MIRROR=mirrors.aliyun.com
PYPI_INDEX_URL=https://mirrors.cloud.tencent.com/pypi/simple
NPM_REGISTRY=https://registry.npmmirror.com/

API 配置

支持 Gemini / OpenAI / Vertex AI,以 Gemini 为例:

AI_PROVIDER_FORMAT=gemini
GOOGLE_API_KEY=your-api-key-here
GOOGLE_API_BASE=https://generativelanguage.googleapis.com

可编辑 PPTX 导出建议配置百度 OCR:

BAIDU_OCR_API_KEY=your-baidu-api-key

与 NotebookLM Slide Deck 对比

功能 NotebookLM banana-slides
页数上限 15 页 无限制
二次编辑 不支持 框选 + 口头编辑
素材添加 生成后无法添加 生成后自由添加
导出格式 仅 PDF PDF、可编辑 PPTX
水印 免费版有水印 无水印

常见问题

  • 文字乱码/不清晰:将分辨率从 1K 调至 2K,并在描述中写明要渲染的文字
  • 可编辑 PPT 效果差:多为 API 配置问题,参考 issue #121
  • Gemini 免费版:仅支持文本,不支持图片生成

官方资料