每日一个开源AI工具之banana-slides
智能 PPT 工具 banana-slides(持续更新)
banana-slides 基于 nano banana pro 图像生成模型,是一款原生 AI PPT 应用,支持一句话/大纲/页面描述生成完整演示文稿,支持口头修改、框选编辑、导出可编辑 PPTX,适合快速制作专业幻灯片。
核心特性
- 多种创作入口:一句话主题、大纲、逐页描述
- 自然语言编辑:口头修改(如“把第三页改成案例分析”)
- 素材解析:上传 PDF/Docx/MD/Txt 自动解析并用于生成
- 风格参考:上传模板或参考图定制风格
- 可编辑导出:导出 PPTX、PDF,支持二次编辑(Beta)
适用场景
| 用户 | 场景 |
|---|---|
| 小白 | 零门槛生成 PPT,减少模板选择 |
| 专业人士 | 获取布局和设计灵感 |
| 教师 | 教案快速可视化 |
| 学生 | 作业 Pre、答辩 slides |
| 职场 | 商业提案、产品介绍 |
部署方式
Docker Compose(推荐)
git clone https://github.com/Anionex/banana-slides
cd banana-slides
# 配置 .env
cp .env.example .env
# 编辑 .env,填写 GOOGLE_API_KEY 或 OPENAI_API_KEY
# 使用预构建镜像快速启动
docker compose -f docker-compose.prod.yml up -d
# 或从头构建
docker compose up -d
国内网络
在 .env 中启用镜像源:
DOCKER_REGISTRY=docker.1ms.run/
GHCR_REGISTRY=ghcr.nju.edu.cn/
APT_MIRROR=mirrors.aliyun.com
PYPI_INDEX_URL=https://mirrors.cloud.tencent.com/pypi/simple
NPM_REGISTRY=https://registry.npmmirror.com/
API 配置
支持 Gemini / OpenAI / Vertex AI,以 Gemini 为例:
AI_PROVIDER_FORMAT=gemini
GOOGLE_API_KEY=your-api-key-here
GOOGLE_API_BASE=https://generativelanguage.googleapis.com
可编辑 PPTX 导出建议配置百度 OCR:
BAIDU_OCR_API_KEY=your-baidu-api-key
与 NotebookLM Slide Deck 对比
| 功能 | NotebookLM | banana-slides |
|---|---|---|
| 页数上限 | 15 页 | 无限制 |
| 二次编辑 | 不支持 | 框选 + 口头编辑 |
| 素材添加 | 生成后无法添加 | 生成后自由添加 |
| 导出格式 | 仅 PDF | PDF、可编辑 PPTX |
| 水印 | 免费版有水印 | 无水印 |
常见问题
- 文字乱码/不清晰:将分辨率从 1K 调至 2K,并在描述中写明要渲染的文字
- 可编辑 PPT 效果差:多为 API 配置问题,参考 issue #121
- Gemini 免费版:仅支持文本,不支持图片生成