第三课

模型接入与配置实战

让 Dify 真正"有脑可动"——手把手配置大模型

⏱ 预计时间：10-15 分钟

🎯 本课目标

在 Dify 控制台里完成至少 2 个模型的接入配置，并理解不同模型类型（系统推理 / 对话 / Embedding）的区别与用途。

一、Dify 里的 4 种模型类型

在配置模型之前，先搞清楚 Dify 把模型分成哪几类——这关系到你该配置哪些模型：

模型类型	作用	举例	必须？
系统推理模型	平台核心大脑，用于工作流、Agent 等所有 AI 推理	DeepSeek-V3、GPT-4o、Claude 3.5	✅ 必须
对话模型	聊天应用的专用模型，支持多轮对话	同上（通常共用）	⚠️ 建议
Embedding 模型	把文本转成向量，用于知识库语义检索（RAG）	text-embedding-3-small、bge-m3	✅ 用知识库必须
语音/图像模型	语音转文字、图像生成等扩展能力	Whisper、Stable Diffusion	❌ 可选

💡 最小配置方案：至少配置 1 个系统推理模型 + 1 个 Embedding 模型，就能跑通"聊天 + 知识库问答"的完整流程。

二、推荐模型供应商对比

国内用户推荐以下 3 家，免费额度充足、中文支持好、接入简单：

⭐ 最推荐

DeepSeek

¥1 / 百万 Token（输入）

中文理解极佳，推理能力强，价格极低，新用户送 500 万 Token。

接入步骤：

注册 platform.deepseek.com
API 密钥 → 新建 Key
Dify 设置 → 模型供应商 → DeepSeek → 输入 Key

免费额度

通义千问（阿里）

有免费额度，按量计费

阿里系，国内访问稳定，与阿里云生态深度整合。

接入步骤：

注册 dashscope.aliyun.com
API-KEY 管理 → 创建 Key
Dify 设置 → 模型供应商 → 通义千问 → 输入 Key

ChatGLM（智谱 AI）

有免费额度

国产大模型，中文能力强，GLM-4 系列表现优秀。

接入步骤：

注册 open.bigmodel.cn
API 密钥 → 新建
Dify 设置 → 模型供应商 → ChatGLM → 输入 Key

Ollama（本地模型）

完全免费（本地运行）

在 Debian 虚拟机里跑本地模型，数据完全不出本机，适合高隐私场景。

接入步骤：

Debian 里安装 Ollama
拉取模型：ollama pull qwen2.5:7b
Dify 设置 → 模型供应商 → Ollama → 配置地址

三、实战：配置 DeepSeek（推荐首选）

跟着步骤走，5 分钟完成：

获取 DeepSeek API Key

访问 platform.deepseek.com，注册/登录
左侧菜单 → API 密钥
点击"创建密钥"，名称随意（如 dify-test）
复制 Key 并保存（只显示一次！）

在 Dify 里添加 DeepSeek

打开 Dify 控制台（http://你的虚拟机IP）
右上角头像 → 设置
左侧 → 模型供应商
找到 DeepSeek，点击"+"或"添加模型"
填入 API Key，模型类型选"LLM"，模型名称选 deepseek-chat
点击"保存"

添加 Embedding 模型（知识库必备）

在同一个 DeepSeek 供应商页面，继续添加模型
模型类型选 "Text Embedding"
模型名称选 deepseek-embedder（如果 DeepSeek 没有 Embedding 模型，改用下面的备选方案）

⚠️ DeepSeek 没有 Embedding 模型！

DeepSeek 目前只提供对话/推理模型，不提供 Embedding 模型。配置知识库需要单独接入一个 Embedding 模型，推荐用 OpenAI（text-embedding-3-small） 或 本地 Ollama + bge-m3。

✅ 推荐组合（国内用户） 系统推理：DeepSeek-V3（便宜、中文好） Embedding：Ollama 本地跑 bge-m3（完全免费，数据不出本机）

四、进阶：在 Debian 里跑本地模型（Ollama）

如果不想依赖任何第三方 API，可以在 Debian 虚拟机里直接跑模型。这样数据完全不出本机，适合对隐私要求高的场景。

安装 Ollama

# 在 Debian 虚拟机里执行 curl -fsSL https://ollama.com/install.sh | sh # 安装完成后，Ollama 会自动以服务运行 # 验证 ollama --version

拉取并运行 Embedding 模型

# 拉取 bge-m3（中文 Embedding 效果最好） ollama pull bge-m3 # 拉取一个对话模型（可选，完全离线运行） ollama pull qwen2.5:7b # 查看已安装的模型 ollama list

在 Dify 里配置 Ollama

⚠️ 网络配置关键点

Dify 的容器里访问 localhost 指的是容器自己，不是 Debian 宿主机。需要在 Dify 的 Ollama 配置里填 Debian 的内网 IP（如 http://192.168.1.105:11434），而不是 localhost:11434。

Dify 控制台 → 设置 → 模型供应商 → 找到 Ollama
模型类型：Text Embedding，模型名称：bge-m3
Base URL：填 http://你的DebianIP:11434
点击保存

五、验证模型配置成功

✅ 验证清单

✅ 设置 → 模型供应商页面能看到已添加的模型，状态为"已启用"
✅ 创建一个"聊天助手"应用，能正常对话
✅ 创建一个知识库，能成功上传文档并完成向量化

快速测试对话：

工作台 → 创建应用 → 聊天助手
应用名称随意（如"测试助手"）
提示词：简单写一句，如"你是一个有帮助的 AI 助手"
选择你刚配置的模型（如 DeepSeek-V3）
点击"预览"，输入一句话测试

📷 提示：第一次对话会稍慢（模型冷启动），之后就快了如果报错，检查 API Key 是否正确、账户是否有余额

六、费用控制与最佳实践

💰 费用参考（2026 年价格）

DeepSeek-V3：输入 ¥1/百万 Token，输出 ¥2/百万 Token
DeepSeek-R1（推理模型）：输入 ¥4/百万 Token，输出 ¥16/百万 Token
一次普通对话：约消耗 500-2000 Token，成本约 ¥0.001-¥0.004
结论：个人/小团队测试，¥10 能用很久

最佳实践

分开配置多个模型：轻量任务用便宜模型（DeepSeek-V3），复杂推理用强模型（Claude/GPT-4o）
设置 Token 限制：在 Dify 应用设置里限制最大 Token 数，防止异常消耗
本地 Embedding：用 Ollama 跑 bge-m3，知识库检索不花 API 钱
定期检查用量：Dify 控制台 → 观测 → 日志，可以看到每次对话的 Token 消耗

七、常见问题排查

❌ 报错："模型供应商 API 请求失败"

检查 API Key 是否正确（注意前后空格）
检查账户是否有余额（DeepSeek 新用户有免费额度，但也会用完）
检查 Debian 虚拟机能否访问外网（curl https://api.deepseek.com）

❌ Ollama 模型在 Dify 里连不上

确认 Ollama 服务在运行：systemctl status ollama
确认 Dify 里填的是 Debian 内网 IP，不是 localhost
确认防火墙放行 11434 端口：sudo ufw allow 11434

❌ 知识库上传文档后向量化失败

检查是否配置了 Embedding 模型
检查 Embedding 模型的 API Key / 连接是否正常
文档格式是否支持（PDF/Word/TXT/Markdown 都支持）

八、本节课重点回顾

✅ Dify 有 4 种模型类型，最小配置需要"系统推理 + Embedding"
✅ 推荐组合：DeepSeek-V3（推理）+ Ollama/bge-m3（Embedding，免费）
✅ DeepSeek 接入：获取 API Key → Dify 设置 → 模型供应商 → 添加
✅ Ollama 本地模型：数据不出本机，适合高隐私场景
✅ 验证方法：创建聊天助手应用，发一条消息测试
✅ 费用极低：个人测试 ¥10 能用很久

▶ 下一课预告

第 4 课：知识库构建与 RAG 实战——上传你的第一份文档，搭建专属问答系统

模型已配好，下一步就是让 AI "读懂"你的私有资料！

参考资料

DeepSeek 开放平台 — 注册获取 API Key
Ollama - bge-m3 模型 — 中文 Embedding 最佳选择
Dify 官方文档 - 模型供应商配置
Dify 官方文档 - 知识库 — 第 4 课预习

配置过程中遇到问题，把报错截图或文字发给我，我帮你排查 🔧

在 Debian 虚拟机上部署 Dify 数据获取与处理 →

模型接入与配置实战

一、Dify 里的 4 种模型类型

二、推荐模型供应商对比

DeepSeek

通义千问（阿里）

ChatGLM（智谱 AI）

Ollama（本地模型）

三、实战：配置 DeepSeek（推荐首选）

获取 DeepSeek API Key

在 Dify 里添加 DeepSeek

添加 Embedding 模型（知识库必备）

四、进阶：在 Debian 里跑本地模型（Ollama）

安装 Ollama

拉取并运行 Embedding 模型

在 Dify 里配置 Ollama

五、验证模型配置成功

六、费用控制与最佳实践

最佳实践

七、常见问题排查

八、本节课重点回顾

参考资料

相关文章