第三课
模型接入与配置实战
让 Dify 真正"有脑可动"——手把手配置大模型
⏱ 预计时间:10-15 分钟
🎯 本课目标
在 Dify 控制台里完成至少 2 个模型的接入配置,并理解不同模型类型(系统推理 / 对话 / Embedding)的区别与用途。
一、Dify 里的 4 种模型类型
在配置模型之前,先搞清楚 Dify 把模型分成哪几类——这关系到你该配置哪些模型:
| 模型类型 | 作用 | 举例 | 必须? |
|---|---|---|---|
| 系统推理模型 | 平台核心大脑,用于工作流、Agent 等所有 AI 推理 | DeepSeek-V3、GPT-4o、Claude 3.5 | ✅ 必须 |
| 对话模型 | 聊天应用的专用模型,支持多轮对话 | 同上(通常共用) | ⚠️ 建议 |
| Embedding 模型 | 把文本转成向量,用于知识库语义检索(RAG) | text-embedding-3-small、bge-m3 | ✅ 用知识库必须 |
| 语音/图像模型 | 语音转文字、图像生成等扩展能力 | Whisper、Stable Diffusion | ❌ 可选 |
💡 最小配置方案:至少配置 1 个系统推理模型 + 1 个 Embedding 模型,就能跑通"聊天 + 知识库问答"的完整流程。
二、推荐模型供应商对比
国内用户推荐以下 3 家,免费额度充足、中文支持好、接入简单:
⭐ 最推荐
DeepSeek
¥1 / 百万 Token(输入)
中文理解极佳,推理能力强,价格极低,新用户送 500 万 Token。
接入步骤:
- 注册 platform.deepseek.com
- API 密钥 → 新建 Key
- Dify 设置 → 模型供应商 → DeepSeek → 输入 Key
免费额度
通义千问(阿里)
有免费额度,按量计费
阿里系,国内访问稳定,与阿里云生态深度整合。
接入步骤:
- 注册 dashscope.aliyun.com
- API-KEY 管理 → 创建 Key
- Dify 设置 → 模型供应商 → 通义千问 → 输入 Key
ChatGLM(智谱 AI)
有免费额度
国产大模型,中文能力强,GLM-4 系列表现优秀。
接入步骤:
- 注册 open.bigmodel.cn
- API 密钥 → 新建
- Dify 设置 → 模型供应商 → ChatGLM → 输入 Key
Ollama(本地模型)
完全免费(本地运行)
在 Debian 虚拟机里跑本地模型,数据完全不出本机,适合高隐私场景。
接入步骤:
- Debian 里安装 Ollama
- 拉取模型:
ollama pull qwen2.5:7b - Dify 设置 → 模型供应商 → Ollama → 配置地址
三、实战:配置 DeepSeek(推荐首选)
跟着步骤走,5 分钟完成:
1
获取 DeepSeek API Key
- 访问 platform.deepseek.com,注册/登录
- 左侧菜单 → API 密钥
- 点击"创建密钥",名称随意(如
dify-test) - 复制 Key 并保存(只显示一次!)
2
在 Dify 里添加 DeepSeek
- 打开 Dify 控制台(http://你的虚拟机IP)
- 右上角头像 → 设置
- 左侧 → 模型供应商
- 找到 DeepSeek,点击"+"或"添加模型"
- 填入 API Key,模型类型选"LLM",模型名称选
deepseek-chat - 点击"保存"
3
添加 Embedding 模型(知识库必备)
- 在同一个 DeepSeek 供应商页面,继续添加模型
- 模型类型选 "Text Embedding"
- 模型名称选
deepseek-embedder(如果 DeepSeek 没有 Embedding 模型,改用下面的备选方案)
⚠️ DeepSeek 没有 Embedding 模型!
DeepSeek 目前只提供对话/推理模型,不提供 Embedding 模型。配置知识库需要单独接入一个 Embedding 模型,推荐用 OpenAI(text-embedding-3-small) 或 本地 Ollama + bge-m3。
✅ 推荐组合(国内用户)
系统推理:DeepSeek-V3(便宜、中文好)
Embedding:Ollama 本地跑 bge-m3(完全免费,数据不出本机)
四、进阶:在 Debian 里跑本地模型(Ollama)
如果不想依赖任何第三方 API,可以在 Debian 虚拟机里直接跑模型。这样数据完全不出本机,适合对隐私要求高的场景。
安装 Ollama
# 在 Debian 虚拟机里执行 curl -fsSL https://ollama.com/install.sh | sh # 安装完成后,Ollama 会自动以服务运行 # 验证 ollama --version
拉取并运行 Embedding 模型
# 拉取 bge-m3(中文 Embedding 效果最好) ollama pull bge-m3 # 拉取一个对话模型(可选,完全离线运行) ollama pull qwen2.5:7b # 查看已安装的模型 ollama list
在 Dify 里配置 Ollama
⚠️ 网络配置关键点
Dify 的容器里访问 localhost 指的是容器自己,不是 Debian 宿主机。需要在 Dify 的 Ollama 配置里填 Debian 的内网 IP(如 http://192.168.1.105:11434),而不是 localhost:11434。
- Dify 控制台 → 设置 → 模型供应商 → 找到 Ollama
- 模型类型:Text Embedding,模型名称:
bge-m3 - Base URL:填
http://你的DebianIP:11434 - 点击保存
五、验证模型配置成功
✅ 验证清单
- ✅ 设置 → 模型供应商 页面能看到已添加的模型,状态为"已启用"
- ✅ 创建一个"聊天助手"应用,能正常对话
- ✅ 创建一个知识库,能成功上传文档并完成向量化
快速测试对话:
- 工作台 → 创建应用 → 聊天助手
- 应用名称随意(如"测试助手")
- 提示词:简单写一句,如"你是一个有帮助的 AI 助手"
- 选择你刚配置的模型(如 DeepSeek-V3)
- 点击"预览",输入一句话测试
📷 提示:第一次对话会稍慢(模型冷启动),之后就快了 如果报错,检查 API Key 是否正确、账户是否有余额
六、费用控制与最佳实践
💰 费用参考(2026 年价格)
- DeepSeek-V3:输入 ¥1/百万 Token,输出 ¥2/百万 Token
- DeepSeek-R1(推理模型):输入 ¥4/百万 Token,输出 ¥16/百万 Token
- 一次普通对话:约消耗 500-2000 Token,成本约 ¥0.001-¥0.004
- 结论:个人/小团队测试,¥10 能用很久
最佳实践
- 分开配置多个模型:轻量任务用便宜模型(DeepSeek-V3),复杂推理用强模型(Claude/GPT-4o)
- 设置 Token 限制:在 Dify 应用设置里限制最大 Token 数,防止异常消耗
- 本地 Embedding:用 Ollama 跑 bge-m3,知识库检索不花 API 钱
- 定期检查用量:Dify 控制台 → 观测 → 日志,可以看到每次对话的 Token 消耗
七、常见问题排查
❌ 报错:"模型供应商 API 请求失败"
- 检查 API Key 是否正确(注意前后空格)
- 检查账户是否有余额(DeepSeek 新用户有免费额度,但也会用完)
- 检查 Debian 虚拟机能否访问外网(
curl https://api.deepseek.com)
❌ Ollama 模型在 Dify 里连不上
- 确认 Ollama 服务在运行:
systemctl status ollama - 确认 Dify 里填的是 Debian 内网 IP,不是 localhost
- 确认防火墙放行 11434 端口:
sudo ufw allow 11434
❌ 知识库上传文档后向量化失败
- 检查是否配置了 Embedding 模型
- 检查 Embedding 模型的 API Key / 连接是否正常
- 文档格式是否支持(PDF/Word/TXT/Markdown 都支持)
八、本节课重点回顾
- ✅ Dify 有 4 种模型类型,最小配置需要"系统推理 + Embedding"
- ✅ 推荐组合:DeepSeek-V3(推理)+ Ollama/bge-m3(Embedding,免费)
- ✅ DeepSeek 接入:获取 API Key → Dify 设置 → 模型供应商 → 添加
- ✅ Ollama 本地模型:数据不出本机,适合高隐私场景
- ✅ 验证方法:创建聊天助手应用,发一条消息测试
- ✅ 费用极低:个人测试 ¥10 能用很久
▶ 下一课预告
第 4 课:知识库构建与 RAG 实战——上传你的第一份文档,搭建专属问答系统
模型已配好,下一步就是让 AI "读懂"你的私有资料!
参考资料
- DeepSeek 开放平台 — 注册获取 API Key
- Ollama - bge-m3 模型 — 中文 Embedding 最佳选择
- Dify 官方文档 - 模型供应商配置
- Dify 官方文档 - 知识库 — 第 4 课预习
配置过程中遇到问题,把报错截图或文字发给我,我帮你排查 🔧
在 Debian 虚拟机上部署 Dify 数据获取与处理 →