AI 工具指南

AI 部署教程 / 大模型部署 / Agent 上线 / RAG 记忆

AI 部署教程:从网页上线到 Agent 和大模型部署

不只做网页部署,也覆盖大模型推理、Agent 工具权限、RAG 知识库、API 成本路由和客户项目交付。先用这页判断自己属于哪条部署路径,再进入对应工具做成本、权限和上线清单。

最容易漏掉的事

部署成功不等于可以交付。还要确认密钥安全、日志脱敏、限流、人工审核、回滚和客户验收边界。

生成部署清单

部署主题中心

先从主题中心进入,再分流到具体问题页和深度教程,形成部署类内容的内链闭环。

查看增长状态

按部署类型选择路径

每条路径都附带常见搜索词、上线前检查项和可直接使用的站内工具。

查看全部工具

网页和应用部署

Vercel、Next.js、环境变量、域名、构建失败

适合把作品集、工具站、客户小项目上线。先确认构建命令、环境变量、域名解析和回滚方式。

  • npm run build 本地通过
  • 生产环境变量已配置
  • 域名和 canonical URL 一致
  • 失败时能回滚到上一个部署
进入对应工具或教程

大模型部署

Ollama、vLLM、GPU、Serverless GPU、API 成本

适合本地模型、私有化问答、推理服务和成本对比。重点是并发、上下文、显存和运维边界。

  • 明确模型规模和上下文长度
  • 估算 GPU/API 单次成本
  • 设置限流和队列
  • 准备降级到 API 或小模型
进入对应工具或教程

Agent 部署

LangGraph、CrewAI、MCP、tool calling、权限控制

适合自动处理资料、生成报告、调用工具或跑工作流。核心不是能不能调用工具,而是权限、日志和人工审核。

  • 区分只读和写入工具
  • 敏感操作需要人工确认
  • 每次工具调用有日志
  • 失败时有停止和回滚路径
进入对应工具或教程

记忆和 RAG 部署

向量数据库、pgvector、知识库、长期记忆、召回评测

适合客服知识库、团队文档问答、长期项目记忆。重点是资料更新、删除机制、召回质量和隐私边界。

  • 资料来源和更新时间明确
  • 切分、嵌入、召回可复现
  • 隐私数据可删除
  • 准备人工评测问题集
进入对应工具或教程

AI API 路由

OpenAI、Claude、Gemini、OpenRouter、限流、预算

适合多个模型供应商、成本控制和可用性兜底。先做 key 安全、限流、缓存、重试和日志脱敏。

  • key 不进前端和日志
  • RPM/TPM 限制可见
  • 预算超限有降级策略
  • 错误码和重试策略明确
进入对应工具或教程

客户交付部署

交付清单、验收、报价、维护、SLA

适合客户项目上线交付。除了部署成功,还要写清楚验收范围、维护边界、账号归属和后续收费。

  • 验收项可截图或录屏证明
  • 账号和密钥归属明确
  • 维护时间和响应边界明确
  • 报价包含部署和排错成本
进入对应工具或教程

后续优先扩展的搜索主题

这些词会作为后续公开教程、工具说明和内链页面的扩展方向。

Next.js 部署 Vercel 教程大模型本地部署教程Ollama 部署 API 服务vLLM 部署显存要求Agent 部署到服务器MCP 工具权限配置RAG 知识库部署向量数据库怎么选AI API 限流怎么做OpenRouter 成本路由AI 应用上线检查清单客户项目部署交付清单

大模型部署成本

粗估 API、Ollama、vLLM 和 Serverless GPU 的成本差异。

RAG 和记忆架构

规划短期记忆、长期记忆、知识库更新和删除机制。

API 限流和路由

检查预算、限流、缓存、降级、密钥安全和日志脱敏。