AI 学习
AI 学习
学习规划
目标:理解智能体核心架构,通过低代码平台建立感性认知。
| 天数 | 核心目标 | 知识点 |
|---|---|---|
| 一、AI 概念基础 | ||
| D1 | 初识智能体 | AI 技术核心概念 智能体的构成与原理 体验第一个智能体 |
| D2 | 智能体范式 | ReAct Plan-and-Solve Reflection |
| D3 | 初体验低代码平台 | Coze 平台配置、工作流编排、插件使用 Dify 平台配置、工作流编排、插件使用 |
| D4 | 记忆与检索 | - 短期记忆 vs 长期记忆 - 向量数据库概念 - RAG 2.0(重排序+混合搜索) |
| D5 | 工具调用与MCP协议 | - Tool Calling原理 - MCP协议定位(智能体的USB-C) - 工具安全边界 |
| D6 | Python环境搭建 | - Conda/venv虚拟环境 - pip依赖管理 - Jupyter Notebook基础 |
| D7 | System Prompt设计 | - CO-STAR框架 - 角色定义与行为约束 - Few-shot示例 |
| D8 | LangChain核心组件 | - ChatModel(统一接口) - PromptTemplate - OutputParser |
| D9 | 工具定义与绑定 | - @tool装饰器 - 工具参数Schema - 多工具注册 |
| D10 | 记忆系统初探 | - 会话记忆(ConversationBufferMemory) - 向量存储记忆 - 记忆窗口管理 |
| D11 | RAG完整流程 | - 文档加载(PDF/网页) - 文本分割 - 向量化与存储 - 检索与生成 |
| D12 | 第一阶段项目:知识库问答助手 | 综合运用D6-D11知识 |
| D13 | LangGraph核心概念 | - StateGraph vs Chain - 状态(State)定义 - 节点(Node)与边(Edge) |
| D14 | 第一个LangGraph智能体 | - create_agent新API - 图编译与调用 - 多轮对话 |
| D15 | 添加工具节点 | - ToolNode概念 - 工具执行器(ToolExecutor) - 工具调用循环 |
| D16 | 条件边与分支 | - 条件边(ConditionalEdge) - 路由逻辑设计 - 终止条件判断 |
| D17 | 记忆与检查点 | - Checkpoint机制 - MemorySaver使用 - thread_id管理 |
| D18 | 人类介入(Human-in-the-loop) | - 中断点设置 - 人工审核节点 - 恢复执行 |
| D19 | 复杂状态设计 | - TypedDict扩展 - 自定义状态字段 - 状态更新策略 |
| D20 | 可视化与调试 | - get_graph().draw_mermaid_png() - LangSmith Trace集成 - 执行路径追踪 |
| D21 | 多智能体基础 | - 子图(Subgraph)概念 - 智能体间通信 - Manager-Worker模式初探 |
| D22 | 第二阶段项目:旅行信息助手 | 综合运用D13-D21知识 |
| D23 | 智能体服务化 | - FastAPI封装 - 异步接口设计 - 请求/响应模型 |
| D24 | Java客户端集成 | - FeignClient定义 - RestTemplate调用 - 连接池配置 |
| D25 | 多智能体协作 | - CrewAI框架 - 角色定义与任务分配 - 并行执行 |
| D26 | A2A协议理解 | - Agent Card(智能体名片) - 跨厂商通信 - 任务生命周期 |
| D27 | 评估与优化 | - Ragas评估框架 - LLM-as-a-judge - 成本优化(小模型替代) |
| D28 | 安全与权限设计 | - 工具调用权限控制 - SQL注入防护 - 敏感数据脱敏 |
| D29 | 综合项目:企业客服智能体 | 综合运用全月知识 |
| D30 | 复盘与知识图谱梳理 | - 30天知识体系复盘 - 进阶方向规划 - 学习资源整理 |
一、AI 基础知识
初识智能体
学习资料:
- AI 技术合集 @隔壁的程序员老王
- hello-agents 第一部分所有章节
- 了解 AI 技术核心概念
- 什么是智能体?
- 什么是 LLM?
- 智能体和 LLM 有什么联系?
- 什么是 MCP?
- 什么是 A2A?
- 智能体的构成与原理
- 理解 Agent = LLM + Plan + Memory + Tools(MCP) + Answer
- 智能体如何工作?
- 体验第一个智能体
- 跑通第一个智能体代码

智能体范式
AI 智能体最具代表性的三种范式:
ReAct
- 核心思想:将推理与行动交织,形成**“思考→行动→观察”循环**,动态调整。
- 工作流程:
- 每步输出
Thought(分析)、Action(调用工具或Finish)。 - 工具返回
Observation,追加到历史,驱动下一步思考。
- 每步输出
- 工具定义:
- 名称、描述(最关键,LLM 据此选择工具)、执行逻辑。
- 示例:
Search工具封装 SerpApi,优先返回直接答案。 - 构建工具执行器
ToolExecutor统一管理。
- 关键代码:
- 提示词模板:包含角色、工具列表、格式规范(Thought/Action)。
- 循环:格式化提示词 → 调用 LLM → 解析输出 → 执行工具 → 记录观察。
- 解析器:正则提取
Thought和Action,从Action解析工具名和输入。
- 特点:
- ✔️ 高可解释性、动态纠错、工具协同。
- ❌ 依赖 LLM 能力、效率低(多次调用)、提示词脆弱、可能陷入局部最优。
- 适用场景:需外部实时信息、多步探索、动态调整的任务。
Plan-and-Solve
- 核心思想:先规划后执行,生成完整步骤列表再依次求解。
- 工作流程:
- 规划阶段:LLM 将问题分解为步骤列表(结构化输出如 Python 列表)。
- 执行阶段:遍历步骤,每一步将历史结果作为上下文,调用 LLM 求解。
- 关键组件:
Planner:生成计划(如["步骤1", "步骤2", ...])。Executor:顺序执行,维护历史状态(history字符串)。- 提示词:规划提示强调输出格式;执行提示包含原始问题、完整计划、历史、当前步骤。
- 特点:
- ✔️ 结构清晰、目标一致、适合长流程复杂任务。
- ❌ 计划静态,无法中途调整(可扩展动态重规划)。
- 适用场景:多步数学题、结构化报告撰写、代码模块设计。
Reflection
- 核心思想:引入事后反思,通过**“执行→反思→优化”循环**提升输出质量。
- 工作流程:
- 执行:生成初始方案(如代码)。
- 反思:LLM 扮演评审员,指出不足(算法效率、逻辑漏洞等)。
- 优化:根据反馈生成改进版。
- 重复直至满意或达最大迭代。
- 关键组件:
- 记忆模块
Memory:存储执行与反思记录,提供轨迹文本供后续提示。 - 三种提示词:初始执行(直接写代码)、反思(严格评审)、优化(根据反馈修改)。
- 记忆模块
- 成本收益:
- ✔️ 质量跃迁、鲁棒性高。
- ❌ 调用次数多、延迟高、提示工程复杂。
- 适用场景:对最终答案质量要求极高、实时性要求低的场景(如关键代码生成、复杂推理)。
范式对比
| 范式 | 策略 | 优势 | 局限 | 适用场景 |
|---|---|---|---|---|
| ReAct | 边想边做 | 灵活、适应性强、可纠错 | 效率低、依赖模型 | 实时查询、动态探索任务 |
| Plan-and-Solve | 先想后做 | 结构清晰、稳定 | 计划静态、无法调整 | 步骤明确、内部推理任务 |
| Reflection | 事后反思 | 质量高、自我优化 | 成本高、延迟大 | 高质量要求、可接受延迟 |
组合使用:例如 ReAct 执行中遇到复杂子任务可临时启用 Plan-and-Solve,或在 ReAct 基础上增加 Reflection 优化最终答案。
二、构建智能体
初体验低代码平台
| 平台 | 核心定位 | 特点 | 适用人群 | 优势 | 局限 |
|---|---|---|---|---|---|
| Coze | 零代码/低代码智能体构建平台(字节跳动) | 可视化拖拽、丰富插件、一键发布多平台(微信/飞书/抖音等) | AI入门用户、产品经理、个人创作者 | 插件生态强大、界面友好、发布便捷 | 不支持MCP、无法导出标准化JSON、部分插件配置复杂 |
| Dify | 开源LLM应用开发与运营平台 | 全栈式开发(RAG、工作流、模型管理)、支持本地/云端部署、Marketplace有8000+插件 | 开发者、企业团队 | 功能全面、企业级安全、开源可扩展 | 学习曲线较陡、Python实现性能有限、企业版成本高 |
Day 9-10:提示词工程实战
学习结构化提示词设计:CO-STAR框架、Few-shot学习
理解系统提示词如何定义智能体的"人格"与"行为边界"
在你的Coze/Dify智能体中反复迭代提示词,观察效果变化
验收标准:已拥有1-2个部署上线的小智能体,理解智能体的基本交互流程。
第三阶段:开发框架实战(第11-20天)
目标:进入代码层面,掌握主流开发框架,将你的Java能力迁移到AI领域。
Day 11-15:Python基础与LangChain入门
Python速成:作为Java架构师,你不需要精通Python所有细节,重点掌握:语法、异步、装饰器、类型注解
LangChain核心:学习Chain、Agent、Tool、Memory等核心组件
实战:用LangChain实现一个具备网络搜索能力的智能体
三、AI 高级知识
记忆与检索
学习向量数据库:Milvus/Pinecone/Chroma
实现完整的RAG流程:文档加载 → 分割 → 嵌入 → 存储 → 检索 → 生成
实战:构建一个基于私有PDF文档的问答智能体
Day 19-20:智能体编排框架
学习 LangGraph:实现更复杂的循环、分支、多智能体协作
理解多智能体协作模式:经理Agent拆解任务,执行Agent干活,审计Agent检查
实战:构建一个"论文写作团队"(调研Agent + 写作Agent + 润色Agent)
验收标准:能独立用LangChain/LangGraph开发一个中等复杂度的多智能体应用。
第四阶段:Java架构师视角的整合(第21-30天)
目标:将AI智能体融入你熟悉的企业级Java生态,思考架构层面的落地。
Day 21-24:AI服务与Java后端的集成
学习如何将智能体封装为微服务:通过RESTful/gRPC接口暴露能力
探索Spring Boot应用如何调用LangChain服务/Python推理服务
关注黑马程序员路线图中的"多智能体协同中台项目":SpringCloudGateway + LangGraph + MCP协议
Day 25-27:企业级落地避坑指南
边界防护:智能体的权限控制,防止误删数据库、越权操作
自动化评估Eval:放弃人工盲测,构建Ragas/LLM-as-a-judge评估体系
成本优化:何时用小模型替代大模型(蒸馏技术)
长上下文处理:避免"令牌地狱",设计记忆压缩机制
Day 28-30:综合实战项目
选题建议:基于你熟悉的业务领域(如供应链、金融、CRM)
完整构建一个智能体系统:包含前端交互界面、Java后端、智能体服务层、向量数据库
撰写架构设计文档:画出系统架构图,标注数据流向和智能体协作关系
验收标准:完成一个完整的智能体应用Demo,并形成可向团队展示的架构方案。
二、高质量学习资源推荐
图文教程/专栏(免费)
资源名称 来源 推荐理由
《2026 AI Agent 职业路线图》 阿里云开发者社区 2026年最新,系统拆解核心技术栈(规划/记忆/工具/MCP)
《智能体来了:从0到1全实战》 阿里云开发者社区 实战导向,包含CO-STAR提示词、LangGraph编排、避坑指南
《Java开发者转型AI大模型全攻略》 百度智能云 专门针对Java开发者,分析技能迁移路径和需补强的数学/框架知识
黑马程序员AI智能应用开发学习路线图 黑马程序员官网 完整的10阶段路线,第10阶段涉及SpringCloud+LangGraph+多智能体中台,非常契合Java架构师
视频课程(付费/免费)
课程名称 平台 推荐理由
DeepLearning.AI 的《LangChain for LLM Application Development》 Coursera 吴恩达团队出品,短小精悍,适合快速上手LangChain
《AI Agent 开发实战》系列 B站/YouTube 搜索"LangGraph实战"、"Coze智能体",有很多免费的实战案例
黑马程序员AI智能应用开发课程 黑马程序员官网 2026版完整路线图,覆盖Python基础→LangChain→RAG→多智能体中台,体系完整
书籍推荐(深度阅读)
书名 作者/出版社 推荐理由
《大语言模型:理论与应用》 高仑等 / 清华大学出版社(2026.01) 2026年最新教材,系统全面:Transformer架构→微调→RAG→智能体→多模态→本地部署。配备教学大纲、源码、思维导图,适合作为体系化学习的案头书
《AI工程:大模型应用开发实战》 Chip Huyen / 人民邮电出版社(2026.01) 业内知名AI工程专家撰写,涵盖模型选择、提示工程、RAG与智能体、推理优化、AI工程架构。注重工程决策,适合架构师视角
《零基础学AI Agent,打造你的专属高效助手》 郭泽德等 / 清华大学出版社(2025.04) 实战导向,包含文心一言、智谱清言、GPTs、扣子等平台的详细案例。如果想深入低代码平台和具体操作,这本书很实用
必备工具与框架清单
开发框架:LangChain、LangGraph、LlamaIndex
低代码平台:Dify(开源推荐)、Coze(字节)、阿里云百炼
向量数据库:Chroma(本地快速)、Milvus(生产级)、Pinecone(云服务)
大模型服务:DeepSeek(国产明星)、通义千问、智谱清言
部署与集成:Docker、Kubernetes、SpringCloud Gateway
三、给Java架构师的特别建议
不要陷入数学细节:你不需要从零学线性代数、反向传播。理解Transformer的宏观原理即可,重点是应用层架构。
发挥工程化优势:你的价值在于:如何将智能体服务化?如何设计高可用的AI中台?如何进行版本管理和灰度发布?这些是纯算法工程师不擅长的领域。
关注多智能体协作:2026年的趋势是多智能体系统(MAS)和标准化协议(如A2A协议)。多个Agent像微服务一样协作,这正是你熟悉的领域。
建立"避坑"意识:AI应用与传统软件不同——它有不确定性、有幻觉、有token成本。作为架构师,你需要设计评估体系、降级方案、人工介入节点。
实践出真知:一个月时间有限,不要停留在"看"。哪怕从Coze拖拽一个智能体开始,也比读完一本书更有收获。
📚 资料
- 综合
- 教程
- AI 技术合集 @隔壁的程序员老王 - AI 智能体概念扫盲
- 教程
🚪 传送
◾ 💧 钝悟的 IT 知识图谱 ◾