Skip to content

学习路线图

🎯 本篇目标

帮助你规划大模型应用开发的学习路径,从基础到进阶,循序渐进。

📊 技能树总览

大模型应用开发
├── 基础能力(前置知识)
│   ├── Python 编程
│   ├── HTTP/API 基础
│   └── 机器学习基础

├── 核心应用模块
│   ├── ✨ Prompt 工程 ⭐
│   │   ├── Zero-shot / Few-shot
│   │   ├── 思维链 (CoT)
│   │   ├── 提示优化
│   │   └── 安全防御
│   │
│   ├── 🔍 RAG 检索增强 ⭐⭐
│   │   ├── 文档处理与切分
│   │   ├── Embedding 技术
│   │   ├── 向量数据库
│   │   ├── 检索与重排序
│   │   └── 评估与优化
│   │
│   ├── 🤖 Agent 智能体 ⭐⭐⭐
│   │   ├── 工具调用 (Function Calling)
│   │   ├── 规划与推理 (ReAct/ToT)
│   │   ├── 记忆机制
│   │   └── 多智能体协作
│   │
│   └── 🔌 MCP 协议 ⭐⭐
│       ├── 协议基础
│       ├── 上下文管理
│       └── 高级特性

└── 深度技术模块
    ├── ⚙️ 训练与微调 ⭐⭐⭐⭐
    │   ├── 数据处理
    │   ├── SFT / LoRA / QLoRA
    │   ├── DPO / RLHF 对齐
    │   └── 推理优化

    └── 👁️ 多模态 ⭐⭐⭐
        ├── 视觉编码器
        ├── 多模态 RAG
        └── 统一架构

🛤️ 推荐路径

路径一:应用开发者(3-6 个月)

目标:能够使用现有模型构建 RAG 和 Agent 应用

阶段学习内容对应模块时间难度
阶段 1:基础入门前置知识 + LLM API 调用
掌握基本交互方式
✨ Prompt 工程2 周
阶段 2:RAG 应用文档检索、向量数据库
构建知识库问答系统
🔍 RAG 检索增强4 周⭐⭐
阶段 3:Agent 开发工具调用、规划推理
构建自动化智能体
🤖 Agent 智能体
🔌 MCP 协议
4 周⭐⭐⭐
阶段 4:生产部署性能优化、监控评估
实际项目落地
综合应用2 周⭐⭐

学习顺序建议

Prompt 工程 → RAG → Agent → MCP (可选)
    ↓         ↓      ↓
  基础     进阶    高级

路径二:算法工程师(6-12 个月)

目标:能够进行模型微调和优化,深度定制模型

阶段学习内容对应模块时间难度
阶段 1:应用基础完成应用开发者路径
理解模型行为与能力边界
Prompt
RAG
Agent
3 个月⭐-⭐⭐⭐
阶段 2:数据处理数据清洗、标注、构建
质量评估与优化
⚙️ 训练与微调 - 数据2 周⭐⭐
阶段 3:高效微调SFT、LoRA、QLoRA
参数高效微调实践
⚙️ 训练与微调 - LoRA
⚙️ 训练与微调 - SFT
4 周⭐⭐⭐
阶段 4:对齐优化RLHF、DPO
人类偏好对齐
⚙️ 训练与微调 - RLHF
⚙️ 训练与微调 - DPO
4 周⭐⭐⭐⭐
阶段 5:部署优化推理优化、量化压缩
生产环境部署
⚙️ 训练与微调 - Serving
⚙️ 训练与微调 - Eval
4 周⭐⭐⭐

可选进阶

  • 多模态方向👁️ 多模态(视觉理解、图文融合)- 4-6 周
  • 研究探索:新架构研究(Mamba、MoE)、前沿对齐技术

路径三:快速入门(1-2 个月)

目标:快速上手,构建简单应用

阶段学习内容对应模块时间难度
第 1 周Prompt 工程基础
API 调用实践
✨ Prompt 工程1 周
第 2-3 周RAG 基础实现
简单问答系统
🔍 RAG 检索增强2 周⭐⭐
第 4 周综合项目实践综合应用1 周⭐⭐

模块依赖关系

依赖说明

  • Prompt 工程 是基础,建议最先学习
  • RAGAgent 可以并行学习,但建议先掌握 RAG 基础
  • MCP 协议 在掌握 Agent 后学习效果更佳
  • 训练与微调 需要较强的机器学习基础
  • 多模态 可以独立学习,但了解 RAG/Agent 有助于理解应用场景

💻 实践项目建议

入门项目(1-2 周)

  1. 智能问答助手

    • 技术栈:Prompt 工程
    • 功能:基于 API 的对话机器人
    • 学习点:Zero-shot、Few-shot、Temperature 调优
  2. 简单 RAG 系统

    • 技术栈:RAG 检索增强 基础
    • 功能:文档检索 + LLM 生成回答
    • 学习点:文档切分、Embedding、向量检索

进阶项目(1-2 个月)

  1. 企业知识库 RAG 系统

    • 技术栈:RAG 检索增强 全链路
    • 功能:多文档索引、混合检索、重排序、引用溯源
    • 学习点:分块策略、检索优化、评估体系
  2. 工具调用 Agent

    • 技术栈:Agent 智能体 - 工具调用
    • 功能:天气查询、计算器、数据库操作
    • 学习点:Function Calling、错误处理、工具编排
  3. 智能规划 Agent

    • 技术栈:Agent 智能体 - 规划与推理
    • 功能:复杂任务分解、多步执行、自我反思
    • 学习点:ReAct、ToT、Reflexion

高级项目(2-3 个月)

  1. 多工具 Agent 系统

    • 技术栈:Agent + MCP 协议
    • 功能:搜索引擎、代码执行、API 调用、多轮对话
    • 学习点:多工具协调、状态管理、MCP 协议
  2. 多模态 RAG Agent

    • 技术栈:RAG + Agent + 多模态
    • 功能:图文检索、视觉问答、多模态推理
    • 学习点:视觉编码、多模态检索、Agent 规划
  3. 自定义微调模型

    • 技术栈:训练与微调
    • 功能:领域数据微调、指令遵循优化、对齐训练
    • 学习点:LoRA/QLoRA、SFT、DPO、评估部署

综合项目(3-6 个月)

  1. 生产级 AI 应用
    • 技术栈:全栈技术整合
    • 功能:完整产品、性能优化、监控告警、A/B 测试
    • 学习点:系统设计、工程实践、运维部署

项目选择建议

  • 初学者:从项目 1-2 开始,循序渐进
  • 应用开发者:重点完成项目 3-5,掌握核心应用技术
  • 算法工程师:深入项目 6-8,掌握模型定制能力

📚 延伸阅读

指南文档

核心技术模块导航

学习建议

  1. 按顺序学习:Prompt → RAG → Agent → MCP,循序渐进
  2. 理论结合实践:每学习一个模块,完成对应的实践项目
  3. 及时复习:新模块会用到之前的知识,定期回顾
  4. 关注最新动态:大模型技术发展迅速,关注最新研究和实践

基于 VitePress 构建