前置知识
🎯 本篇目标
了解学习大模型应用开发前需要掌握的基础知识。
📊 知识清单
必备技能
| 领域 | 要求 | 优先级 | 相关模块 |
|---|---|---|---|
| Python | 熟练使用,理解面向对象、异步编程 | ⭐⭐⭐ | 所有模块 |
| HTTP/API | 理解 RESTful API、JSON 格式 | ⭐⭐⭐ | Agent、MCP |
| Git | 基本的版本控制操作 | ⭐⭐ | 所有模块 |
加分技能
| 领域 | 要求 | 优先级 | 相关模块 |
|---|---|---|---|
| 机器学习 | 理解训练/推理、损失函数、梯度下降 | ⭐⭐ | 训练与微调 |
| NLP 基础 | 理解 Tokenization、Embedding 概念 | ⭐⭐ | RAG、Prompt |
| 深度学习 | 了解 Transformer 架构 | ⭐ | 训练与微调 |
| Docker | 容器化部署基础 | ⭐ | 训练与微调 |
模块前置知识映射
| LLM 模块 | 所需前置知识 | 难度 |
|---|---|---|
| 🔍 RAG 检索增强 | Python、NLP 基础(Embedding、向量检索)、数据库基础 | ⭐⭐ |
| 🤖 Agent 智能体 | Python、HTTP/API、异步编程、基础算法思维 | ⭐⭐⭐ |
| ⚙️ 训练与微调 | 机器学习、深度学习、PyTorch/TensorFlow、分布式计算 | ⭐⭐⭐⭐ |
| 👁️ 多模态 | 计算机视觉基础、NLP 基础、Transformer 架构 | ⭐⭐⭐ |
| ✨ Prompt 工程 | 自然语言处理直觉、逻辑思维、实验方法论 | ⭐ |
| 🔌 MCP 协议 | HTTP/API、协议设计、数据流处理 | ⭐⭐ |
💻 快速补课资源
Python
- Python 官方教程
- 重点掌握:类型提示、异步编程、包管理
Transformer
LLM 基础
- What Is ChatGPT Doing
- 理解:Token、上下文窗口、Temperature、Top-p
⚠️ 常见误区
- ❌ 必须精通深度学习才能开始
- ✅ 应用开发可以先用 API,边做边学原理
- ❌ 需要 GPU 才能学习
- ✅ 大部分学习可以用云 API 完成
📚 延伸阅读
指南文档
- 学习路线图 - 查看完整的学习路径规划
核心技术模块
🔍 RAG 检索增强
检索增强生成技术,解决知识滞后和幻觉问题
🤖 Agent 智能体
规划、工具使用和复杂任务执行能力
⚙️ 训练与微调
SFT、DPO、RLHF、LoRA 等模型定制技术
👁️ 多模态
视觉与语言的融合,GPT-4V、LLaVA 等
✨ Prompt 工程
掌握与大模型高效沟通的艺术
🔌 MCP 协议
Model Context Protocol,标准化上下文协议