跳转到内容
LLM Primer
搜索
Ctrl
K
取消
选择主题
深色
浅色
自动
选择语言
简体中文
English
首页 / Home
基础 / Foundations
📍 模块总览
Attention:让每个位置选择上下文
Embeddings:把离散符号放进连续空间
Positional Encoding:顺序从哪里来
Sampling 与 Decoding:从概率到文字
Tokenization:模型如何看见文字
Transformer Architecture:现代 LLM 的骨架
为什么 LLM 会涌现能力
训练 / Training
📍 模块总览
微调与对齐:让模型听指令、守规矩
预训练与 Scaling Law:模型怎么学
推理 / Inference
📍 模块总览
高效注意力:突破序列长度平方瓶颈
KV Cache 与量化:让大模型跑得更快
长上下文:让模型读得更远
应用 / Applications
📍 模块总览
Agent 与工具使用:模型不只是聊天
代码生成:模型如何写程序
评估与基准:如何判断模型好坏
提示工程:与模型对话的艺术
RAG 与检索增强:让模型有外部记忆
安全与对抗:模型的防护与攻击
术语 / Glossary
博客 / Blog
新增训练、推理与应用模块
如何使用 LLM Primer 学习
多模态:LLM 不止于文本
LLM 的开放问题(2026)
如何高效阅读 LLM 论文
为什么要做 LLM Primer
Papers
选择主题
深色
浅色
自动
选择语言
简体中文
English
训练 / Training
⚡
训练
从预训练到对齐的完整流程
2
篇文章
9
篇论文
~16 分钟
阅读时长
推荐阅读顺序
1
预训练与 Scaling Law:模型怎么学
解释预训练目标、数据工程、Scaling Law 与计算最优训练。
直觉
工程
研究
4 篇论文
2
微调与对齐:让模型听指令、守规矩
解释 SFT、RLHF、DPO 与偏好优化方法。
直觉
工程
研究
5 篇论文