Skip to content

Training

⚡

Training

From pretraining to alignment

2 Articles

12 Papers Referenced

~16 min Reading Time

Recommended Reading Order

Pretraining and Scaling Law: How Models Learn

Pretraining objectives, data engineering, scaling laws, and compute-optimal training.

Intro Engineer Research

Fine-Tuning and Alignment: Making Models Follow Instructions

SFT, RLHF, DPO, and preference optimization methods.

Intro Engineer Research

→ Start with First Article