卡内基梅隆大学(CMU)将于 2026 年春季推出 10-202:现代人工智能导论 课程。该课程由知名专家 Zico Kolter 教授,核心目标是解构现代 AI 系统(尤其是大语言模型 LLM)背后的简单原理。课程不仅涵盖机器学习基础,还深入探讨从架构实现到模型对齐与安全的完整流程,并向全球学习者提供 免费的在线学习资源。
课程核心目标与视野
尽管现代 AI 系统表现出惊人的通用性,但其底层技术出奇地简单。本课程将“人工智能”定义为当下大众最常接触的聊天机器人等机器学习系统,强调通过几百行代码就能实现一个极简的 LLM。
在学术界,“人工智能”范畴极广;但在本课程中,我们将聚焦于改变现代生活的核心动力:机器学习与大型语言模型。
学习路径与核心板块
课程内容环环相扣,从基础数学工具一直延伸到前沿的 AI 安全:
- 基础阶段: 监督学习、线性模型、损失函数与优化算法。
- 核心架构: 深度神经网络、Transformer 架构、自注意力机制、分词器(Tokenizers)。
- 大模型进阶: 高效推理、监督微调(SFT)、对齐与指令微调。
- 前沿挑战: 推理模型、强化学习(RL)、AI 系统的安全性与防御。
参与方式与资源获取
- 在线学习: 官方提供免费的在线版本,讲义和作业将在校内发布 两周后 同步更新,支持全球开发者自主学习。
- 编程实践: 使用 marimo notebook 系统进行作业,重点在于手动实现从自动微分到 Transformer 乃至极简 LLM 的完整过程。
- 准入门槛: 学习者需具备 Python 编程能力(熟练使用面向对象方法)以及基础的 微分演算 知识。线性代数和概率论只需基础了解。
考核机制与 AI 使用政策
课程评分由 20% 的编程作业、40% 的随堂测验和 40% 的期中期末考试组成。针对目前争议较大的 AI 工具使用,课程制定了平衡的政策:
- 允许使用 AI 辅助作业: 学习如何利用 AI 工具完成任务是现代必备技能。
- 独立完成考试: 考试为闭卷形式,严禁使用 AI。
- 核心逻辑: 仅仅依靠 AI 生成答案会导致对材料的理解流于表面。“只有亲自解决最终的提交方案,才能在考试和实际应用中表现更佳。”
通过这种模式,课程旨在引导学生在利用技术便利的同时,通过底层的数学推导和代码实现,建立对 AI 系统逻辑的深刻掌握。