斯坦福 CS 224N | 深度学习自然语言处理

自然语言处理（NLP）是人工智能（AI）的重要组成部分，它建模人们如何共享信息。近年来，深度学习方法在许多 NLP 任务上取得了很高的性能。在本课程中，学生将系统学习面向 NLP 的前沿神经网络方法。

授课教师

Diyi Yang

Yejin Choi

课程团队

John Cho（课程经理）

Swati Dube Batra（课程经理顾问）

助教

课程安排

课堂：每周二/周四太平洋时间下午 4:30 - 5:50 在 NVIDIA Auditorium 上课。课程也会通过 Canvas 上的 Panopto 直播。
面向已注册学生的课程录像：每次课结束后不久会发布到 Canvas（需要登录）。很遗憾，这些录像不能开放给未注册学生观看。
公开课程录像和课程版本：CS224N 的完整课程录像可在 CS224N 2024 YouTube 播放列表免费观看。欢迎任何人在全年报名 XCS224N：深度学习自然语言处理，这是本课程在斯坦福人工智能专业项目中的版本（中等费用，社区助教和证书）。斯坦福学生正常选修 CS224N，其他学习者也可以通过 Stanford Online 选修 CS224N（费用较高，名额有限，可获得斯坦福学分）。课程幻灯片和作业会随着课程推进每年在线更新。我们欢迎任何人使用这些资源，也欢迎致谢。
办公时间：采用混合形式，可通过 Zoom 远程参加，也可线下参加。信息见这里。
联系方式：学生应在 Ed 论坛中提出所有课程相关问题，公告也会发布在那里。你可以在课程 Canvas 页面或页面顶部链接中找到本课程的 Ed。如有外部咨询、紧急情况，或不希望发布为 Ed 私密帖的个人事务，可以发邮件至 cs224n-staff-win2526@cs.stanford.edu。请将所有邮件发送到这个邮件列表，不要直接给授课教师发邮件。

课程内容

本课程讲什么？

自然语言处理（NLP），也称计算语言学，是信息时代最重要的技术之一。 NLP 应用无处不在，因为人们几乎通过语言交流一切：网络搜索、广告、电子邮件、客户服务、语言翻译、虚拟代理、医疗报告、政治等。在 2010 年代，深度学习（或神经网络）方法在许多不同的 NLP 任务上取得了很高的性能，它们使用单一的端到端神经模型，不再需要传统的、面向特定任务的特征工程。到 2020 年代，ChatGPT 等大语言模型的规模化带来了惊人的进一步进展。在本课程中，学生将系统学习 NLP 深度学习的基础知识，以及大语言模型（LLM）的最新前沿研究。通过课堂、作业和期末项目，学生将学习使用 PyTorch 框架设计、实现并理解自己的神经网络模型所需的技能。

“选这门课吧。CS221 教会我算法，CS229 教会我数学，CS224N 教会我如何编写机器学习模型。” - 一位 CS224N 学生在 Carta 上的评价

往年课程

下面列出了往年课程网站归档和学生项目报告。免责声明：作业每年都会变化；请不要做往年的作业！

CS224N 课程网站: 2025 年冬季 / 2024 年春季 / 2024 年冬季 / 2023 年冬季 / 2022 年冬季 / 2021 年冬季 / 2020 年冬季 / 2019 年冬季 / 2018 年冬季 / 2017 年冬季 / 2015 年秋季 / 2014 年秋季 / 2013 年秋季 / 2012 年秋季 / 2011 年秋季 / 2011 年冬季 / 2010 年春季 / 2009 年春季 / 2008 年春季 / 2007 年春季 / 2006 年春季 / 2005 年春季 / 2004 年春季 / 2003 年春季 / 2002 年春季 / 2000 年春季

CS224N 课程录像: 2024 年春季 / 2023 年冬季 / 2021 年冬季 / 2019 年冬季 / 2017 年冬季

CS224N 报告: 2024 年冬季 / 2023 年冬季 / 2022 年冬季 / 2021 年冬季 / 2020 年冬季 / 2019 年冬季 / 2018 年冬季 / 2017 年冬季 / 2015 年秋季及更早

CS224d 报告: 2016 年春季 / 2015 年春季

先修要求

熟练掌握 Python
所有课程作业都将使用 Python（并使用 NumPy 和 PyTorch）。如果你需要复习 Python，或不太熟悉 NumPy，可以参加第 1 周的 Python 复习课（见课程日程）。如果你有丰富的编程经验，但主要使用其他语言（如 C/C++/Matlab/Java/Javascript），通常也可以胜任。
大学微积分、线性代数（如 MATH 51、CME 100）
你应熟悉（多变量）求导，并能理解矩阵/向量记号和运算。
概率与统计基础（如 CS 109 或同等课程）
你应了解概率、高斯分布、均值、标准差等基础知识。
机器学习基础（如 CS221、CS229、CS230 或 CS124）
我们会构造代价函数、求导，并使用梯度下降进行优化。如果你已经具备基础的机器学习和/或深度学习知识，本课程会更容易；但没有这些背景也可以选修 CS224N。机器学习入门资料很多，包括网页、书籍和视频。Hal Daumé 正在撰写的 A Course in Machine Learning 是一个容易上手的入门资源。阅读该书前 5 章会提供很好的背景；如果掌握前 7 章则更好。

参考书目

以下书籍很有用，但都不是必读。它们都可以在线免费阅读。

Dan Jurafsky and James H. Martin. Speech and Language Processing（2024 预发布版）
Jacob Eisenstein. Natural Language Processing
Yoav Goldberg. A Primer on Neural Network Models for Natural Language Processing
Ian Goodfellow, Yoshua Bengio, and Aaron Courville. Deep Learning
Delip Rao and Brian McMahan. Natural Language Processing with PyTorch（需要斯坦福登录）。
Lewis Tunstall, Leandro von Werra, and Thomas Wolf. Natural Language Processing with Transformers

如果你没有神经网络背景但仍想选修本课程，以下书籍可能有助于补充背景知识：

Michael A. Nielsen. Neural Networks and Deep Learning
Eugene Charniak. Introduction to Deep Learning

课程作业

免责声明：课程作业安排暂定，可能会调整！

作业（48%）

本课程有四次周作业，将同时提升你的理论理解和实践技能。所有作业都包含书面问题和编程部分。在办公时间中，助教可以查看学生第 1、2 次作业的代码，但不会查看第 3、4 次作业的代码。

评分构成:
- 作业 1（6%）：词向量简介
- 作业 2（14%）：神经网络基础、张量导数计算、依存句法分析
- 作业 3（14%）：自注意力与 Transformer
- 作业 4（14%）：大语言模型基准测试与评估
截止时间：所有作业都在周二或周四课前截止（即下午 4:30 前）。所有截止时间列在课程日程中。
提交：作业通过 Gradescope 提交。你可以在 Canvas 上访问本课程的 Gradescope 页面。如果需要注册 Gradescope 账号，请使用你的 @stanford.edu 邮箱。每份作业说明中会提供进一步指引。 请不要通过电子邮件提交作业。
起步较晚：如果这样能让你获得更高成绩，我们将不计入你的作业 1 分数，并按作业 2-4 各 16% 计算作业成绩。
合作：允许学习小组，但学生必须理解并完成自己的作业，每位学生提交一份作业。如果你参与了小组学习，请在作业开头写明学习小组成员姓名。如果对合作政策有任何疑问，请向我们提问。
荣誉准则：我们要求学生不要查看网上的答案或实现。和斯坦福所有其他课程一样，我们严肃对待学生荣誉准则。我们有时会使用自动化方法检测过度相似的作业解答。

期末项目（49%）

期末项目让你有机会把新学到的技能应用到一个深入项目中。学生有两个选择：默认期末项目（完成一个预设任务，即实现一个极简版 GPT-2）或自选期末项目（选择一个涉及人类语言和深度学习的自定义项目）。两类项目示例可见 2024 年春季网站。注意：无论是默认项目还是自选项目，助教都不能查看学生代码。2024 年春季的默认期末项目基于 BERT，现在已替换为 GPT-2。

重要信息

评分构成：无论默认项目还是自选项目，期末项目评分如下：
- 项目提案（8%）
- 项目里程碑（6%）
- 项目海报（3%）
- 项目报告（32%）
截止时间：项目提案、里程碑和报告均在下午 4:30 截止。所有截止时间列在课程日程中。
默认期末项目：在该项目中，学生将实现 GPT-2 架构的一部分，并用它处理 3 个下游任务。与往年类似，代码使用 PyTorch。
项目建议 [课程幻灯片] [自选项目建议]：期末项目实践建议这节课会提供选择和规划项目的指导。如需向课程团队寻求项目建议，请先查看办公时间页面上每位成员的专业方向。这可以帮助你找到熟悉你项目领域的课程团队成员。
伦理相关问题：如果项目涉及伦理问题，或项目过程中出现伦理问题，请联系 Wanheng Hu（wanhenghu@stanford.edu）或 Justin Shin（justinjs@stanford.edu）获取指导。

实际事项

团队规模：学生可以单独完成期末项目，也可以组成最多 3 人的团队。我们强烈建议组队完成期末项目。更大的团队需要完成相应更大的项目；只有在计划做一个每位成员都会有显著贡献的有挑战性项目时，才应组建 3 人团队。
贡献说明：期末报告中需要说明每位团队成员对项目的贡献。团队成员通常会获得相同成绩，但在贡献极不均衡的情况下我们可能会区分评分。如遇贡献不均衡情况，可以私下联系我们。
外部合作者：你可以与外部（非 CS224N 学生）合作者一起做项目，但必须在期末报告中清楚说明项目的哪些部分是你完成的。
共享项目：你可以将同一个项目同时用于 CS224N 和另一门课程，但我们期望该项目相应更大，并且你必须在项目提案中声明该项目会被共享。
导师：每个自选项目团队都会有一位导师，在项目过程中提供反馈和建议。默认项目团队没有导师。项目可以有外部导师（即非课程团队成员）；否则，我们会在项目提案后为自选项目团队分配一位 CS224N 课程团队导师。
计算资源：感谢 Google、Kimi、Modal 和 Qwen 的慷慨捐赠，所有团队都会获得计算额度！
使用外部资源：以下准则适用于所有项目（默认项目另有一些更具体的规则，详见说明文档中的荣誉准则部分）：
- 你可以使用任何喜欢的深度学习框架（PyTorch、TensorFlow 等）。
- 更一般地说，你可以在项目中使用任何已有代码、库等，也可以查阅任何论文、书籍、在线参考资料等。但是，你必须在报告中引用来源，并明确指出项目哪些部分是你的贡献，哪些部分由他人实现。
- 在任何情况下，你都不得查看其他 CS224N 小组的代码，也不得将他们的代码纳入你的项目。

课堂参与（3%）

我们感谢大家积极参与课程！获得参与分的方式有多种，总分上限为 3%：

参加嘉宾讲座：

课程后半段会有四位受邀讲者。嘉宾讲者付出了很大努力来为我们授课，因此（既是表达感谢，也是为了持续吸引有趣的讲者），我们不希望他们面对大量空座授课。因此，我们鼓励学生实时参加这些线上讲座，并参与问答。
每位讲者对应 0.375%（合计 1.5%）。学生可以通过线下参加嘉宾讲座获得，也可以在远程观看后写一段反思文字获得；具体细节将另行提供。学生不必实时参加讲座才能写反思段落；可以异步观看。

完成反馈问卷：我们会发送两次反馈问卷（期中和期末），帮助我们了解课程进展以及改进方式。两次问卷各占 0.5%。
Ed 参与：Ed 上贡献排名前约 20 的学生将获得 3%；其他学生会按相对于第约 20 名贡献量的比例获得参与分。
奖励分：任何其他改善课程的行为，例如在办公时间帮助其他学生，或围绕某个主题为学生撰写有用指南，并被 CS224N 助教或授课教师注意到且认为值得奖励：1%。

迟交天数

每位学生有 6 天迟交天数可用。1 个迟交天数会将截止时间延后 24 小时。每项作业最多可使用 3 天迟交天数（包括四次作业、项目提案、项目里程碑和期末项目报告）。
用完全部 6 天迟交天数后，每额外迟交一天，将从课程总成绩中扣除 1%。
项目提案和里程碑（迟交天数不能共享）：迟交天数按个人使用，不在团队内合并。如果某位学生剩余迟交天数不足，则该学生每缺少 1 天迟交天数，其课程总成绩扣 1%；该惩罚只适用于该学生。
期末项目报告（迟交天数可以共享）：团队成员可以合并迟交天数。例如，在三人团队中，团队可用迟交天数总量等于每位成员剩余迟交天数之和，再除以三，以决定团队最多可迟交多少天。在期末报告开头，你们必须说明团队合并了多少迟交天数，以及哪些团队成员还有剩余迟交天数。

重新评分请求

如果你认为某次作业应获得更高分数，可以在成绩发布后 3 天内通过 Gradescope 提交重新评分请求。请求应简要说明你认为原评分不公平的原因。你的助教会尽快重新评估你的作业并给出决定。如果你仍不满意，可以请求由授课教师重新评分。 免责声明：除你请求复核的具体题目外，课程团队保留重新评分整份作业的权利。提交重新评分请求需自行承担风险。

学分/无学分选课

如果你以学分/无学分方式选修本课，你的评分方式与注册字母成绩的学生相同。唯一不同的是，只要你的表现达到 C- 标准，最终成绩会记为 CR。

欢迎所有学生

我们致力于尽己所能促进公平，并创造一个包容性的学习环境，积极重视 CS224N 中每个人在背景、身份和经历方面的多样性。我们也知道自己有时会出错。如果你注意到我们可以做得更好的地方，希望你告诉课程团队成员。

身心健康

如果你正在经历个人、学业或人际关系问题，并希望与受过训练且有经验的人交流，请联系校内的 Counseling and Psychological Services（CAPS）。CAPS 是大学面向学生心理健康与福祉的咨询中心。你可以拨打 650-723-3785 预约 CAPS 电话评估，或通过 Vaden 网站访问 VadenPatient 门户预约。

旁听课程

一般而言，如果旁听者是斯坦福社区成员（注册学生、正式访问者、职员或教师），我们欢迎旁听。如果你有兴趣，请发邮件至 cs224n-staff-win2526@cs.stanford.edu。如果你希望真正掌握课程内容，我们强烈建议旁听者完成所有作业。不过，由于选课人数较多，我们无法为未正式选课学生的作业评分。

有记录残障的学生

我们认为每个人的学习方式都不同，课程组织也必须以不同方式适应每位学生。我们致力于确保所有正式选课学生都能充分参与本课程。如果你因残障需要学业便利安排，应向 Office of Accessible Education（OAE）发起请求。 OAE 会评估请求、建议便利安排，并为教师准备信函。学生应尽快联系 OAE，并且无论如何都应在作业截止时间前联系，因为协调便利安排需要及时通知。学生还应尽快将便利安排信函发送至课程团队邮件列表（cs224n-staff-win2526@cs.stanford.edu），或在 Ed 上发布私密帖。

小组项目的 OAE 便利安排：OAE 便利安排不会扩展到协作作业。

AI 工具政策

学生必须独立提交 CS224N 作业解答。允许与 Co-Pilot、ChatGPT 等生成式 AI 工具合作，将其视为解题过程中的协作者。但是，直接索取答案或复制解答，无论来源是同伴还是外部资源，都被严格禁止。

使用 AI 工具实质性完成作业或考试将被视为违反荣誉准则。 更多细节请参见生成式 AI 政策指南。

性暴力

经历过性暴力或正在从性暴力中恢复的学生可以获得学业便利安排。如果你希望与保密资源交流，可以预约 Confidential Support Team，或拨打其 24/7 热线：650-725-9955。Counseling and Psychological Services 也提供保密咨询服务。非保密资源包括负责调查和便利安排的 Title IX Office，以及提供康复项目的 SARA Office。学生也可以直接与教学团队沟通以安排便利措施。请注意，大学员工（包括教授和助教）必须向 Title IX Office 报告他们所知的性暴力或亲密关系暴力、跟踪和性骚扰事件。学生可在此了解更多信息：https://vaden.stanford.edu/sexual-assault。

课程日程

更新后的课程幻灯片会在每次课前不久发布在这里。大多数课程的讲义会在课后几天上传。讲义（大约覆盖课程前半部分内容）会提供课堂之外的补充细节。

免责声明：课程日程暂定，可能会调整！
免责声明：作业会变化；请不要做旧作业。完成去年作业不会获得任何分数。

日期	主题	课程资料	事件	截止时间
第 1 周 1 月 6 日周二	NLP 历史 [介绍幻灯片] [历史幻灯片]	建议阅读： Human Language Understanding & Reasoning	作业 1 发布 [代码]
1 月 8 日周四	词向量 [幻灯片] [讲义 1] [讲义 2]	建议阅读： Efficient Estimation of Word Representations in Vector Space（原始 word2vec 论文） Distributed Representations of Words and Phrases and their Compositionality（负采样论文） GloVe: Global Vectors for Word Representation（原始 GloVe 论文） Improving Distributional Similarity with Lessons Learned from Word Embeddings Evaluation methods for unsupervised word embeddings 补充阅读： A Latent Variable Model Approach to PMI-based Word Embeddings Linear Algebraic Structure of Word Senses, with Applications to Polysemy On the Dimensionality of Word Embedding
1 月 9 日周五	Python 复习课 [幻灯片] [Colab]	时间 1:30pm-2:50pm 地点 NVIDIA Auditorium
第 2 周 1 月 13 日周二	反向传播与神经网络基础 [幻灯片] [讲义]	建议阅读：矩阵微积分讲义微分学复习 CS231n 网络架构讲义 CS231n 反向传播讲义 Derivatives, Backpropagation, and Vectorization Learning Representations by Backpropagating Errors（Rumelhart 等人的开创性反向传播论文）补充阅读： Yes you should understand backprop Natural Language Processing (Almost) from Scratch	作业 2 发布 [代码] [说明文档] [LaTeX 模板]	作业 1 截止
1 月 15 日周四	语言模型与 RNN [幻灯片] [讲义]	建议阅读： Learning long-term dependencies with gradient descent is difficult（最早讨论梯度消失的论文之一） On the difficulty of training Recurrent Neural Networks（梯度消失问题的证明） Vanishing Gradients Jupyter Notebook（前馈网络演示） Attention Is All You Need
1 月 16 日周五	PyTorch 教程课 [Colab]	时间 1:30pm-2:50pm 地点 NVIDIA Auditorium
第 3 周 1 月 20 日周二	Transformer [幻灯片] [讲义]	建议阅读： Attention Is All You Need The Illustrated Transformer Transformer（Google AI 博客文章） Layer Normalization Image Transformer Music Transformer: Generating music with long-term structure Jurafsky and Martin 第 9 章（The Transformer）
1 月 22 日周四	期末项目：自选与默认；实践建议 [幻灯片]	建议阅读： Practical Methodology（Deep Learning 书中章节）	作业 3 发布 [代码] [说明文档] [LaTeX 模板]	作业 2 截止
第 4 周 1 月 27 日周二	预训练（规模化、系统、数据） [幻灯片]	建议阅读： BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding Contextual Word Representations: A Contextual Introduction The Illustrated BERT, ELMo, and co. Jurafsky and Martin 第 10 章（Masked Language Models） The Llama 3 Herd of Models
1 月 29 日周四	后训练（RLHF、SFT、DPO） [幻灯片]	建议阅读： Aligning language models to follow instructions Scaling Instruction-Finetuned Language Models AlpacaFarm: A Simulation Framework for Methods that Learn from Human Feedback How Far Can Camels Go? Exploring the State of Instruction Tuning on Open Resources Direct Preference Optimization: Your Language Model is Secretly a Reward Model	项目提案发布 [说明文档] 默认期末项目发布 [说明文档]
第 5 周 2 月 3 日周二	高效适配（Prompting + PEFT） [幻灯片]	建议阅读： Language Models are Few-Shot Learners Chain-of-Thought Prompting Elicits Reasoning in Large Language Models The Lottery Ticket Hypothesis: Finding Sparse, Trainable Neural Networks LoRA: Low-Rank Adaptation of Large Language Models Parameter-Efficient Transfer Learning for NLP
2 月 5 日周四	智能体、工具使用与 RAG [幻灯片]	建议阅读： ReAct: Synergizing Reasoning and Acting in Language Models Language Agents: Foundations, Prospects, and Risks Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks Toolformer: Language Models Can Teach Themselves to Use Tools	作业 4 发布 [代码] [说明文档] [LaTeX 模板]	作业 3 截止
2 月 6 日周五	Hugging Face Transformers 教程课 [幻灯片] [Colab]	时间 1:30pm-2:50pm 地点 NVIDIA Auditorium
第 6 周 2 月 10 日周二	基准测试与评估 [幻灯片]	建议阅读： Challenges and Opportunities in NLP Benchmarking Measuring Massive Multitask Language Understanding Holistic Evaluation of Language Models AlpacaEval		项目提案与导师表截止
2 月 12 日周四	推理 1 [幻灯片]	建议阅读： Chain-of-Thought Prompting Elicits Reasoning in Large Language Models Self-Consistency Improves Chain of Thought Reasoning in Language Models DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning DAPO: An Open-Source LLM Reinforcement Learning System at Scale
第 7 周 2 月 17 日周二	推理 2 [幻灯片]	建议阅读： Let's Verify Step by Step Fast Inference from Transformers via Speculative Decoding Scaling LLM Test-Time Compute Optimally can be More Effective than Scaling Model Parameters RoFormer: Enhanced Transformer with Rotary Position Embedding	项目里程碑发布 [说明文档]	期末项目提案返还
2 月 19 日周四	嘉宾讲座：分词与多语言性（讲者：Julie Kallini） [幻灯片]	建议阅读： Jurafsky & Martin 第 2 章 Neural Machine Translation of Rare Words with Subword Units Unsupervised Cross-lingual Representation Learning at Scale Do All Languages Cost the Same? Tokenization in the Era of Commercial Language Models		作业 4 截止
第 8 周 2 月 24 日周二	嘉宾讲座：可解释性（讲者：Been Kim）	建议阅读： Because we have LLMs, we Can and Should Pursue Agentic Interpretability The Pareto Frontier of Human-Centered AI Bridging the human–AI knowledge gap through concept discovery and transfer in AlphaZero We Can't Understand AI Using our Existing Vocabulary Neologism Learning for Controllability and Self-Verbalization	期末项目报告说明发布 [说明]
2 月 26 日周四	NLP 的社会与广泛影响（风险） [幻灯片]			期末项目里程碑截止
2 月 27 日周五				课程退课截止时间
第 9 周 3 月 3 日周二	嘉宾讲座：多模态（讲者：Luke Zettlemoyer）	建议阅读： Visual Sketchpad: Sketching as a Visual Chain of Thought for Multimodal Language Models Chameleon: Mixed-Modal Early-Fusion Foundation Models Transfusion: Predict the Next Token and Diffuse Images with One Multi-Modal Model Mixture-of-Transformers: A Sparse and Scalable Architecture for Multi-Modal Foundation Models 可选阅读： Scaling Laws for Generative Mixed-Modal Language Models Scaling Autoregressive Multi-Modal Models: Pretraining and Instruction Tuning Retrieval Augmented Multimodal Language Modeling LMFusion: Adapting Pretrained Language Models for Multimodal Generation OneFlow: Concurrent Mixed-Modal and Interleaved Generation with Edit Flows Multimodal RewardBench: Holistic Evaluation of Reward Models for Vision Language Models Reconstruction Alignment Improves Unified Multimodal Models		期末项目里程碑返还
3 月 5 日周四	嘉宾讲座：Tinker and LoRA Without Regret（讲者：John Schulman）
第 10 周 3 月 10 日周二	2026 年 NLP 开放问题 [幻灯片]
3 月 12 日周四	无课程			期末项目截止
3 月 16 日周一	期末项目海报展示	时间 12:15pm-3:15pm 地点 AOERC 所有在校学生必须线下参加！		[打印指南]