NLP Lab · 研究生知识向导

自然语言处理研究生知识库

一份面向 NLP 方向研究生的中文学习路线图。从基础理论到前沿 LLM、从代码实现到论文写作, 按推荐顺序循序渐进,也可按主题自由跳转。所有材料均为中文教材或精读笔记。

5 大学习模块 40+ 章节教材 中文 · 研究生级别

导览推荐学习路线

五个阶段循序推进。第一年打牢基础(阶段 1–2),第二年深入研究方向(阶段 3–5)。

Stage 1

语言模型基础

Jurafsky & Martin 经典教材,从分词、N-gram 到 Transformer 与 RAG。

Stage 2

深度学习 NLP

斯坦福 CS224N 系列讲义,词向量、预训练、PEFT、Agent、推理。

Stage 3

从零搭建 LLM

Raschka《Build a LLM from Scratch》中译,亲手实现 GPT。

Stage 4

前沿研究专题

选定细分方向(Agent Memory、TKGQA 等)做深度文献调研。

Stage 5

科研论文写作

掌握学术写作方法与投稿流程,把研究成果转化为论文。

01基础理论 · Jurafsky & Martin《NLP 导论》

Speech and Language Processing(第三版)中文翻译稿。NLP 领域最权威的入门教材之一,建议作为起点系统精读。

NLP 导论中文版

10 章 · 中文

从词与词元、N-gram、神经网络到 Transformer、后训练与 RAG,覆盖现代 NLP 的核心概念栈。

英文原著 PDF

参考 · 英文

需查阅原文、对照术语或精读细节时使用。建议研究生阶段以英文为最终引用来源。

02深度学习 NLP · 斯坦福 CS224N

Stanford 2026 Winter 课程讲义改写版。每讲均扩写为研究生教材级中文文档,配合原英文课程网页学习效果最佳。

课程原网页

参考 · 英文

斯坦福官方课程页面,含完整 slides、作业(a1-a5)、Final Project 指南与 office hours 信息。

03从零搭建大语言模型 · Raschka

《Build a Large Language Model (from Scratch)》中文翻译稿。强烈推荐每章都跟着代码亲手实现一遍, 只有写过 GPT 才真正理解 LLM。

动手实现 GPT

7 章 · 中文

从数据处理、注意力机制开始,逐步搭建 GPT 模型,并完成预训练、分类微调与指令微调。

英文原著 PDF

参考 · 英文

配合中文章节对照阅读,并随附 Raschka 的官方代码仓库实现完整 demo。

04前沿研究专题 · 深度综述

面向具体子方向的中文深度调研笔记。研究生在确定研究方向后,建议参照这些笔记的写作结构来产出自己的综述。

Agent Memory

综述

Agent 记忆机制进阶教程:从认知科学基础出发,梳理到 2025 年的工程最佳实践。

TKGQA

综述

时序知识图谱问答研究生科研入门深度教程,涵盖问题定义、基线方法与最新进展。

05科研方法 · 学术论文写作

研究问题的提出、文献综述结构、实验设计、论文组织与投稿流程。建议在动笔写第一篇 paper 前完整通读。

学术论文写作方法和技巧

中文综合教程 PDF,覆盖选题、结构、语言风格与投稿全流程。

配套 ARS 工作流

本知识库已加载 /ars-full/ars-plan/ars-outline 等学术写作命令,可在 Claude Code 中直接调用。

评审与修订

使用 /ars-revision-coach 解析审稿意见,生成 Revision Roadmap 与 Response Letter 骨架。