北京师范大学研究生培养方案
汉语文化学院 语言学及应用语言学 专业(代码: 050102 )
语言信息处理方向
(一级学科: )
本专业具有 硕士 学位授予权和 博士 学位授予权
一、培养目标与学习年限
1.硕士生
培养语言信息处理(特别是中文信息处理)方面的专业人才,为我国语言信息科技的可持续发展和保持竞争优势创造基础条件。
毕业生应达到以下要求:(1)德智体全面发展;(2)熟悉我国语言信息处理领域的历史、现状和发展方向;(3)具有扎实的语言学基础知识;(4)能熟练使用电脑,并熟悉语言信息处理所需的计算机基本技术;(5)能胜任语言信息处理方面的基础研发工作,并具有一定的独立研究能力;(6)至少精通一门外语,并能阅读外文专业文献。
硕士生实行弹性学制,学习年限为2-3年。按规定修满学分、成绩合格、答辩通过的硕士生可以在2年或2年半完成学业。
2.博士生
培养语言信息处理(特别是中文信息处理)方面的高级专业人才,使之能够成为跨接语言学和计算机科学的“两栖型”人才,以适应我国发展语言信息科技和保障信息安全的需要,为我国在信息科技领域保持竞争优势和赢得领先地位做出贡献。
毕业生应达到以下要求:(1)德智体全面发展;(2)深入了解我国语言信息处理领域的历史、现状和发展方向;(3)在语言学和计算机技术两个方面都具有扎实的基础知识;(4)在语言信息处理方面具有独立的研发能力,并能提出、论证和主持重大科研项目;(5)至少精通一门外语,能阅读外文专业文献,并能用外文撰写论文。
博士生学习年限一般为3年,其中北京地区的定向、委托培养在职博士生的学习年限可以为4年。硕博连读生、本科直博生学习年限为5年。
二、专业研究方向
序号 |
研究方向 |
主要研究内容 |
研究生导师 |
1 |
语言信息处理 |
中文信息处理的应用基础研究;语言信息处理的基本理论、方法和技术;国内外语言信息处理领域的历史、现状和发展方向;自然语言处理的基本问题;语言信息处理的工程规划和组织实施。 |
许嘉璐教授(博导) 朱小健教授 |
2 |
|
|
|
三、课程设置与学分要求
1.硕士生
总学分:36分。
课程类别 |
科目和门数 |
最低学分要求 |
公共课 |
政治2门、外语1门 |
8学分 |
学位基础课 |
3门(含一门方法类课程) |
9学分 |
学位专业课 (含专业英语) |
4门 |
11学分 |
必修环节 |
实践活动 |
1学分 |
开题报告 |
不计学分 |
|
选修课 |
专业选修或公共选修课 |
9学分 |
注明:公共选修课由研究生院培养处组织开设,除一外为小语种的研究生必修二外英语以外,其他研究生可以不修公共选修课,如选修,每人累计不超过3门。下同。
2.博士生
总学分:16学分。
课程类别 |
科目和门数 |
最低学分要求 |
公共课 |
政治1门、外语1门 |
7学分 |
学位基础课 |
1门 |
3学分 |
学位专业课 |
2门 |
6学分 |
3.本科直博生
总学分:45学分。
|
课程类别 |
科目和门数 |
最低学分要求 |
硕士课程 学习阶段 (36学分) |
公共课 |
政治2门、外语1门 |
8学分 |
学位基础课 |
3门(含一门方法类课程) |
9学分 |
|
学位专业课 (含专业英语) |
4门 |
11学分 |
|
必修环节 |
实践活动 |
1学分 |
|
开题报告 |
不计学分 |
||
选修课 |
专业选修或公共选修课 |
9学分 |
|
博士课程 学习阶段 (9学分) |
学位基础课 |
1门 |
3学分 |
学位专业课 |
2门 |
6学分 |
4.港澳台研究生总学分要求与普通研究生相同,免修公共政治课。
5.外国留学研究生免修公共政治和外语课,必修“中国概况”(2学分),硕士生总学分不低于32学分,博士生不低于11学分。
四、培养方式与考核方式
1.硕士生培养与中期考核的基本要求
培养方式采取导师负责制,培养过程包括学位课程、必修环节和学位论文写作。
学位课程采用课堂讲授、课堂讨论和阅读文献相结合的教学方式,注重提高学生独立从事科研工作和进行创造性研究工作的能力。导师应指导学生选择合适的学位基础课和学位专业课。
学位课程和必修环节都必须进行成绩考核,经考核合格后方能取得规定的学分。成绩考核分为考试和考查两种方式。凡学位课程,一律采用考试方式,成绩一律按百分制来评定,60分以下为不合格。学位课程的考试,除撰写课程论文外,一般应有一定量的闭卷考试,全面考核学生对课程内容的掌握程度。必修环节采用考查方式,成绩一律按是否合格来评定。
硕士生课程学习安排在前三学期完成,中期考核应在第三学期末完成,考核的结果将作为硕博连读候选人选拔的重要依据。中期考核合格者方能进入撰写论文阶段。
2.博士生培养与中期考核的基本要求
培养方式采取导师负责制,并建立以导师为首的博士生指导小组,实行集体培养。学位课程一般采用教师课堂讲授、师生课堂讨论和学生自学相结合的教学方式,注重提高学生从事科研工作和进行创造性研究工作的能力。
博士生课程学习安排在第一学年完成,中期考核应在第三学期末完成。中期考核合格者方能进入撰写论文阶段。
五、学位论文与论文答辩
1. 硕士生学位论文
在确定论文选题之前,必须查阅本专业基本的文献资料,进行充分的调查研究,了解国内外的研究历史和现状。选题要注意先进性和可行性。
论文选题须经过填写个人培养计划和开题报告的阶段,个人培养计划和开题报告均须经导师审核通过。
硕士学位论文必须由研究生本人独立完成,用于直接撰写论文的时间不得少于一个学年。论文要在理论或方法上提出新见解,做到观点鲜明,言之有据,结构严谨,行文流畅。硕士学位论文的正文应不少于2万字,一般不超过4万字。
硕士学位论文类型可以多样化,强调“理论联系实际”,既可以是基础研究,也可以是应用研究、开发研究等。
2.博士生学位论文
在确定论文选题之前,必须查阅本专业基本的文献资料,进行充分的调查研究,了解国内外的研究历史和现状,特别是学术前沿的最新状况。选题要有先进性、开拓性和可行性。完成选题的基本资料和参考文献应该是国内所具备的。
论文选题须经过填写个人培养计划书和开题报告的阶段,个人培养计划书在第一学期内提交,内容包括各培养阶段的主要内容、基本设想、进行方式、完成期限和阅读书目等。开题报告在第三学期内完成,内容包括论文题目、进行方式、完成期限、文献综述、论文主要内容、撰写的时间安排、资料准备等。个人培养计划书和开题报告均须经导师和指导小组的其他专家审核通过。
博士学位论文必须由研究生本人独立完成,用于直接撰写论文的时间不得少于三个学期。论文要在重大学术问题上有创新性,做到观点鲜明,言之有据,结构严谨,行文流畅。论文要包括中外文摘要、正文、参考文献三个部分,正文应不少于8万字,一般不超过10万字。论文的部分章节应达到在国内权威刊物上发表的水平,整篇论文经修改后应达到公开出版的水平。
博士学位论文应反映出博士生具有独立从事本学科专业创造性研究工作和实际应用工作的能力。博士生在校期间原则上必须发表与学科专业相关的高水平科研成果。
六、课程一览表与主要参考书目
1.硕士生课程
课程类别 |
课程中文名称 |
课程英文名称 |
任课 教师 |
学 分 |
学时 |
上课 学期 |
学位基础课 |
中文信息处理概论 |
An Introduction to Chinese Information Processing |
苗传江 刘智颖 |
3 |
54 |
1 |
自然语言处理基础 (Visual FoxPro) |
Foundations of Natural Language Processing |
苗传江 |
3 |
54 |
1 |
|
自然语言理解导论 |
An Introduction to Natural Language Understanding |
苗传江 |
3 |
54 |
2 |
|
学位专业课 |
HNC理论与语言研究和处理 |
HNC Theory: Applied in Language Studies and Processing |
苗传江 刘智颖 |
3 |
54 |
1 |
面向对象程序设计与自然语言处理(C# .NET) |
Object-Oriented Programming and Natural Language Processing (C# .NET) |
苗传江 |
3 |
54 |
2 |
|
自然语言处理专题 |
Seminar on Natural Language Processing |
许嘉璐 朱小健 |
3 |
54 |
3 |
|
专业英语 |
Professional English for Natural Language Processing |
苗传江 |
2 |
36 |
2 |
|
专业选修课 |
万维网技术入门 |
A Guide to World Wide Web |
苗传江 |
3 |
54 |
3 |
概率论与数理统计 |
Probability Theory and Mathematical Statistics |
李颖 |
3 |
54 |
3 |
|
计算语言学经典文献导读 |
References Reading Guide on Computational Linguistics |
苗传江 |
3 |
54 |
3 |
注:除上述课程外,本院和其他院系所相关专业的课程均可作为硕士生选修课,但学生必须与导师商定选修的课程。
2.博士生课程
课程类别 |
课程中文名称 |
课程英文名称 |
任课 教师 |
学 分 |
学时 |
上课 学期 |
学位基础课 |
自然语言处理专题 |
Seminar on Natural Language Processing |
许嘉璐 朱小健 |
3 |
54 |
1 |
学位专业课 |
HNC理论与语言研究和处理 |
HNC Theory: Applied in Language Studies and Processing |
苗传江 刘智颖 |
3 |
54 |
1 |
面向对象程序设计与自然语言处理(C# .NET) |
Object-Oriented Programming and Natural Language Processing (C# .NET) |
苗传江 |
3 |
54 |
2 |
课程内容简介
中文信息处理概论(An Introduction to Chinese Information Processing) 54学时 3学分 讲述中文信息处理的概况,主要包括三个方面的内容:(1)中文信息处理的历史、现状和发展方向;(2)中文信息处理的基本理论、方法和技术;(3)中文信息处理各应用领域的发展状况。
自然语言处理基础(Foundations of Natural Language Processing)54学时 3学分 以数据库管理系统Visual FoxPro及其编程语言为工具,学习和掌握用计算机对自然语言进行处理的基础知识和技能。
自然语言理解导论(An Introduction to Natural Language Understanding) 54学时 3学分 讲解自然语言理解领域基本的概念和问题,一般的理论和方法,综述其现状,让学生对这个领域有系统而具体的认识,并获得进行相关研究的基础知识。
HNC理论与语言研究和处理(HNC Theory: Applied in Language Studies and Processing) 54学时 3学分 阐述HNC理论这一关于自然语言理解处理的理论体系,促进学生的语言本体研究,并能利用本课程知识进行HNC词语知识库、HNC语料库的建设。
面向对象程序设计与自然语言处理(C# .NET)(Object-Oriented Programming in C# .NET and Natural Language Processing ) 54学时 3学分 以Microsoft C# .NET为编程语言和开发平台,介绍面向对象程序设计的基本思想和方法,让学生能够在自然语言处理的研发中运用这些基本的前沿技术。
自然语言处理专题(Seminar on Natural Language Processing) 54学时 3学分 对自然语言处理领域的某些重要专题(如词义消歧、句子语义分析、信息抽取、智能检索等)进行既有广度又有深度的调研和讨论,引导学生思考核心问题、了解最新进展、探讨发展趋势。
专业英语(Professional English for Natural Language Processing) 36学时 2学分 培养阅读英文专业文献的能力,养成查阅第一手英文文献的习惯,练习用英文撰写专业论文。
万维网技术入门(A Guide to World Wide Web) 54学时 3学分 理解万维网(World Wide Web)的基本概念,掌握其基本技术,如HTML、XML、CSS、XSL、XSD等。
概率论与数理统计(Probability Theory and Mathematical Statistics) 54学时 3学分 通过教授概率论与数理统计的基本理论和方法,使学生了解这门学科在自然语言处理中的作用和地位,熟悉概率统计的基本原理和方法,掌握用于自然语言处理的常用算法理论(如Bayes公式、Hidden Marko Model等),为统计自然语言处理奠定扎实的基础。
计算语言学经典文献导读(References Reading Guide on Computational Linguistics) 54学时 3学分 让学生对计算语言学的经典文献有全面的了解,引导他们阅读最重要的文献,为专业学习和研究打下良好的基础。 |
3.专业书目
(按著作或期刊名称的音序排列)
序号 |
著作或期刊名称 |
作者或出版者 |
适用对象及要求 |
1 |
An Introduction to Corpus Linguistics |
Graeme Kennedy |
硕士必读 |
2 |
Aspects of the Theory of Syntax |
Chomsky |
硕士选读 |
3 |
Comprehension: A Paradigm for Cognition |
Kintsch |
博士选读 |
4 |
Computational Linguistics |
The Association for Computational Linguistics |
硕士选读 博士必读 |
5 |
Conceptual Information Processing |
Schank |
博士选读 |
6 |
Corpus Linguistics |
Douglas Biber, etc. |
硕士选读 |
7 |
Dynamic Memory |
Schank |
博士选读 |
8 |
Form and Style: Research Papers, Reports and Theses (Tenth edition), (如何写研究论文与学术报告) |
Carole Slade |
硕士、博士必读 |
9 |
Foundations of Statistical Natural Language Processing (统计自然语言处理基础) |
Christopher D. Manning, Hinrich Schütze (苑春法等译) |
硕士选读 博士必读 |
10 |
HNC(概念层次网络)理论导论 |
苗传江 |
硕士必读 |
11 |
HNC(概念层次网络)理论——计算机理解语言研究的新思路 |
黄曾阳 |
硕士、博士必读 |
12 |
Knowledge of Language: Its Nature, Origins and Use |
Chomsky |
硕士、博士选读 |
13 |
Lectures on Government and Binding |
Chomsky |
博士选读 |
14 |
Linguistic Semantics: An Introduction |
John Lyons |
硕士、博士必读 |
15 |
Natural Language Understanding (自然语言理解) |
James Allen (刘群等译) |
硕士、博士必读 |
16 |
Pragmatics: An Introduction |
Jacob L. Mey |
硕士、博士选读 |
17 |
Scripts, Plans, Goals, and Understanding |
Schank and Abelson |
博士选读 |
18 |
Semantics |
John I. Saeed |
硕士、博士选读 |
19 |
Semantics |
John Lyons |
硕士、博士选读 |
20 |
Speech and Language Processing: An Introduction to Natural Language Processing, Computational Linguistics, and Speech Recognition (自然语言处理综论) |
Daniel Jurafsky, James H. Martin (冯志伟、孙乐译) |
硕士、博士必读 |
21 |
Statistics in Language Studies (语言研究中的统计方法) |
Anthony Woods, etc. (陈小荷、徐娟译) |
硕士必读 |
22 |
The Case for Case (格辨) |
Fillmore (胡明扬译) |
硕士、博士必读 |
23 |
The Logical Structure of Linguistics Theory |
Chomsky |
博士选读 |
24 |
词汇语义和计算语言学 |
林杏光 |
硕士必读 |
25 |
汉语计算语义学——关系、关系语义场和形式分析 |
吴蔚天 |
博士选读 |
26 |
汉语认知研究 |
彭聃龄 |
硕士、博士选读 |
27 |
汉语语法的意合网络 |
鲁川 |
硕士选读 |
28 |
汉语语法分析问题 |
吕叔湘 |
硕士选读 |
29 |
计算语言学导论 |
翁富良、王野翊 |
硕士选读 |
30 |
计算语言学概论 |
俞士汶 |
硕士选读 |
31 |
计算语言学基础 |
冯志伟 |
硕士必读 |
32 |
计算语言学视窗 |
靳光瑾 |
硕士选读 |
33 |
逻辑语义学 |
方立 |
硕士、博士选读 |
34 |
面向计算机的现代汉语词汇研究概论 |
许嘉璐 |
硕士、博士必读 |
35 |
普通语言学教程 |
索绪尔 |
硕士、博士必读 |
36 |
全国计算语言学联合学术会议论文集 |
中国中文信息学会 |
硕士、博士选读 |
37 |
人工智能及其应用 |
蔡自兴、徐光祐 |
博士选读 |
38 |
实验心理语言学纲要——语言的感知、理解和产生 |
桂诗春 |
硕士、博士选读 |
39 |
西方语言学名著选读 |
胡明扬 |
硕士选读 |
40 |
现代汉语八百词 |
吕叔湘 |
硕士选读 |
41 |
现代汉语动词语义计算理论 |
靳光瑾 |
博士选读 |
42 |
现代汉语自动分析——Visual C++实现 |
陈小荷 |
硕士必读 |
43 |
新编心理语言学 |
桂诗春 |
硕士、博士选读 |
44 |
形式语义学引论 |
蒋严、潘海华 |
硕士、博士选读 |
45 |
训诂学基础 |
陈绂 |
硕士、博士选读 |
46 |
应用语言学 |
桂诗春 |
硕士选读 |
47 |
应用语言学导论 |
S.皮特·科德 |
硕士选读 |
48 |
应用语言学概论 |
于根元 |
硕士选读 |
49 |
应用语言学纲要 |
齐沪扬、陈昌来 |
硕士选读 |
50 |
应用语言学综论 |
冯志伟 |
硕士选读 |
51 |
语法答问 |
朱德熙 |
硕士选读 |
52 |
语言概念空间的基本定理和数学物理表示式 |
黄曾阳 |
硕士、博士必读 |
53 |
语言文字学及其应用研究 |
许嘉璐 |
硕士选读 |
54 |
语言文字应用 |
教育部语言文字应用研究所 |
硕士、博士必读 |
55 |
语义学 |
徐烈炯 |
硕士、博士必读 |
56 |
语义学导论 |
伍谦光 |
硕士选读 |
57 |
语义学教程 |
李福印 |
硕士、博士必读 |
58 |
语用学概要 |
何兆熊 |
硕士、博士选读 |
59 |
中国现代应用语言学史纲 |
于根元 |
硕士、博士选读 |
60 |
中文文本自动分词和标注 |
刘开瑛 |
硕士选读 |
61 |
中文信息处理应用平台工程 |
陈力为、袁琦 |
硕士、博士选读 |
62 |
中文信息学报 |
中国中文信息学会 |
硕士、博士必读 |
63 |
自然语言处理 |
刘开瑛、郭炳炎 |
硕士选读 |
64 |
自然语言处理技术基础 |
王小捷、常宝宝 |
硕士选读 |
65 |
自然语言理解——一种让机器懂得人类语言的研究 |
姚天顺等 |
硕士、博士选读 |
66 |
自然语言逻辑研究 |
邹崇理 |
博士选读 |