山东大学数据科学实验----NLP说明



这个实验主要分为三部分:
(1)xml解析
(2)自然语言解析
(3)情感分析

第一部分:
首先按照老师给的模板上一步一步的做基础的操作,了解各个方法的实现什么功能,然后按照学习到的知识,对数据进行批量处理。主要是遍历树的各个节点,然后对各个节点的某些信息进行提取与处理
第一部分完成后,会生成一系列text文本文件,在该资源中,附带了这些文件,在text文件夹中;
第二部分:
用斯坦福解析器,对得到的文本文件中的自然语言进行解析。主要是画树,标准树、依赖树啥的。主要步骤就按照代码模板上的就行。然后,学会方法之后,就进行批量操作,生成一系列xml文件。文件也附在了资源里。代码也在
Windows系统要在Linux系统上进行
第三部分:
对第二部分的到的xml进行情感分析。反正我是找的名词和修饰名次的形容词,也可以有不同的理解。实验代码也在资源包中。

注:该博客主要是配合下载频道的资源包使用的。具体实现代码请转战下载频道,包含全部实验资料。

你可能感兴趣的:(数据科学,山东大学,数据科学,自然语言处理)