NLP工作内容总结

词法分析(分词器实现,关键词提取,命名实体名的识别)
句法分析(MaxEnt 句法依存关系分析)
语义分析
知识图谱
虚拟助理(智能问答)
深度学习


用户意图识别算法:主要对大街网智能搜索算法进行改造和改进。完成了query plan 词典优化。建立ngram语言模型并改进搜索词典。完成行业实体名的识别算法
人民在线多文本距离计算,参与多文本距离计算算法的研究与实现
人民在线新闻内容抽取系统:采用自然语言处理的相关算法对新闻内容5W1H(who,where,when,what,why,how)抽取的设计与 实现。
人民在线垃圾信息识别系统:对来源于论坛,博客的垃圾内容进行识别,识别过程中用到了相关的文本分类算法
文章主题提取:目前设计实现关键词的提取的相关算法,并已加入特征选取算法
分词器项目:主要编写了一个java版本的分词器,目前不断完善过程中,希望加入隐马分词和条件随机场分词。
命名实体名识别:主要是人名,地名,机构名等命名实体的识别
唯品知识图谱构建:主要进行唯品知识图谱,语义搜索的相关工作
智能问答系统:
1,基于hmm的segmentation
2 基于dewplearning的segmwntation评测
3.唯品商品实体识别
4.依存句法分析

你可能感兴趣的:(NLP)