2022-03-24

自然语言处理实验演示 - 17. RegexpStemmer 词干提取

词干提取 (Stemming) 是英文语料预处理的其中一个必要步骤,英语单词在句子中使用时会转化成各种形式。除了 Porter、Snowball、Lancaster 以外,NLTK 还提供 RegexpStemmer 工具,使用正则表达式检查是否存在形态或结构前缀或后缀。本实验将对文本使用 RegexpStemmer,通过删除一些通用后缀 (如:ing 和 ed),将单词转换为基本形式。

#知识# #校园学习# #NLP# #自然语言处理# #Stem# #词形还原# #NLTK#

#人工智能专业建设# #词干提取# #实验视频##正则表达式# #Python#

个人用户获取相关代码及数据集,请访问企业网站 (www.080910t.com),扫描【知识微店(个人用户)】二维码关注或订阅。注:全部实验演示视频、代码、数据集仅授权予个人用户学习与实验使用,禁止用于二次销售、课堂教学及培训用途。

视频原创制作:广州跨象乘云软件技术有限公司

企业网站:https://www.080910t.com

你可能感兴趣的:(2022-03-24)