新手探索NLP(一)

目录

基础知识模块

1. 概念

2. 正则化表达

Data Cleaning模块

3. 去掉标点

4. 切分词功能

5. 去掉停止词

6. Stemming & Lemmatizing

stemming

lemmatizing

两者的异同

Vectorizing模块 

7. Count Vectorization

 8. N-gram Vectorization

9. Inverse Document Frequency Weighting 

Feature Engineering模块

10. Creating New Features

11. Transformation

你可能感兴趣的:(Neural,Network,NLP,机器学习,Machine,Learning,自然语言处理)