word2vec聚类

  1. 评论抓取、去重、去标点符号、词性标注+分词、去停用词 (linux上,txt存为默认,不用存utf-8;win上txt存utf-8)
  2. 安装linux
    使用VMware安装CentOS7详请
    https://blog.csdn.net/hui_2016/article/details/68927487

  3. 安装vmware tool 工具
    VMWare里CentOS7与win10共享文件
    https://blog.csdn.net/ichenwin/article/details/78635256

    VMware安装VMware tool是 遇到The path “” is not a valid path to the 3.10.0-693.el7.x86_64 kernel headers.
    https://www.cnblogs.com/netsa/p/8257589.html

  4. 将word2vec放入共享文件夹中

  5. make一下
  6. 聚类
    https://blog.csdn.net/accumulate_zhang/article/details/52662144
    https://blog.csdn.net/zhaoxinfan/article/details/11069485

linux指令:
1. 超级权限 su -
2. 查看当前目录 ls
3. 查看当前路径 pdw | ~可以代替
4. Tab可以补命令、文件,不可以补参数
5. 历史命令搜索 Ctrl +R
6. sudo 使用管理员权限执行
7. touch创建文件

你可能感兴趣的:(python,文本分析)