import numpy对数据进行操作,创建数组,生成随机数
·numpy.concatenate()数据集成
import pandas导入数据,为数据指定索引,引用数据框,数据离散化
import matplotlib.pylab数据可视化,作图(折线图,散点图,直方图)
import pymysql连接数据库
import jieba文本分析,加载词典,分词,标注词性
from collections import defaultdict创建字典
from collections import Counter统计词频
from gensim import corpora创建语料库
from gensim import models引用模型(如TF-IDF模型)
from gensim import similarities计算矩阵/向量相似度
from os import listdir创建指定列表,查看路径下所有文件
import random生成随机数
from sklearnimport feature_selection预处理
from sklearn.preprocessing import StandardScaler标准化
from sklearn.preprocessing importMinMaxScaler归一化
from sklearn.preprocessing importimputer缺失值插补
from sklearnimport decomposition降维
from sklearn import metrics模型效果评估指标
from sklearn.metrics import classification_report分类模型评价报告
from sklearn.metrics import mean_squared_error使用均方误差
from sklearn.feature_extraction.text import CountVectorizer文本向量化
from sklearn.model_selection import train_test_split训练集和测试集分割
from sklearn.decomposition import PCA主成份分析
from sklearn.neighbors import KNeighborsClassifier创建KNN分类算法模型
from sklearn.neighbors import NearestNeighbors创建KNN回归算法模型
from sklearn.linear_model import LinearRegression线性回归
from sklearn.linear_model import LogisticRegression逻辑回归
from sklearn.naive_bayes import GaussianNB高斯朴素贝叶斯
from sklearn.naive_bayes import MultinomialNB多项式朴素贝叶斯
from sklearn.datasets import fetch_20newsgroups自带新闻数据集
from sklearn.tree import DecisionTreeClassifier分类树
from sklearn.tree import DecisionTreeRegressor回归树
from sklearn.tree import export_graphviz决策树生成dot文件
from sklearn import svm支持向量机
from sklearn.cluster import KMeans K-Means聚类分析
from sklearn.neural_network import MLPClassifier人工神经网络分类模型
from sklearn.neural_network import MLPRegressor人工神经网络回归模型
from keras.models import Sequential利用深度学习的序列模型构建人工神经网络模型
from keras.layers.core import Dense,Activation创建人工神经网络模型的层与激活函数
from lxml import etree把数据源转化为树的模型
import re正则表达式
from selenium import webdriver使用phantomjs+selenium