「补充」20Python主要模块的使用

import numpy对数据进行操作,创建数组,生成随机数

·numpy.concatenate()数据集成

import pandas导入数据,为数据指定索引,引用数据框,数据离散化

import matplotlib.pylab数据可视化,作图(折线图,散点图,直方图)

import pymysql连接数据库

import jieba文本分析,加载词典,分词,标注词性

from collections import defaultdict创建字典

from collections import Counter统计词频

from gensim import corpora创建语料库

from gensim import models引用模型(如TF-IDF模型)

from gensim import similarities计算矩阵/向量相似度

from os import listdir创建指定列表,查看路径下所有文件

import random生成随机数

from sklearnimport feature_selection预处理

from sklearn.preprocessing import StandardScaler标准化

from sklearn.preprocessing importMinMaxScaler归一化

from sklearn.preprocessing importimputer缺失值插补

from sklearnimport decomposition降维

from sklearn import metrics模型效果评估指标

from sklearn.metrics import classification_report分类模型评价报告

from sklearn.metrics import mean_squared_error使用均方误差

from sklearn.feature_extraction.text import CountVectorizer文本向量化

from sklearn.model_selection import  train_test_split训练集和测试集分割

from sklearn.decomposition import PCA主成份分析

from sklearn.neighbors import KNeighborsClassifier创建KNN分类算法模型

from sklearn.neighbors import NearestNeighbors创建KNN回归算法模型

from sklearn.linear_model import LinearRegression线性回归

from sklearn.linear_model import LogisticRegression逻辑回归

from sklearn.naive_bayes import GaussianNB高斯朴素贝叶斯

from sklearn.naive_bayes import MultinomialNB多项式朴素贝叶斯

from sklearn.datasets import fetch_20newsgroups自带新闻数据集

from sklearn.tree import DecisionTreeClassifier分类树

from sklearn.tree import DecisionTreeRegressor回归树

from sklearn.tree import export_graphviz决策树生成dot文件

from sklearn import svm支持向量机

from sklearn.cluster import KMeans K-Means聚类分析

from sklearn.neural_network import MLPClassifier人工神经网络分类模型

from sklearn.neural_network import MLPRegressor人工神经网络回归模型

from keras.models import Sequential利用深度学习的序列模型构建人工神经网络模型

from keras.layers.core import Dense,Activation创建人工神经网络模型的层与激活函数

from lxml import etree把数据源转化为树的模型

import re正则表达式

from selenium import webdriver使用phantomjs+selenium

你可能感兴趣的:(「补充」20Python主要模块的使用)