E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
sk-learn
特征工程数据预处理--基于
SK-learn
的One-Hot编码
一,One-Hot编码概念:在数据处理和特征工程中,经常会遇到类型数据,如性别分为[男,女](暂不考虑其他。。。。),国家分为[中国,日本,美国]等,我们通常将其转为数值带入模型,如[0,1],[1,0,-1]等,但模型往往默认为连续型数值进行处理,这样其实是违背我们最初设计的,也会影响模型效果。独热编码便是解决这个问题,其方法是使用N位bit来对N个状态进行编码,每个状态都由他独立的bit位,并
Change_JW
·
2020-07-04 21:42
机器学习
GBDT和Xgboost模型对比总结
答:本题答案引自http://www.07net01.com/2016/12/1742073.html在
sk-learn
中,GradientBoostingClassifier为GBDT的分类类,GradientBoostingRegressor
panda_zjd
·
2020-07-02 14:20
算法
特征筛选利器:详解T-test(T检验)原理、参数分析、单\双尾检验选择
当笔者使用SPSS,或者调用很多
sk-learn
函数包时,常常会用并不是最难的,会选择包,会阅读结果,会得出统计学答案才是最难的。T-ValueT-value就是组间差异与组内差异的比值。
Haor.L
·
2020-06-29 17:18
经典机器学习模型
python机器学习基础教程笔记01
sk-learn
中NumPy数组是基本数据结构。
sk-learn
接受NumPy数据格式的
白白白安安
·
2020-06-29 15:06
机器学习
机器学习
sk-learn
鸢尾花分类模型训练
sk-learn
鸢尾花分类模型训练在python的sklearn库中,有一些小型数据集,我们可以直接拿来进行模型训练学习。
ran_梦
·
2020-06-29 14:47
sk-learn
Facebook数据集预测签到位置
sk-learn
预测facebook签到位置本次比赛的目的是预测一个人将要签到的地方。为了本次比赛,Facebook创建了一个虚拟世界,其中包括10公里*10公里共100平方公里的约10万个地方。
ran_梦
·
2020-06-29 14:47
常见机器学习算法笔记
机器学习开发的流程(
sk-learn
)加载数据集数据预处理选择模型(算法)训练模型评估模型如果模型达到要求,进入实战如果模型达不到要求,可以优化(调参数).扩展数据集,增加泛化能力,可以换模型—————
星尘逸风
·
2020-06-29 04:45
ML
机器学习——决策树算法的应用
对于买电脑的示例,在Python数据包
sk-learn
中利用决策树算法实现数据分类,并画出决策树的结构1、准备工作(1)安装Graphviz(数据可视化软件),并配置好环境变量,加入到path中,我的环境变量配置为
loveliuzz
·
2020-06-24 08:25
机器学习
计算机视觉---手写体识别,SVM分类
我没有选用
sk-learn
的手写体数据集的原因是他的数据集每张图片是8×8的,而我下载的mnist的digits是一张包含5000张手写体图片的1000×2000的图片,也就是每张手写体
sdnjyxr
·
2020-03-04 16:19
机器学习之numpy和matplotlib学习(一)
整个教程有参考网上其他一些大牛的看法,总体的教学应该是从numpy和matplotlib开始教学,然后最后进入
SK-learn
学习,整个课程的代码之后会推送到github上面去。
SundayCoder
·
2020-02-24 04:41
从DataFrame自动化特征抽取的尝试
前言虽然提供了很多Estimator/Transformer,正如这篇文章所显示的,如何基于SDL+TensorFlow/
SK-Learn
开发NLP程序,处理的代码依然是很多的,能不能进一步简化呢?
祝威廉
·
2019-10-31 19:01
开源sk-dist,超参数调优仅需3.4秒,
sk-learn
训练速度提升100倍
在一台没有并行化的单机上进行超参数调优,需要7.2分钟,而在一百多个核心的Spark群集上用它进行超参数调优,只需要3.4秒,把训练
sk-learn
的速度提升了100倍。
AI科技大本营
·
2019-09-08 21:28
开源sk-dist,超参数调优仅需3.4秒,
sk-learn
训练速度提升100倍
在一台没有并行化的单机上进行超参数调优,需要7.2分钟,而在一百多个核心的Spark群集上用它进行超参数调优,只需要3.4秒,把训练
sk-learn
的速度提升了100倍。
AI科技大本营
·
2019-09-08 21:28
sk-learn
实现L2岭回归,对线性回归正则化
岭回归算法:fromsklearn.datasetsimportload_bostonfromsklearn.externalsimportjoblibfromsklearn.linear_modelimportRidge,RidgeCVfromsklearn.metricsimportmean_squared_errorfromsklearn.model_selectionimporttrain
高颜值的杀生丸
·
2019-08-21 20:00
SK-learn
实现k近邻算法【准确率随k值的变化】-------莺尾花种类预测
原文链接:http://www.cnblogs.com/LiuXinyu12378/p/11376588.html代码详解:fromsklearn.datasetsimportload_irisfromsklearn.model_selectionimporttrain_test_splitfromsklearn.preprocessingimportStandardScalerfromsklea
agrj56057
·
2019-08-19 13:00
【Python机器学习实战】一个案例迅速入门所有的Scikit-learn回归模型
简介本文旨在通过经典的波士顿放假预测问题来实战运行一下
sk-learn
中所有常见的回归算法,因此不涉及过多的算法讲解。
张大千09
·
2019-01-11 18:58
机器学习
sklearn
机器学习
GBDT与XGBOOST、RF
答:本题答案引自http://www.07net01.com/2016/12/1742073.html在
sk-learn
中,GradientBoostingClassifier为GBDT的分类类,GradientBoostingRegressor
北冥有小鱼
·
2018-08-19 17:11
机器学习
机器学习概述、线性回归和逻辑回归--机器学习--思维导图、小抄、笔记(26)
一、思维导图二、
sk-learn
小抄图片来源:http://scikit-learn.org/stable/tutorial/machine_learning_map/三、算法笔记1.留出法将数据集D划分为两个互斥的集合
HGaviN
·
2018-06-25 11:29
机器学习
机器学习及应用
70个NumPy分级练习:用Python一举搞定机器学习矩阵运算
Numpy还是深度学习工具Keras、
sk-learn
的基础组件之一。此处的70个numpy练习,可以作为你学习numpy基础之后的应用参考。练习难度分为4层:从1到4依次增大
AI科技大本营
·
2018-03-01 17:42
AI
人工智能
Titanic生还率预测
主要使用Python语言里的pandas、
sk-learn
、matplotlib包进行相关数据分析。主要分析思路分为四个部分:导入数据、数据可视化、数据整理、调用算法预测。
donruo
·
2017-11-26 18:25
python
SK-Learn
学习目录
屁话不多了,此次学习笔记旨在巩固理论,付诸代码,知道典型的模型及算法,另外也训练下自己的表达能力。资料链接scikit-learn1.supervisedlearning2.unsupervisedlearning3.modelselectionandevaluation4.datasetstransformations5.datasetsloadingutilities6.strategiest
叨逼叨小马甲
·
2017-08-06 04:38
分别使用
sk-learn
和mllib进行文本情感分类
总体思路文本预处理提取特征特征选择选择分类算法训练和评估预处理包括分句、分词和词干化,使用nltk可以实现。实现分两个版本:1.scikit-learn版本2.MLLIB版本主要是因为运行效率的问题,基于spark的mllib采用分布式的训练算法,速度快很多。特征提取tf-idf是基本的文本分类特征提取方法,它是词袋模型的一个信息量衡量方式,也是常用的基准方法。本文就是用tf-idf来构建文本特征
TonLP
·
2016-12-14 09:23
nlp
SK-Learn
使用NMF(非负矩阵分解)和LDA(隐含狄利克雷分布)进行话题抽取
英文链接:http://scikit-learn.org/stable/auto_examples/applications/topics_extraction_with_nmf_lda.html这是一个使用NMF和LDA对一个语料集进行话题抽取的例子。输入分别是是tf-idf矩阵(NMF)和tf矩阵(LDA)。输出是一系列的话题,每个话题由一系列的词组成。默认的参数(n_samples/n_fe
ZH奶酪
·
2016-03-08 14:00
Scikit-learn的安装过程
Scikit-learn的安装过程首先,安装
SK-Learn
需要依赖的Python安装包有:Python(>=2.6),NumPy(>=1.3),SciPy(>=0.7),setuptools,PythondevelopmentheadersandaworkingC
zstarstone
·
2016-01-09 16:04
Python
PR
and
DM
Scikit-learn的安装过程
Scikit-learn的安装过程首先,安装
SK-Learn
需要依赖的Python安装包有:Python(>=2.6),NumPy(>=1.3),SciPy(>=0.7),setuptools,PythondevelopmentheadersandaworkingC
ShiZhixin
·
2016-01-09 16:00
上一页
1
2
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他