E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
sklearn数据预处理
机器学习训练营机器学习算法(一): 基于逻辑回归的分类预测学习笔记
学习知识点概要二、学习内容三、学习问题与解答四、学习思考与总结本学习笔记为阿里云天池龙珠计划机器学习训练营的学习内容,学习链接为:添加链接描述一、学习知识点概要1、了解逻辑回归的理论;2、掌握逻辑回归的
sklearn
yan冰
·
2023-11-24 19:03
机器学习
arima
数据预处理
_时间序列分析|ARIMA模型分步骤解析及R中实践
你是否想要做时间序列分析,但却不知道代码怎么写?你是否不清楚时间序列分析各种模型该在什么情况下使用?本文将针对以上两个问题,带你入门时间序列分析~等等!不止’入门‘读完这篇,你立即就能在R中写出不同模型的相应代码~先介绍以下我自己吧~我目前是WarnerBros.做DataScientist,记得刚入职时,老板就跟我说未来我的主要任务是用各种类型的时间序列模型做预测:预测好莱坞游览车未来三年每天的
weixin_39751076
·
2023-11-24 19:05
arima
数据预处理
机器学习---SVM一些简单的例子(XOR逻辑分类、最大间隔超平面、一维回归、SVM分类、权重、类别不平衡、核函数、单变量特征选择、参数C、非线性核、不同类型的SVM、正则化参数、RBF核参数组合)
importnumpyasnpimportmatplotlib.pyplotaspltfrom
sklearn
importsvmxx,yy=np.meshgrid(np.linspace(-3,3,500
三月七꧁ ꧂
·
2023-11-24 18:02
机器学习
机器学习
支持向量机
分类
大数据分析步骤及分析方法详解
3
数据预处理
对数据进行必要的预处理,常用的
数据预处理
方法包括:数据集成、数据清洗、数
tonglingtou1875
·
2023-11-24 16:53
大数据
数据挖掘
大数据
可视化
机器学习
机器学习第13天:模型性能评估指标
折交叉验证留一交叉验证混淆矩阵精度与召回率介绍精度召回率区别使用代码偏差与方差介绍区别交叉验证保留交叉验证介绍将数据集划分为两部分,训练集与测试集,这也是简单任务中常用的方法,其实没有很好地体现交叉验证的思想使用代码#导入库from
sklearn
.model_selectionimporttr
Nowl
·
2023-11-24 16:06
机器学习
机器学习
人工智能
机器学习实战第1天:鸢尾花分类任务
☁️主页Nowl专栏《机器学习实战》《机器学习》君子坐而论道,少年起而行之文章目录一、任务描述二、数据集描述三、主要代码主要代码库的说明与导入方法
数据预处理
模型训练模型预测与性能评估除
数据预处理
外的完整代码四
Nowl
·
2023-11-24 16:36
机器学习实战
机器学习
分类
人工智能
机器学习实战第2天:幸存者预测任务
☁️主页Nowl专栏《机器学习实战》《机器学习》君子坐而论道,少年起而行之文章目录一.任务描述二.数据集描述三.主要代码(1)主要代码库的说明与导入方法(2)
数据预处理
(3)模型训练(4)模型预测与性能评估
Nowl
·
2023-11-24 16:36
机器学习实战
机器学习
人工智能
机器学习之决策树
Outline1.算法思想2.概念解释3.
Sklearn
CodePart1算法思想一堆数据,依次根据不同的item依次进行展开分支,如下图所示。
Ob_la_di
·
2023-11-24 10:44
Spark数据倾斜解决办法
数据倾斜Spark数据倾斜解决办法前言一、解决办法1.
数据预处理
2.过滤导致数据倾斜的key3.提高shu
不会打球的摄影师不是好程序员
·
2023-11-24 09:50
Spark
spark
python手写数字识别论文_Python数据分析及可视化实例之手写体数字识别
Talkischeap,showUthecode.该源码注释比较全面,需要对
SKlearn
有一定的了解,当然,你也可以把它视作黑箱,做个调包侠也是大侠。
weixin_39644021
·
2023-11-24 08:37
python手写数字识别论文
手写数字可视化_Python数据分析与可视化
数据在
sklearn
中,包含近2000份8x8的手写数字缩略图。
阿松爱睡觉
·
2023-11-24 08:03
Python数据分析可视化
python
数据分析
开发语言
数据可视化
深度学习
文档相似度之词条相似度word2vec、及基于词袋模型计算
sklearn
实现和gensim
文档相似度之词条相似度word2vec、及基于词袋模型计算
sklearn
实现和gensim示例代码:importjiebaimportpandasaspdfromgensim.models.word2vecimportWord2Vecfromgensimimportcorpora
IT之一小佬
·
2023-11-24 06:35
文本挖掘/NLP
自然语言处理
nlp
python
深度学习
机器学习
sklearn
中的TfidfTransformer和gensim中的TfidfModel的区别
sklearn
.feature_extraction.text.TfidfTransformer和gensim.models.TfidfModel都是用于计算文本数据的TF-IDF值的工具。
lantx_SYSU
·
2023-11-24 06:20
NLP
sklearn
人工智能
python
ModuleNotFoundError: No module named ‘
sklearn
.externals.six‘解决
解决办法模块
sklearn
.externals.six在scikit-learn0.23及以后的版本中被删除。要使用它,您必须降级到0.22版。
阿迪不想上班
·
2023-11-24 06:59
经验分享
经验分享
机器学习——1.
Sklearn
:特征工程
目录scikit-learn数据集API介绍
sklearn
小数据集
sklearn
大数据集
sklearn
数据集的使用数据集的划分特征工程特征抽取/特征提取特征提取API字典特征提取文本特征提取中文文本特征值抽取停用词中文文本特征值抽取分词处理文本特征抽取
买奶茶的小孩
·
2023-11-24 05:52
机器学习
sklearn
机器学习
python
sklearn
中的神经网络
目录概述softmax概述在机器学习中,我们建模,将特征矩阵输入模型中,然后算法为我们输出预测结果。只不过在人脑中,数以亿计的神经细胞相互链接来构建一个生物神经网络(一个神经细胞当然可以和众多个神经细胞相连),我们的机器学习中,往往只有一个模型或者一种算法在运行。人脑通过构建复杂的网络可以进行逻辑,语言,情感的学习,相信模拟这种结构的机器也可以有很强大的学习能力,于是人工神经网络应运而生。神经网络
kongqing23
·
2023-11-24 05:51
sklearn
神经网络
机器学习
sklearn
专题四:降维算法
目录1概述1.1从什么叫“维度”说开来2PCA与SVD2.2重要参数n_components2.2.1迷你案例:高维数据的可视化2.2.2最大似然估计自选超参数2.2.3按信息量占比选超参数2.3PCA中的SVD2.3.1PCA中的SVD哪里来?2.3.2重要参数svd_solver与random_state2.3.3重要属性components_2.4重要接口inverse_transform2
Colorfully_lu
·
2023-11-24 05:50
sklearn
算法
机器学习
关于
sklearn
的:还可能是网络的问题???
前提:安装
sklearn
需要numpy、scipy等库(这个自行搜索)昨天安装numpy、scipy很快,一会就好了,然后安装
sklearn
一直报错,还以为是版本问题。
zr_xs
·
2023-11-24 05:19
sklearn
python
聚类笔记/
sklearn
笔记:Affinity Propagation亲和力传播
1算法原理1.1基本思想将全部数据点都当作潜在的聚类中心(称之为exemplar)然后数据点两两之间连线构成一个网络(相似度矩阵)再通过网络中各条边的消息(responsibility和availability)传递计算出各样本的聚类中心。1.2主要概念Examplar聚类中心similarityS(i,j)相似度一般使用负的欧式距离,所以S(i,j)越大,表示两个点距离越近,相似度也就越高Pre
UQI-LIUWJ
·
2023-11-24 02:08
python库整理
机器学习
聚类
笔记
sklearn
机器学习/
sklearn
笔记:K-means,kmeans++,MiniBatchKMeans
1K-means介绍1.0方法介绍KMeans算法通过尝试将样本分成n个方差相等的组来聚类,该算法要求指定群集的数量。它适用于大量样本,并已在许多不同领域的广泛应用领域中使用。KMeans算法将一组样本分成不相交的簇,每个簇由簇中样本的平均值描述。这些平均值通常称为簇的“质心”;注意,质心通常不是样本点,尽管它们存在于相同的空间中。KMeans算法旨在选择最小化惯性或称为群内平方和标准的质心:1.
UQI-LIUWJ
·
2023-11-24 02:37
机器学习
python库整理
机器学习
sklearn
笔记
机器学习/
sklearn
笔记:MeanShift
1算法介绍一种基于质心的算法通过更新候选质心使其成为给定区域内点的均值候选质心的位置是通过一种称为“爬山”技术迭代调整的,该技术找到估计的概率密度的局部最大值1.1基本形式给定d维空间的n个数据点集X,那么对于空间中的任意点x的均值漂移向量基本形式可以表示为:其中Sk表示数据集的点到x的距离小于球半径h的数据点漂移过程就类似于”梯度下降“通过计算漂移向量,然后把球圆心x的位置更新一下求解一个向量,
UQI-LIUWJ
·
2023-11-24 02:32
python库整理
机器学习
机器学习
sklearn
笔记
天猫用户重复购买预测(速通二)
逻辑回归分类模型2、K近邻分类模型3、高斯贝叶斯分类模型4、决策树分类模型5、集成学习分类模型模型验证模型验证指标特征优化特征选择技巧1、搜索算法2、特征选择方法模型训练分类相关模型1、逻辑回归分类模型from
sklearn
.linear_modelimportLinearRegressionfrom
sklearn
.linear_modelimpo
盖盖的博客
·
2023-11-24 01:46
读书笔记
预测
天池大赛
阿里云
特征优化
天猫用户重复购买预测
天猫用户重复购买预测之建模优化
特征优化目的:优化数据,接近模型上限from
sklearn
.imputeimportSimpleImputerfrom
sklearn
.metricsimportroc_auc_scoreasAUCfrom
sklearn
.model_selectionimportcross_val_scorefrom
sklearn
.ensembleimportRandomForestClassifier
张先生-您好
·
2023-11-24 01:42
机器学习竞赛
机器学习
python
未来就业城市选择问题(python 数据分析,数据可视化)(文档+代码+数据+PPT+注释)
未来就业城市选择问题分析项目文档目录目录21数据来源32理论基础33算法流程33.1中国城市资本流动探索33.1.1
数据预处理
33.1.2查看全国城市控股型投资关系43.1.32013-2016年全国跨城市资本流动情况
_yuan20
·
2023-11-23 23:38
数据分析
数据分析
机器学习
python
数据可视化
数据科学导论——
数据预处理
第1关:引言-根深之树不怯风折,泉深之水不会涸竭第2关:数据清理-查漏补缺importnumpyasnpimportpandasaspdimportmatplotlib.pyplotaspltdefstudent():train=pd.read_csv('Task1/diabetes_null.csv',na_values=['#NAME?'])train['Insulin']=train['In
小施没烦恼
·
2023-11-23 20:19
Educoder人工智能
机器学习
人工智能
【nlp】2.7 seq2seq英译法实战项目解析
seq2seq英译法实战项目1seq2seq介绍1.1seq2seq模型架构2数据集介绍3案例步骤3.1导入工具包和工具函数3.2
数据预处理
3.2.1清洗文本和构建文本字典3.2.2构建数据源对象3.2.3
lys_828
·
2023-11-23 19:45
NLP自然语言处理
自然语言处理
gru
翻译
“Python+”集成技术高光谱遥感数据处理与机器学习深度
结合Python编程工具,专注于解决高光谱数据读取、
数据预处理
、高光谱数据机器学习等技术难题,通过复现高光谱数据处理和分析过程,并解析代码,使学员掌握python高光谱数据处理技巧。
Mr.靳靳477302280
·
2023-11-23 18:44
python
机器学习
PyTorch 之 Dataset 类入门学习
类可以进行自定义数据集的格式、大小和其它属性,供后续使用;可以看到官方封装好的数据集也是直接或间接的继承自Dataset类自定义数据集逻辑继承Dataset类;重写init():构造函数,可自定义数据读取方法以及进行
数据预处理
野生绿箭侠
·
2023-11-23 18:59
Python
PyTorch
pytorch
学习
人工智能
竞赛选题 题目:垃圾邮件(短信)分类 算法实现 机器学习 深度学习 开题
文章目录1前言2垃圾短信/邮件分类算法原理2.1常用的分类器-贝叶斯分类器3数据集介绍4
数据预处理
5特征提取6训练分类器7综合测试结果8其他模型方法9最后1前言优质竞赛项目系列,今天要分享的是基于机器学习的垃圾邮件分类该项目较为新颖
laafeer
·
2023-11-23 18:46
分类
python
Sklearn
实践——利用Scikit-learn进行机器学习模型构建和评估
Scikit-learn(简称
Sklearn
)是Python中最受欢迎和广泛应用的机器学习库之一。它提供了丰富的工具和函数,用于各种机器学习任务,如分类、回归、聚类和模型评估等。
非著名程序员阿强
·
2023-11-23 17:55
机器学习
sklearn
scikit-learn
TensorFlow实战教程(二十五)-基于BiLSTM-CRF的医学命名实体识别研究(下)模型构建
这篇文章写得很冗余,但是我相信你如果真的看完,并且按照我的代码和逻辑进行分析,对您以后的
数据预处理
和命名实体识别都有帮助,只有真正对这些复杂的文本进行NLP处理后,您才能适应更多的真实环境,坚持!
张志翔的博客
·
2023-11-23 15:38
TensorFlow实战教程
tensorflow
人工智能
python
hw1_pytorch实现linear regression
/train.csv',encoding='big5')importtorchfromtorch.utilsimportdatafromtorchimportnn#
数据预处理
-1:训练模型部分#x,y是配套
堂小白
·
2023-11-23 11:02
深度学习
python
机器学习笔记
数据集获取
sklearn
.datasets.load_*()获取小规模数据集fetch_*(data_home=None)获取大规模数据集,data_home表示目录,可不指定实例1:获取鸢尾花数据集
sklearn
.datasets.load_iris
提子同学是我
·
2023-11-23 08:17
数据分析
数据分析
scikit-learn
2023年数维杯国际赛B题赛题解题思路+部分代码
数据类题目,第一步都是
数据预处理
。无论到底有没有异常值、缺失值都要进行处理。及时没有异常值、缺失值也要说,进行了相应的处理,未发现异常值。(可以参考20
热心网友俣先生
·
2023-11-23 08:12
算法
使用PySpark 结合Apache SystemDS 进行信号处理分析 (离散傅立叶变换)的简单例子
环境搭建与数据准备
数据预处理
模型训练与结果评估参考文献简介:什么是SystemDS?
shiter
·
2023-11-23 07:49
大数据机器学习实践探索
信号处理
Python数据清洗 和 预处理入门完整指南!
本文是一个初学者指南,将带你领略如何在任意的数据集上,针对任意一个机器学习模型,完成
数据预处理
工作。
Sim1480
·
2023-11-23 01:49
基于LDA主题分析的《老友记》情景喜剧数据集的建模分析
如果文章对你有帮助的话,欢迎评论点赞收藏加关注+目录1.项目背景2.数据集介绍3.技术工具4.实验过程4.1导入数据4.2
数据预处理
4.3词云图可视化4.4为LDA模型训练准备数据4.5确定主题个数K4.6LDA
艾派森
·
2023-11-23 01:32
文本分析
数据分析
数据分析
数据挖掘
python
人工智能
基于情感分析+聚类分析+LDA主题分析对服装产品类的消费者评论分析
如果文章对你有帮助的话,欢迎评论点赞收藏加关注+目录1.项目背景2.数据集介绍3.技术工具4.实验过程4.1加载数据4.2
数据预处理
4.3数据可视化4.4情感分析4.5相关性分析4.6特征重要性分析4.7
艾派森
·
2023-11-23 01:31
数据分析
数据可视化
信息可视化
数据分析
数据挖掘
python
人工智能
基于Bagging集成学习方法的情绪分类预测模型研究(文末送书)
如果文章对你有帮助的话,欢迎评论点赞收藏加关注+目录1.项目背景2.数据集介绍3.技术工具4.实验过程4.1导入数据4.2
数据预处理
4.3分词处理4.4词云可视化4.5构建语料库4.6词向量化4.7构建模型
艾派森
·
2023-11-23 01:58
机器学习
数据挖掘
python
集成学习
机器学习
分类
数据挖掘
机器学习之数据清洗和预处理
目录Box_CoxBox_CoxBox-Cox变换是一种用于
数据预处理
和清洗的方法,旨在使数据更符合统计模型的假设,特别是对于线性回归模型。这种变换通过调整数据的尺度和形状,使其更加正态分布。
赵孝正
·
2023-11-23 00:09
#
7.数据清洗与准备
机器学习算法
机器学习
人工智能
sklearn
模型中预测值的R2_score为负数
目录正文评论区参考链接正文
Sklearn
.metrics下面的r2_score函数用于计算R²(确定系数:coefficientofdetermination)。
赵孝正
·
2023-11-23 00:00
机器学习算法
sklearn
人工智能
python
TensorFlow实战教程(二十四)-基于BiLSTM-CRF的医学命名实体识别研究(上)
数据预处理
这篇文章写得很冗余,但是我相信你如果真的看完,并且按照我的代码和逻辑进行分析,对您以后的
数据预处理
和命名实体识别都有帮助,只有真正对这些复杂的文本进行NLP处理后,您才能适应更多的真实环境,坚持!
张志翔的博客
·
2023-11-23 00:25
TensorFlow实战教程
tensorflow
人工智能
python
sklearn
相关性分析_Python数据分析:小红书销售额预测
一、分析背景根据小红书的部分用户数据以及消费行为数据,使用Python建立线性回归模型,找到对用户消费影响较大的因素,预测用户的消费金额变化。根据模型,确定销售额较高用户的相关特征,并由此提出营销方案建议。二、数据分析的流程数据分析的整体流程如图所示:(一)数据概况分析1、调用基本包和读取数据importpandasaspdimportseabornassnsimportmatplotlib.py
weixin_39525313
·
2023-11-22 22:54
sklearn
相关性分析
TensorFlow实战教程(二十八)-Keras实现BiLSTM微博情感分类和LDA主题挖掘分析
这篇文章将结合文本挖掘介绍微博情感分类知识,包括
数据预处理
、机器学习和深度学习的情感分类,后续结合LDA进行主题挖掘。基础性文章,希望对您有所帮助!
张志翔的博客
·
2023-11-22 22:21
TensorFlow实战教程
tensorflow
keras
分类
Python获取照片主色调
代码备份importsysfromoptparseimportOptionParserimportPILfromPILimportImage#importcv2#importnumpyasnp#from
sklearn
.clusterimportKMeans
哈希Map
·
2023-11-22 19:50
其他分享
python
聚类
机器学习
5.
sklearn
数据集
sklearn
数据集数据集划分分为训练数据:用于训练,构建模型测试数据:在模型检验时使用,用于评估模型是否有效
sklearn
数据集划分api
sklearn
.model_selection.train_test_split
sklearn
butters001
·
2023-11-22 18:36
深度学习动物识别 - 卷积神经网络 机器视觉 图像识别 计算机竞赛
文章目录0前言1背景2算法原理2.1动物识别方法概况2.2常用的网络模型2.2.1B-CNN2.2.2SSD3SSD动物目标检测流程4实现效果5部分相关代码5.1
数据预处理
5.2构建卷积神经网络5.3tensorflow
Mr.D学长
·
2023-11-22 13:51
python
java
【python笔记】客户运营 - cohort分析
二、
数据预处理
2.1读取数据importpandasaspddf=pd.read_csv('your_path/Year2010-2011.csv',encoding='ISO-8859-1')df.head
htuhxf
·
2023-11-22 13:51
数据分析应用
Python
笔记
python
笔记
cohort
客户留存
用户运营
数据分析:
数据预处理
流程及方法
数据预处理
是数据分析过程中至关重要的一步,它涉及到清洗、转换和整理原始数据,以便更好地适应分析模型或算法。
rubyw
·
2023-11-22 11:36
#
概念和理论
数据分析
2023年亚太杯数学建模思路 - 案例:异常检测
type=blog一、简介–关于异常检测异常检测(outlierdetection)在以下场景:
数据预处理
病毒木马检测工业制造产品检测网络流量检测等等,有着重要的作
建模君A
·
2023-11-22 11:48
算法
上一页
22
23
24
25
26
27
28
29
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他