E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
python数据挖掘
python基础系列教程——数据结构(列表、元组、字典、集合、链表)
全栈工程师开发手册(作者:栾鹏)
python数据挖掘
系列教程基本顺序存储结构——列表与元组Python中的基本顺序存储结构是列表与元组,在操作的复杂度上和数组完全相同,其中列表是可变数据类型,元组是不可变数据类型
数据架构师
·
2020-07-16 02:14
python系列课程
快速学习实战应用
python数据挖掘
需要学的内容
在本篇文章中我们给大家整理了关于
python数据挖掘
需要学什么的知识点指南,有兴趣的朋友们跟着参考下。
jb_1352461
·
2020-07-16 00:53
数据挖掘——numpy基础
前言:
python数据挖掘
numpy的基础知识,参考网上资料和博客进行简单总结,主要是为了方便自己写代码的时候查看,发现有用的方法,随时补充,欢迎指正数据挖掘专栏数据挖掘——python基础数据挖掘——
39.5℃的风
·
2020-07-15 16:59
数据挖掘专栏
numpy
数据挖掘——pandas基础
前言:
python数据挖掘
pandas的基础知识,简单总结,主要是为了方便自己写的时候查看,发现有用的方法,随时补充,欢迎指正数据挖掘专栏数据挖掘——python基础数据挖掘——numpy基础数据挖掘—
39.5℃的风
·
2020-07-15 16:27
数据挖掘专栏
数据挖掘——python基础
前言:
python数据挖掘
的基础知识,参考网上很多文章和博客进行总结,主要是为了方便自己写代码的时候查看,发现有用的方法,随时补充数据挖掘专栏数据挖掘——python基础数据挖掘——numpy基础数据挖掘
39.5℃的风
·
2020-07-15 16:27
数据挖掘专栏
python数据挖掘
实战 -数据预处理篇(数据可视化-空值填充-哑变量编码)
数据预处理包含:数据盘点-数据可视化分析-空值填充-数据编码importmatplotlib.pyplotaspltimportseabornassnsfromsklearn.neighborsimportKNeighborsClassifierfromsklearn.linear_modelimportLogisticRegressionfromsklearn.treeimportDecisio
AI深度学习算法实战代码解读
·
2020-07-15 16:03
数据建模
BI
人工智能技术
数据挖掘——pandas+matplotlib+seaborn数据可视化
前言:
python数据挖掘
pandas+matplotlib+seaborn数据可视化(画图)的基础知识,简单总结,主要是为了方便自己写代码的时候查看,发现有用的方法,随时补充,欢迎指正数据挖掘专栏数据挖掘
39.5℃的风
·
2020-07-15 13:42
数据挖掘专栏
Python数据挖掘
02-MySQLdb的使用
MySQLdb是在Python中使用MySQL数据库的桥梁,有了这个桥梁,得以实现Python与MySQL的数据交换。由于Python与MySQL使用的编码可能不同,以及不同操作系统文字编码的区别,所以对于中文的处理需要特别注意。读取中文数据库#coding=utf-8importMySQLdbtry:conn=MySQLdb.connect(host='localhost',user='root
千山万水
·
2020-07-15 09:51
python机器学习库sklearn——数据预处理
全栈工程师开发手册(作者:栾鹏)
python数据挖掘
系列教程主要操作内容标准化,也称去均值和方差按比例缩放将特征缩放至特定范围内缩放稀疏(矩阵)数据缩放有离群值的数据核矩阵的中心化非线性转换归一化二值化特征二值化标称特征编码缺失值插补生成多项式特征直接上代码
数据架构师
·
2020-07-14 14:26
机器学习系列课程
快速学习实战应用
python系列课程
快速学习实战应用
python机器学习库sklearn——K最近邻、K最近邻分类、K最近邻回归
全栈工程师开发手册(作者:栾鹏)
python数据挖掘
系列教程KNN即K最近邻,相关的知识内容可以参考http://blog.csdn.net/luanpeng825485697/article/details
数据架构师
·
2020-07-14 14:26
机器学习系列课程
快速学习实战应用
python系列课程
快速学习实战应用
Python数据挖掘
—电力窃漏电用户自动识别
实验有两个部分:1.利用拉格朗日差值法进行缺失值的补充2.构建分类模型对窃电用户进行识别(一)用户的用电数据存在缺失值,数据见“test/data/missing_data.xls”,利用拉格朗日插值法补全数据。(二)对所有窃电用户及正常的用电的电量,警告及线损数据和该用户在当天是否窃电漏电的标识,按窃电漏电评价标准进行处理样本数据,得到专家样本,数据见“test/data/model.xls”,
可行的code
·
2020-07-14 11:46
python
Python数据挖掘
与机器学习,快速掌握聚类算法和关联分析
云栖君导读:前文数据挖掘与机器学习技术入门实战与大家分享了分类算法,在本文中将为大家介绍聚类算法和关联分析问题。分类算法与聚类到底有何区别?聚类方法应在怎样的场景下使用?如何使用关联分析算法解决个性化推荐问题?本文就为大家揭晓答案。本次直播视频精彩回顾:http://click.aliyun.com/m/45918/演讲嘉宾简介:韦玮,企业家,资深IT领域专家/讲师/作家,畅销书《精通Python
云栖社区v
·
2020-07-14 10:29
Python数据挖掘
与机器学习_通信信用风险评估实战(2)——数据预处理
系列目录:
Python数据挖掘
与机器学习_通信信用风险评估实战(1)——读数据数据说明通过对读取数据的实践,下面是数据集文件对应读取后的DataFrame说明。
padluo
·
2020-07-12 09:04
python机器学习库sklearn——线性回归
全栈工程师开发手册(作者:栾鹏)
python数据挖掘
系列教程线性回归的相关的知识内容可以参考http://blog.csdn.net/luanpeng825485697/article/details/
数据架构师
·
2020-07-11 12:42
机器学习系列课程
快速学习实战应用
python系列课程
快速学习实战应用
python机器学习案例系列教程——K最近邻算法(KNN)、kd树
全栈工程师开发手册(作者:栾鹏)
python数据挖掘
系列教程K最近邻简介K最近邻属于一种估值或分类算法,他的解释很容易。
数据架构师
·
2020-07-11 12:42
机器学习系列课程
快速学习实战应用
python系列课程
快速学习实战应用
python数据挖掘
和分析(二)
这一章我们讲如何将数据导入到Python中以便我们进行处理。数据导入的方式有很多,经常用的就是从数据库直连得到数据,从csv文件读取数据,从Excel文件读数据,从HTML中读数据,从TXT中读数据。我们挨个讲解一下:从csv中导入数据,数据使用mysql5.7的sakila库里的actor表内数据:a=pda.read_csv("C:/Users/yuexiao.liu/Desktop/2.cs
liuyuexiaofirstBK
·
2020-07-11 11:31
数据分析
python
机器学习之模型建立及评估
常见的模型评价和在Python中的实现
python数据挖掘
建模中,第一个步骤是建立一个对象,这个对象是空白的,需要进一步训练的;然后,设置模型的参数;接着,通过fit()方法对模型进行训练;最后,通过predict
今晨er
·
2020-07-11 08:42
【
python数据挖掘
课程】二十.KNN最近邻分类算法分析详解及平衡秤TXT数据集读取
这是《
Python数据挖掘
课程》系列文章,也是我这学期上课的部分内容及书籍的一个案例。本文主要讲述KNN最近邻分类算法、简单实现分析平衡秤数据集,希望这篇文章对大家有所帮助,同时提供些思路。
Eastmount
·
2020-07-10 21:08
Python数据挖掘课程
机器学习
知识图谱
web数据挖掘及NLP
Python数据挖掘
——烟火图像分类:传统机器学习建模方法与卷积神经网络性能比较
文章目录背景介绍导入相关库数据探索数据预处理暗通道去雾算法数据建模预先定义模型评估方法使用传统机器学习模型:支持向量机、随机森林、神经网络、集成学习Adaboost进行训练使用CNN进行建模训练模型性能评估,以及不同模型性能比较数据集+源码背景介绍假设开发一款基于户外监控摄像头的山火/非法焚烧秸秆的预防系统。希望能够在最短的时间内基于监控画面确定是否有烟火发生,然后人工快速介入,确定是否是山火/非
Demonslzh
·
2020-07-10 21:04
数据挖掘
Python数据挖掘
之逻辑回归算法
逻辑回归算法逻辑回归算法:虽然名字中带有回归两个字,但它却不是回归算法,它是一个经典的二分类算法。目录逻辑回归算法Logistic函数Logistic回归建模步骤Logistic函数Logistic回归模型中的因变量只有1和0(发生于不发生)两种。假设在p个独立自变量x1,x2…xp作用下,y取1的概率是p=P(y=1|X)取0的概率是1-p,取1和取0的概率之比为p1−p\frac{p}{1-p
高羊羊羊羊羊杨
·
2020-07-10 10:13
Python
6月书讯:Di li li li di li li li...
互联网与人工智能》、《iOS开发指南:从HelloWorld到AppStore上架(第4版)》、《ReactNative开发指南》、《图解密码技术(第3版)》、《R语言入门与实践》【含社区电子版】、《
Python
turingbooks
·
2020-07-10 03:57
图灵书讯
Python实现初阶决策树
《
Python数据挖掘
入门与实践》这本书中关于决策树部分的讲解,代码部分相对简要,但坑爹的是,他给的数据下载网站,人家改版了,根本找不到数据,进行测试,于是我又用“鸢尾花”数据测试了一下决策树算法。
一行数师
·
2020-07-10 00:20
python数据挖掘
入门与实践---作者归属问题
问题:通过对文本中的信息分析,找到文章对应的作者用到的算法模型:SVM,支持向量机。SVM可以简单看着一种二类分类器(画一条线,使两边类别的点到线的距离最大化),扩展后可以是多类分类器,但实际也是A类和非A类的二类分类,只是进行多次,将ABCD....类分别分出来。解决问题两种思路:1、功能词。功能词(如the,which,that...)是指本身含义很少,但却是组成句子必不可少的成分。一般认为功
ypgsh
·
2020-07-09 04:57
Python数据挖掘
基础(三):Pandas基础
目录1.介绍1.1为什么使用Pandas?1.2DataFrame(对比二维数组)1.2.1DataFrame的属性1.2.2DatatFrame索引的设置1.3MultiIndex(对比三维数组)1.4Series结构(对比一维数组)1.4.1创建series2.基本数据操作2.1索引操作2.1.1直接使用行列索引(先列后行)2.1.2结合loc或者iloc使用索引2.1.3组合索引2.2赋值操
Amo Xiang
·
2020-07-09 02:14
Python
python数据挖掘
实战笔记——文本挖掘(10):自动摘要
概念:摘要:全面准确地反映某一文献中心内容的简单连贯的短文。自动摘要:利用计算机自动地从原始文件中提取摘要。算法原理:余弦相似定理算法步骤:获取需要摘要的文章对该文章进行词频统计对该文章进行分句,一般采用“,"、"."、?"进行分句。计算分句与文章之间的余弦相似度。取相似度最高的分句,作为文章的摘要。下面是具体代码实现:首先导入包:#导入需要的包importreimportosimportjieb
小柴~
·
2020-07-08 20:17
python
python数据挖掘
实战笔记——文本挖掘(9):相似文章推荐
概念:相似文本推荐:在用户阅读某篇文章的时候,为用户推荐更多与在读文章内容类似的文章。**推荐:**指介绍好的人或事物,希望被任用或接受。数据挖掘领域,推荐包括相似推荐及协同过滤推荐。**相似推荐:**指当用户表现出对某人或某物的兴趣时,为他推荐与之类似的人,或者物。核心定理:物以类聚,人以群分。**协同过滤推荐:**是指利用已有用户群过去的行为或意见,预测当前用户最有可能喜欢哪些东西或对哪些东西
小柴~
·
2020-07-08 20:47
python
python数据挖掘
笔记——相关分析
相关性分析:对两个或多个具备相关性的元素变量进行分析,从而衡量两个变量之间的密切相关程度,相关性的元素之间要存在一定的联系或概率才可以进行相关性分析。相关性分析的几个方法:图示初判(散点图,基本呈一条直线分布)Pearson相关系数(皮尔逊相关系数)Sperman秩相关系数(斯皮尔曼相关系数)相关系数:相关系数是变量间关联程度的最基本的测度之一。基本特征:方向:正相关,两个变量变化方向相同。负相关
小柴~
·
2020-07-08 20:47
python
python数据挖掘
-文本挖掘(词频统计)
一,使用pycharm创建项目 我创建的项目下只有两个文件,一个停分词文件,一个脚本代码文件 停分词文件(stopwords.txt):作用:在用jieba分词库对文件进行分词处理时,有些无用却频繁出现的分词,像“的”、“得”、“地”、“是”等,我们并不希望这些分词也被进行词频统计,因为统计这些分词没有什么意义,所以事先建立一个停分词文件,等会代码中利用这些停分词进行数据清洗 注意
augus_q
·
2020-07-08 19:32
python
11.用深度学习方法为图像中的物体进行分类
CreatedonSunOct1409:09:582018@author:asus"""#11用深度学习方法为图像中的物体进行分类importosbatch1_filename=os.path.join("E:\\books\
Python
北有鸣鹿
·
2020-07-08 00:08
python数据挖掘入门与实践
python数据挖掘
商品推荐算法
利用亲和性分析进行商品推荐importnumpyasnpdataset_filename=("affinity_dataset.txt")X=np.loadtxt(dataset_filename)print(X[:5])#面包、牛奶、奶酪、苹果和香蕉#计算数据集中有多少个人买了苹果num_apple_purchases=0forsampleinX:ifsample[3]==1:num_apple
fnc1012382501
·
2020-07-07 12:29
python数据挖掘
Python数据挖掘
学习笔记(6)频繁模式挖掘算法----Apriori
一、相关原理Apriori算法是一种最有影响的挖掘布尔关联规则频繁项集的算法。其核心是基于两阶段频集思想的递推算法。该关联规则在分类上属于单维、单层、布尔关联规则。在这里,所有支持度大于最小支持度的项集称为频繁项集,简称频集。该算法的基本思想是:首先找出所有的频集,这些项集出现的频繁性至少和预定义的最小支持度一样。然后由频集产生强关联规则,这些规则必须满足最小支持度和最小可信度。然后使用第1步找到
Zhengyh@Smart3S
·
2020-07-07 00:34
Python
Python数据挖掘
学习笔记(7)频繁模式挖掘算法----FP-growth
一、相关原理FP-Growth算法是韩嘉炜等人在2000年提出的关联分析算法,它采取如下分治策略:将提供频繁项集的数据库压缩到一棵频繁模式树(FP-tree),但仍保留项集关联信息。在算法中使用了一种称为频繁模式树(FrequentPatternTree)的数据结构。FP-tree是一种特殊的前缀树,由频繁项头表和项前缀树构成。FP-Growth算法基于以上的结构加快整个挖掘过程。FP-growt
Zhengyh@Smart3S
·
2020-07-07 00:34
Python
Python数据挖掘
学习笔记(5)决策树分类算法----以ID3为例
一、相关原理决策树(DecisionTree)是在已知各种情况发生概率的基础上,通过构成决策树来求取净现值的期望值大于等于零的概率,评价项目风险,判断其可行性的决策分析方法,是直观运用概率分析的一种图解法。由于这种决策分支画成图形很像一棵树的枝干,故称决策树。在机器学习中,决策树是一个预测模型,他代表的是对象属性与对象值之间的一种映射关系。Entropy=系统的凌乱程度,使用算法ID3、C4.5和
Zhengyh@Smart3S
·
2020-07-07 00:34
Python
python数据挖掘
实战笔记——文本挖掘(8):用sklearn包进行关键字提取
概念:sklearn:全名Scikit-Learn,是基于python的机器学习模块,网址:http://scikit-learn.org/stable/index.html,里面对一些常用的机器学习方法进行了封装,在进行机器学习任务时,并不需要每个人都实现所有的算法,只需要简单的调用sklearn里的模块就可以实现大多数机器学习任务。机器学习任务通常包括分类(Classification)和回归
小柴~
·
2020-07-06 19:22
python
python数据挖掘
数据分析pandas的介绍及简单例子
pandas是python下最有力的数据挖掘和数据分析的工具之一,支持类似于SQL的数据库的增、删、查、改,并且带有丰富的数据处理函数,支持时间序列的分析功能,支持灵活处理缺失数据。pandas基本的数据结构是Series和DataFrame,series就是序列,类似于一维数组,dataframe相当于一张二维的表格,类似于二维数组,它的每一列都相当于一个series,为了定位series中的元
妙手书生2016
·
2020-07-06 19:46
python
9.作者归属问题
CreatedonSunOct709:00:322018@author:asus"""#9作者归属问题#9.1.3获取数据importosimportsysdata_folder=os.path.join("E:\\books\
Python
北有鸣鹿
·
2020-07-06 17:19
python数据挖掘入门与实践
Python数据挖掘
学习笔记(2)文本相似度分析
关于使用Python进行文本相似度分析,网上的相关博客已经非常多了,因此本文仅进行简单的讲解,直接上代码,方便不想过多理解概念即要实现文本相似度分析的网友使用。一、相关理论:语料库的定义:https://baike.baidu.com/item/语料库/11029908?fr=aladdin稀疏向量的定义:https://baike.baidu.com/item/稀疏向量TF-IDF算法:可参考h
Zhengyh@Smart3S
·
2020-07-06 15:51
Python
Python数据挖掘
:聚类
Python数据挖掘
:聚类数据挖掘第三周作业#波士顿房价数据集聚类#1.k均值聚类,按照类别涂色;#2.层次聚类,绘制聚类结果的基础上,绘制出层次树。
weixin_44382897
·
2020-07-06 05:33
Python
[
Python数据挖掘
] sklearn-SVM分类(SVC)
[问题分析]在[
Python数据挖掘
]sklearn-KMeans聚类一文中,实现了对以下数据集的聚类:YZN,133,108,76ZHY,96,145,101WYZ,132
swordtraveller
·
2020-07-05 13:08
Python
Python
数据挖掘
入门
kaggle竞赛系列3----
python数据挖掘
时间序列时间量分析(以elo竞赛为例)
今天要分析的一个kernel是一个关于elo的loyalty关于时间序列的关系的研究的kernel。关于竞赛介绍及基础知识见:我的上一篇内核分析:https://blog.csdn.net/ssswill/article/details/85217702这篇kernel来自:ACloserLookatDateVariables写在前面:个人认为这篇kernel与比赛关系不大,之所以分析它是因为里面
ssswill
·
2020-07-05 13:48
kaggle
python数据挖掘
预测Boston房价
第5章LinearR/PLR/SVR/KNN/DTR/RFR(测算房价)
python数据挖掘
预测Boston房价以上为两个博客,本文都是从中整理而来第一个数据集,包名如下:housing.csv0.0063218.002.31000.53806.575065.204.09001296.015.30396.904.9824.000.027310.007.07000.46906.421078.904
chen_zan_yu_
·
2020-07-04 13:54
Python数据挖掘
—回归—一元非线性回归
1、使用scatter_matrix判断个特征的数据分布及其关系散步矩阵(scatter_matrix)Pandas中散步矩阵的函数原理1defscatter_matrix(frame,alpha=0.5,figsize=None,ax=None,diagonal='hist',marker='.',density_kwds=None,hist_kwds=None,range_padding=0.
anrao9657
·
2020-07-01 17:53
带你入门
Python数据挖掘
与机器学习(附代码、实例)
本文结合代码实例待你上手
python数据挖掘
和机器学习技术。
有文化_0a9b
·
2020-07-01 14:50
以豆瓣网为例,模拟登陆爬虫以及验证码处理
最近在学天善智能课堂韦玮老师的课程,
python数据挖掘
与分析实战,通过自己部分的代码和借鉴老师的项目,多次试验改进调试成功豆瓣的模拟登录,顺便处理了怎么自动化的处理验证码。
zqzq19950725
·
2020-06-30 19:54
python 数据挖掘 之 对数据进行简单预处理(1)
python数据挖掘
之对数据进行简单预处理在我们对数据集进行数据挖掘之前,需要先对数据集进行简单的处理,让数据集变得更规范更具有代表性。对数据集进行的预处理又许多种,接下来我就简单说几种常用的。
longling0
·
2020-06-30 18:32
python
数据挖掘
python基本操作
python
数据分析
Python数据挖掘
实战——KNN算法(K最近邻节点算法,k-NearestNeighbor)
一、分类分类是用来预测类别数据的一种方法,可以用来预测未来一段时间内用户是否会流失,预测用户是否会响应你的促销活动,能够评估用户的信用度是好还是差的一系列分类预测问题。二、概念2.1监督学习(SupervisedLearning)从给定标注的训练数据集中学习出一个函数,根据这个函数为新数据进行标注。(有因变量y)回归分类、分类、时间序列等。2.2无监督学习(UnsupervisedLearning
zhuoyue65
·
2020-06-30 17:00
数据挖掘
Python数据挖掘
实战——贝叶斯分类算法
一、概念1.1贝叶斯定理(BayesTheorem)eg.判断一个人品质的好坏是根据一个人过往的行为进行判断的,但是对于陌生人一开始初始化为50%好人、50%坏人,如果之后他做了一件好事,这个事会增加我们判断他为好人的根据。如果发现他做了一件坏事,会增加他是坏人的概率。1.2朴素贝叶斯分类(NaiveBayesClassifier)贝叶斯分类算法,是统计学的一种分类方法,它是利用贝叶斯定理的概率统
zhuoyue65
·
2020-06-30 17:00
数据挖掘
Python数据挖掘
实战——回归
一、回归分析(RegressionAnalysis)研究自变量与因变量之间关系形式的分析方法,它主要是通过建立因变量y与影响它的自变量Xi(i=1,2,3....)之间的回归模型,来预测因变量y的发展趋势。二、回归分析的分类2.1线性回归分析:简单线性回归、多重线性回归2.2非线性回归分析:逻辑回归、神经网络三、简单线性回归模型y=a+bx+e(一元一次方程)1)y——因变量2)x——自变量3)a
zhuoyue65
·
2020-06-30 17:59
数据挖掘
Python数据挖掘
实战——相关分析
继续补以前拉下的债~~~一、相关性指标的研究意义1.1相关系数(Correlationcoefficient):相关系数是变量间关联程度的最基本测度之一1.2相关分析(Correlationanalysis)是研究现象之间是否存在某种依存关系,并对具体有依存关系的现象探讨其相关方向以及相关程度,是研究随机变量之间的相关关系的一种统计方法。二、相关系数的基本特征2.1方向:正相关(positivec
zhuoyue65
·
2020-06-30 17:59
数据挖掘
Python数据挖掘
——概况
一、碎碎念之前一直因为懒,没有把学了的给整理下来,现在慢慢补起来。二、数据挖掘概述1.什么是数据挖掘?数据挖掘(datamining,简称DM),是指从大量的数据中,通过统计学、人工智能、机器学习等方法,挖掘出未知的、且有价值的信息和知识的过程。eg:啤酒与尿布、杜蕾斯与口红、杜蕾斯与红酒。==>达到增加商品销售的目的。数据挖掘误区:【实际】:1.数据挖掘是人们处理商业问题的某些方法,我们通过它来
zhuoyue65
·
2020-06-30 17:59
数据挖掘
上一页
2
3
4
5
6
7
8
9
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他