E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
【数据分析与挖掘】
数据分析与挖掘
之数据预处理
目录数据集成简单变换数据规范化—标准化1、离差标准化(归一化)2、Z-score标准化(0-1标准化)3、小数定标规范化数据规范化—离散化1、等宽离散化2、等频率离散化3、优化离散数据集成#数据集成importnumpya=numpy.array([[1,5,6],[9,4,3]])b=numpy.array([[6,36,7],[2,3,39]])c=numpy.concatenate((a,b
小脑斧123
·
2020-08-11 02:55
数据分析
数据挖掘
python
数据挖掘 之 数据预处理(《Python
数据分析与挖掘
实战》)
文章目录一、数据清洗1.缺失值处理2.异常值处理二、数据集成1.实体识别2.冗余属性识别三、数据变换1.简单函数变换2.规范化(归一化)3.连续属性离散化4.属性构造5.小波变换四、数据规约1.属性规约2.数值规约五、Python主要数据预处理函数在数据挖掘中,原始数据存在大量不完整、有异常的数据,严重影响建模的执行效率,甚至会导致结果偏差,因此非常有必要进行数据清洗,数据清洗完成后接着或同时进行
条件反射104
·
2020-08-11 02:29
data
mining
Python3
数据分析与挖掘
建模实战 笔记
省略号的问题importnumpyasnpimportpandasaspdpd.set_option('display.max_columns',1000)pd.set_option('display.width',1000)pd.set_option('display.max_colwidth',1000)numpy.set_printoptions(threshold=numpy.nan)单因
比利时署球
·
2020-08-11 02:54
Python
数据分析与挖掘
建模实战-单因子探索分析与可视化
理论铺垫:集中趋势(数据聚拢的衡量)均值:连续值的中位数:异样值衡量集中趋势分位数:和其他几个值综合使用众数:离散值Q1=(n+1)*0.25Q2=(n+1)*0.5Q3=(n+1)*0.75离中趋势σ=1N∑i=1N(xi−μ)2\sigma=\sqrt{\frac{1}{N}\sum_{i=1}^{N}(x_{i}-\mu)^{2}}σ=N1∑i=1N(xi−μ)2σ\sigmaσ越小表示数据
志yu
·
2020-08-11 02:12
data
analysis
《Python
数据分析与挖掘
实战》张良均,第一章学习笔记
第一章从餐饮行业来引出数据挖掘【有问题或错误,请私信我将及时改正;借鉴文章标明出处,谢谢】刚开始讲到了T餐饮企业的管理系统(5个管理系统),因为多方面管理系统加强了此企业的信息化管理,提高了工作效率,但是积累的这些大量的历史数据中提取有用的数据需要大量的精力,人力,更重要的是时间上的浪费,在企业的竞争中优胜劣汰,物竞天择,导致最终企业倒闭。那能不能让电脑来解决数据,挖掘有用的数据最后自动分析,从而
fy_1852003327
·
2020-08-11 02:09
数据分析与挖掘
Python数值计算工具----Numpy
从零开始学Python
数据分析与挖掘
之Python数值计算工具----Numpy#导入模块,并重命名为npimportnumpyasnp数组创建arr1=np.array([3,10,8,7,34,11,28,72
朴素.无恙
·
2020-08-10 23:20
python
Python数据分析与挖掘
深入浅出大数据--课本学习 one
深入浅出大数据–课本学习寒假期间完成学习此书大数据概述大数据关键技术基于Hadoop的生态系统分布式文件系统HDFS分布式计算框架MapReduce资源管理框架分布式存储数据库HBase数据仓库Hive
数据分析与挖掘
中关村一男子
·
2020-08-10 07:12
课本学习
Python 数据分析三剑客之 Matplotlib(三):图例 / LaTeX / 刻度 / 子图 / 补丁等基本图像属性
CSDN课程推荐:《Python
数据分析与挖掘
》,讲师刘顺祥,浙江工商大学统计学硕士,数据分析师,曾担任唯品会大数据部担任数据分析师一职,负责支付环节的数据分析业务。
TRHX • 鲍勃
·
2020-08-10 07:39
#
Matplotlib
菜鸟之路——Linux基础::计算机网络基础,Linux常用系统命令,Linux用户与组权限...
第五阶段是
数据分析与挖掘
,第六阶段是自然语言处理,第七阶段是面试技巧提高。第四阶段我猜应该是计算机视觉吧,没有就没有吧,正好
weixin_30916125
·
2020-08-10 02:07
《Python
数据分析与挖掘
实战》一3.2 数据特征分析
本节书摘来自华章出版社《Python
数据分析与挖掘
实战》一书中的第3章,第3.2节,作者张良均王路谭立云苏剑林,更多章节内容可以访问云栖社区“华章计算机”公众号查看3.2数据特征分析对数据进行质量分析以后
weixin_34319374
·
2020-08-09 00:31
【实战应用】传统调研与数据分析的结合方式
感谢关注天善智能,走好数据之路↑↑↑欢迎关注天善智能,我们是专注于商业智能BI,人工智能AI,大
数据分析与挖掘
领域的垂直社区,学习,问答、求职一站式搞定!
R3eE9y2OeFcU40
·
2020-08-07 12:13
让女朋友说Yes I Do的方法,数据分析助力客户管理的秘籍
感谢关注天善智能,走好数据之路↑↑↑欢迎关注天善智能,我们是专注于商业智能BI,人工智能AI,大
数据分析与挖掘
领域的垂直社区,学习,问答、求职一站式搞定!
R3eE9y2OeFcU40
·
2020-08-06 10:58
大数据基础知识
Hadoop:大数据系统HDFS:分布式文件系统MapReduce:分布式计算框架YARN:资源管理框架HBase:分布式列存储数据库Hive:数据仓库Mahout:
数据分析与挖掘
第二章.大数据关键技术
CUG48
·
2020-08-04 12:54
大数据
爬取国内创业公司、投资机构、独角兽公司信息
欢迎关注天善智能,我们是专注于商业智能BI,人工智能AI,大
数据分析与挖掘
领域的垂直社区,学习,问答、求职一站式搞定!
R3eE9y2OeFcU40
·
2020-08-04 10:49
《
数据分析与挖掘
第六章 电力窃漏电用户自动识别系统》
电力窃漏电用户自动识别系统数据预处理有一张含有若干缺失值的表格,需要用拉格朗日插值法,将缺失值补齐:这是三个用户的用电情况importpandasaspdfromscipy.interpolateimportlagrangeinputfile='missing_data.xls'data=pd.read_excel(inputfile,header=None)data1=data.copy()#自
逆夏11111
·
2020-08-04 07:47
数据分析与挖掘
《
数据分析与挖掘
实战》总结及代码练习---chap7 航空公司客户价值分析
航空公司客户价值分析目录航空公司客户价值分析背景:需求:分析过程:步骤总结:数据抽取:数据探索分析:客户价值分析:模型应用:拓展思考:背景:信息时代营销产品中心à客户中心,客户关系管理–>企业的核心问题,客户分类:无价值客户,高价值客户(个性化服务方案,不同的营销策略,有限的资源à高价值客户,实现企业利润最大化,)需求:对客户分群,比较分析不同的客户价值à制定相应的营销策略步骤:对航空公司的客户数
assassin_sword
·
2020-08-04 06:17
Python数据分析
《
数据分析与挖掘
实战》总结及代码练习---chap5 挖掘建模---5.4 时序模型:
目录5.4时序模型:时间序列的预处理:纯随机序列(白噪声序列):平稳非白噪声序列:非平稳序列:平稳时间序列的定义:平稳性检验平稳时间序列分析:AR模型:MA模型:MA(q)q阶自回归模型ARMA模型:平稳时间建模:python主要时序模型算法5.4时序模型:餐饮业销售和生产同时,需要预测销售,防止产品滞销或者备料不足,以做到按·减小库存降低物流成本,生产准时餐饮:基于时间序列的短期数据预测,{Xt
assassin_sword
·
2020-08-04 06:17
Python数据分析
python应用:使用jupyter做
数据分析与挖掘
最近在用anaconda自带的编辑器jupyter恶补数据分析,发现还蛮好用的。当在这里做做记录和学习总结,持续更新,希望大家讨论一二:关于jupyter的快捷键这是我用的最多的几个。ESC进入命令模式:Shift-Enter:运行本单元,选中下个单元Ctrl-Enter:运行本单元1:设定1级标题A:在上方插入新单元B:在下方插入新单元D,D:删除选中的单元Shift-M:合并选中的单元编辑模式
街口卖菜的老刘
·
2020-08-04 06:32
python语法
python数据分析
计算机基础
配置
数据结构(十六) -- C语言版 -- 树 - 二叉树的线索化及遍历 -- 左指针域线索化、顺序表线索化、链表线索化
Python
数据分析与挖掘
内容预览零、读前说明一、什么是线索化、什么是线索二叉树二、为什么要进行线索化二叉树三、线索化二叉树及其遍历3.1、利用空指针域线索化二叉树及其遍历---先序线索化3.1.1、线索化分析说明
青椒*^_^*凤爪爪
·
2020-08-03 12:46
数据结构
《
数据分析与挖掘
实战》总结及代码练习---chap6 电力窃漏电用户自动识别
目录6电力窃漏电用户自动识别背景:分析方法与过程:总结:步骤:数据抽取:数据分析探索:构建专家样本用户实时诊断6电力窃漏电用户自动识别背景:传统:防止窃漏电,定期巡逻,定期检验电表,用户举报窃电缺点:对热的依赖性太强,目标不明确现在:计量异常报警功能,电能量数据查询-->电量异常,符合异常,终端报警,主站报警,线损异常—>建立数据分析模型-->实时监测窃漏电情况缺点:终端误报或者漏报过多,建模时需
assassin_sword
·
2020-08-03 11:00
Python数据分析
Python基础篇-安装python
下面将对Python的具体功能进行说明Python能做什么:网络爬虫开发游戏开发Web项目
数据分析与挖掘
机器学习自动化运维黑客逆向编程……等等不管各位学习方向如何,重要的要打好基础,如果你有其他编程语言的开发经验
Ryan28Lui
·
2020-08-02 13:07
Python基础篇
推荐系统遇上深度学习(十九)--探秘阿里之完整空间多任务模型ESSM
欢迎关注天善智能,我们是专注于商业智能BI,人工智能AI,大
数据分析与挖掘
领域的垂直社区,学习,问答、求职一站式搞定!
天善智能
·
2020-08-01 05:32
深度学习笔记2:手写一个单隐层的神经网络
欢迎关注天善智能,我们是专注于商业智能BI,人工智能AI,大
数据分析与挖掘
领域的垂直社区,学习,问答、求职一站式搞定!
天善智能
·
2020-07-31 17:30
看Youtube怎么利用深度学习做推荐
欢迎关注天善智能,我们是专注于商业智能BI,人工智能AI,大
数据分析与挖掘
领域的垂直社区,学习,问答、求职一站式搞定!
R3eE9y2OeFcU40
·
2020-07-31 14:50
如何画好看的可视化图片
欢迎关注天善智能,我们是专注于商业智能BI,人工智能AI,大
数据分析与挖掘
领域的垂直社区,学习,问答、求职一站式搞定!
天善智能
·
2020-07-30 23:11
如何判断信息的可信度,避免被数字欺骗?
感谢关注天善智能,走好数据之路↑↑↑欢迎关注天善智能,我们是专注于商业智能BI,人工智能AI,大
数据分析与挖掘
领域的垂直社区,学习,问答、求职一站式搞定!
R3eE9y2OeFcU40
·
2020-07-30 11:59
《Python
数据分析与挖掘
实战》第四章 数据预处理
主要包括数据清洗、数据集成、数据变幻和数据规约。数据清洗删除原始数据集中的无关数据、重复数据,平滑噪声数据,筛选掉与挖掘主题无关的数据,处理缺失值、异常值等。缺失值处理方法:删除记录、数据差补和不处理数据插补方法:均值/中位数/众数、固定值、最近临插补、回归、插值(拉格朗日插值法、牛顿插值法)异常值处理方法:删除含有异常值的记录、视为缺失值、平均值修正、不处理数据集成将多个数据源合并存放在一个一直
大美mixer
·
2020-07-30 00:50
深度学习笔记3:手动搭建深度神经网络(DNN)
欢迎关注天善智能,我们是专注于商业智能BI,人工智能AI,大
数据分析与挖掘
领域的垂直社区,学习,问答、求职一站式搞定!
天善智能
·
2020-07-29 11:00
Thinking in BigData(六)大数据技术核心之ETL
我们从:数据采集、数据存储、数据管理、
数据分析与挖掘
,四个方面讨论大数据在实际应用中涉及的技术与知识点。核心技术架构挑战:1、对现有数据库管理技术的挑战。
dufman
·
2020-07-29 01:56
MindThink
BigDate
大
数据分析与挖掘
简介——《大
数据分析与挖掘
》学习笔记
大数据的定义英文名称为BigData,Gartner将其定义为:需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。区别于海量数据(MassData)和非常大的数据(VeryLargeData),不仅意味着数据的大容量,还有一些其他特点。国际数据中心(IDC)定义大数据为:大数据技术描述了一个技术和体系的新时代,被设计用于从大规模、多样化的数据中通过高速
xiaolunan666
·
2020-07-29 00:15
python学习用到的一些书籍
图灵程序设计丛书).epub“笨办法”学Python(第3版).epubPython高级编程.pdf《Python核心编程第二版》pdfDjangoWeb开发指南.pdfPYTHON网络编程基础.pdfPython
数据分析与挖掘
实战
程序人生_life of code
·
2020-07-28 22:15
数据分析与挖掘
之数据探索与清洗
目录数据探索和准备的步骤1.变量识别2.单变量分析3.双变量分析3.1类别型与类别型3.2类别型和连续型4.处理缺失值4.1为什么需要处理缺失值?4.2为什么会存在缺失值?4.3处理缺失值的方法有那些5.检测和处理异常值的方法5.1异常值的类型有哪些5.2异常值产生的原因5.3异常值对整个数据集的影响5.4怎么检测异常值5.5怎么移除异常值6.特征工程的艺术6.1什么是特征工程6.2特征工程的步骤
小脑斧123
·
2020-07-28 21:58
数据挖掘
大
数据分析与挖掘
的视角
大数据分析技术。改进已有数据挖掘和机器学习技术;开发数据网络挖掘、特异群组挖掘、图挖掘等新型数据挖掘技术;突破基于对象的数据连接、相似性连接等大数据融合技术;突破用户兴趣分析、网络行为分析、情感语义分析等面向领域的大数据挖掘技术。数据挖掘就是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。数据挖掘涉及的技术方法很多,
_Flyzhang
·
2020-07-27 22:43
《Python
数据分析与挖掘
实战》张良均,第六章电力窃漏电用户自动识别实验学习笔记
《Python
数据分析与挖掘
实战》第六章案例代码总结与修改分析一、实验目的1.掌握拉格朗日插值算法进行缺失值处理的方法。2.掌握LM神经网络和CART决策树构建分类模型的方法。
fy_1852003327
·
2020-07-27 22:23
数据分析与挖掘
从豆瓣的反爬说说自建代理池
欢迎关注天善智能,我们是专注于商业智能BI,人工智能AI,大
数据分析与挖掘
领域的垂直社区,学习,问答、求职一站式搞定!
R3eE9y2OeFcU40
·
2020-07-27 17:25
数据挖掘实战(1):数据探索
内容分为两个部分:第一部分:《Python
数据分析与挖掘
实战》第三章的内容;第二部分:自己编码过程中这部分的学习总结。
Stormzudi
·
2020-07-20 17:56
数据挖掘
python
数据挖掘
Python
数据分析与挖掘
实战中的错误总结与分析(持续更新)
这里是博主在学习中看的一本书《python
数据分析与挖掘
实战》中基础篇的一些代码规范以及参考方法,供大家学习。2.错误分析由于第一章和第二章较为简单,这里就不在赘述,涉及到官方文档,大家一定多看看。
柚子咩
·
2020-07-16 06:30
Python
Python之——Numpy
转载请注明出处:http://blog.csdn.net/l1028386804/article/details/78945157新年新气象,2018年的第一天,给大家带来一篇Python
数据分析与挖掘
领域中很重要的一个类库
冰 河
·
2020-07-16 01:21
Python
《Python
数据分析与挖掘
实战》第四章案例代码总结与修改分析
第四章案例代码总结与修改分析【有问题或错误,请私信我将及时改正;借鉴文章标明出处,谢谢】每个案例代码全部为书中源代码,出现错误按照每个案例下面给出的代码错误,原因,及怎样修改进行修改即可解决每个案例错误4-1#拉格朗日插值代码importpandasaspd#导入数据分析库Pandasfromscipy.interpolateimportlagrange#导入拉格朗日插值函数inputfile='
fy_1852003327
·
2020-07-15 23:36
数据分析与挖掘
【
数据分析与挖掘
实战】数据预处理篇
数据预处理1.数据清洗1.1缺失值处理1.2异常值处理2.数据集成2.1实体识别2.2冗余属性识别3.数据变换3.1简单函数变换3.2规范化3.3连续属性离散化3.4属性构造3.5小波变换4.数据规约4.1属性规约4.2数值规约1.数据清洗数据预处理一方面是要提高数据质量,另一方面可以让数据更好的适应特定的挖掘技术。统计发现,数据建模过程中,数据预处理工作占了整个工作的60%。数据预处理的过程包括
Asher117
·
2020-07-15 16:56
数据分析与挖掘
数据分析与挖掘
实战-窃电漏电用户的发现
为什么选择
数据分析与挖掘
技术?原因当然是之前处理方式的不合理。方式不合理之处定期巡检、定期检查电表、用户举报对人的依赖太高,容错率低。
周先森爱吃素
·
2020-07-15 12:43
数据分析与挖掘
基于Python的Kmeans聚类分析介绍及实践
基于Python的Kmeans聚类分析介绍及实践这是一篇学习的总结笔记参考自《从零开始学
数据分析与挖掘
》[中]刘顺祥著完整代码及实践所用数据集等资料放置于:Github聚类算法是依据已知的数据集,将高度相似的样本集中到各自的簇中
Yingya?
·
2020-07-15 09:20
数据分析与挖掘
之手写体识别(KNN算法)
K-近邻算法(KNN)概述最简单最初级的分类器是将全部的训练数据所对应的类别都记录下来,当测试对象的属性和某个训练对象的属性完全匹配时,便可以对其进行分类。但是怎么可能所有测试对象都会找到与之完全匹配的训练对象呢,其次就是存在一个测试对象同时与多个训练对象匹配,导致一个训练对象被分到了多个类的问题,基于这些问题呢,就产生了KNN。KNN是通过测量不同特征值之间的距离进行分类。它的思路是:如果一个样
小脑斧123
·
2020-07-15 07:32
数据分析
python
数据挖掘
python
数据分析与挖掘
(二十九)--- Pandas量化--股票时间序列数据处理
Python教程网:www.python88.cn1什么是时间序列时间序列是一组按照时间发生先后顺序进行排列的数据点序列。通常一组时间序列的时间间隔为一恒定值(如1秒,5分钟,12小时,7天,1年),因此时间序列可以作为离散时间数据进行分析处理。例如:某监控系统的折线图表,显示了请求次数和响应时间随时间的变化趋势2Pandas的时间类型pd.to_datetime():转换成pandas的时间类型
python爬虫人工智能大数据
·
2020-07-15 06:58
python
数据分析
什么是网络爬虫?有什么用?怎么爬?终于有人讲明白了
此时,我们可以使用网络爬虫对数据信息进行自动采集,比如应用于搜索引擎中对站点进行爬取收录,应用于
数据分析与挖掘
中对数据进行采集,应用于金融分析中对金融数据进行采
来杯牛奶呗
·
2020-07-15 05:13
数据分析与挖掘
练习2 --kaggle比赛 House Prices 预测
题目描述:通过79个变量(几乎)描述爱荷华州埃姆斯(Ames)住宅的每一个特征,在这个竞赛里,需要你预测每个住宅的最终价格,并最终提交。http://ww2.amstat.org/publications/jse/v19n3/Decock/DataDocumentation.txt上述官方给的一份说明里是对数据的描述,描述了79个属性变量的具体描述以及数据类型。Thedatahas82column
zhxh0609
·
2020-07-14 22:13
机器学习
数据分析与挖掘
《Python
数据分析与挖掘
实战》
文章目录前言第1章数据挖掘基础第2章Python数据分析简介第3章数据探索数据质量分析数据特征分析Python常用函数第4章数据预处理数据清洗数据集成数据变换(非常重要)数据规约Python常用的数据预处理函数第5章挖掘建模分类与预测聚类分析关联规则时序模式离群点检测第6章电力窃漏电用户自动识别第7章航空公司客户价值分析第8章中医证型关联规则挖掘第9章基于水色图像的水质评价第10章家用电器用户行为
我的猪仔队友
·
2020-07-14 18:25
Python 数据分析 与 数据挖掘 (介绍篇)
2019-03-1520:14:57楚格介绍:Python
数据分析与挖掘
,快速入门的PythonandPacket工具使用方法,其次是解决方案的应用案例,最后是
数据分析与挖掘
的思维价值。
ananzhou9118
·
2020-07-14 07:54
数据挖掘 案例一:电力窃漏用户自动识别
案例来源:《Python
数据分析与挖掘
实战》第6章案例背景与挖掘目标提取窃漏电用户的关键特征,构建窃漏电用户的识别模型,自动检查、判断用户是否存在窃漏电行为。
aa8785458
·
2020-07-14 07:38
《Python
数据分析与挖掘
实战》第三章 数据探索
样本数据集的数量和质量是否满足模型构建要求?是否出现没设想过得数据状态?其中是否有明显的规律和趋势?各因素中有什么样的关联性?数据探索:对样本数据集的结果和规律进行分析数据质量分析主要任务:检查原始数据中是否存在脏数据脏数据包括:缺失值、异常值、不一致的值、重复值缺失值分析缺失包括:记录缺失、某个字段缺失缺失产生原因有些信息无法获取有些信息被遗漏属性值不存在缺失值的影响丢失有用信息不确定性更加显著
大美mixer
·
2020-07-13 19:29
上一页
5
6
7
8
9
10
11
12
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他