E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
数据清理
Python - Pandas用法说明
建立在NumPy数组结构上的Pandas,尤其是它的Series和DataFrame对象,为数据科学家们处理那些消耗大量时间的“
数据清理
”
天线嘟嘟茄
·
2020-03-31 23:50
Python数据整洁(译)
我最近发现了一篇HidleyWickham在2014年发布的名为TidyData的论文,文中重点关注
数据清理
,数据整洁的一个方面:构建数据集以便于分析。
RossH
·
2020-03-31 21:41
《谁说菜鸟不会数据分析》读书笔记3
第三章数据处理1.
数据清理
1.1小妙招△冻结窗格△自动筛选△快速隐藏:对应快捷键,隐藏行“Ctrl+9”;隐藏列“Ctrl+0”△“Ctrl+箭头键”:“Ctrl+箭头键”可将光标移动到工作表中当前数据区域的边缘
卡卡农西
·
2020-03-29 14:44
《Pandas Cookbook》第04章 选取数据子集
第01章Pandas基础第02章DataFrame运算第03章数据分析入门第04章选取数据子集第05章布尔索引第06章索引对齐第07章分组聚合、过滤、转换第08章
数据清理
第09章合并Pandas对象第10
SeanCheney
·
2020-03-26 13:44
IOS图标和启动页尺寸配置
通过iTunes查看沙河文件ApplicationsupportsiTunesfilesharingYES/NOPCH$(SRCROOT)/项目名称/pch文件名Xcode缓存
数据清理
1、Xcode缓存文件
树洞Mr_o
·
2020-03-26 07:11
《Pandas Cookbook》第11章 用Matplotlib、Pandas、Seaborn进行可视化
第01章Pandas基础第02章DataFrame运算第03章数据分析入门第04章选取数据子集第05章布尔索引第06章索引对齐第07章分组聚合、过滤、转换第08章
数据清理
第09章合并Pandas对象第10
SeanCheney
·
2020-03-23 05:11
《Pandas Cookbook》第06章 索引对齐
第01章Pandas基础第02章DataFrame运算第03章数据分析入门第04章选取数据子集第05章布尔索引第06章索引对齐第07章分组聚合、过滤、转换第08章
数据清理
第09章合并Pandas对象第10
SeanCheney
·
2020-03-21 16:18
Jupyter Notebook(介绍篇)
它的用途包括:
数据清理
和转换、数值模拟、统计建模、数据可视化、机器学习等等。它具有以下优势:可选择语言:支持超过40种编程语言,包括Python、R、Julia、Scala等。
hwang_zhic
·
2020-03-21 01:57
没创业时喊创业,创业时真累却不敢喊累!
毕业两年了,也在一家数据公司做了两年数据分析,从业务分析,数据结构理解,
数据清理
,数据挖掘抽取,建立定价模型等等,同时也了解了.net,Python,r,以及数据库等知识。
天使会哭
·
2020-03-18 15:05
你好12
被今天突如其来的
数据清理
工作,占用了两个多小时,时间分割成碎片,没有好好利用又浪费了好多时间。
红心芭乐
·
2020-03-18 00:17
苏州及周边地区Odoo Openerp外包实施二次开发服务报价
含安装部署一次现场培训)odoo10odoo11企业版全模块一套1万(带远程安装)odoo业务现场培训2000元一天(苏州以外地区3000元)全年技术支持2万(含服务器数据每日备份,疑难问题处理、数据恢复、
数据清理
n37r06u3
·
2020-03-15 20:16
数据分析过程
第二部:数据再加工,也就是数据采集和
数据清理
第三部:数据探索,在这个步骤中需要熟悉数据培养直觉并找出数据。第四部:总结或进行预测。第五步:需要与其他人交流你的研究结果,数据可视化是最高效的交流方式。
KennyP0618
·
2020-03-14 15:43
【机器学习工程师】学习路径
机器学习路径将带你学会使用Numpy,Scipy,Pandas,Scikit-learn,Matplotlib等开源工具,完成从
数据清理
、数据分析、模型构建,到最终的预测评估及可视化呈现。
实验楼
·
2020-03-11 05:32
一次mysql问题查询
一、好言目前这个年龄真的很尴尬不够成熟也不够幼稚没有能力却有野心二、背景昨天上线,但是在准生产上,出现了问题,这个问题在测试环境出现过,但是我把数据库四千多万的
数据清理
了,然后就成功了,但是现在在预发布环境又出现了这个问题
吴世浩
·
2020-03-10 12:05
数据挖掘基本概念
作为知识发现过程,它通常包括
数据清理
、数据集成、数据变换、模式发现、模式评估和知识表示。数据仓库是一种长期存储数据的仓库,这些数据来自多个数据源,是经过组织的,以便支持管理决策。
pptb
·
2020-03-09 10:14
商业智能可视化决策平台
数字冰雹的商业智能可视决策平台,能够结合各行各业独特的指标和KPI表示方式,从
数据清理
集成,到数据存储整合,再到数据分析挖掘,之后进行可视化呈现,最终完成人机交互体验。
数字冰雹
·
2020-03-03 22:12
数据挖掘的过程
包括表、记录和属性的选择,数据转换和
数据清理
等。4)建模:选择和应用各种建模技术,并对其参数进行优
夜海晴歌
·
2020-02-29 23:54
20160919 Daily Review
00~8:00补觉听podcast编写业绩档案项目启动会会议主持ppt8:00~8:20早饭分享釜山行、鲨滩看什么8:30~16:00完成本日工作计划,3件主要事情讨论项目成果项目技术交流,业务数据源、
数据清理
黄桃de夏天
·
2020-02-24 20:26
unittest学习
一个函数或者一个类来进行正确性检验的测试工作2.单元测试中最核心的四个概念:testcase(测试用例),testsuite(测试套件),testrunner(测试运行器),testfixture(测试环境数据准备和
数据清理
或者测试脚手架
瘦不下去了
·
2020-02-22 18:39
玩转jupyter + 远程访问
主要用于:
数据清理
与转换,数值模拟,统计建模,机器学习等。
繁著
·
2020-02-21 23:56
使用Python脚本进行es
数据清理
需求背景业务系统将各类的报表和统计数据存放于ES中,由于历史原因,系统每天均以全量方式进行统计,随着时间的推移,ES的数据存储空间压力巨大。同时由于没有规划好es的索引使用,个别索引甚至出现超过最大文档数限制的问题,现实情况给运维人员带来的挑战是需要以最小的代价来解决这个问题。下面以内网开发、测试环境举例使用python脚本解决这个问题。EachElasticsearchshardisaLucen
ylw6006
·
2020-02-21 10:26
es
elasticsearch
python
Python
Jupyter介绍和使用 中文版
它在大
数据清理
和探究,可视化,机器学习,和大数据分析中都有广泛运用.Notebooks可以直接在github直接被读取.这是一个非常有用的功能,你可以方便地分享。
DerekGrant
·
2020-02-16 04:07
浅谈基于模糊音的中文匹配算法
查看原文背景介绍字符串的相似度算法在许多领域都能经常用到,在
数据清理
、语音识别、语音纠错、搜索等领域有重要的用处。
ioiogoo
·
2020-02-15 17:03
《Pandas Cookbook》第09章 合并Pandas对象
第01章Pandas基础第02章DataFrame运算第03章数据分析入门第04章选取数据子集第05章布尔索引第06章索引对齐第07章分组聚合、过滤、转换第08章
数据清理
第09章合并Pandas对象第10
SeanCheney
·
2020-02-13 17:49
MyCat路由规则分析(十五)
在这种情况下,按自然月分片的话,按月对过期数据做
数据清理
时,不会对业务产生冲击。
john_zhong
·
2020-02-13 14:25
Jupyter Notebook
它的用途包括:
数据清理
和转换、数值模拟、统计建模、数据可视化、机器学习等等。它具有以下优势:可选择语言:支持超过40种编程语言,包括Pyt
hwang_zhic
·
2020-02-11 00:49
Selenium WebDriver——如何测试REST API
但是,如果你想使用Selenium为UI测试执行一些数据设置/
数据清理
,那么可以通过一些额外的库来实现这一点;这就是我们将在本文中看到内容。如果你
软测小生
·
2020-02-09 14:59
《Pandas Cookbook》第07章 分组聚合、过滤、转换
第01章Pandas基础第02章DataFrame运算第03章数据分析入门第04章选取数据子集第05章布尔索引第06章索引对齐第07章分组聚合、过滤、转换第08章
数据清理
第09章合并Pandas对象第10
SeanCheney
·
2020-02-09 01:47
对数据预处理方法的分析与思考
1不同阶段中相同的预处理方法在
数据清理
这一阶段的光滑噪声技术中,可以使用这三种方法:分箱、回归、聚
石显
·
2020-01-07 22:10
Spark菜鸟学习营Day2 分布式系统需求分析
主要迁移点:A:批量
数据清理
重点:分析要清理的表在哪里A1.参数表:存放Oracle、Redis。清理Oracle就可以,Red
百万机器猫
·
2020-01-07 10:37
数据分析师薪酬?拉勾网职位爬取+分析
爬虫selenium+BautifulSoup+xpath储存数据MySQL
数据清理
薪酬和职位需求分析seabor
汝心若知
·
2020-01-06 17:56
16 Spark Streaming源码解读之
数据清理
RDD、不断的接收数据存储数据,不断的保存元数据等,如果不清理这些数据,内存和磁盘空间都会崩溃,看一下SparkStreaming是如何做清理工作的SparkStreaming在Job运行完成时会触发
数据清理
动作
海纳百川_spark
·
2019-12-31 20:18
Python 爬虫实践:《战狼2》豆瓣影评分析
目标总览主要做了三件事:抓取网页
数据清理
数据用词云进行展示使用的python版本是3.5.一、抓取网页数据第一步要对网页进行访问,python中使用的是urllib库。代码如下:fromurlli
Alukar
·
2019-12-31 04:41
优云软件数据专家最佳实践:数据挖掘与运维分析
1.
数据清理
:消除噪音或不一
优云双态运维
·
2019-12-30 15:27
维度建模
一部分来自日志,清洗成二维表DWD:把所有的
数据清理
整合,规范化。脏
数据清理
,命名不规范的。最后拿到的是干净的,一致性的数据。
锋锋2019
·
2019-12-30 08:00
数据预处理
预处理技术包含了
数据清理
,数据归约,数据变换。
数据清理
:清楚数据中的噪声,纠正不一致。数据归约:通过如聚集、删除冗余特征或聚类来降低数据的规模。
FreeLuo
·
2019-12-29 06:38
机器学习-数据预处理
1、引言数据预处理的主要任务如下:(1)
数据清理
:填写空缺值,平滑噪声数据,识别,删除孤立点,解决不一致性(2)数据集成:集成多个数据库,数据立方体,文件(3)数据变换:规范化(消除冗余属性)和聚集(数据汇总
文哥的学习日记
·
2019-12-28 01:51
京东联盟开发(1) 商品SKUID采集
API介绍推广商品列表的API为https://media.jd.com/gotoadv/goods相关参数说明主类目表二、采集方法使用火车头采集,采集配置如下网址采集规则内容采集规则内容发布规则三、
数据清理
及入库采集到过程如图所示同时用
心冰之海
·
2019-12-24 21:00
Core Table Housekeeping案例1
一、为什么要做
数据清理
?●系统运行一段时间后,会产生历史数据,保存太久会降低系统处理效率。比如:账户计提历史表。
小代嘚吧嘚
·
2019-12-21 10:39
Python爬虫大作业
简介如下图所示内容红色标记框内的内容:二、爬取步骤:1.数据服务爬取步骤:(1)爬取整个动态网页信息内容;(2)解析网页内容,利用正则表达式获取有效信息;(3)把爬取下来的信息采用csv进行存储;(4)进行必要的手动的
数据清理
和美化
Jokerˇ
·
2019-12-20 16:00
《Pandas Cookbook》第10章 时间序列分析
第01章Pandas基础第02章DataFrame运算第03章数据分析入门第04章选取数据子集第05章布尔索引第06章索引对齐第07章分组聚合、过滤、转换第08章
数据清理
第09章合并Pandas对象第10
SeanCheney
·
2019-12-18 02:38
机器学习中过拟合常见采用方法
与问卷审核不同,录入后的
数据清理
一般
风火布衣
·
2019-12-17 15:40
单车用户满意分数因素分析
一.数据获取与清洗1.使用R读取从数据库导入的数据2.
数据清理
转换数据类型处理缺失值3.数据的转换合并两个表格,创建新的,时间,分数排名,推荐者字段二.探索不同城区,年龄采访时间与用户的分数关系情况1.
今天吃红薯了吗
·
2019-12-17 12:35
Power Query 系列 (20) - 如何在外部使用Power Query提供的服务
PowerQuery作为桌面端
数据清理
和转换的工具,能极大解放生产力,将繁琐的数据处理工作从重复的劳动中解放出来。那么,PowerQuery能否对外提供计算服务呢?
Stone0823
·
2019-12-16 00:03
报告总统(下)
这其中还包括数据结构化、
数据清理
、建立模型、验证模型等数据处理步骤。所以,规模大,也可理解为工作量大,以及对软硬件的数量需求巨大。下面几段报告,就是基于这样一个技术现实。1、个人数
豆官
·
2019-12-14 14:03
Jupyter Notebook 入门指南
用途包括:
数据清理
和转换,数值模拟,统计建模,机器学习等等安装与运行1.使用Anaconda安装对于小白,强烈建议使用Anaconda发行
一次旅行
·
2019-12-08 14:41
python爬虫实战一:分析豆瓣中最新电影的影评
目标总览主要做了三件事:抓取网页
数据清理
数据用词云进行展示使用的python版本是3.5.运行环境:jupyernotebook,如在其他环境下运行报错了,请查看评论区的讨论,里面有一些解决办法。
派派森森
·
2019-12-07 23:01
干货 | 22个免费的数据可视化和分析工具推荐!
列表如下:
数据清理
(Datacleaning)当你分析和可视化数据前,常需要“清理”工作。比如一些输入性列表“NewYorkCity”,同时其他人会说”NewYork,NY”。
芜湖达内科技
·
2019-12-06 19:57
2019-10-24
1不同阶段中相同的预处理方法在
数据清理
这一阶段的光滑噪声技术中,可以使
石显
·
2019-12-01 01:31
HttpRunner学习10--hook机制
通常setUp()主要用于测试准备工作,而tearDown()主要用于测试后的
数据清理
。在HttpRunner中,我们可以通过hook机制来实现setUp()和tearDown()。
wintest
·
2019-11-30 16:00
上一页
13
14
15
16
17
18
19
20
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他