E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
python后端数据清洗
两集群数据拷贝
业务场景:公司有两套集群,A集群专门做数据存储,B集群专门做
数据清洗
和数据展现A集群每天定时把数据同步过来B集群后,B集群负责后续清洗和供业务系统使用集群背景两套集群都配有各自的KDC服务器A集群没做namenodeHA
阿甘骑士
·
2021-05-10 12:51
用Excel的框架去学pandas(
数据清洗
)
处理空值Excel方法在Excel中,碰到空值的时候直接可以通过定位空值之后然后进行统一改动。定位空值后处理空值Pandas方法dropna把带有空值的行全部去除。dropnafillna对空值进行填充。fillna清理字符串中的空格Excel方法Excel中可以通过替换的方法去除字符串中的空格。Pandas方法利用str.strip函数可以去除字符串中两边的空格(中间的空格不能去除)。清除空格大
成鹏9
·
2021-05-09 03:25
python后端
flask框架 计算时间差 并根据时间差条件返回flag值
python后端
计算时间差并根据时间差条件返回flag值话不多说直接上代码先上代码片段这里的逻辑是根据现在的实际和数据库存储的时间差小于16天的则返回flag1否则flag为0sub_time=abs(
MelroseQ
·
2021-05-08 11:04
python
后端
业务
数据清洗
动手小心得
项目经理做小任务的思考最近做个小需求,自己主动认领的。具体的需求是把系统中的历史数据刷成基于业务部门的新数据,大概几千条数据,量也不算特别大。但这些数据来自不同业务部门,需要跟十来个部门对接人一起沟通,各部门对接人工核实数据,拿到数据后反查该数据对应的数据唯一编号,确认完正确的数据进行洗数。基本流程:获取原始数据-定位有问题的数据-部门同事确认数据-统一汇总数据-反馈异常数据-完成问题数据确认-数
wlp2evan
·
2021-05-07 14:10
数据分析系列 之python中数据探索与预处理
1概述1.1数据探索检查数据错误,了解数据分布特征和内在规律1.2数据预处理
数据清洗
Datacleaning数据集成Dataintegration数据变换Datatransformation数据规约Datareduction2
琅晓琳
·
2021-05-04 12:49
数据分析
python
数据分析
数据清洗
数据变换
数据规约
Pandas 必知必会的18个实用技巧,值得收藏!
数据科学家们会花费大量的时间来清理数据集,毫不夸张地说,
数据清洗
会占据他们80%的工作时间,而真正用来分析数据的时间只占到20%左右。所以,
数据清洗
到底是在清洗些什么?
Cherich_sun
·
2021-05-03 20:55
Python常用第三方库
Python常用第三方库一、文件读写二、网络抓取和解析三、数据库连接四、
数据清洗
转换五、数据计算和统计分析六、自然语言处理和文本挖掘七、图像和视频处理八、音频处理九、数据挖掘/机器学习/深度学习十、数据可视化十一
半吊子Kyle
·
2021-05-03 14:54
python
Kettle工具使用及总结
Kettle工具使用及总结一、kettle安装及报错:kettle主要用于
数据清洗
,即常见ETL工具,拥有图形化界面且免费的优点。
GoAl的博客
·
2021-05-03 00:40
数据分析与数据挖掘
数据库
python
mysql
干净的数据:
数据清洗
入门与实践
百度网盘地址:https://pan.baidu.com/s/1Ajs0uS1V72TofL9AW3IAtw解压码:rltf封面图片
亮亮你看起风了
·
2021-05-02 22:34
从Excel到Python:最常用的36个Pandas函数
本文涉及pandas最常用的36个函数,通过这些函数介绍如何完成数据生成和导入、
数据清洗
、预处理,以及最常见的数据分类,数据筛选,分类汇总,透视等最常见的操作。
统计学家
·
2021-05-02 21:59
特征工程-特征处理小结
特征处理包括:
数据清洗
和特征预处理。
Jana_LU
·
2021-05-02 20:45
数据分析体系构建
一、数据分析的目的1.验证产品模式是否可行2.验证用户对产品功能的满意度3.挖掘新的需求,帮助产品、运营进行迭代二、数据分析流程1.数据采集友盟+事件埋点2.
数据清洗
Excel清洗3.数据分析Excel
不二翔叔
·
2021-05-01 12:16
电商数据分析——基于hive数仓,实现大数据分析
数据源可通过日志取得,
数据清洗
转换导入数据仓库,通过数仓中数据分析得到数据总结,用于企业决策。
A_Zhong20
·
2021-05-01 10:25
数据分析
大数据
hadoop
数据仓库
模型评估和超参数调优
模型评估和超参数调优fromIPython.displayimportImage%matplotlibinline1.通过管道Pipeline简化工作流程在正式建立模型之前,一般会经理很多步骤的数据预处理,比如常见的
数据清洗
AIHUBEI
·
2021-04-30 21:33
数据分析&挖掘
机器学习
交叉验证
调参
模型评估
学习曲线
【Spark】Apache日志分析
文章目录Apache日志分析一、日志格式二、日志解析1.主要步骤2.
数据清洗
代码实现解析2.1环境准备2.2
数据清洗
解析2.3.1整体框架2.3.2解析数据三、日志分析1.统计Web服务器返回的内容大小
骑着蜗牛ひ追导弹'
·
2021-04-29 20:27
#
Spark练习题
spark
sparksql
大数据
从Excel到Python:最常用的36个Pandas函数
从Excel到Python:最常用的36个Pandas函数本文涉及pandas最常用的36个函数,通过这些函数介绍如何完成数据生成和导入、
数据清洗
、预处理,以及最常见的数据分类,数据筛选,分类汇总,透视等最常见的操作
天明豆豆
·
2021-04-29 10:40
2019-09-15(论文学习笔记——MegaDepth: Learning Single-View Depth Prediction from Internet Photos)
来自MVS数据的挑战:包含噪声和不可重构的实体,因此本文中提出了一种新的
数据清洗
的方法在本文提出的数据集——Megadepth
雨住多一横
·
2021-04-29 09:34
Hawk教程- 更新日志和捐赠列表
GitHub文档镜像欢迎使用Hawk快速教程主要组件介绍核心功能:Hawk工程Hawk任务市场数据表和数据库连接网页采集器
数据清洗
[模块和算子]转换器过滤器执行器生成器常见问题更新日志作者和捐赠列表专题
desert2017
·
2021-04-28 17:30
「Python」
数据清洗
常用正则
对爬虫数据进行自然语言清洗时用到的一些正则表达式标签中的所有属性匹配(排除src,href等指定参数)参考链接#\b(?!src|href)\w+=[\'\"].*?[\'\"](?=[\s\>])#匹配特征id="..."#\b(?!...)排除属性名中的指定参数,零宽断言前向界定判断属性结束#tips:带\b的python正则匹配一定要加r转义str1=''''''print(re.finda
HughDong
·
2021-04-28 05:46
人事部珊珊-6月第2周检视,第3周计划
10000步3、坚持周末跑步,跳绳,游泳交替学习目标[8分]:1、坚持每日英语学习打卡2、完成《少有人走的路心智成熟的旅程》阅读3、完成腾哥作业6月第3周计划:工作目标:1、找任务相关代码运行【周五前】2、
数据清洗
管理时间不畏将来
·
2021-04-27 20:39
特征预处理
DataPreProcessing(数据预处理)、FeatureExtraction(特征提取)、FeatureSelection(特征选择)和Featureconstruction(特征构造)等子问题,而数据预处理又包括了
数据清洗
和
David_ess
·
2021-04-27 18:49
中国大学MOOCPython语言程序设计(北京理工大学)第7-9周学习笔记和课后练习
一维数据的格式化和处理7.4二维数据的格式化和处理7.5模块6:wordcloud库的使用7.6实例12:政府工作报告词云单元测试1.文件行数2.文件字符分布3.文件独特行数4.CSV格式列变换5.CSV格式
数据清洗
文本的平均列数
zhuyue1995
·
2021-04-27 10:01
Python慕课学习笔记
python
数据分析
208个最新最全大数据/人工智能专有名词术语 中英对照D
数据清洗
(DataCleansing):顾名思义,
数据清洗
涉及到检测并更正或者删除数据库中不准确的数据或记录,然后记住「脏数据」。
Albert陈凯
·
2021-04-27 01:35
Excel Power Pivot:如何在Excel中加载并打开Power Pivot
利用PowerQuery将
数据清洗
、整合之后,将其上载并添加到PowerPivot数据模型,以便进一步建立数据之间的联系,并对数据进行统计分析。
数字工厂
·
2021-04-27 00:49
金融风控训练营-Task02学习笔记
aliyun.com)目录一、学习知识点概要二、学习内容4、生成数据报告三、学习问题与解答四、学习思考与总结一、学习知识点概要经过数据挖掘的第一个步骤信息分析后,接下来便是对所获得的数据进行处理,通常包括:选择数据、
数据清洗
寻欢无罪¸
·
2021-04-25 22:32
数据挖掘
python
tornado后台热加载配置
后台使用tornado4开发,需要搭建一个后台开发环境,让代码修改后自动重启热加载;1.简介
Python后端
使用tornado开发并且使用setuptools进行编译部署线上,流程相对完善;每次代码版本修改完成后编译并
shawna_god
·
2021-04-25 01:14
缺失值处理1
数据预处理步骤有
数据清洗
、数据集成、数据变换、数据规约。实际工作中不是每一步都必须。
apricoter
·
2021-04-24 19:03
windows服务器nginx配置 使用proxy_pass windows server2008 配置vue与
python后端
端口放行
windows服务器nginx配置使用proxy_passwindowsserver2008配置vue与
python后端
端口放行vue配置使用nginx进入conf目录配置nginx.conf文件我这里使用的
MelroseQ
·
2021-04-22 23:39
服务器部署
vue
python
Python
数据清洗
工具之Numpy的基本操作
1.Numpy(NumbericalPython)Anaconda中已经集成了NumPy,可以直接使用。如果想要自行安装的话,可以使用流行的Python包安装程序pip来安装NumPy,目前使用的是Anaconde的环境进行学习和使用这个库1.1这库的安装方法CMD:pipinstallnumpy或者使用清华源的镜像库:pipinstallnumpy-ihttps://pypi.tuna.tsin
·
2021-04-22 13:34
日记3.19
不像面试的时候说的那样,建模、评分卡、
数据清洗
,却依然是报表!!!真的真的很难接受。我因为这个放弃了一家更好的工作单位,然而你却告诉我,我的实际工作是依然是这个!报
蓝鲸min
·
2021-04-22 12:59
Hawk教程-欢迎使用Hawk
HawkAdvancedCrawlerETLtoolwritteninC#/WPFGitHub文档镜像欢迎使用Hawk快速教程主要组件介绍核心功能:Hawk工程Hawk任务市场数据表和数据库连接网页采集器
数据清洗
desert2017
·
2021-04-22 03:32
Hawk教程- 设计Hawk背后的故事(2016)
GitHub文档镜像欢迎使用Hawk快速教程主要组件介绍核心功能:Hawk工程Hawk任务市场数据表和数据库连接网页采集器
数据清洗
[模块和算子]转换器过滤器执行器生成器常见问题更新日志作者和捐赠列表专题
desert2017
·
2021-04-21 13:54
基于python的大数据分析-数据处理(代码实战)
数据处理的主要内容包括
数据清洗
、数据抽取、数据交换和数据计算等。
数据清洗
数据清洗
是数据价值链中最关键的一步。垃圾数据即使是通过最好的分析也可能会产生错误的结
测试帮日记
·
2021-04-20 19:40
贝壳网武汉二手房数据分析———数据可视化
条二手房源数据包括以下信息:标题描述楼盘信息标签总价单价楼层建筑时间户型朝向发布时间关注人数二、分析目的1、了解武汉二手房屋信息概况;2、探索小区、建房时间、房屋类型、面积、楼层、朝向等因素对房价的影响;三、
数据清洗
首先导入需要的工具包
一半芒果
·
2021-04-20 13:11
Seq2Seq聊天机器人项目
零、总结整个项目分为
数据清洗
和建立模型两个部分。(1)主要定义了seq2seq这样一个模型。首先是一个构造函数,在构造函数中定义了这个模型的参数。
潇萧之炎
·
2021-04-20 08:32
【我要偷偷学Python,然后惊呆所有人】专栏导航
直到看了橡皮檫大佬的爬虫百例教程,我知道,我的这个专栏却一份目录、本专栏尽可能包含从Python小白入门,到爬虫数据采集、
数据清洗
、数据存储、数据分
看,未来
·
2021-04-19 21:42
Python其他
python
数据挖掘
数据分析
可视化
powerbi学习
PowerQuery常用的
数据清洗
十三招1.提升标题在Excel中第一行为标题行,从第二行开始才是数据,但在PQ
卅清
·
2021-04-19 09:58
【ETL】系列七:核心转换场景-规格化清洗
ETL】系列四:核心转换场景—单表间直转【ETL】系列五:核心转换场景-字段合并与字段拆分【ETL】系列六:核心转换场景-行转列与列转行之前的三篇文章,主要针对来源数据进行直接映射处理,并未涉及到来源表
数据清洗
后再同步到目标表的场景
不爱吃药的小白鼠
·
2021-04-19 09:54
2019-11-25 R语言中的数据处理包dplyr、tidyr笔记
来源:https://www.cnblogs.com/yjd_hycf_space/p/6686141.htmldplyr包是HadleyWickham的新作,主要用于
数据清洗
和整理,该包专注dataframe
_客舍青青_
·
2021-04-19 03:37
淘宝用户行为数据分析(MySQL+Excel)
本次分析主要分五个步骤进行:理解数据→提出问题→
数据清洗
→建模分析→总结建议由于是先拿到数据集,再进行分析,所以此次分析的步骤为先理解数据,再思考通过这样一份数据的分析能够获得的对业务有用的信息。
pobabyq
·
2021-04-18 21:09
sql-淘宝用户行为分析
商业分析目录:1、项目背景2、数据导入与认识3、
数据清洗
4、数据分析5、结论与建议一、项目背景移动互联网企业从粗放式到精细化运营管理过程中,需要结合市场、渠道、用户行为等数据分析,对用户开展有针对性的运营活动
jinghenggl
·
2021-04-18 08:43
10个
数据清洗
小技巧,快速提高你的数据质量
所以
数据清洗
成为了数据分析的重要前提,并且占据了整个数据分析工作中80%的时间。那么如何通过
数据清洗
来提高数据质量呢?
DataHunter小数
·
2021-04-17 23:21
用Excel做一次完整的数据分析
一个完整的数据分析都需要经历这样几个步骤:1、数据获取——这里我已经用Python爬好了;2、明确分析目的——你拿这数据要得到什么信息,解决什么问题;3、观察数据——各个数据字段的含义,中英文释义;4、
数据清洗
smile_74de
·
2021-04-17 22:20
爬取淘宝商品+可视化(上篇)
全链路数据分析思路数据分析学习,就要全链路的学习,就是从获取数据源,到
数据清洗
,再到数据分析,可视化的展现,一整套完整的学习路径。这也是数据分析的完整思路。
似水年华_388a
·
2021-04-15 05:29
两张小抄,带你 “迅速” 掌握Pandas “
数据清洗
” 流程!
本文简介今天这篇文章,就当作是pandas教程的开篇文章吧!这是由Pandas官方发布的两张“小抄”,内容不像matplotlib小抄那么多,但是内容确实极其精简,肯定可以迅速带你“理清”Pandas学习思路。项目地址如下:https://github.com/pandas-dev/pandas/blob/master/doc/cheatsheet/Pandas_Cheat_Sheet.pdf当然
数据分析与统计学之美
·
2021-04-14 17:26
pandas
pandas
kaggle-Titanic生存分析
分析目的:主要通过已有的数据集的几个维度,探索各维度数据与生存之间的关系,然后通过
数据清洗
,数据处理,建立模型预测test数据的生存情况。
不是达芬奇也不是达尔文
·
2021-04-14 08:25
让数据清澈如水:
数据清洗
的策略与方法
数据清洗
的职责就是分辨、处理这些问题数据。
数据清洗
,顾名思义,就是把数据拿去“洗一遍”,把其中的脏数据给“洗掉”,简单来说,
数据清洗
就是发现并纠正数据中可识别的错误,从而来保持数据的完整性、唯一
亿信华辰
·
2021-04-13 11:28
大数据平台 - 数据采集及治理
在采集过程中针对业务场景对数据进行治理,完成
数据清洗
工作。在大数据场景下,数据源复杂、多样,包括业务数据库、日志数据、图片、视频等多媒体数据等。
端碗吹水
·
2021-04-13 11:55
数据清洗
动手学深度学习——5.
数据清洗
记录一下学习深度学习的一些。
QWERDF007
·
2021-04-12 21:17
动手学深度学习
深度学习
pytorch
干货丨Hadoop MapReduce 作业长时间卡死怎么办?
源数据文件发到Hadoop集群后,我们的预处理程序会对源数据进行编码转换、数据去重、加时间拉链、
数据清洗
、错误数据处理等操作,生成贴源的ODS层数据,供上层建模使用。
·
2021-04-12 21:30
上一页
51
52
53
54
55
56
57
58
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他