E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
---数据质量
python-数据分析(10-数据清洗)
Pandas10Pandas之数据清洗10.1Pandas数据清洗数据清洗介绍数据清洗实际上也是
数据质量
分析,检查原始数据中是否存在脏数据(不符合要求,或者不能直接进行分析的数据),并且处理脏数据。
看吉吉真香
·
2023-01-04 07:40
matlab
数据分析
python
Python数据分析5——数据清洗
目录Python数据清洗数据清洗介绍处理缺失值判断数据是否为NaN过滤缺失值补全缺失值异常值处理重复数据判断重复值删除重复值离散化向量化字符串函数Python数据清洗数据清洗介绍数据清洗实际上也是
数据质量
分析
彩色的泡沫
·
2023-01-04 07:05
python数据分析
数据挖掘
python
数据分析
NEFU数据科学导论(二)获取数据1
日志收集系统特征·:高可用性,高可靠性,可扩展性2.2网络数据收集2.3数据库收集关系型数据库(mysql,oracle)非关系型数据库(redis)2.4公开出版刊物2.5开发数据平台2.6市场调查三、
数据质量
检验
NEFU-Go D 乌索普
·
2023-01-03 10:07
数据库
主数据的3大特征、4个超越和3个二八原则
不论是大数据还是小数据,持续地提升
数据质量
才是企业数据治理之道!主数据具备3个主要特征1、高价值:主数据是所有业务处理都离不开的实体数据,与大数据相
用友iuap
·
2022-12-31 17:37
大数据
阿里云DataWorks学习——数仓架构设计
DataWorks则包括数据开发、
数据质量
、数据安全、数据管理等在内的一系
zhisheng_blog
·
2022-12-31 16:36
数据仓库
大数据
dbcp
数据分析
odbc
ETL过程中数据清洗(脏数据处理)小结
在我们想尽各种办法把数据弄进数据仓库ods层后,接下来的事情就比较有意思了,并且比较重要,对后续的数据模型建设,
数据质量
的保证,甚至影响管理层的决策(就问你怕不怕?)
派可数据BI可视化
·
2022-12-31 10:26
数据库
big
data
模型不达标调整
模型不好如何处理模型拟合不好,我们能想到的原因主要有以下几个方面其一:样本的多少通常情况下,样本越多,样本的
数据质量
越高,那么会对模型拟合有正向的帮助;其二:测量指标的好坏与多少如果选取的指标不能很好地代表所研究的问题
spssau
·
2022-12-30 16:49
人工智能
python
所谓数据治理
点击上方蓝色字体,选择“设为星标”回复”资源“获取更多资源在阅读本文之前,你需要了解:所谓数据模型所谓
数据质量
那些年,我们一起踩过的坑大数据时代,数据成为社会和组织的宝贵资产,像工业时代的石油和电力一样驱动万物
王知无(import_bigdata)
·
2022-12-29 23:26
大数据
react
native
devops
qt4
consul
数据治理:认识数据治理
然而,不同数据团队或者不同企业对数据治理的理解和定义却不尽相同《一本书讲透数据治理》作者定义:所有为提高
数据质量
而展开的技术、业务和管理活动都属于数据治理范畴。
小明同学YYDS
·
2022-12-29 23:19
大数据
数据治理
大数据
人工智能
数据治理
数据挖掘
数据管理 数据治理 数据管控的概念区别和范围是什么?_光点科技
什么是数据治理狭义的数据治理的驱动力最早源自两个方面:(1)内部风险管理的需要,包括:财务做假、敏感数据涉密、
数据质量
差影响关键决策等。
光点数据治理
·
2022-12-29 21:04
科技
数据治理的流程以及需要注意的地方_光点科技
从理论上来讲,企业做数据治理的意义有四个方面,首先是提高
数据质量
,第二是改善决策能力,第三是降低潜在风险,第四是提高安全监管。1.提高
数据质量
光点数据治理
·
2022-12-29 21:04
大数据
java
人工智能
GNSS数据处理(一)——开源GNSS数据处理软件介绍
目录1、总体介绍2、软件下载链接3、数据下载4、下载方法1、总体介绍目的:介绍数据处理软件RTKLIB与
数据质量
分析软件G-Nut/Anubis的使用方法应用场景:静态短基线解算(大坝、桥梁、滑坡等形变监测
unbiliverbal
·
2022-12-28 08:56
GNSS数据处理
gnss
pandas dataframe column_数据清洗:pandas与excel对比学习
数据质量
准则:完全合一完整性:单条数据是否存在空值,统计的字段是否完整全面性:观察某一列的数据,excel中看一列数据的个数,pandas中,http://df.info()观察字段的类型、数据量;常识判断
weixin_39642622
·
2022-12-28 07:27
pandas
dataframe
column
pandas获取行号
Python数据分析与挖掘实战-基础篇总结(一)
数据挖掘建模过程:1.3常用的数据挖掘建模工具2、python数据分析简介2.1python环境搭建2.2python数据分析第三方库2.2.1Numpy基本操作2.2.2Pandas简单例子3、数据探索3.1
数据质量
分析
卞亚超
·
2022-12-27 11:49
机器学习-数据分析
大数据
数据挖掘
python
数据分析
DCMM评估内容
DCMM评估内容DCMM定义了数据战略、数据治理、数据架构、数据应用、数据安全、
数据质量
、数据标准和数据生存周期8个核心能力域和28个能力项:1.数据战略分为数据战略规划、数据战略实施和数据战略评估3个能力项
HB_18660785998
·
2022-12-26 22:02
大数据
人工智能
主数据的3大特征、4个超越和3个二八原则
不论是大数据还是小数据,持续地提升
数据质量
才是企业数据治理之道!主数据具备3个主要特征1、高价值:主数据是所有业务处理都离不开的实体数据,与大数据相
·
2022-12-26 18:02
数据
Meetup预告:SeaTunnel在天翼云数据集成平台的探索实践
大数据时代下,数据开发治理成为企业数据资产管理、提升
数据质量
、数据智能应用等过程的关键。数据开发治理成功与否,关系着实现能否实现企业数据价值的最大化。
·
2022-12-26 16:50
meetup技术分享数据同步
实用机器学习-2. 数据预处理
面积检查数字列的最大最小值是否合理过滤掉不正常值的列可视化方法displotsubplots/heaetmapboxplot2.数据清洗流程图2.1数据错误缺值、错误、极端值好的ML模型对错误容忍度很高,但是会影响精度把错误的模型部署在线上会影响新收集到的
数据质量
11408考研休息室
·
2022-12-26 11:25
数据挖掘
数据分析
人工智能
联邦学习的基本概念、三种框架和应用场景
下篇将从威胁模型和攻防现状入手介绍联邦学习的安全隐私现状…一、提出背景需求:人工智能是由大数据所驱动的,如2016年,AlphaGo总共使用了300,000个棋局作为训练数据,以取得出色的成绩现实:除少数行业外,大多数领域的数据有限,以孤岛形式存在,并且
数据质量
较差挑战
白白净净吃了没病
·
2022-12-26 07:15
联邦学习&安全隐私
人工智能
联邦学习
隐私安全
安全架构
【机器学习课程】第二章数据准备 2.
数据质量
分析
——爱因斯坦第二章数据准备2.
数据质量
分析2.1为什么要进行
数据质量
分析2.2
数据质量
分析工具2.3重复值检查2.4缺失值检查对空值进行操作2.5异常值检查数据取值异常利用箱型图的四分位距(IQR)对异常值进行检测利用
人工智能学术前沿(真)
·
2022-12-25 22:42
机器学习
python
数据分析
算法项目开展的数据准备及标注规范
标注数据的质量本身决定了算法天花板GoodMLreliesongooddata,Garbagein,garbageout训练的数据量
数据质量
提升测试集验证
贝叶斯巴达
·
2022-12-25 21:25
工作规范
人工智能
python
340页11万字智慧政务大数据资源平台数据治理方案
一.1.1 数据治理子系统建设大数据治理子平台,提供数据标准管理、元数据管理、
数据质量
管理能力,实现对数据的规范治理与管理;提供数据工厂能力,实现对归集的数据进行清洗、加工,支撑业务的数据应用需求
数字化方案
·
2022-12-25 14:46
大数据
flinkx-web管理界面-LarkMidTable数据中台篇
LarkMidTable是一站式开源的数据中台,实现元数据管理,数据仓库开发,
数据质量
管理,数据的可视化,实现高效赋能数据前台并提供
踏雪无痕2019
·
2022-12-25 03:07
flinkx-web
flinkx
数据中台
大数据
数据仓库
数据库
数据质量
管理—2、数据审核(Data Auditing)
前一篇文章介绍了
数据质量
的一些基本概念,
数据质量
控制作为数据仓库的基础环节,是保障上层数据应用的基础。
huryer
·
2022-12-25 03:32
etl
数据质量管理
数据审核
完整性
一致性
准确性
数据质量
管理—3、数据修正(Data Correcting)
前面的两篇文章——分析的前提—
数据质量
1和分析的前提—
数据质量
2分别介绍了通过DataProfiling的方法获取数据的统计信息,并使用DataAuditing来评估数据是否存在质量问题,数据的质量问题可以通过完整性
huryer
·
2022-12-25 03:01
etl
数据质量管理
数据修正
数据管理篇之
数据质量
第15章
数据质量
1.
数据质量
保障原则完整性准确性一致性及时性2.
数据质量
方法概述消费场景知晓(1)数据资产定义分为五个等级:①毁灭性质(A1),数据一旦出错,将会引起重大资产损失,面临重大受益损失,造成重大公共风险
道理你都懂
·
2022-12-25 03:00
大数据之路书籍阅读
人工智能
大数据
数据挖掘实战—财政收入影响因素分析及预测
文章目录引言一、数据探索1.
数据质量
分析1.1缺失值分析1.2异常点分析—箱型图分析1.3重复数据分析2.数据特征分析2.1描述性统计分析2.2分布分析2.3相关性分析二、数据预处理三、模型构建1.灰色预测模型
哎呦-_-不错
·
2022-12-24 17:46
#
数据挖掘项目实战
财政收入
数据挖掘
数据挖掘—GEO,TCGA,Oncomine联合(三)GEO数据的下载和
数据质量
分析
使用工具:R提示:以下是本篇文章正文内容,下面案例可供参考一、
数据质量
分析有什么用吗?GEO可以对芯片的数据进行管理,但是并不对数据的质量进行监控,所以
生信学徒
·
2022-12-24 08:34
数据挖掘
生物信息学
让金融机构轻松应对监管报送,网易数帆发布最新解决方案
近年来,随着人民银行、银保监会等监管机构对金融机构数据报送的制度与规则日益完善,需要提交报送的数据量越来越大,对
数据质量
及业务合规性的要求也越来越高。
·
2022-12-23 17:29
python数据整理规范形式_python数据分析与挖掘 | 数据预处理
数据预处理既要提高
数据质量
,又要让数据更好的适应建模工具。其主要内容包括数据清洗、数据集成、数据变换、和数据规约。
林兹克路
·
2022-12-23 16:13
python数据整理规范形式
《python数据分析与挖掘实战》(一)1-5章
目录1数据挖掘基础2Python数据分析简介2.1函数式编程map()reduce()filter()3数据探索3.1
数据质量
分析3.1.1缺失值分析3.1.2异常值分析餐饮数据异常值检测3.2数据特征分析
薄薄荷
·
2022-12-23 16:06
python
big
data
数据分析之特征分析(一)
1
数据质量
分析
数据质量
分析的主要任务是检查原始数据中是否存在脏数据。
weixin_43824060
·
2022-12-23 14:59
数据可视化
数据分析
python
数据质量
控制理论与实践经验
数据质量
管理是对数据从计划、收集、记录、存储、回收、分析和展示生命周期的每个阶段里可能引发的
数据质量
问题,进行识别、度量、监控、预警等一系列管理活动,并通过改善和提高组织的管理水平使得
数据质量
获得进一步提高
王知无(import_bigdata)
·
2022-12-22 18:09
大数据
编程语言
人工智能
数据分析
java
DCMM—数据管理能力发展中的挑战
为进一步推动DCMM标准在各行业中的落地实施,提升
数据质量
,保障数据安全,促进数据价值发挥,帮助各行业更好的落实国家关于数据要素的各项要求,推动产业数据化,数据产业化的进程。
资质规划引路人
·
2022-12-22 18:39
big
data
人工智能
物联网
军工机构、组织和企业的数据治理体系应该如何建设
但由于数据标准化体系不健全、基础
数据质量
不佳,导致各系统之间的交互成本高、数据采集难、精益管控难、横向协同弱,从而出现无法发挥基于数据协同的数字化管理效能等问题。
DCMM
·
2022-12-22 18:04
大数据
数据仓库
数据库架构
DCMM发展正在面临什么挑战?
为进一步推动DCMM标准在各行业中的落地实施,提升
数据质量
,保障数据安全,促进数据价值发挥,帮助各行业更好的落实国家关于数据要素的各项要求,推动产业数据化,数据产业化的进程。
D_ISO
·
2022-12-22 18:31
big
data
人工智能
物联网
集团型企业主数据管理框架、方法
主数据管理正是为解决各系统数据孤岛,建立数据标准化而产生的,通过主数据建设可以建立基础数据标准规范,提高
数据质量
,为企业统计分析提供
·
2022-12-22 17:59
数据
R语言数据预处理方案
R语言数据挖掘与实战一、数据探索通过检验数据集的
数据质量
、绘制图表、计算某些特质量等手段,对样本数据集的结构和规律进行分析的过程就是数据探索。
Gerry_RedBean
·
2022-12-21 21:32
临床数据挖掘
数据挖掘
机器学习
算法
3.SPSS Modeler数据基本分析笔记
Modeler数据基本分析包括5大块内容:1.
数据质量
分析2.描述性统计分析3.探索性分析4.二分类变量相关性分析5.变量的重要性分析学习相关知识1.
数据质量
探索数据挖掘的首要任务是对
数据质量
进行考察。
身边都是巨佬的菜王DoubleF
·
2022-12-21 13:10
SPSSModeler数据分析
数据分析
数据挖掘
big
data
pandas计算含缺失值中列平均值_
数据质量
:缺失数据处理
天空澄碧,纤云不染本文转载来源于微信公众号:数据仓库与Python大数据(ID:dw_zzxx)前言在几乎所有的数据仓库与数据分析挖掘项目中都会遇到缺失数据的存在,数据缺失会导致数据治好了变差,从而在数据分析项目中面临严重的数据问题。对于数值型数据,panda使用浮点数值NaN表示丢失的数据,本节的目标就是使用Pandas让处理丢失的数据变得尽可能轻松。一般情况下,我们会使用变量的平均值填充数值型
包林纯
·
2022-12-21 10:42
数据治理知识体系学习笔记
数据治理涉及组织体系、标准体系、流程体系、评价体系、技术体系几方面的内容,主要包含:元数据管理、主数据管理、数据标准管理、
数据质量
管理、数据安全管理等内容。
数据文字工作者
·
2022-12-20 12:08
数据治理
数据治理
抽样技术笔记
有可能获得比普查质量更高的
数据质量
。抽样调查又可分为概率抽样和非概率抽样。
小天使甲
·
2022-12-19 15:41
回归
最小二乘法
css导航栏悬浮在轮播图上面,如何设置半透明悬浮效果
简而言之就是,将导航的ul列表放在一个盒子里,然后导航栏置顶,设置透明度,设置z-index值效果图如下:页面代码:body:物联网设备管理系统数据交换系统
数据质量
校验系统大数据挖掘与分析系统大数据可视化管理系统
大聪明学前端
·
2022-12-19 10:59
css
html
前端
vue
css3
训练集与测试集数据分布不一致
简介
数据质量
的高低是决定使用机器学习算法获得预测结果质量高低的重要因素,在很多常见任务中,
数据质量
的作用远大于模型的作用,本文讨论数据预处理时会遇到的一个常见问题:训练集与测试集数据分布不一致。
懒编程-二两
·
2022-12-19 04:32
python
机器学习
人工智能
深度学习
大数据
黑马程序员《数据清洗》学习总结
目录1.1数据清洗的背景1.1.1
数据质量
概述1.1.2
数据质量
的评价标准1.1.3
数据质量
的问题分类1.2数据清洗的定义1.3数据清洗的原理1.4数据清洗的基本流程1.5数据清
子子木
·
2022-12-19 00:52
大数据
数据挖掘—数据预处理
数据清洗缺失值处理异常值处理2数据集成实体识别冗余属性识别数据变换简单函数变换规范化连续属性离散化属性构造3数据规约属性归约数值归约Python主要数据预处理函数数据预处理数据预处理的过程数据预处理的目的:1)提高
数据质量
W_chuanqi
·
2022-12-19 00:21
数据挖掘与可视化
数据挖掘
数据分析
机器学习
数据挖掘 | 实验一 数据的清洗与预处理
文章目录一、目的与要求二、实验设备与环境三、实验内容数据清洗数据集成数据变换(统一格式并标准化)四、实验小结一、目的与要求1)了解
数据质量
问题、掌握常用解决方法;2)熟练掌握数据预处理方法,并使用Python
寒夜点孤灯
·
2022-12-19 00:21
#
数据挖掘
数据挖掘
机器学习
数据清洗
Python
【数据清洗】总结
写在前面(201908):
数据质量
问题往往会影响到工作效果,我们学习现代工具后,很容易就建立起一个初步的模型。但是真正的工作是如何优化它,而关键节点就包括数据的清洗和模型的调优。
Lamcky
·
2022-12-19 00:51
数据分析
跨越数字化周期,
数据质量
如何影响和驱动业务增长
本文是根据DQMIS2020第四届
数据质量
管理国际峰会
数据质量
业务场景应用圆桌论坛现场嘉宾讨论整理而成。
hanxiaolaa
·
2022-12-17 19:03
数据治理
深度学习
数据挖掘
机器学习
大数据
数字货币
CDGA|工业互联网行业怎么做好数据治理?
目前,工业互联网行业快速发展下,企业面临着数据标准不统一、数据信息分散、
数据质量
参差不齐、数据安全隐患等问题。因此,数据治理对于工业互联网的发展至关重要。那么,工业互联网行业怎么做好数据治理呢?
hb15302782362
·
2022-12-17 16:56
弘博创新培训
深圳CDGA认证
深圳DAMA认证
大数据
数据治理
CDGA
CDGP
DAMA
上一页
13
14
15
16
17
18
19
20
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他