E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
pythonexcel数据清洗
Hive实战 —— 电商数据分析(全流程详解 真实数据)
目录前言需求概述
数据清洗
数据分析一、前期准备二、项目1.数据准备和了解2.确定数据粒度和有效列3.HDFS创建用于上传数据的目录4.建库数仓分层5.建表5.1近源层建表5.2.明细层建表为什么要构建时间维度表
Byyyi耀
·
2024-01-27 08:25
hive
数据分析
hadoop
[AIGC] 后台开发者必看:大数据背景下的关键技能与难点
文章目录后台开发者必看:大数据背景下的关键技能与难点关键技能1.数据结构和算法2.分布式计算3.数据库技术4.编程语言难点1.数据安全2.高并发访问3.
数据清洗
与预
专注于Java中间件的程序员木木
·
2024-01-27 07:30
AIGC
生成的文章
大数据
后端
分布式
Matpoltlib && Pandas 学习笔记
目录Matplotlibmatplotlib常用方法散点图饼图直方图Pandaspandas.Series(*args)参数说明DataFrame数据结构CSVfile
数据清洗
Matplotlib定义:
_pass_
·
2024-01-27 03:00
data_alaysis
pandas
笔记
matplotlib
2024年深圳市工业和信息化局软件产业高质量发展技术创新体系扶持计划产业链关键环节提升项目申请指南
(一)大数据:重点支持数据采集、
数据清洗
、数据分析发掘、数据可视化、大数据行业应用、联邦学习、隐私计算等领域。(二)云计算:重点支持平台即服务(PaaS)、软件即服务(SaaS)等领域。
高新技术企业认定条件
·
2024-01-27 00:46
项目政策
大数据
Seer*Stat乳腺癌数据预测模型-Step1
数据清洗
和预处理
这里写自定义目录标题通过R语言进行数据的清洗进入R官网下载环境下载IDE:Rstudio一些基本的小命令使用Rstudio对Seer乳腺癌数据进行清洗通过R语言进行数据的清洗由于刚从Seer上面下载的数据需要进行预处理,不然模型是无法读懂字符串的,也有一些数据的预处理操作也要执行。进入R官网下载环境https://www.r-project.org/这是官网,进入官网之后,点击downloadR即
m0_51876286
·
2024-01-26 20:45
r语言
算法
数据中台架构原理与开发实战:构建数据中台的步骤与方法
1.背景介绍数据中台概述数据中台(DataCentral)是一个集成不同的数据源、
数据清洗
、数据转换、数据分析等工具为用户提供数据服务的多样化平台。
OpenChat
·
2024-01-26 20:15
AI实战
大数据AI人工智能
Python实战
大数据
人工智能
语言模型
Java
Python
架构设计
Pandas数据大师之路-高级应用与性能优化【第35篇—python:Pandas数据大师】
文章目录引言Pandas简介安装Pandas读取Excel文件数据操作示例:计算平均值示例:筛选数据写入Excel文件实例:读取并写入新表格
数据清洗
与转换缺失值处理数据类型转换分组与聚合数据可视化进一步学习高级功能与进阶应用多表关联与合并时间序列分析自定义函数应用性能优化与大数据处理持续学习与实践结语引言在日常的数据处理工作中
一见已难忘
·
2024-01-26 15:41
pandas
python
开发语言
数据处理
数据大师
数据治理为什么要清洗数据
而
数据清洗
作为数据治理的重要环节之一,更是不可或缺的一部分。
数据清洗
是指在数据获取和处理过程中,对于不规范、重复、缺失、错误或不完整的数据进行纠正、清理和补充的过程。它可以帮助组织规范
qingyunliushuiyu
·
2024-01-26 09:02
数据治理
数据清洗
数据治理体系
【Kaggle】泰坦尼克号生存预测 Titanic
文章目录前言案例背景数据集介绍加载数据集探索性数据分析(EDA)可视化特征和目标值之间关系缺失值分析数据预处理
数据清洗
缺失值处理去除噪声并且规范化文本内容数据转换数据划分建模逻辑回归模型决策分类树模型随机森林模型梯度提升树模型预测
撕得失败的标签
·
2024-01-26 04:24
Kaggle
机器学习
Kaggle
泰塔尼克号
Titanic
逻辑回归
分类树
天池赛:淘宝用户购物行为数据可视化分析
目录前言一、赛题介绍二、
数据清洗
、特征构建、特征可视化1.数据缺失值及重复值处理2.日期分离,PV及UV构建3.PV及UV可视化4.用户行为可视化4.1各个行为的面积图(以UV为例)4.2各个行为的热力图
wjzeroooooo
·
2024-01-26 01:52
数据分析
数据可视化
数据分析
python
PowerBI商业智能分析引入,带你了解什么是商务智能
PowerBl是微软开发的一个软件,它是从获取数据、
数据清洗
、数据图表搭建、数据分析、共享发布为一体的软件,无论你的数据是简单的Excel电子表格,还是复杂庞大的数据库,PowerBl都可轻松地连接到数据源
大话数据分析
·
2024-01-25 23:09
powerbi
大数据时代的清道夫:JVS-BI的
数据清洗
加工引擎解析
其中,
数据清洗
加工是最为关键的一环,它涉及到数据的关
jonyleek
·
2024-01-25 14:49
信息可视化
大数据
数据可视化
数据分析
java
gitee
开源
爬虫模板(附完整代码+案例)
目录背景1、写入空白Excel2、提供URL、headers、cookies、params3、
数据清洗
,这里大家各有各的办法,依情况而定可以使用re正则表达式,如:可以使用xpath,如:可以使用字典,
一晌小贪欢
·
2024-01-25 14:42
Python爬虫
爬虫
Selenium + Django + Echarts 实现亚马逊商品数据可视化爬虫项目
项目功能简介根据用户输入商品名称、类别名称,使用Selenium,BS4等技术每天定时抓取亚马逊商品数据,使用Pandas进行
数据清洗
后保存在MySql数据库中.使用Django提供用户端功能,显示商品数据
__弯弓__
·
2024-01-25 06:02
selenium
django
echarts
西班牙高速列车票价预测分析--数据分析实战
知识点
数据清洗
特征工程预测模型构建数据集预处理数据在资源里。现在先来加载数据,通过下面代码下载数据。加载并预览数据前五行importpand
HHAoW
·
2024-01-24 18:52
数据分析实战
数据分析
数据挖掘
机器学习
乳腺癌预测_EDA_Models
**关于数据集**预测过程1.安装包2.加载库3.导入数据4.
数据清洗
5.EDA重复行缺失值单变量分析正态性检验双变量分析年龄与肿瘤大小(cm)肿瘤大小(cm)与诊断结果肿瘤大小(cm)与转移多元分析6
老虎也淘气
·
2024-01-24 14:16
数据解析之旅:发现信息的奥秘
人工智能
银行数据仓库体系实践(4)--数据抽取和加载
Extract、Transfrom、Load即抽取、转换、加载三个英文单词首字母的集合:E:抽取,从源系统(Souce)获取数据;T:转换,将源系统获取的数据进行处理加工,比如数据格式转化、数据精度转换、
数据清洗
南极找南
·
2024-01-24 07:12
银行数据仓库
数据仓库
2021-06-17 第二章:
数据清洗
及特征处理
2.1缺失值观察与处理2.1.1任务一:缺失值观察pandas里边查找NaN值的话,可以是.isna(),也可以是.isnull()isna的意思是判断是不是notanumber,主要是数值字段;isnull的意思是判断是否为空值1)df.isna().sum()查看空值信息df.isnull().sum()查看空值信息df.info()查看数据信息2)df[['Age','Cabin','Emb
Akai_
·
2024-01-24 06:10
Day 6--学习笔记(gfg)
dplyr包可用于处理R内部或者外部的结构化数据,主要用于
数据清洗
和整理,主要功能有:行选择、列选择、统计汇总、窗口函数、数据框交集等。
爱学习的郭富贵
·
2024-01-24 05:23
超实用!整理了34个Python自动化办公库!
PythonExcel
自动化库//1.xlwings库官网:https://www.xlwings.org/特点:xlwings是开源且免费的,预装了Anaconda和WinPython,可在Win
乔代码嘚
·
2024-01-23 16:50
python
自动化
开发语言
CC工具箱使用指南:【清洗字段值】
二、工具参数介绍点击【字符串相关】组里的【字段
数据清洗
】工具:即可打开下面的工具框界面:1、选择要素图层或
规划GIS会
·
2024-01-23 13:13
CC工具箱使用帮助
arcgis
c#
arcgis
pro二次开发
CC工具箱
arcgis
pro
sdk
Python数据分析:实战都有哪些
以下是一些常见的实战项目示例:
数据清洗
和预处理:对数据集进行清洗、填充缺失值、处理异常值、标准化、归一化等操作。
独木人生
·
2024-01-23 10:45
python
python
数据分析
数据仓库系列10- 数据仓库规范
image.png当前DW结构现况image.png1.1.1ODS(源数据层) ODS层,是最接近数据源中数据的一层,为了考虑后续可能需要追溯数据问题,因此对于这一层就不建议做过多的
数据清洗
工作,原封不动地接入原始数据即可
只是甲
·
2024-01-23 06:20
全国快递物流 API 实现快递单号自动识别的原理解析
数据采集和处理全国快递物流API的数据采集和处理过程主要包括爬虫、
数据清洗
和数据标准化三个步骤。下载.png数据采集和处理的技术难点下载(2).png快递单号识别的原理单号识别是指通过一
API小百科_APISpace
·
2024-01-23 03:40
MySQL修炼手册13:存储过程初探:提高数据库操作效率
存储过程中的流程控制2.1IF语句的使用2.2循环与分支控制2.2.1WHILE循环2.2.2REPEAT循环2.2.3LOOP循环2.2.4CASE语句3存储过程的应用场景3.1存储过程在业务逻辑中的应用3.1.1
数据清洗
与转换
theskylife
·
2024-01-22 21:29
数据库
数据库
mysql
android
sql
2023-02-14:实习工作的阶段性进展
实习到岗第十天,
数据清洗
保存上传任务仍未完成。周频和月频数据的清洗有一定的相似性。以日频为例,首先要将日频数据对应到所属周数上,其次要考虑周频数据内空值的影响大不大。
aceCrasher
·
2024-01-22 16:36
【爬虫、数据可视化实战】以“人口”话题为例爬取实时微博数据并进行舆情分析
流程:这里主要可以分为三个流程:1、数据爬取2、
数据清洗
3、数据可视化流程如下所示:数据爬取:这里TaoTao采用的方式是使用pyt
陶陶name
·
2024-01-22 15:22
信息可视化
爬虫
Stata 爬虫:如何爬取并清洗民政部行政区划代码数据
下载行政区划代码(Stata爬虫)Stata爬虫
数据清洗
与主数据对接(merge)这里使用的行政区划代码数据来自于民政部:2020年12月中华人民共和国县以上行政区划代码。首先网页爬取和数据导入。
虹衣剑客
·
2024-01-21 17:57
数据分析完整流程一般包括哪几个环节/步骤
数据清洗
:对收集到的数据进行清理,处理缺失值、异常值和重复值,确保数据质量。数据探索(探索性数据分析EDA):探索数据的特征、分布、相关性等,通过可视化和统计方法深入了解数据。
Recursions
·
2024-01-21 07:21
数据分析
数据去重(完全去重和不完全去重)
不完全去重指的是在
数据清洗
中,所有字段值都相等的重复值是一定要剔除的。一、完全去重:1.数据准备与查看数据2.在Kettle新建转换,添加“CSV文件输入”控
殊迟
·
2024-01-21 06:20
etl
大数据
etl
etl工程师
决策树在商业保险中的应用
决策树在商业保险中的应用决策树在商业保险中的应用⼀、业务背景二、数据探索性分析2.1、导入数据和安装包2.2了解数据特征的分布情况2.3了解数据特征与标签之间的相关性强弱三、
数据清洗
3.1删除不需要的列
哆啦A梦呀
·
2024-01-20 17:23
1024程序员节
数据分析
决策树
机器学习
python
数据处理中的ETL概念
是构建数据仓库的重要一环,用户从数据源抽取出所需的数据,经过
数据清洗
,最终按照预先定义好的数据仓库模型,将数据加载到数据仓库中去。
GTW_Zeus
·
2024-01-20 17:19
【Zeus】数据库类
java
前端
javascript
华为外包数据库面试问题分享20211225
(指的是
数据清洗
)用过哪些ETL方面的商用工具。数据库方面做过哪些,例如安装部署、开发支持、运维、调优?SQL调优这块你是怎么在做的。数仓的东西了解多少。数据库开发支持这方面你做过哪些。
钦䲹
·
2024-01-19 16:05
数据库
华为
面试
Pandas助力表格操作提升生产力,以销售表格为例
Pandas助力表格操作提升生产力1.数据加载和预览2.
数据清洗
和处理3.数据分析和统计实战案例:销售数据分析步骤1:数据加载和预览步骤2:
数据清洗
和处理步骤3:数据分析和可视化结尾1.数据加载和预览首先
Silver__Wolf
·
2024-01-19 15:16
pandas
数据中台概念
数据中台1.数据中台模块数据采集数据存储数据处理数据分析数据应用2.数据中台的核心功能数据采集与集成
数据清洗
与预处理数据建模与存储数据分析与挖掘数据可视化与报告数据质量管理数据安全与隐私保护数据共享与开放
大数据驱动
·
2024-01-19 14:40
#
8数据中台-S级
信息可视化
大数据
利用 Apache Spark 和 Databricks 进行企鹅种类预测的机器学习实践入门
然后进行
数据清洗
,包括删除缺失数据和数据类型转换。随后,数据被分为70%的训练集和30%的测试集,以便于后续的模型训练和评估。在对机器学习的特征工程部分包括了对分类特征的编码和数值特征的规范化处
AI普惠大师
·
2024-01-19 06:17
机器学习
人工智能
大模型部署过程中需要注意的事项
在数据集的准备过程中,
数据清洗
是一个关键环节,包括去除数据中的无关信息,例如错
英智未来
·
2024-01-19 01:51
人工智能
语言模型
Kettle基本概念 之 Kettle设计模块
转换包括一个或多个步骤(step),如读取文件、过滤输出行、
数据清洗
或将数据加载到数据库。转换里的步骤通过跳(hop)来连接,跳定义了一个单向通道,允许数据从一个步骤向另一个步骤流动。
小纠结在简书
·
2024-01-18 18:56
机器学习根据金标准标记数据-九五小庞
数据清洗
和预处理:在这一步,需要对收集到的数据进行清洗和预处理,以消除异常值、缺失值和重复值,确保数据的质量和可用性。金标准标记:金标准标记是对数据进行的一种标准化和规范化的过程。
Up九五小庞
·
2024-01-18 16:49
人工智能-AI
机器学习
人工智能
数据清洗
具备的基本函数
left():left()函数是一个字符串函数,,它返回具有指定长度的字符串的左部分。=LEFT(text,[num_chars]):text文本单元格,[num_chars]:字符串长度right():right()函数是一个字符串函数,,它返回具有指定长度的字符串的右部分。=RIGHT(text,[num_chars]):text文本单元格,[num_chars]:字符串长度MID():mid
Lowe-小码
·
2024-01-18 12:28
excel
大创项目推荐 深度学习的智能中文对话问答机器人
文章目录0简介1项目架构2项目的主要过程2.1
数据清洗
、预处理2.2分桶2.3训练3项目的整体结构4重要的API4.1LSTMcells部分:4.2损失函数:4.3搭建seq2seq框架:4.4测试部分
laafeer
·
2024-01-18 09:11
python
【机器学习实例讲解】机器学习-鸢尾花数据集多分类第02课
数据预处理:
数据清洗
:处理缺失值、异常值、重复值等问题。数据转换:对数据进行规范化、标准化、归一化等操作以适应模型要求。特征编码:将非数值特征(如类别标签)转化为数值形式。特征工程
德天老师
·
2024-01-18 08:45
AI模型专栏
机器学习
分类
人工智能
阿里云大数据ACA及ACP复习题(121~140)
121.
数据清洗
(DataCleaning)是用于检测和纠正(或删除)记录集,表或数据库中的不准确或损坏的记录。
周周的奇妙编程
·
2024-01-18 03:07
阿里云
大数据
云计算
结构化数据挖掘
传统建模流程主要建立在业务理解上,90%时间用在DC(
数据清洗
)和EDA上。存在的问题业务理解是一个悖论——科学的业务理解需要来自对数据宏观的分析,而分析
AntiGravity
·
2024-01-17 23:01
风控算法大赛解决方案分享
01项目总体思路本文将为您介绍我们在数据处理过程中所采用的方法,从
数据清洗
到特征工程再到特征选择,最终进行模型设计与分析。在
风控小兵突击
·
2024-01-17 23:29
智能风控
算法
机器学习
支持向量机
金融
2022-03-21
#知识##校园学习##NLP##自然语言处理##人工智能专业建设##textblob##文本
数据清洗
##实验视频##正则表达式##Python##keras##文本分词#个人用户获取相关代
跨象乘云
·
2024-01-17 19:45
第十五周周报
经过
数据清洗
、数据预处理、数据分词等操作后,使用LDA模型进行分析,最后分成4个主题,每个主题具有不同关键词的概率
Joy_moon
·
2024-01-17 15:12
机器学习
数据分析
Pandas实战100例 | 案例 48: 检测重复行
案例48:检测重复行知识点讲解在
数据清洗
过程中,识别和处理重复的行是一个常见的任务。Pandas提供了duplicated方法来检测重复的行。
惊鸿若梦一书生
·
2024-01-16 15:59
Pandas实战100例
pandas
电商数据分析--常见的数据采集工具及方法
电商数据分析中,常见的数据采集工具及方法有下面几种:可以做数据抓取,
数据清洗
、分析、挖掘、可视化等。采集数据,所有爬虫需要在自己电脑上跑。免费
电商数据girl
·
2024-01-16 14:31
数据分析
数据挖掘
大数据
python
php
java
c++
数据清洗
:确保数据质量的关键步骤
在数据分析和处理的过程中,
数据清洗
是一个非常重要的环节。它的目的是确保数据的准确性、完整性和一致性,从而为后续的分析和决策提供可靠的基础。
正儿八经的数字经
·
2024-01-16 14:00
数字经济
python
人工智能
大数据
上一页
1
2
3
4
5
6
7
8
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他