E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
pythonexcel数据清洗
【毕业设计】大数据分析的航空公司客户价值分析 - python
文章目录0前言1数据分析背景2分析策略2.1航空公司客户价值分析的LRFMC模型2.2数据2.3分析模型3开始分析3.1数据预处理3.1.1数据预览3.1.2
数据清洗
3.2变量构建3.3建模分析4数据分析结论
caxiou
·
2023-01-06 11:13
大数据
毕业设计
python
数据分析
航空公司客户价值分析
算法建模流程详解及python代码实现
算法建模前言建模的一般流程代码实现(以逻辑回归为例,重在解释流程)导入相关模块
数据清洗
及降维woe编码(好处不需要填充缺失值不需要数据标准化)检验多重共线性(在这步之后决定样本不平衡怎么处理)模型训练(
ecnu_frc_new
·
2023-01-06 11:04
机器学习算法相关知识
python
机器学习
数据分析
大数据
算法
机器学习算法构建流程
(一)
数据清洗
1.数据集完整性验证数据是否存在残缺2.数据集中是否存在缺失值缺失数据是很常见的。python中的pandas的部分函数是可以用来处理缺失值的。pandas使
隔壁王者新
·
2023-01-06 11:33
机器学习算法总结
机器学习算法
个性化推荐算法一,看看你的浏览如何被识别~
推荐算法推荐模型构建流程推荐算法概述基于协同过滤的推荐算法协同过滤实现一推荐模型构建流程Data(数据)->Features(特征)->MLAlgorithm(机器学习算法)->PredictionOutput(预测输出)
数据清洗
Echo-Niu
·
2023-01-06 10:43
人工智能
算法
人工智能
python编程语言排行曲线绘制_最新编程语言排名(TIOBE)-数据抓取及绘图(使用Python)...
本章数据分析的主要步骤:1、从网上获取公开数据:html网页2、读取html中表格数据3、
数据清洗
和整理4、数据绘图与可视化5、保存绘图接下来进行详细的说明1、从网上获取公开数据:html网页在学习编程开始的时候
weixin_39693193
·
2023-01-06 09:48
特征工程系列:时间特征构造以及时间序列特征构造
文章系列:特征工程系列:
数据清洗
特征工程系列:特征筛选的原理与实现特征工程系列:特征预处理特征工程系列:特征构造特征工程系列:时间特征构造以及时间序列特征构造前言数据和特征决定了机器学习的上限,而模型和算法只是逼近这个上限而已
安替-AnTi
·
2023-01-06 07:40
机器学习
时间序列
特征构造
【快乐Kaggle入门】Kaggle入门之比赛基本流程
目录1.数据读取2.
数据清洗
3.数据重构4.建模预测提交5.总结比赛的基本流程由四个部分组成:数据读取、
数据清洗
、数据重构、建模预测提交导包:importnumpyasnpimportpandasaspdimportpandas_profilingasppfimportjoblib
死亡只在一瞬间
·
2023-01-05 20:34
机器学习
深度学习
数据挖掘
数据预处理,插值拟合及回归分析
2.数据处理2.1
数据清洗
——缺失值和异常值的处理2.1.1缺失值处理:删除记录,数据插补或者不处理。最常见的是插补。1)均值/中位数/众数插补,用这些值代替缺失值。
七柒想齐
·
2023-01-05 19:42
数学建模小白
数据挖掘
人工智能
《
数据清洗
》第七章操作题
文章目录前言一、全量加载二、增量加载总结前言数据的加载机制与数据的抽取机制相类似,数据的加载机制可以分为全量加载和增量加载。其中,全量加载是指将目标数据表中的数据全部删除后,进行数据加载的操作;而增量加载是指目标表只加载源数据表中变化的数据,其中变化的数据包含新增、修改和删除的数据。一、全量加载假设,现有两张数据表,分别为数据表full_source和数据表full_target,其中数据表ful
月下清浊
·
2023-01-05 03:22
dba
etl工程师
深度梳理:机器学习建模调参方法总结
注意:文末提供技术交流方法前言建模调参:特征工程也好,
数据清洗
也罢,都是为最终的模型来服务的,模型的建立和调参决定了最终的结果。模型的选择决定结果的上限,如何更好的去达到模型上限取决于模型的调参。
Python数据挖掘
·
2023-01-05 02:56
python
机器学习
数据挖掘
人工智能
python
房屋信贷违约风险竞争(kaggle)系列3-探索性数据分析
探索性数据分析实例7.1异常7.2相关性7.3年龄对还款的影响7.4外部来源7.5最后平面图参考:概述探究性数据分析第一步将数据可视化,然后从图中理解数据的趋势,数据异常等问题,再对数据进行处理,例如
数据清洗
等操作
只是甲
·
2023-01-05 00:55
数据分析
+
机器学习
Python
#
Python数据分析与机器学习
数据分析
python
机器学习
2022泰迪杯数据分析技能赛B题方案及赛后总结:银行客户忠诚度分析
题题目为“银行客户忠诚度分析”,题目给出了短期客户产品购买数据“short-customer-data.csv”和长期客户资源信息数据的训练集“long-customer-train.csv”,需要进行
数据清洗
和预处理
Pluto_Ct
·
2023-01-04 18:03
竞赛
数据分析
python
一文看懂
数据清洗
:缺失值、异常值和重复值的处理
导读:在
数据清洗
过程中,主要处理的是缺失值、异常值和重复值。所谓清洗,是对数据集通过丢弃、填充、替换、去重等操作,达到去除异常、纠正错误、补足缺失的目的。
大数据v
·
2023-01-04 13:36
python-数据分析(10-
数据清洗
)
Pandas10Pandas之
数据清洗
10.1Pandas
数据清洗
数据清洗
介绍
数据清洗
实际上也是数据质量分析,检查原始数据中是否存在脏数据(不符合要求,或者不能直接进行分析的数据),并且处理脏数据。
看吉吉真香
·
2023-01-04 07:40
matlab
数据分析
python
CC00043.python——|Hadoop&Python.v07|——|Arithmetic.v07|Pandas数据分析库:Pandas
数据清洗
|
一、
数据清洗
###---
数据清洗
importnumpyasnpimportpandasaspddf=pd.DataFrame(data={'color':['red','blue','red','green
yanqi_vip
·
2023-01-04 07:39
数据分析
python
大数据
索引
elasticsearch
Python数据分析5——
数据清洗
目录Python
数据清洗
数据清洗
介绍处理缺失值判断数据是否为NaN过滤缺失值补全缺失值异常值处理重复数据判断重复值删除重复值离散化向量化字符串函数Python
数据清洗
数据清洗
介绍
数据清洗
实际上也是数据质量分析
彩色的泡沫
·
2023-01-04 07:05
python数据分析
数据挖掘
python
数据分析
100天精通Python(数据分析篇)——第68天:Pandas
数据清洗
函数大全(判断缺失、删除空值、填补空值、替换元素、分割元素)
文章目录一、drop():删除指定行列1.删除指定行2.删除指定列二、del():删除指定列三、isnull():判断是否为缺失1.判断是否为缺失2.判断哪些列存在缺失3.统计缺失个数四、notnull():判断是否不为缺失五、dropna():删除缺失值1.导入数据2.删除含有NaN值的所有行3.删除含有NaN值的所有列4.删除元素都是NaN值的行5.删除元素都是NaN值的列6.删除指定列中含有
无 羡ღ
·
2023-01-04 07:30
python
pandas
数据分析
电影数据分析
电影数据分析背景概述提出问题本文主要研究以下几个问题:导入对应的包理解数据导入数据查看数据集信息
数据清洗
数据分析及可视化问题一:电影类型如何随着时间的推移发生变化的?
weixin_54672002
·
2023-01-03 12:08
数据分析
python
数据挖掘
电商评论数据聚类实验报告
电商评论数据聚类实验报告——冯煜博目录实验目的整体思路数据介绍代码与实验步骤4.1爬虫代码4.2
数据清洗
4.3分词4.4去停用词4.5计算TF-IDF词频与聚类算法应用4.6生成词云图实验结果5.1词云图
weixin_30519071
·
2023-01-03 10:20
python
json
爬虫
NEFU数据仓库与数据挖掘复习
文章目录数据仓库和数据挖掘概述数据仓库数据仓库的两个主要作用数据仓库的关键特征数据仓库的三级模型OLAPOLAP概述OLAP与DWOLAP与OLTPOLAP的特性OLAP的分析方法OLAP的数据组织ROLAP和MOLAP的对比数据预处理
数据清洗
数据集成模式匹配问题冗余问题数据值冲突问题数据变换数据归约联机分析处理数据仓库和数据挖掘概述定义
之子与安
·
2023-01-03 10:40
数据仓库
数据挖掘
数据库
NEFU数据科学导论(三)数据预处理
一、总过程二、
数据清洗
·2.1什么是
数据清洗
?
NEFU-Go D 乌索普
·
2023-01-03 10:07
数据挖掘
人工智能
1153天数据告诉你黄山云海在哪些天容易遇见
黄山风景区管理委员会官网>气象信息原创:Ing_ideas文章目录1153天数据告诉你黄山云海在哪些天容易遇见@[toc]一、数据获取1.request请求2.lxml结合xpath解析网页源代码3正则提取文本二、
数据清洗
将数据去重
Ing_ideas
·
2023-01-03 09:20
数据挖掘
python
数据清洗
与准备:缺失值、重复值、异常值处理
目录一、缺失值处理(1)判断缺失值(2)去掉缺失值(3)填补缺失值(二)重复值处理(针对于dataframe里面的重复行)(1)判断是否重复出现(2)处理重复行三、异常值处理(1)挑选异常值(2)处理异常值(比如超过了区间范围内的值)一、缺失值处理(1)判断缺失值(data类型为series/dataframe)data.isnull()##返回布尔值对象,缺失值即为true.data.notnu
是Yvonne一碗呀
·
2023-01-03 07:28
python
开发语言
数据分析
机器学习
python缺失值与异常值处理_python实现
数据清洗
(缺失值与异常值处理)
1。将本地sql文件写入mysql数据库本文写入的是python数据库的taob表source[本地文件]其中总数据为9616行,列分别为title,link,price,comment2。使用python链接并读取数据查看数据概括#-*-coding:utf-8-*-#author:M10importnumpyasnpimportpandasaspdimportmatplotlib.pylaba
weixin_39577908
·
2023-01-03 07:56
python缺失值与异常值处理
python缺失值与异常值处理_python数据分析之清洗数据:缺失值处理
在使用python进行数据分析时,如果数据集中出现缺失值、空值、异常值,那么
数据清洗
就是尤为重要的一步,本文将重点讲解如何利用python处理缺失值创建数据为了方便理解,我们先创建一组带有缺失值的简单数据用于讲解检查缺失值对于现在的数据量
weixin_39762348
·
2023-01-03 07:56
python缺失值与异常值处理
数据清洗
用python处理缺失值_python实现
数据清洗
(缺失值与异常值处理)
{"moduleinfo":{"card_count":[{"count_phone":1,"count":1}],"search_count":[{"count_phone":4,"count":4}]},"card":[{"des":"阿里技术人对外发布原创技术内容的最大平台;社区覆盖了云计算、大数据、人工智能、IoT、云原生、数据库、微服务、安全、开发与运维9大技术领域。","link1":
weixin_39618275
·
2023-01-03 07:26
Python中
数据清洗
缺失值,重复值和异常值的处理
1缺失值的处理1.1常规缺失值的处理np.nan,NaN,None,NaT(时间数据类型的缺失值)等df.isnull()1.判断每一个df中的数据是否为缺失值,是则返回True,否则返回False2.可以利用True为1,False为0的特性,sum()即为缺失值数量df.notnull()判断每个df中的值是否不为缺失值,是不为缺失值返回True,不是不为缺失值则返回Falsedf.dropn
Ifordzhang
·
2023-01-03 07:56
数据分析
python
hive sql 的三种去重方法总结
sql字段去重在从数据库中取数据或者进行
数据清洗
的过程中,经常会遇到去重复问题,常用的去重方法包括三种方式。接下来主要介绍常用的三种方式以及最优方法。
maligebilaowang
·
2023-01-02 15:57
数据库相关(sql)
hive
sql
大数据
【Python模块学习】pandas模块简介
另一方面,numpy适用于处理“干净”的数据,及规范、无缺失的数据,而pandas更加擅长
数据清洗
(dat
Buffedon
·
2023-01-02 15:55
python基础
python
数据分析
pandas
Python代码实操:详解
数据清洗
导读:此前的文章《一文看懂
数据清洗
:缺失值、异常值和重复值的处理》中,我们介绍了
数据清洗
的过程和方法,本文给出各步骤的详细代码,方便你动手操作。
大数据v
·
2023-01-02 11:42
2021年最有用的
数据清洗
Python 库
对于许多数据工作者来说,数据的清理和准备也往往是他们工作中最不喜欢的部分,因此他们将另外20-30%的时间花在抱怨上,这虽然是一个玩笑,但是却很好的反应了
数据清洗
在数据分析工作当中的特殊地位在平时的工作生活中
zhouluobo
·
2023-01-02 07:53
python
整理了 34 个 Python 自动化办公库
PythonExcel
自动化库//1.xlwings库官网:https://www.xlwings.org/特点:xlwings是开源且免费的,预装了Anaconda和WinPython,可在Windows
淋风沐雨
·
2023-01-02 07:51
python
【英文文本分类实战】之一——实战项目总览
[1]总览 【英文文本分类实战】系列共六篇文章: 【英文文本分类实战】之一——实战项目总览 【英文文本分类实战】之二——数据集挑选与划分 【英文文本分类实战】之三——
数据清洗
【英文文本分类实战
征途黯然.
·
2023-01-01 13:32
自然语言处理
文本分类
实战
英文文本
pytorch
【英文文本分类实战】之五——数据加载
接着,我们需要对训练集train.csv、验证集dev.csv、测试集test.csv中的每一条文本,先进行
数据清洗
,接着把每条文本的单词以词典中的序号来替代。代
征途黯然.
·
2023-01-01 13:01
自然语言处理
文本分类
英文文本
文本分类实战
pytorch
【英文文本分类实战】之四——词典提取与词向量提取
【注】:“清洗”可参见博客【英文文本分类实战】之三——
数据清洗
。 1、为什么要提取词典,转存为pkl文件? ——
征途黯然.
·
2023-01-01 13:58
自然语言处理
文本分类
pytorch
英文文本
文本分类实战
python
数据清洗
的三个常用的处理方式!
关于python数据处理过程中三个主要的
数据清洗
说明,分别是缺失值/空格/重复值的
数据清洗
。这里还是使用pandas来获取excel或者csv的数据源来进行数据处理。
Python 集中营
·
2023-01-01 01:26
python
python
pandas
数据分析
python的pandas清除负数数据-Pandas 数据处理,
数据清洗
详解
#-*-coding:utf-8-*-frompandasimportDataFrameimportpandasaspdimportnumpyasnp"""获取行列数据"""df=DataFrame(np.random.rand(4,5),columns=["A","B","C","D","E"])printdfprintdf["col_sum"]=df.apply(lambdax:x.sum()
weixin_39915308
·
2022-12-31 20:18
千万级
数据清洗
ETL设计方案
千万级
数据清洗
项目分析总结项目简介一、需求分析1.前期需求2.中期需求3.后期需求二、技术支持1.MySQL2.Redis三、框架设计1.流线型代码2.工厂模式四、调式工作1.线上测试五、问题回顾1.Mysql
成都—大数据开发工程师—杨洋
·
2022-12-31 10:26
python
数据库
mysql
redis
sql
ETL
数据清洗
MapReduce-ETL
数据清洗
(From 尚硅谷)
个人学习整理,所有资料来自尚硅谷B站学习连接:添加链接描述MapReduce—ETL
数据清洗
1.ETL
数据清洗
“ETL",Extract-Transform-Load的缩写,用来描述将数据从来源端经过抽取
lavineeeen
·
2022-12-31 10:26
Hadoop
mapreduce
etl
hadoop
ETL过程中
数据清洗
(脏数据处理)小结
那么,对于ETL过程中的
数据清洗
,你一般会怎么做呢?
派可数据BI可视化
·
2022-12-31 10:26
数据库
big
data
电商离线数仓项目-DWD层ETL
数据清洗
,最大亮点之自定义UDF函数
ODS层所得到的数据,是最原始的数据,保持原貌,不做任何的改变,例如id:1name:zhangsan类型字段加上字段值。在导入DWD层的时候,我们要对这个数据做处理,只取到value值,去除字段的名称。这里面用到UDF(一进一出)和UDTF(一进多出)。展示一条最初始的数据:这条数据,红色框起来的部分是基本字段对应一对一出。而蓝色框起来的部分是一进多出。所要的格式如下:要对获取到的日志数据进行处
梦里Coding
·
2022-12-31 10:55
Hive
hive
maven
big
data
ETL
数据清洗
工具总结
转自:https://www.cnblogs.com/yuyu666/p/10049912.htmlETL
数据清洗
工具总结用excel做
数据清洗
,少量数据和表还行,如果上百万就很痛苦了,毕竟性能在那。
yujkss
·
2022-12-31 10:23
大数据
ETL
数据清洗
代码操作
数据清洗
数据清洗
:洗衣服=》脏东西洗出来
数据清洗
=》脏数据有的时候数据并非全部需要不符合格式的数据不是所有的数据都符合目前情况或缺少值清除掉1、给默认值2、转化比如男女3、删除错误数据,不符合格式的数据
九八年的尾巴
·
2022-12-31 10:53
Hadoop
大数据
java
hadoop
ETL
数据清洗
的案例
数据清洗
(ETL)Extract-Transform-Load,用来描述将数据从来源端经过抽取(Extract)、转换(Transform)、加载(Load)至目的端的过程。
未来影子
·
2022-12-31 10:22
hadoop
etl
mapreduce
hadoop
关于ETL的两种架构(ETL架构和ELT架构)
ETL是构建数据仓库的重要一环,用户从数据源抽取出所需的数据,经过
数据清洗
,最终按照预先定义好的数据仓库模型,将数据加载到数据仓库中去。ETL在转化的过程中,主要体现在以
微服务 spring cloud
·
2022-12-31 10:51
etl
数据仓库
数据库
Hadoop MapReduce ETL
数据清洗
| 案例实操
文章目录一、什么是ETL
数据清洗
?二、案例实操1、需求分析2、撸代码一、什么是ETL
数据清洗
?ETL英文名:Extract-Transform-Load,用来讲数据从来源端经过抽取(Extrac
lesileqin
·
2022-12-31 10:21
大数据学习笔记
Hadoop
大数据
mapreduce
hadoop
etl
java
数据清洗
(ETL)
运行核心业务MapReduce程序之前,往往要先对数据进行清洗,清理掉不符合用户要求的数据。清理的过程往往只需要运行Mapper程序,不需要运行Reduce程序。1.需求去除日志中字段个数小于等于11的日志。(1)期望输出数据每行字段长度都大于11。2.需求分析需要在Map阶段对输入的数据根据规则进行过滤清洗。3.实现代码(1)编写Mapper类packagecom.etl;importorg.a
asd623444055
·
2022-12-31 10:19
etl
mapreduce
hadoop
Hadoop案例:
数据清洗
(ETL)
目录1.概述2.需求3.代码实现3.1编写WebLogMapper类3.2编写WebLogDriver类1.概述“ETL,是英文Extract-Transform-Load的缩写,用来描述将数据从来源端经过抽取(Extract)、转换(Transform)、加载(Load)至目的端的过程。ETL一词较常用在数据仓库,但其对象并不限于数据仓库在运行核心业务MapReduce程序之前,往往要先对数据进
小M姐姐呀~
·
2022-12-31 10:19
大数据
etl
hadoop
big
data
mapreduce
大数据
MapReduce中ETL
数据清洗
案例
在实际业务场景中,我们在对数据处理时会先对数据进行清洗,比如过滤掉一些无效数据;清洗数据只需要map阶段即可,不需要reduce阶段。在该案例中我们要实现的是员工表数据中只留下部门编号为d01的数据。数据准备001,Tina,d03002,Sherry,d01003,Bob,d01004,Sam,d02005,Mohan,d01006,Tom,d03新建project:引入pom依赖4.0.0wy
QYHuiiQ
·
2022-12-31 10:48
大数据之Hadoop
etl
大数据
数据仓库
hadoop
ETL
数据清洗
大多数据仓库的数据架构可以概括为:数据源-->ODS(操作型数据存储)-->DW-->DM(datamart)ETL贯穿其各个环节。一、数据抽取:可以理解为是把源数据的数据抽取到ODS或者DW中。1.源数据类型:关系型数据库,如Oracle,Mysql,Sqlserver等;文本文件,如用户浏览网站产生的日志文件,业务系统以文件形式提供的数据等;其他外部数据,如手工录入的数据等;2.抽取的频率:大
jerry-89
·
2022-12-31 10:45
ETL
etl
数据仓库
数据挖掘
上一页
29
30
31
32
33
34
35
36
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他