E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
python后端数据清洗
关于ETL的两种架构(ETL架构和ELT架构)
ETL是构建数据仓库的重要一环,用户从数据源抽取出所需的数据,经过
数据清洗
,最终按照预先定义好的数据仓库模型,将数据加载到数据仓库中去。ETL在转化的过程中,主要体现在以
微服务 spring cloud
·
2022-12-01 14:45
etl
数据仓库
数据库
信用卡评分模型
数据来源来自kaggle上的数据:https://www.kaggle.com/c/GiveMeSomeCredit/data项目流程理解数据包括导入数据,查看数据集信息,从整体上了解数据探索性数据分析和
数据清洗
主要研究各个变量内部结构
violetcc67617
·
2022-12-01 09:18
学习记录
信用卡评分建模
【Python】详解pandas缺失值处理
缺失值处理常用于数据分析
数据清洗
阶段;Pandas中将如下类型定义为缺失值:NaN:‘’,‘#N/A’,‘#N/AN/A’,‘#NA’,‘-1.#IND’,‘-1.
风度78
·
2022-12-01 01:08
人工智能
python
数据分析
java
机器学习
【Python】pandas 缺失数据处理大全(附代码)
利用闲暇之余将有关
数据清洗
、数据分析的一些技能再次进行分类,里面也包含了我平时用到的一些小技巧,此次就从
数据清洗
缺失值处理走起,链接:pandas
数据清洗
,关注这个话题可第一时间看到更新。
风度78
·
2022-12-01 01:38
人工智能
python
数据分析
java
大数据
数据挖掘 知识发现过程与应用结构
数据清洗
与预处理技术要点数据预处理是进行数据分析和挖掘的基础,对源数据进行再加工,
三元湖有大锦鲤
·
2022-11-30 18:35
数据挖掘原理与算法
数据挖掘
人工智能
算法
Pandas
目录一、Pandas数据结构-Series二、Pandas数据结构-DataFrame三、PandasCSV文件四、PandasCSV文件数据处理五、PandasJSON六、Pandas
数据清洗
一、Pandas
量子纠缠猫
·
2022-11-30 15:53
机器视觉基础工具
pandas
python
盘点数据处理工具,手把手教你做
数据清洗
和转换
导读:原始数据本身没有用。为了使它实际有用,你需要准备它。作者:MarsGeldard,JonathonManning,ParisButtfield-Addison,TimNugent来源:大数据DT(ID:hzdashuju)01了解数据集数据准备的关键和重复阶段是数据探索。一组因为太大而无法由人工手动读取、检查和编辑每个值的数据,仍需要验证其质量和适用性,然后才可以将其委托给一个值得花费时间和
大数据v
·
2022-11-30 11:51
人工智能
可视化
大数据
编程语言
python
数据预处理的方法有哪些
数据预处理的方法1、
数据清洗
数据清洗
是通过填补缺失值,平滑或删除离群点,纠正数据的不一致来达到清洗的目的。简单来说,就是把数据里面哪些缺胳膊腿的数据、有问
中琛源科技
·
2022-11-29 15:51
数据预处理(纯干货,适合小白学习)
数据预处理
数据清洗
数据清洗
目的:将脏数据(这里指是对数据分析没有意义、格式非法、不在指定范围的数据)清洗干净,是原数据具有完整性、唯一性、权威性、合法性、一致性等特点。
ashan927
·
2022-11-29 15:12
大数据
python数据分析师书籍_从零开始学Python数据分析与挖掘 Python数据分析师 Numpy数据处理Pandas数据可视化Matplotlib数据挖掘Sklearn技术教程书籍...
害群之马”21.2.2交通出行领域——为打车平台进行私人订制31.2.3医疗健康领域——找到医疗方案31.3数据分析与挖掘的区别41.4数据挖掘的流程51.4.1明确目标51.4.2数据搜集61.4.3
数据清洗
weixin_39602967
·
2022-11-29 13:40
python数据分析师书籍
Python项目实战 —— 01. 疾病预测结构化数据
Python项目实战Python项目实战--目录Python项目实战——01.疾病预测结构化数据一、背景二、解题思路三、数据分析3.1
数据清洗
3.2数据分析3.2.1相关系数3.2.2各特征与ALF的图表
share16
·
2022-11-29 13:40
项目实战
python
像Excel一样使用Python进行数据分析
在Python中pandas库用于数据处理,我们从1787页的pandas官网文档中总结出最常用的36个函数,通过这些函数介绍如何通过python完成数据生成和导入,
数据清洗
,预处理,以及最常见的数据分类
代码输入中...
·
2022-11-29 12:48
python
pandas
数据分析
数据挖掘
开发语言
简易多元线性回归学习
目录多元线性回归一、问题分析二、数据预处理(excel)1.
数据清洗
2.数据全数值化三、使用EXcel回归回归实现回归分析四、使用代码实现回归ⅠStatsmodels1.数据处理2.绘制热力图探讨价格与其他之间的联系
永远爱mai
·
2022-11-29 09:13
线性回归
回归
机器学习
飞桨——数据集的获取途径和数据处理技巧
数据集获取平台Kaggle、天池、DataFountain、百度AIStudio、GIthub、Gitee图像处理完整流程1.图片数据获取2.图片
数据清洗
----初步了解数据,筛选掉不合适的图片3.图片数据标注
XXX_UUU_XXX
·
2022-11-29 06:40
深度学习
黑马程序员《
数据清洗
》学习笔记第八章综合案例(3)
目录第八章综合案例(3)8.3.7加载演员数据至演员维度表1.打开Kettle工具,创建转换2.配置表输入控件3.配置表输入2控件4.配置插入/更新控件5.运行转换load_dim_actor6.查看数据表dim_actor中的数据8.3.8加载电影数据至电影维度表1.打开Kettle工具,创建转换2.配置表输入控件3.配置表输入2控件4.配置数据库查询控件5.配置数据库查询2控件6.配置值映射控
眨个眼就睡着
·
2022-11-28 16:39
黑马程序员《数据清洗》学习笔
etl
数据库
database
黑马程序员《
数据清洗
》学习笔记第八章综合案例(1)
目录第八章综合案例(1)8.3.2加载日期数据至日期维度表1.打开Kettle工具,创建转换2.配置生成记录控件3.配置增加序列控件4.配置JavaScript控件5.配置表输出控件6.运行转换load_dim_date7.查看数据表dim_date中的数据8.3.3加载时间数据至日期维度表1.打开Kettle工具,创建转换2.配置生成记录控件3.配置增加序列控件4.配置JavaScript代码控
眨个眼就睡着
·
2022-11-28 16:38
黑马程序员《数据清洗》学习笔
etl
数据库
黑马程序员《
数据清洗
》学习笔记第八章综合案例(2)
目录第八章综合案例(2)8.3.5加载用户数据至用户维度表1.打开Kettle工具,创建转换2.配置表输入控件3.配置表输入2控件4.打开Kettle工具,新建转换5.配置映射输入规范控件6.配置数据库查询控件7.配置数据库查询2控件8.配置数据库查询3控件9.配置过滤记录控件10.配置JavaScript代码控件11.配置字段选择控件12.配置映射控件13.配置字段选择控件14.配置值映射控件1
眨个眼就睡着
·
2022-11-28 16:38
黑马程序员《数据清洗》学习笔
etl
数据库
database
淘宝用户行为分析(Python)
文章目录一、分析背景与目的二、数据理解三、
数据清洗
1、读取并查看数据基本信息和数据的完整性2、缺失值处理3、增加新特征四、数据分析1、不同时间维度的PV、UV流量的情况2、不同行为在不同时间维度下的pv
嘻嘻吖哈哈
·
2022-11-28 11:53
数据分析
python
淘宝用户行为统计分析-python
淘宝用户行为统计分析-Python一分析背景二分析目的三分析思路四数据处理4.1数据导入4.2
数据清洗
4.3数据转换五统计分析5.1用户习惯5.2销售规律5.3漏斗模型5.4RFM模型1最近一次交易R2
weixin_46338676
·
2022-11-28 11:53
数据分析案例
数据分析
大数据
python实现淘宝用户行为分析
数据分析实战项目之python用户消费行为分析项目背景和前言分析大纲**分析流程**1.提出问题2.
数据清洗
3.数据分析用户分析商品分析帕累托分析总结前言:博主是一个正在学习数据分析的21届普通大学学生
人生得意须尽欢!
·
2022-11-28 11:23
数据分析实战
数据分析
python
python大数据挖掘系列之淘宝商城数据预处理实战
商品数据挖掘
数据清洗
:所谓的
数据清洗
,就是把一些异常的、缺失的数据处理掉,处理掉不一定是说删除,而是说通过某些方法将这个值补充上去,
数据清洗
目的在于为了让我们数据的可靠,因为脏数据会对数据分析产生影响。
风信子的故事
·
2022-11-28 11:51
Python
数据分析
python泰坦尼克号数据预测_Python机器学习预测泰坦尼克号乘客生存率(kaggle项目)...
提出问题(BusinessUnderstanding)理解数据(DataUnderstanding)
数据清洗
(DataPreparation)特征工程(FeatureEngineering)获取相关系数
weixin_39943202
·
2022-11-27 21:30
python泰坦尼克号数据预测
泰坦尼克号python数据预处理_Python机器学习入门:泰坦尼克号预测
机器学习分析步骤:提出问题2.理解数据导入数据采集数据查看数据集信息3.
数据清洗
数据预处理特征工程4.构建模型5.模型评估6.方案实施提交结果报告撰写一、提出问题什么样的人可以在泰坦尼克号事故中生存下来二
weixin_39530838
·
2022-11-27 21:00
Spark:基于PySpark的逻辑回归和决策树模型对泰旦尼克号幸存者预测的机器学习流程
pyspark的ML回顾下文章目录官网文档环境泰坦尼克号数据分析泰坦尼克号
数据清洗
整理SparkMLPipelineTitanic幸存者预测:逻辑回归LR模型模型训练模型预测Titanic幸存者预测:决策树模型官网文档
小明同学YYDS
·
2022-11-27 21:28
大数据
机器学习
SparkML
PySpark
泰坦尼克号幸存者
Spark机器学习
python基础知识及数据分析工具安装及简单使用(Numpy/Scipy/Matplotlib/Pandas/StatsModels/Scikit-Learn/Keras/Gensim))
环境配置配置python基础知识及数据分析工具安装及简单使用(Numpy/Scipy/Matplotlib/Pandas/StatsModels/Scikit-Learn/Keras/Gensim))数据探索(
数据清洗
eeenkidu
·
2022-11-27 20:12
python
数据分析
python
数据分析
Hive基本操作--2018安徽省大数据竞赛赛题2(hive
数据清洗
)
题目描述:“安徽省大数据学院”跟学校进行校企合作,提供了一些商品交易的数据源给学校学生进行
数据清洗
,想请你帮他们完成数据的清洗。
不是祸津神的夜斗
·
2022-11-27 18:18
大数据
hive
大数据
数据库
【工具包】目标检测label-image剔错去重等清洗工具包
文章目录01_check_image02_check_annotation目标检测
数据清洗
很重要,磨到不误砍材工,使用工具包把
数据清洗
好了,其实也就解决目标检测训练里90%的数据加载报错问题了01_check_image
小菜学AI
·
2022-11-27 18:26
从入门算法到高级CV算法工程师
目标检测
python
pytorch
电商产品评论数据情感分析
电商产品评论数据情感分析项目流程数据预处理评论分词分词删除停用词名词词云分析情感分析读入正负情感词处理否定修饰词情感分析LDA主题分析LDA模型介绍寻找最优主题数主题建模项目流程数据采集:网络爬虫和数据采集器数据预处理:评论去重和删除空值数据
数据清洗
dxw-1997
·
2022-11-27 17:30
python
开发语言
关于数仓建设及数据治理的超全概括
1、用空间换时间,通过大量的预处理来提升应用系统的用户体验(效率),因此数据仓库会存在大量冗余的数据;不分层的话,如果源业务系统的业务规则发生变化将会影响整个
数据清洗
过程,工作量巨大。
浊酒南街
·
2022-11-27 14:12
数仓建设
数据仓库
数据挖掘
大数据
Kaggle_Titanic 数据分析 (初学者速通篇)
数据获取(excel文档csv格式)Pycharm函数库中获取numpy&pandas&matplotlib&sklearnPycharm调用文件数据实现数据分析查看数据图以及对应参数回顾总体方法一、
数据清洗
Flying_fish7
·
2022-11-27 10:51
数据分析
python
机器学习
《
数据清洗
》第八章 综合案例--构建DVD租赁商店数据仓库
sakila数据库--->
数据清洗
--->构建数据仓库1.案例概述1.1案例背景介绍对于在线DVD租赁商店的决策者来说,他们需要从不同的商业角度观察数据,如从时间、电影、演员、用户等角度观察数据,并进行相关的分析得出决策
夜空霓虹
·
2022-11-27 06:27
数据仓库和ETL
数据仓库
数据库
database
ETL
数据清洗
——第八章8.3.2、8.3.3、8.3.4实例
一、8.3.21.创建转换2.配置生成记录控件3.配置增加序列控件4.配置javascript代码控件5.配置表输出控件并连接数据库6.运行结果二、8.3.31.创建转换2.配置生成记录控件3.配置增加序列控件4.配置javascript代码控件5.配置记录关联代码6.配置javascript控件7.配置表输出控件并连接数据库8.运行结果三、8.3.41.创建转换2.配置表输入并连接数据库3.配置
weixin_45778672
·
2022-11-27 06:56
etl
etl构建数据仓库五步法_ETL构建数据仓库五步法
ETL构建企业级数据仓库五步法在数据仓库构建中,ETL贯穿于项目始终,它是整个数据仓库的生命线,包括了从
数据清洗
,整合,到转换,加载等的各个过程,如果说数据仓库是一座大厦,那么ETL就是大厦的根基,ETL
李棠辉
·
2022-11-27 06:25
etl构建数据仓库五步法
数据清洗
之如何用一行Python代码去掉文本中的各种符号
目录前言1.问题描述2.相关知识3.解决方案总结前言在搜集了很多文本语料之后,会开始漫长的
数据清洗
过程,通常要不断迭代。1.问题描述有些文本数据中,会包含一些特殊符号。
·
2022-11-27 00:12
Error:function ‘LogSoftmaxBackward‘ returned nan values in its 0th output.
Error:function‘LogSoftmaxBackward’returnednanvaluesinits0thoutput.原因分析产生这个问题的原因可能有几种:1.数据中出现NAN——
数据清洗
pure water
·
2022-11-26 21:17
pytorch
pytorch
用python分析“数据分析”到底值不值得学习,以及学完之后大概能拿到多少工资
大家好呀,这里是魔王~国内数据分析求职需求分析用python分析“数据分析”到底值不值得学习,以及学完之后大概能拿到多少工资青灯教育数据分析流程1.原始数据2.
数据清洗
3.数据分析4.结论事先采集得数据
魔王不会哭
·
2022-11-26 19:49
python
数据分析
python
数据分析
计算机网络
python 千万级数据处理_Python实现 ! 千万级别数据处理
今天分享一个
数据清洗
小技巧,可以让你在遇到百万、千万级别数据的时候游刃有余。
81只狮子
·
2022-11-26 18:40
python
千万级数据处理
python 处理大量数据_如何用python处理大量数据
而且,这些工具不像pandas那样具有丰富的进行高质量
数据清洗
、探索和分析的特性。对于中等规模的数据,我们的愿望是尽
小拾1236
·
2022-11-26 18:04
python
处理大量数据
python后端
和爬虫_【后端开发】python的爬虫是什么意思
Python爬虫即使用Python程序开发的网络爬虫(网页蜘蛛,网络机器人),是一种按照一定的规则,自动地抓取万维网信息的程序或者脚本。另外一些不常使用的名字还有蚂蚁、自动索引、模拟程序或者蠕虫。其实通俗的讲就是通过程序去获取web页面上自己想要的数据,也就是自动抓取数据。网络爬虫(英语:webcrawler),也叫网络蜘蛛(spider),是一种用来自动浏览万维网的网络机器人。其目的一般为编纂网
瑞士鲁迅
·
2022-11-26 16:18
python后端和爬虫
我参加NVIDIA Sky Hackathon 后端修改
文件架构前面两个分别是执行语音识别和图片识别的代码templates存放的是网页的模板,前端将文件写在这里即可uploads存放的是上传至后台的文件server.ipynb用于启动flash服务器app.py内是用flash写的
Python
金装二百五
·
2022-11-26 15:36
经验分享
python
flask
Python-Kmeans聚类全流程,aribnb
数据清洗
调整年龄的范围airbnb=airbnb[airbnb['age']=18]转变日期的格式,转为对分析有用的日期形式调用to_datetime转化为日期时间格式airbnb['date_account_created
tt_work_it_out
·
2022-11-26 12:13
python
Python实现音乐推荐系统【跟着迪哥学python】
实现音乐推荐系统推荐系统数据读取对每一个用户,分别统计他的播放总量对于每一首歌,分别统计它的播放总量看看目前的排行情况取其中一部分数(按大小排好序的了,这些应该是比较重要的数据),作为我们的实验数据加入音乐详细信息我们现有的
数据清洗
数据集展示最流行的歌曲最受欢迎的
紧到长不胖
·
2022-11-26 11:19
机器学习
python
数据分析
机器学习
机器学习项目实战——04逻辑回归算法之糖尿病预测项目
数据分析基本过程:①提出问题,②理解数据需求,③
数据清洗
,④构建模型。⑤数据可视化;
数据清洗
的基本过程:①选择子集,②列名重命名,③缺失数据处理,④数据类型转
平行世界里的我
·
2022-11-26 10:24
机器学习
机器学习
Hive实战 —— 利用Hive进行数据分析并将分析好的数据导出到mysql数据库中
♂️本文目录hive实战一、需求分析二、数据准备2.1、查看原始数据2.2、表的数据结构2.3、
数据清洗
2.4、准备hive
it春和
·
2022-11-26 09:30
hive
mysql
big
data
大数据
基于大数据的动漫影视可视化分析系统
温馨提示:文末有CSDN平台官方提供的学长Wechat/QQ名片:)1.项目简介本动漫分析系统开发语言为Python,并进行
数据清洗
,数据处理,并最后利用可视化技术进行动漫数据分析。
Python极客之家
·
2022-11-26 09:20
Python
毕设精品实战案例
数据挖掘
数据分析
数据可视化
大数据
Python数据分析基础: 异常值检测和处理
作者:东哥起飞公众号:Python数据科学上一篇分享了关于数据缺失值处理的一些方法,链接如下:【Python数据分析基础】:数据缺失值处理本篇继续分享
数据清洗
中的另一个常见问题:异常值检测和处理。
Python数据科学
·
2022-11-26 05:40
Python数据科学
python
特征工程
数据处理
异常值
通俗理解TF-IDF与TextRank
TextRankTF-IDFTF-IDF(termfrequency–inversedocumentfrequency)是一种用于信息检索与数据挖掘的常用加权技术,常用于挖掘文章中的关键词,而且算法简单高效,常被工业用于最开始的文本
数据清洗
Dusk2090
·
2022-11-26 02:19
NLP
自然语言处理
基于 Word2Vec 的微博情绪分类
本文仅供参考文章目录任务说明一、基于Word2Vec的文本表示及文本分类方法二、实验原理三、具体步骤1.引入库2.读入数据3.
数据清洗
4.生成word2vec模型5.文本表示6.模型预测四、优化1.模型选择
淡写 ╮ 青春
·
2022-11-25 21:36
nlp
分类
python
nlp
自然语言处理
机器学习建模流程
机器学习实战机器学习三把斧1.
数据清洗
1.1缺失值的处理某一列的特征缺失值达到40%左右,删除这个特征值;或者某一个样本的缺失值过大,那么删除这个样本。
开始King
·
2022-11-25 21:24
机器学习
机器学习
数据挖掘
【pandas 基本操作:数据合并】
pandas基本操作第一章
数据清洗
第二章数据合并第三章数据重塑第四章数据转换文章目录pandas基本操作前言1.轴向堆叠数据2.主键合并数据3.根据行索引合并数据4.合并重叠数据前言
数据清洗
是一项复杂且繁琐的工作
一杯冰糖
·
2022-11-25 14:01
pandas
python
上一页
37
38
39
40
41
42
43
44
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他