E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
python后端数据清洗
数据清洗
黑马程序员 第八章综合案例——构建DVD租赁商店数据仓库——阅读笔记(3)
8.3.7加载演员数据至演员维度表1.打开Kettle工具,创建转换使用Kettle工具,创建一个转换load_dim_actor,并添加表输入控件、插入/更新控件以及Hop跳连接线,具体如图1所示:图1创建转换load_dim_actor2.配置表输入控件双击“表输入”控件,进入“表输入”配置界面,单击【新建】按钮,配置数据库连接,配置完成后单击【确认】按钮。MySQL数据库连接的配置,如图2所
あㅉ
·
2022-11-22 02:21
数据仓库
数据清洗
黑马程序员 第八章综合案例——构建DVD租赁商店数据仓库——阅读笔记(4)
8.3.9加载租赁数据至租赁事实表1.打开Kettle工具,创建转换使用Kettle工具,创建一个转换load_fact_rental,并添加表输入控件、字段选择控件、过滤记录控件、计算器控件、增加常量控件、数据库查询控件、维度查询/更新控件、插入/更新控件以及Hop跳连接线,如图1所示:图1创建转换load_fact_rental2.配置表输入控件双击“表输入”控件,进入“表输入”配置界面,单击
あㅉ
·
2022-11-22 02:21
数据仓库
数据清洗
黑马程序员 第八章综合案例——构建DVD租赁商店数据仓库——阅读笔记(2)
8.3.5加载用户数据至用户维度表1.打开Kettle工具,创建转换使用Kettle工具,创建一个转换load_dim_customer,并添加表输入控件、映射控件、字段选择控件、值映射控件、维度查询/更新控件以及Hop跳连接线,具体如图1所示:tu1创建转换load_dim_customer2.配置表输入控件双击“表输入”控件,进入“表输入”配置界面,单击【新建】按钮,配置数据库连接,配置完成后
あㅉ
·
2022-11-22 02:51
数据仓库
python 爬虫爬取疫情数据,爬虫思路和技术你全都有哈(二)
上一章:python爬虫爬取疫情数据,爬虫思路和技术你全都有哈(一、爬虫思路及代码)第三步:
数据清洗
清洗数据很简单,就是数据太乱的话,就得花些时间,所以一定要有一个好的方法,才能避免在清洗数据上花费太多的时间
源源佩奇
·
2022-11-22 02:11
python爬虫
python
爬虫
数据挖掘笔记Ⅱ——
数据清洗
(房租预测)
缺失值分析及处理缺失值出现的原因分析采取合适的方式对缺失值进行填充异常值分析及处理根据测试集数据的分布处理训练集的数据分布使用合适的方法找出异常值对异常值进行处理深度清洗分析每一个communityName、city、region、plate的数据分布并对其进行
数据清洗
冉景文
·
2022-11-22 00:10
python
机器学习
数据分析
【推荐收藏】Python 缺失数据处理大全(附代码)
大家好,趁着周末休息,将有关
数据清洗
、数据分析的一些技能再次进行分类,整理成PDF版,里面也包含了我平时用到的一些小技巧,此次就从
数据清洗
缺失值处理走起。
Python数据挖掘
·
2022-11-21 22:19
python
python
python开发
缺失值处理
数据处理
aryson ms sql_数据治理:SQL
数据清洗
十八般武艺
在TowardsDataScience上看过一篇文章,讲的是用Pandas做
数据清洗
,作者将常用的清洗逻辑封装成了一个个的清洗函数。
weixin_39950010
·
2022-11-21 18:06
aryson
ms
sql
asp
sql
ip地址排序
asp.net2.0
sql
server2005
coalesce函数用法
sql
head
first
sql
中文版
inner
join
重复数据
09组团队项目-Alpha冲刺-3/6
基本情况团队ID:09团队名称:叔叔阿姨菜菜捞捞组长博客:https://bbs.csdn.net/topics/609129612小组人数:8二、冲刺概况汇报黄森过去两天完成了哪些任务文字描述继续学习
python
梁佳莺 032002521
·
2022-11-21 18:50
python
开发语言
时间序列预处理
数据预处理的主要流程为:
数据清洗
、特征选择、归一化处理、划分窗口、Shuffle和划分数据集等五个阶段。
行者无疆_ty
·
2022-11-21 18:01
人工智能
机器学习
人工智能
数据分析
深度学习(11)——房价预测实践
通过这次实践我发现这类数据分析或是数据预测的问题,
数据清洗
有着非常重要的作用,直接使用高维度的原数据不但跑的时间很长,而且跑出来的结果也相当不好,因此得选择对于数据分析有用的一
星辰大海_coli
·
2022-11-21 17:48
深度学习
深度学习
python
机器学习
数据分析——
数据清洗
之文字特征编码
在对数据进行预处理时,有时会面临特征值是字符串类型的时候,这时候就需要对特征值进行编码处理,主要分为一下两类:各个特征值之间没有任何关联,如['red','green','blue']。各个特征值之间有关系,如['Excellent','Good','Normal','Bad']。下面分别说一下如何对以上两种类型数据进行编码处理:拿kaggle中的HousePrice数据来举例说明。importp
敲代码的quant
·
2022-11-21 17:00
data
analysis
数据清洗
python
文字编码
数据特征预处理
"""特征工程的数据处理:1.异常数据处理(采用
数据清洗
);1)删除含有异常值的记录;2)将异常值视为缺失值,交给缺失值处理方法来解决;3)用平均值修正;4)不处理2.数据不平衡处理(数据增强)2.1离散数据异常
小白进阶---持续充电中
·
2022-11-21 16:10
机器学习
java
python
javascript
dhu 数据科学与技术 第5次作业
将含有NaN数据的行导出为数据文件pre.csv,判断采用何种
数据清洗
模式:填充、删除或手工填充;4)查询课程名称、实验项目名称、实验
凤凰院克里斯
·
2022-11-21 15:26
dhu
python
python
pandas
数据分析
dhu 数据科学与技术 第4次作业
一.简答题(共2题,100分)(简答题)
数据清洗
和填充1)从studentsInfo.xlsx文件的“Group1”表单中读取数据;2)将“案例教学”列数据值全改为NaN;3)滤除每行数据中缺失3项以上
凤凰院克里斯
·
2022-11-21 15:25
python
dhu
python
机器学习
pandas
【Python】pandas 变量类型转换的 6 种方法
pandas
数据清洗
pandas骚操作系列所有数据和代码可在我的GitHub获取:https://github.com/xiaoyusmd/PythonDataScience一、变量类型及转换对于变量的数据类型而言
风度78
·
2022-11-21 11:10
人工智能
字符串
python
数据分析
机器学习
python还是c++量化_从Python到C++,对量化回测的一点思考
而就算知道了策略参数,如果
数据清洗
步骤不一样,回测逻辑计算不一样,实盘订单提交逻辑不一样,那最终结果也不太一样。这
weixin_39987926
·
2022-11-21 09:22
python还是c++量化
三种客观赋权法——熵权法、变异系数法、CRITIC
1.1
数据清洗
数据的清洗是解决问题的第一步,包括缺失值处理和异常值处理两方面。对于缺失值,通常有三种可选的操作——删除、插补、不处理。
m0_59989429
·
2022-11-21 09:13
数学建模心得
算法
【感恩系列】:说点事儿 以及 我把所有的粉丝放到了中国地图上啦~
写博客的收获此可已无言中国版图里的我们设计思路:具体实现爬取粉丝博客名和IP所属地
数据清洗
并保存绘制地图结束语专栏Python零基础入门篇Python网络蜘蛛Python数据分析Django基础入门宝典小玩意儿
IT工藤新一
·
2022-11-21 08:01
真心小项目
python
绘制地图
俺把所有粉丝显示在地图上啦~【详细教程+完整源码】
文章目录小逼叨爬取所有粉丝的IP所属地爬者基本素养:网页分析源代码
数据清洗
和保存源代码绘制地图源代码结束语小逼叨其实昨天发了一篇文章【感恩系列】:说点事儿以及我把所有的粉丝放到了中国地图上啦~这篇文章是自己的第一篇
IT工藤新一
·
2022-11-21 08:00
真心小项目
python
粉丝
绘制地图
python预测糖尿病_使用机器学习的算法预测皮马印第安人糖尿病
皮马印第安人糖尿病预测pima_diabetes_analysis_and_prediction文件夹:data-->存储原始样本和
数据清洗
后的样本data_analysis_after_clean--
weixin_39613433
·
2022-11-21 07:36
python预测糖尿病
python学习 --DataFrame
数据清洗
(空值、重复值)
目录空值的处理1、检查是否有空值2、统计空值的数量3、删除空值4、填补空值用value参数替换空值将空值替换成上一列的值将空值替换成上一行的值将空值替换成下一列的值将空值替换成下一行的值重复值的处理1、检查是否有重复值2、删除重复行一、空值的处理importpandasaspdlist1=[['赵一',23,'男'],['钱二',27,'女'],['孙三',26,'女']]list2=[['赵一
悠闲的小鱼Liu
·
2022-11-21 06:41
python
python
pandas
数据分析
天池长期赛:二手车价格预测(422方案分享)
前言一、赛题介绍及评测标准二、数据探索(EDA)1.读取数据、缺失值可视化2.特征描述性统计3.测试集与验证集数据分布4.特征相关性三、
数据清洗
四、特征工程1.构建时间特征2.匿名特征交叉3.平均数编码五
wjzeroooooo
·
2022-11-21 05:27
数据挖掘
Python
大数据
python
数据挖掘
阿里云天池大数据长期赛:金融风控-贷款违约预测(含代码)
赛题介绍二、数据描述性统计2.1.读取数据2.2.查看重复值2.3.统计目标变量比例2.4.查看数据的统计量2.5.统计每个变量的种类2.6.查看训练集与测试集的特征分布是否一致2.7查看数据相关性三、
数据清洗
wjzeroooooo
·
2022-11-21 05:56
大数据
Python
数据挖掘
数据分析
数据挖掘
anaconda tensorflow 2.3_TensorFlow 速成 | 统计师的Python日记 第13天
第7天开始学习
数据清洗
,着手学会了重复值删除、异常值处理、替换、创建哑变量等技能。第8天接着学习
数据清洗
,一些常见的数
weixin_39808143
·
2022-11-21 05:23
anaconda
tensorflow
2.3
python
mean函数
python
minimize
python
minimize用法
python
sklearn
logistic
【数据竞赛】消费金融场景下的用户购买预测冠军方案分享
我们在全景智额、千人千面、大数据风控等金融科技方面的尝试与创新,也正是因为打造了从数据收集到
数据清洗
、再到数据挖掘和商业应用的一体化大
风度78
·
2022-11-21 05:11
人工智能
大数据
机器学习
python
深度学习
景联文科技:一起聊聊数据标注那些事儿
数据标注的主要流程图像标注的标注流程分为
数据清洗
、数据标注和标注检验三类。清洗数据
数据清洗
就是排除数据所存在缺失值、噪声数据、重复数据等质量问题。
景联文科技
·
2022-11-21 02:29
数据标注
数据采集
人工智能
机器学习
深度学习
python
数据清洗
工具、方法、过程整理归纳(七、
数据清洗
之数据预处理(二)——异常值处理、数据离散化处理)
文章目录数据预处理7.3异常值处理7.4数据离散化处理数据预处理7.3异常值处理异常值指那些偏离正常范围的值,不是错误值异常值出现频率较低,但又会对实际项目分析造成偏差异常值一般用箱线图法(分位差法)或者分布图法(标准差法)来判断异常值往往采取盖帽法或者数据离散化来解决df.head()ConditionCondition_DescPriceLocationModel_YearMileageExt
favorbanana
·
2022-11-20 22:39
#
数据清洗
python
数据分析
python评论数据分析_Python亚马逊智能产品评论数据分析
一、概述本文主要使用Python对亚马逊智能产品评论数据集进行
数据清洗
,通过对不同产品的评分进行变换后得到产品的好评数、中评数、差评数以及对应的比率等,通过上述这些指标,找到好评率最高的产品、并尝试通过词云图对差评率最高的产品进行原因分析
张雪峰老师
·
2022-11-20 19:33
python评论数据分析
总结一些 spark 处理小trick
前言最近做了很多
数据清洗
以及摸底的工作,由于处理的数据很大,所以采用了spark进行辅助处理,期间遇到了很多问题,特此记录一下,供大家学习,。
weixin_42001089
·
2022-11-20 18:29
程序人生
深度学习导论与应用实践(机器学习篇)
深度学习导论与应用实践(机器学习篇)前言机器学习概述机器学习基本定义和基本术语数据预处理
数据清洗
数据集拆分机器学习三要素1、模型判别模型和生成模型概率模型和非概率模型机器学习方法概述数据集分类方法数据集不平衡特征工程前言本章较为详细
唐十
·
2022-11-20 18:23
2022暑期集训
深度学习
人工智能
基于YoloV5+目标追踪算法的越界识别项目——从
数据清洗
到边缘设备部署,全面掌握项目流程
而本次训练营全程“硬菜”,保姆式教学,以“基于YoloV5+目标追踪算法的越界识别项目”,图文并茂讲述了如何从开始的
数据清洗
到边缘设备部署。所谓“实践出真知”,“工欲善其事,必先利其器”
学算法的小猴子
·
2022-11-20 17:41
算法
人工智能
2023届-计算机视觉算法岗实习面经
ViT的计算量5、如何降低Transformer的计算量6、开放性问题如何从零开始完成一个基于深度学习的业务在已有的业务基础上,如何开展一个类似的新业务unseendata,openset问题如何进行图像
数据清洗
liuz_notes
·
2022-11-20 15:38
学习成长
计算机视觉
实习
经验分享
面试
算法
大数据、云计算系统高级架构师课程学习路线图
大数据、云计算系统高级架构师课程学习路线图大数据之Linux+大数据开发篇JavaLinux基础Shell编程Hadoop2.xHDFSYARNMapReduceETL
数据清洗
HiveSqoopFlume
tao_wei162
·
2022-11-20 13:55
大数据
数据库
操作系统
Pandas数据预处理_持续更新
Pandas数据预处理_持续更新一、
数据清洗
1.1字符串数据分列1.2Series提取字符串部分元素1.3Series替换\删除字符串部分元素1.4重复值处理1.5缺失值处理1.6异常值处理1.7数据合并
金针菇玉米肠
·
2022-11-20 12:11
pandas
python
数据分析
数据挖掘
Paper再现:MD+AI自动编码机探测蛋白变构(二):MD数据处理及特征化
original_dataset保存的是MD生成的PDB结构,是datsetsplit.ipynb进行
数据清洗
分割以后的结果,分为两个holo和opo两个文件夹,其中opo就是文献中提及的Unbound
wufeil
·
2022-11-20 06:12
图神经网络
药物设计
机器学习
python
神经网络
临床大数据分析与挖掘
分布分析2.1.1.定量数据分析2.2.2.定性数据分析2.2.对比分析2.2.1.对比分析的形式2.2.2.对比分析的标准2.3.描述性统计分析2.4.周期性分析2.5.贡献度分析2.6.相关性分析3.
数据清洗
_森罗万象
·
2022-11-20 03:50
杂七杂八
python
算法
机器学习
神经网络
sklearn
数据建模初入门笔记
班级成绩案例之大数据分析相关矩阵热图柱状图直方图散点图UCI肿瘤数据集之大数据分析准备阶段数据集模型训练预测结果UCI观影数据集之大数据分析读取CSV数据清理统计数据与作图Kaggle竞赛之“泰坦尼克号”大数据分析准备工作
数据清洗
探索可视化特征工程基本建模和评估炼丹集成方法预测前言
望向天空的恒毅
·
2022-11-20 02:09
小白的成长
数据挖掘
机器学习
人工智能
数据建模
基于RFM的航空公司客户价值分析模型
目录一、背景二、分析方法与过程2.1数据抽取2.2数据探索分析2.3数据预处理2.3.1
数据清洗
2.3.2属性规约2.3.3数据变换2.4聚类分析2.5特征分析三、分析结果四、模型应用4.1会员的升级与保级
猪逻辑公园
·
2022-11-19 23:50
数据挖掘
机器学习应用
工业大数据在铅粉机的应用(二)
从第一批数据开始建模,持续了三个月,发现模型精度始终不高,一直没有达到我要的效果;我反复检查了模型参数,
数据清洗
过程,代码bug等等,就是找不到问题。我最后猜测是不是输入数据
DATARUSHER
·
2022-11-19 22:39
数据挖掘案例
大数据
机器学习中缺失值处理方法大全(附代码)
目录
数据清洗
简介填补缺失值的重要性缺失值导致的问题缺失数据类型如何处理数据集中缺失的数据干货推荐浙大博士导师深度整理:Tensorflow和Pytorch的笔记(包含经典项目实战)值得收藏,这份机器学习算法资料着实
机器学习社区
·
2022-11-19 19:46
机器学习
机器学习
人工智能
python
【机器学习】机器学习中缺失值处理方法大全(附代码)
目录
数据清洗
简介填补缺失值的重要性缺失值导致的问题缺失数据类型如何处理数据集中缺失的数据
数据清洗
数据预处理中的
数据清洗
与机器学习方法、深度学习架构或数据科学领域的任何其他复杂方法无关。
风度78
·
2022-11-19 19:42
算法
人工智能
大数据
python
机器学习
城市规划与大数据学习网址
常见有用网址一、空间地理数据分析常用的软件二、可视化工具三、关于地图坐标转换的方法:四、在线数据的爬取五、数据分析(用于
数据清洗
)六、大数据的获取方式其它最近在学习的城市规划大数据理论与方法学习,其中涉及到的工具和软件
美滋滋(你猜
·
2022-11-19 16:02
笔记
arcgis
python
数据库
大数据
数据挖掘——数据采集和
数据清洗
数据采集和
数据清洗
一、
数据清洗
1.数据去重(一)相关知识1>pandas读取csv文件-read_csv()2>pandas的去重函数-drop_duplicates()(二)本关任务(三)参考代码2.
zkinglin
·
2022-11-19 15:43
数据挖掘
习题
python
数据分析
数据挖掘
数据挖掘:
数据清洗
——数据不平衡处理
数据挖掘:
数据清洗
——数据不平衡处理一、什么是数据不平衡?不平衡数据集指的是数据集各个类别的样本数目相差巨大,也叫数据倾斜。以二分类问题为例,即正类的样本数量远大于负类的样本数量。
AvenueCyy
·
2022-11-19 15:16
数据挖掘
机器学习
数据挖掘
python
实验三 线性回归
二、多项式回归1.数据集构建2.模型构建3.模型训练4.模型评估三、Runner类介绍四、基于线性回归的波士顿房价预测1.数据处理1.1数据集介绍1.2
数据清洗
1.3
沐一mu
·
2022-11-19 14:53
线性回归
回归
机器学习
深度学习
pytorch
NNDL 实验三 线性回归
2.3多项式回归2.3.1数据集构建2.3.2模型构建2.3.3模型训练2.3.4模型评估2.4Runner类介绍2.5基于线性回归的波士顿房价预测2.5.1数据处理2.5.1.1数据集介绍2.5.1.2
数据清洗
Persevere~~~
·
2022-11-19 13:05
线性回归
机器学习
深度学习
基于Keras深度学习LSTM模型 预测黄金主力收盘价
深度学习框架Keras,深度学习LSTM模型1数据源:黄金主力数据来源于JQData(数据由JQData支持)2
数据清洗
3使用黄金主力数据进⾏预测的2个实验数据集:70%用做训练集训练模型;30%测试集
DavidDing2088
·
2022-11-19 12:53
量化交易
挖掘用户购物信息--关联规则
提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档文章目录前言背景介绍关联规则(AssociationRules)一、项目目的二、操作步骤1.引入库2.读入数据3.
数据清洗
与加工三、结论与总结建议前言背景介绍通过挖掘客户购物信息
奔跑的小绵羊02
·
2022-11-19 12:40
数据挖掘
python
算法
【数据分析】用户价值分析
●R:最近一次消费时间(最近一次消费到参考时间的间隔)●F:消费的频次●M:消费的金额(总消费金额)
数据清洗
数据格式InvoiceNo:订单编号,每笔交易有6个整数,退货订单编号开头有字母’C’。
叶柖
·
2022-11-19 11:52
数据分析
python
数据分析
电商用户价值分析——基于RFM模型、KMeans聚类
电商用户价值分析——基于RFM模型、KMeans聚类一、背景二、RFM模型、KMeans聚类三、分析框架四、具体分析1.导入所需的库2.导入数据3.
数据清洗
4.数据分析4.1核心数据分析4.2用户分析5
奔跑的小绵羊02
·
2022-11-19 11:38
python
数据分析
kmeans
k-means
数据挖掘
上一页
39
40
41
42
43
44
45
46
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他