E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
pythonexcel数据清洗
深度学习 第3章线性分类 实验四 pytorch实现 Softmax回归 鸢尾花分类任务 下篇
目录:第3章线性分类3.3实践:基于Softmax回归完成鸢尾花分类任务3.3.1数据处理3.3.1.1数据集介绍3.3.1.2
数据清洗
1.缺失值分析2.异常值处理3.3.1.3数据读取3.3.2模型构建
岳轩子
·
2022-11-23 19:19
深度学习
python
深度学习
分类
pytorch
如何使用Pandas操作数据
Pandas是一个强大的分析结构化数据的工具集;它的使用基础是Numpy(提供高性能的矩阵运算);用于数据挖掘和数据分析,同时也提供
数据清洗
功能。
久劫
·
2022-11-23 16:04
python
大数据
数据结构
pandas 第一行_Pandas进阶Excel(一)——读取
在数据导入、
数据清洗
、数据计算、数据导出都有着完整性的支撑,是一个提供高性能易用数据类型和分析工具,并且用一段时间你就会发现如果拿pandas只操
weixin_39707597
·
2022-11-23 15:49
pandas
第一行
城市空气质量分析与预测
城市空气质量分析与预测一、AQI分析与预测1、背景信息2、任务说明3、数据集描述二、数据分析流程基本流程三、读取数据1、导入相关的库2、加载数据集四、
数据清洗
1、缺失值1.1、缺失值探索1.2、缺失值处理
孙若堃
·
2022-11-23 13:32
python
数据分析
Spark机器学习
第二章数据驱动的机器学习系统的组成1.机器学习系统组成:数据收集->
数据清洗
与转换->模型训练->模型测试->模型部署与整合->模型监控与反馈(同时监控模型的准确度相关指标以及业务指标,模型反馈是指通过用户的行为来对模型的预测进行反馈
MrGeroge
·
2022-11-23 11:58
Spark
记一次python清洗疫情历史数据
目录1.数据获取2.使用python读取csv3.使用pyhon进行
数据清洗
4.将清洗的数据自动导入MySql完整代码脚本运行效果在我2020年大三的一个实训的大作业中,我整了一个新冠肺炎疫情的数据采集和可视化分析系统
不愿意做鱼的小鲸鱼
·
2022-11-23 10:24
python
python
数据分析
数据挖掘
【线性回归——从简单构建到实现数据预测】
模型评估1.7、样本数量和正则化系数的影响二、多项式回归1.1、数据集的构建1.2、模型构建1.5、模型训练1.6、模型评估三、尝试封装Runner类四、基于线性回归的波士顿房价预测4.1数据集介绍4.2
数据清洗
小鬼缠身、
·
2022-11-23 06:41
线性回归
机器学习
算法
Python爬取天气数据,并且进行天气预报(已实现)
分析任意一个城市的天气状况先分析网页爬取数据获取城市ID获得城市的昨天与今天的气温城市多音字问题爬取城市的历史数据(用到正则匹配)并进行
数据清洗
天气数据分析绘图用机器学习进行气温预测将两部分数据合并成为一个
辣子不辣,英语不难
·
2022-11-23 01:46
python项目
python
爬虫
beautifulsoup
matplotlib
神经网络
用python+opencv实现
数据清洗
1、数据集简述:博主依据视频抽帧得到的图像数据集为基础,进行相应的人工
数据清洗
;因为博主观察到图像中有一些是不符合项目要求的图像,为了方便接下来的人工标注,必须剔除掉不符合要求的图像。
BlackBack_
·
2022-11-23 00:15
小技巧代码
python
opencv
深度学习
图像识别-
数据清洗
1.删除不清晰的图片(由于图片是从视频里截取到的,摄像头在移动的过程中,会出现自动对焦)模糊图片示例:2.删除重复度高的图片(相似度高的图片,无法给模型提供多样性信息)空闲了会考虑一下,使用程序自动去除模糊图片和重复度高的图片,提高工作效率。
懵懂的梦花火
·
2022-11-23 00:12
特征工程
【
数据清洗
】图像
数据清洗
之---去除相似度高的图像
目的:人工做
数据清洗
较为麻烦,而且费事费力没成绩,还拉拽整个项目的后腿。所以这里根据调研情况,分析尝试一下。
聿默
·
2022-11-23 00:11
数据清洗
pytorch
数据清洗
小福利,数据分析之
数据清洗
常用方法(2)
大家好,我是天空之城,今天带来小福利,数据分析之
数据清洗
常用方法(2)我们需要将日期这一列的数据做一个转化,去掉年和日的信息,而只保留月的信息。
littlespider889
·
2022-11-23 00:11
python
python
数据分析
图片
数据清洗
中超级常用的一招操作!
点击上方“AI算法与图像处理”,选择加"星标"或“置顶”重磅干货,第一时间送达导读在做图像分类的任务中,经常需要将图片resize到指定的尺寸,例如224,直接resize的结果,会导致图片失真,因此需要对其进行填充操作。例如我们需要对上面的图片进行resize,直接使用resize操作得到的结果:大小:224*224显然并不是我们想要的结果。我们希望得到的是:1、图片大小缩放2、图片特征不失真(
flyfor2013
·
2022-11-23 00:09
算法
python
opencv
计算机视觉
人工智能
(深度学习)简单的图片和xml
数据清洗
脚本
(深度学习)简单的图片和xml
数据清洗
脚本分享一个自己目前在用的操作比较简单的
数据清洗
脚本,主要功能包括:1.显示命名不规划的xml文件(可设置自己定义的命名规范格式)2.缺失xml文件显示3.缺失图像显示
SSSlasH
·
2022-11-23 00:09
图片
数据清洗
通常,在对采集到的大量数据进行标注前需要做一些
数据清洗
工作。
jane_xing
·
2022-11-23 00:08
Python开发
数据结构及算法
python
计算机视觉
机器学习
大数据分析平台建模及建议
首先应开展业务调研和数据调研工作,明确分析需求,其次应开展数据准备工作,即选择数据源、进行数据抽样选择、数据类型选择、缺失值处理、异常值检测和处理、数据标准化、数据簇分类、变量选择等,再次应进行数据处理工作,即进行数据采集、
数据清洗
中琛源科技
·
2022-11-22 23:30
数据挖掘实战—航空公司客户价值分析
1.2异常值分析1.3重复数据分析2.数据特征分析2.1描述性统计分析2.2分布分析2.2.1客户基本信息分布分析2.2.2客户乘机信息分析2.2.3客户积分信息分布分析2.3相关性分析二、数据预处理1.
数据清洗
哎呦-_-不错
·
2022-11-22 19:26
#
数据挖掘项目实战
数据挖掘
客户价值分析
RFM模型
聚类
雷达图
对抗样本代码问题总结(持续更新~)
1、shuffle=True用于打乱数据集,每次都会以不同的顺序返回2、data_clean()
数据清洗
,排除一些无法输入的数据3、pretrained=True远程获取已训练好的模型参数4、item(
凉茶i
·
2022-11-22 19:50
深度学习
pytorch
神经网络
Python数据挖掘 数据预处理案例(以航空公司数据为例)
Python数据预处理一、内容:1、
数据清洗
2、数据集成3、数据可视化二、实验数据根据航空公司系统内的客户基本信息、乘机信息以及积分信息等详细数据,依据末次飞行日期(LAST_FLIGHT_DATE),
阴天v快乐丶
·
2022-11-22 19:05
python
数据挖掘
人工智能
数据分析
【数据挖掘】数据预处理
OutlineChapterOverview1.为什么要对数据预处理2.数据描述性总结3.
数据清洗
4.数据变换5.数据整合6.数据归约7.离散化与概念层级8.总结Chapter1.为什么要预处理我们从现实生活中获得的原始数据
Torture_L
·
2022-11-22 15:49
Data
Mining
数据挖掘
人工智能
算法
Python进阶分享 | 盘点一个Pandas
数据清洗
题目
一、写在前面大家好,我是吒吒。前几天在Python技术交流群有个小伙伴问了一道Python清洗数据的问题,这里拿出来给大家分享下,一起学习下。如何才能把pandasserise里乱七八糟的字符清理干净呢?二、解决过程这里给出了一个示例的代码,使用了apply和lambda和正则表达式,一气呵成,只需要稍微修改下,匹配自己的数据就可以了。df['主营业务']=df['主营业务'].astype('s
哪吒敲代码闹海
·
2022-11-22 15:09
python
时间序列预测——时序卷积网络(TCN)
整个过程主要包括:数据导入、
数据清洗
、结构转化、建立TCN模型、训练模型(包括动态调整学习率和earlystopping的设置)、预测、结果展示、误差评估等完整的时间序列预测流程。
行者无疆_ty
·
2022-11-22 13:49
人工智能
tensorflow
神经网络
深度学习
5.4.2 数据规范化处理
由于数据源系统分散在各个业务线上,不同业务线对数据的要求,理解和规范都不同,这样就会导致对同一数据对象的描述规格完全不同,因此,在
数据清洗
的过程中需要将统一数据规范的数据抽取出来进行规范处理。
万俟傲霜
·
2022-11-22 10:26
数据清洗
etl
黑马程序员《
数据清洗
》学习笔记
数据清洗
与检验部分内容
目录第五章
数据清洗
与检验5.1数据去重5.1.1完全去重5.1.2不完全去重5.2缺失值处理5.2.1缺失值清洗策略5.2.2去除缺失值5.2.3填充缺失值本章习题第五章
数据清洗
与检验常见的
数据清洗
操作包括重复值的处理
眨个眼就睡着
·
2022-11-22 10:55
黑马程序员《数据清洗》学习笔
etl
数据清洗
黑马程序员 第五章数据的清洗与检验——阅读笔记
5.1数据去重数据去重又称重复数据的删除,通常指的是找出数据文件集合中重复的数据并将其删除,只保存唯一的数据单元,从而消除冗余数据。通常情况下,数据去重方法分为两种,分别是完全去重和不完全去重。5.1.1完全去重完全去重指的是消除完全重复的数据,这里提到的完全重复数据指的是数据表记录字段值完全一样的数据。1.打开Kettle工具,创建转换通过使用Kettle工具,创建一个转换repeat_tran
あㅉ
·
2022-11-22 10:51
mysql
关于ETL的两种架构(ETL架构和ELT架构)
ETL是构建数据仓库的重要一环,用户从数据源抽取出所需的数据,经过
数据清洗
,最终按照预先定义好的数据仓库模型,将数据加载到数据仓库中去。ETL在转化的过程中,主要体现在以
微服务 spring cloud
·
2022-11-22 10:51
etl
架构
数据仓库
Python二手房价格预测(二)——数据处理及数据可视化
系列文章目录数据获取部分:Python二手房价格预测(一)——数据获取文章目录系列文章目录一、
数据清洗
二、数据可视化总结一、
数据清洗
1、先导入需要的库:importpandasaspdimportnumpyasnpimportmatplotlib.pyplotaspltimportsysimportseabornassnsimportwarningsimportjsonimportpymongoi
_HXZ
·
2022-11-22 05:29
机器学习
数据可视化
数据分析
python
数据挖掘
数据分析
特征工程系列:特征筛选的原理与实现
文章系列:特征工程系列:
数据清洗
特征工程系列:特征筛选的原理与实现特征工程系列:特征预处理特征工程系列:特征构造特征工程系列:时间特征构造以及时间序列特征构造前言数据和特征决定了机器学习的上限,而模型和算法只是逼近这个上限而已
安替-AnTi
·
2022-11-22 02:01
机器学习
特征工程
特征处理
第1关:
数据清洗
MapReduce综合应用案例 — 招聘
数据清洗
根据提示,在右侧编辑器补充代码,对数据按照一定规则进行清洗。数据说明如下:data.json;数据所在位置:/root/data/data.json;{"id":4,"company_name":"智联招聘网/Zhaopin.com","eduLevel_name":"本科","emplType":"全职","jobName":"大数据工程师010","salary":"20K-30K","cre
是草莓熊吖
·
2022-11-22 02:58
mapreduce
大数据
hadoop
hdfs
java
数据清洗
黑马程序员 第八章综合案例——构建DVD租赁商店数据仓库——作业(3)
8.3.7加载演员数据至演员维度表1.打开Kettle工具,创建转换使用Kettle工具,创建一个转换load_dim_actor,并添加表输入控件、插入/更新控件以及Hop跳连接线,具体如图所示:2.配置表输入控件双击“表输入”控件,进入“表输入”配置界面,单击【新建】按钮,配置数据库连接,配置完成后单击【确认】按钮。MySQL数据库连接的配置,如图所示:在SQL框中编写SQL语句,用于获取字段
黄橙子^O^
·
2022-11-22 02:57
数据清洗
开发语言
etl
数据库
数据清洗
黑马程序员 第八章综合案例——构建DVD租赁商店数据仓库——作业(4)
8.3.9加载租赁数据至租赁事实表1.打开Kettle工具,创建转换使用Kettle工具,创建一个转换load_fact_rental,并添加表输入控件、字段选择控件、过滤记录控件、计算器控件、增加常量控件、数据库查询控件、维度查询/更新控件、插入/更新控件以及Hop跳连接线,如图所示:2.配置表输入控件双击“表输入”控件,进入“表输入”配置界面,单击【新建】按钮,配置数据库连接,配置完成后单击【
黄橙子^O^
·
2022-11-22 02:57
数据清洗
etl
数据库
mysql
数据清洗
黑马程序员 第八章综合案例——构建DVD租赁商店数据仓库——阅读笔记
8.3案例实现8.3.2加载日期数据至日期维度表1.打开Kettle工具,创建转换使用Kettle工具,创建一个转换load_dim_date,并添加生成记录控件、增加序列控件、JavaScript代码控件、表输出控件以及Hop跳连接线,具体如图1所示。图1创建转换2.配置生成记录控件双击“生成记录”控件,进入“生成记录”配置界面,在“限制”处添加生成的日期,默认为10,这里改为3650,即生成1
あㅉ
·
2022-11-22 02:21
数据仓库
数据清洗
黑马程序员 第八章综合案例——构建DVD租赁商店数据仓库——阅读笔记(3)
8.3.7加载演员数据至演员维度表1.打开Kettle工具,创建转换使用Kettle工具,创建一个转换load_dim_actor,并添加表输入控件、插入/更新控件以及Hop跳连接线,具体如图1所示:图1创建转换load_dim_actor2.配置表输入控件双击“表输入”控件,进入“表输入”配置界面,单击【新建】按钮,配置数据库连接,配置完成后单击【确认】按钮。MySQL数据库连接的配置,如图2所
あㅉ
·
2022-11-22 02:21
数据仓库
数据清洗
黑马程序员 第八章综合案例——构建DVD租赁商店数据仓库——阅读笔记(4)
8.3.9加载租赁数据至租赁事实表1.打开Kettle工具,创建转换使用Kettle工具,创建一个转换load_fact_rental,并添加表输入控件、字段选择控件、过滤记录控件、计算器控件、增加常量控件、数据库查询控件、维度查询/更新控件、插入/更新控件以及Hop跳连接线,如图1所示:图1创建转换load_fact_rental2.配置表输入控件双击“表输入”控件,进入“表输入”配置界面,单击
あㅉ
·
2022-11-22 02:21
数据仓库
数据清洗
黑马程序员 第八章综合案例——构建DVD租赁商店数据仓库——阅读笔记(2)
8.3.5加载用户数据至用户维度表1.打开Kettle工具,创建转换使用Kettle工具,创建一个转换load_dim_customer,并添加表输入控件、映射控件、字段选择控件、值映射控件、维度查询/更新控件以及Hop跳连接线,具体如图1所示:tu1创建转换load_dim_customer2.配置表输入控件双击“表输入”控件,进入“表输入”配置界面,单击【新建】按钮,配置数据库连接,配置完成后
あㅉ
·
2022-11-22 02:51
数据仓库
python 爬虫爬取疫情数据,爬虫思路和技术你全都有哈(二)
上一章:python爬虫爬取疫情数据,爬虫思路和技术你全都有哈(一、爬虫思路及代码)第三步:
数据清洗
清洗数据很简单,就是数据太乱的话,就得花些时间,所以一定要有一个好的方法,才能避免在清洗数据上花费太多的时间
源源佩奇
·
2022-11-22 02:11
python爬虫
python
爬虫
数据挖掘笔记Ⅱ——
数据清洗
(房租预测)
缺失值分析及处理缺失值出现的原因分析采取合适的方式对缺失值进行填充异常值分析及处理根据测试集数据的分布处理训练集的数据分布使用合适的方法找出异常值对异常值进行处理深度清洗分析每一个communityName、city、region、plate的数据分布并对其进行
数据清洗
冉景文
·
2022-11-22 00:10
python
机器学习
数据分析
【推荐收藏】Python 缺失数据处理大全(附代码)
大家好,趁着周末休息,将有关
数据清洗
、数据分析的一些技能再次进行分类,整理成PDF版,里面也包含了我平时用到的一些小技巧,此次就从
数据清洗
缺失值处理走起。
Python数据挖掘
·
2022-11-21 22:19
python
python
python开发
缺失值处理
数据处理
aryson ms sql_数据治理:SQL
数据清洗
十八般武艺
在TowardsDataScience上看过一篇文章,讲的是用Pandas做
数据清洗
,作者将常用的清洗逻辑封装成了一个个的清洗函数。
weixin_39950010
·
2022-11-21 18:06
aryson
ms
sql
asp
sql
ip地址排序
asp.net2.0
sql
server2005
coalesce函数用法
sql
head
first
sql
中文版
inner
join
重复数据
时间序列预处理
数据预处理的主要流程为:
数据清洗
、特征选择、归一化处理、划分窗口、Shuffle和划分数据集等五个阶段。
行者无疆_ty
·
2022-11-21 18:01
人工智能
机器学习
人工智能
数据分析
深度学习(11)——房价预测实践
通过这次实践我发现这类数据分析或是数据预测的问题,
数据清洗
有着非常重要的作用,直接使用高维度的原数据不但跑的时间很长,而且跑出来的结果也相当不好,因此得选择对于数据分析有用的一
星辰大海_coli
·
2022-11-21 17:48
深度学习
深度学习
python
机器学习
数据分析——
数据清洗
之文字特征编码
在对数据进行预处理时,有时会面临特征值是字符串类型的时候,这时候就需要对特征值进行编码处理,主要分为一下两类:各个特征值之间没有任何关联,如['red','green','blue']。各个特征值之间有关系,如['Excellent','Good','Normal','Bad']。下面分别说一下如何对以上两种类型数据进行编码处理:拿kaggle中的HousePrice数据来举例说明。importp
敲代码的quant
·
2022-11-21 17:00
data
analysis
数据清洗
python
文字编码
数据特征预处理
"""特征工程的数据处理:1.异常数据处理(采用
数据清洗
);1)删除含有异常值的记录;2)将异常值视为缺失值,交给缺失值处理方法来解决;3)用平均值修正;4)不处理2.数据不平衡处理(数据增强)2.1离散数据异常
小白进阶---持续充电中
·
2022-11-21 16:10
机器学习
java
python
javascript
dhu 数据科学与技术 第5次作业
将含有NaN数据的行导出为数据文件pre.csv,判断采用何种
数据清洗
模式:填充、删除或手工填充;4)查询课程名称、实验项目名称、实验
凤凰院克里斯
·
2022-11-21 15:26
dhu
python
python
pandas
数据分析
dhu 数据科学与技术 第4次作业
一.简答题(共2题,100分)(简答题)
数据清洗
和填充1)从studentsInfo.xlsx文件的“Group1”表单中读取数据;2)将“案例教学”列数据值全改为NaN;3)滤除每行数据中缺失3项以上
凤凰院克里斯
·
2022-11-21 15:25
python
dhu
python
机器学习
pandas
【Python】pandas 变量类型转换的 6 种方法
pandas
数据清洗
pandas骚操作系列所有数据和代码可在我的GitHub获取:https://github.com/xiaoyusmd/PythonDataScience一、变量类型及转换对于变量的数据类型而言
风度78
·
2022-11-21 11:10
人工智能
字符串
python
数据分析
机器学习
python还是c++量化_从Python到C++,对量化回测的一点思考
而就算知道了策略参数,如果
数据清洗
步骤不一样,回测逻辑计算不一样,实盘订单提交逻辑不一样,那最终结果也不太一样。这
weixin_39987926
·
2022-11-21 09:22
python还是c++量化
三种客观赋权法——熵权法、变异系数法、CRITIC
1.1
数据清洗
数据的清洗是解决问题的第一步,包括缺失值处理和异常值处理两方面。对于缺失值,通常有三种可选的操作——删除、插补、不处理。
m0_59989429
·
2022-11-21 09:13
数学建模心得
算法
【感恩系列】:说点事儿 以及 我把所有的粉丝放到了中国地图上啦~
写博客的收获此可已无言中国版图里的我们设计思路:具体实现爬取粉丝博客名和IP所属地
数据清洗
并保存绘制地图结束语专栏Python零基础入门篇Python网络蜘蛛Python数据分析Django基础入门宝典小玩意儿
IT工藤新一
·
2022-11-21 08:01
真心小项目
python
绘制地图
俺把所有粉丝显示在地图上啦~【详细教程+完整源码】
文章目录小逼叨爬取所有粉丝的IP所属地爬者基本素养:网页分析源代码
数据清洗
和保存源代码绘制地图源代码结束语小逼叨其实昨天发了一篇文章【感恩系列】:说点事儿以及我把所有的粉丝放到了中国地图上啦~这篇文章是自己的第一篇
IT工藤新一
·
2022-11-21 08:00
真心小项目
python
粉丝
绘制地图
上一页
37
38
39
40
41
42
43
44
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他