E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
pythonexcel数据清洗
数据湖概念
应该具备的能力:数据要转换,那就需要有支撑海量
数据清洗
转换的分布式计算能力;数据要产生价值,那就需要有技术门槛低的AI平台来做探索分析;数据治理的视角
陶醉
·
2022-12-10 13:05
大数据
数据仓库
房产销售数据分析与可视化的设计与实现
精彩新手项目案例Python精彩新手项目案例文章目录Java精彩实战项目案例Java精彩新手项目案例Python精彩新手项目案例前言一、研究目的及工作内容二、房产销售数据处理分析及可视化2.1爬虫之数据保存2.2
数据清洗
疯狂行者
·
2022-12-10 13:50
Python项目
数据分析
python
数据挖掘
pandas数据
pandas是强大的结构化数据分析工具,可以用于数据挖掘与数据分析,也可以用于
数据清洗
。pandas的数据结构有Serials形式,以及dateframe形式。
多多¥
·
2022-12-10 13:08
pandas
python
机器学习-NLP(二):LSTM假新闻检测
文章目录导入相关库读取数据创建x数据和y标签
数据清洗
编码输入数据数据拆分创建模型训练假新闻分类器模型使用模型预测并检测精度导入相关库importreimportnltkimportnumpyasnpimportpandasaspdimporttensorflowastffromnltk.corpusimport
川川菜鸟
·
2022-12-10 11:16
机器学习入门到大神
自然语言处理
lstm
Python
数据清洗
-异常值处理
异常值的判别如何定义异常值:根据正态分布定律,95%的样本理论上应该落在均值的两倍标准差以内,因此我们将一组测定值中与平均值的偏差超过两倍标准差的测定值判别为异常值,与平均值的偏差超过三倍标准差的测定值,称为高度异常的异常值。在实际生活中最常讲到的二八法则也是根据这一定理。本文的分析结构首先,自定义一个分析的数据集合,日常的话可以是从数据库提取的数据,EXCEL表格等##自定义数据分析数据集合im
更更-python
·
2022-12-09 23:24
python基础知识
python
开发语言
阿里十年技术沉淀|深度解析百PB级数据总线技术
通过数据总线,可以实时接入来自服务器、K8s、APP、Web、IoT/移动端等产生的各类异构数据,进行统一数据管理,进而实现与下游系统的解耦;之后可以异步实现
数据清洗
、数据分发、实时计算、离线计算等计算过程
阿里云云栖号
·
2022-12-09 21:17
kafka
java
大数据
阿里云
云计算
数据可视化分析报告作业_数据分析——可视化和商业报告
3,
数据清洗
。4,构建模型。5,数据可视化。▲今日重点,关于数据可视化和PPT商业分析报告。1,看懂不同类型的图表。2,像设计师一样设计图表。3,使用PPT制作数据分析报告。
点点0605
·
2022-12-09 18:50
数据可视化分析报告作业
泰坦尼克号预测结果分析报告
目录提出问题(BusinessUnderstanding)理解数据(DataUnderstanding)采集数据导入数据查看数据集信息
数据清洗
(DataPreparation)数据预处理特征工程(FeatureEngineering
郭苗苗772266
·
2022-12-09 18:16
数据挖掘
python
数据分析
泰坦尼克号可视化数据分析报告
目录提出问题理解数据采集数据导入数据查看数据
数据清洗
数据处理幸存率与家庭类别幸存率与头衔幸存率与年龄幸存率与客舱等级幸存率与性别幸存率与登船港口1.提出问题什么样的人更容易存活?
郭苗苗772266
·
2022-12-09 18:11
数据分析
数据挖掘
python
【大数据实战】招聘网站职位分析
通过采集招聘网站大数据职位信息、利用
数据清洗
、数据分析、jieba分词、数据挖掘完成整体项目的开发工作。
闭关修炼——暂退
·
2022-12-09 11:14
大数据
python
数据分析
akshare量化是什么?有什么用?
akshare量化是一个非常好用的开源A股数据获取模块,它是基于Python的财经数据接口库,目的是实现对A股、美股、期货等金融产品的基本面数据、实时和历史行情数据、衍生数据从数据采集、
数据清洗
到数据落地的一套工具
Qq_2037696191
·
2022-12-09 10:55
l2行情接口
量化交易
c++
【机器学习小论文】sklearn线性回归LinearRegression代码及调参
至于
数据清洗
那一块,暂时不贴上了,主要原因就是
数据清洗
不容易,并且每个人的清洗方法也不一样,所以主要还是看思路。二、算法简介2.1什
小胡同1991
·
2022-12-09 04:24
机器学习
Python
机器学习
【毕业设计】大数据招聘数据分析可视化 - python
文章目录0前言1数据集说明2数据处理2.1
数据清洗
2.2数据导入3数据分析可视化3.1整体情况(招聘企业数、岗位数、招聘人数、平均工资)3.2企业主题3.2.1行业情况3.2.2公司类型3.2.3最缺人的公司
caxiou
·
2022-12-09 01:49
大数据
毕业设计
python
数据分析
大数据
招聘数据分析可视化
啃书 《利用python进行数据分析》第七章
数据清洗
与准备
啃书《利用python进行数据分析》第七章
数据清洗
与准备文章目录啃书《利用python进行数据分析》第七章
数据清洗
与准备7.1处理缺失值7.1.1过滤缺失值dropna()7.1.2补全缺失值fillna
真是喵啊
·
2022-12-08 23:20
数据分析
python
数据挖掘
数据清洗
操作步骤
1、txt第一行删掉2、txt中null替换为0,0,0,0,0,0(之后会删除这些帧)3、运行data_fixation.py#txt文件名改为数字,删第一行,将null替换为0,0,0,0,0,0,输入此程序,可获得每帧fixation点的重心importosimportnumpyasnpfromnumpyimport*path="./test/"#输入文件的绝对路径lists=os.list
hollq
·
2022-12-08 21:56
python
开发语言
Pytorch 天池_工业蒸汽量预测
Pytorch天池_工业蒸汽量预测1.赛题介绍2.数据说明3.实验步骤3.1
数据清洗
3.2数据归一化3.3数据划分3.4建立模型3.5训练参数3.6运行代码3.7实验结果1.赛题介绍火力发电的基本原理是
雲帝
·
2022-12-08 19:45
Python
深度学习
算法
python
深度学习
Pytorch
天池
年终总结
今年的总体感觉,累,身心俱累,但总要有积极向上的态度,人生不如意十之八九,还行、还行工作上面,报告4+简报4+审核校对、封面封底;各种调研工作、功能梳理等;3个PPT,读书、胡、刘素养;榜单梳理;
数据清洗
遥小吧
·
2022-12-08 15:49
黄佳《零基础学机器学习》chap3笔记
预测网店的销售额3.1问题定义:小冰的网店广告该如何投放3.2数据的收集和预处理3.2.1收集网店销售额数据3.2.2数据读取和可视化3.2.3数据的相关分析3.2.4数据的散点图3.2.5数据集清洗和规范化
数据清洗
数据规范化
临风而眠
·
2022-12-08 12:43
机器学习
算法
线性回归分析
R语言数据分析
数据分析过程:数据导入——
数据清洗
——数据探索——数据建模——可视化——报告发现基本操作命令注:*处写包名函数说明getwed()显示当前工作目录setwd()修改当前工作目录ls()显示当前工作空间中的所有对象
gz瑋
·
2022-12-08 12:31
R语言
r语言
数据分析
从零开始:机器学习的数学原理和算法实践--学习笔记(2)
数据准备阶段数据采集
数据清洗
:去除不合理的值、缺失值处理不均衡样本处理:上采样、下采样数据类型转化:one-hot编码数据标准化:max-min标准化、z-score标准化(将数据转化为均值为0,方差为
weixin_45752264
·
2022-12-08 12:54
算法
学习
NNDL 实验3 线性回归
样本数量&正则化系数2.3多项式回归2.3.1数据集构建.2.3.2模型构建2.3.3模型训练2.3.4模型评估2.4Runner类介绍2.5基于线性回归的波士顿房价预测2.5.1数据处理2.5.1.2
数据清洗
喝无糖雪碧
·
2022-12-08 11:34
机器学习
算法
人工智能
pandas数据分析之数据运算(逻辑运算、算术运算、统计运算、自定义运算)
数据分析离不开数据运算,在介绍完pandas的数据加载、排序和排名、
数据清洗
之后,本文通过实例来介绍pandas的常用数据运算,包括逻辑运算、算术运算、统计运算及自定义运算。
xiejava1018
·
2022-12-08 04:09
机器学习
大数据
Python
数据分析
python
数据挖掘
pandas
机器学习
问答场景 实战案例
其中标题一至三都是
数据清洗
工作,标题四至七是数据投喂至模型预测本文所使用的数据文件为:comment.csv,提取码:2323。文件不大,无需百度网盘会员也可短时间下载完毕。
蓝牙传输味觉
·
2022-12-08 01:25
人工智能
pandas
python
算法
人工智能
深度学习
tensorflow
数据分析
数据科学概论Add-on Resources
DataScienceAddonResource2020.09.15version一、数据科学概论二、OLTP与数据服务SQL快速入门并发控制三、OLAP与结构化数据分析四、
数据清洗
与数据集成编辑距离五
xiongpai1971
·
2022-12-07 22:48
教材
数据科学概论
Addon
Resources
R数据分析:如何在R中使用mutate
今天要写的就是
数据清洗
的函数mutate(),这个属于超级基本的内容哦,一般我们拿到数据最头疼应该就是清洗数据了,所以清洗数据的基础一定要牢牢掌握。
公众号Codewar原创作者
·
2022-12-07 22:00
R
python对电影进行预测评分_TMDb电影数据分析 & 电影评分预测
前言本项目展示了问题分解、
数据清洗
、数据分析与可视化的过程,最后给出了一个简单的预测模型。
weixin_39956612
·
2022-12-07 16:53
python对电影进行预测评分
游玩数据获取与数据分析、数据挖掘 【2022.5.30】
1b39J-dEfUt1ZROO93aEkag提取码:8848要点:1、主要使用BeautifulSoup进行解析,BeautifulSoup语法需要掌握find_all,find方法,自行百度了解2、使用pandas和numpy进行
数据清洗
和挖掘
丶凉介
·
2022-12-07 16:48
数据挖掘
python爬虫
旅游
python
数据分析
数据挖掘
大数据
数据分析与数据挖掘实战案例本地房价预测(716):
数据分析与数据挖掘实战案例(7/16):2022年首届钉钉杯大学生大数据挑战赛练习题目练习题A:二手房房价分析与预测要点:1、机器学习2、数据挖掘3、
数据清洗
、分析、pyeahcrs可视化4、随机森林回归预测模型预测房价整体代码
丶凉介
·
2022-12-07 16:16
机器学习
数据挖掘
数据挖掘
数据分析
python
随机森林
大数据
pandas 缺失数据处理大全(附代码)
利用闲暇之余将有关
数据清洗
、数据分析的一些技能再次进行分类,里面也包含了我平时用到的一些小技巧,此次就从
数据清洗
缺失值处理走起,链接:pandas
数据清洗
,关注这个话题可第一时间看到更新。
Python数据科学
·
2022-12-07 15:13
pandas数据清洗
数据挖掘
python
数据分析
pandas
数据清洗
机器学习练手---负荷数据预测
纸上得来终觉浅,得知此事要躬行文章目录前言一、
数据清洗
查看特征与label的关联程度查看特征自身的差异性。
小小怪,战胜你所有的黑暗,嘿哈
·
2022-12-07 14:45
机器学习
python
人工智能
pandas学习笔记
pandas学习笔记文章目录pandas学习笔记一、数据的导入导出二、查看数据三、数据提取四、
数据清洗
五、合并数据六、数据统计七、各种数据类型的转换一、数据的导入导出1.导入pandas库importpandasaspd2
叫我胡萝北
·
2022-12-07 12:19
pandas
学习
python
详细介绍NLP文本分类
统计方法首先是对原始输入数据进行预处理,一般包括分词、
数据清洗
和数据统计等,然后人工抽取特征并选择具体的统计模型设计分类算法。
若年封尘
·
2022-12-07 11:22
深度学习
自然语言处理
分类
机器学习
文本分类
NLP
数据清洗
(黑马程序员)课后题答案选择填空判断
____
数据清洗
__________技术是提高数据质量的有效方法。5.常见的数据质量问题主要包括缺失值、_
Kc77
·
2022-12-07 10:36
数据仓库
数据库
数据挖掘
大数据
数据挖掘:理论与算法 笔记(1)
基础概念:(1)
数据清洗
是耗神的,原因有信息不完整,噪点(比如工资为-1元),前后不一等问题。
八刀
·
2022-12-07 05:15
数据挖掘
数据i挖掘
笔记
【机器学习实战】对加州住房价格数据集进行
数据清洗
1.先将X和Y(标签值)分开#预测器housing=start_train_set.drop("median_house_value",axis=1)#标签housing_labels=start_train_set["median_house_value"].copy()预测器:标签值:2.对缺失值进行处理2.1通常对缺失值进行处理的三种方法#1.放弃这些相应的地区,即删掉包含缺失值的每一行样本
想做一只快乐的修狗
·
2022-12-07 02:30
机器学习
python
numpy
数据清洗
预测
船轨迹预测
数据清洗
,数据里面有很多数字的连续性不强,也是要去掉的。网络参数调整:包括调整神经元个数还有dropout率,似乎效果影响不大。
摸鱼RPA
·
2022-12-06 23:07
人工智能
特征值处理-机器学习
数据清洗
和特征挖掘的工作是在灰色框中框出的部分,即“
数据清洗
=>特征,标注数据生成=>模型学习=>模型应用”中的前两个步骤。灰色框中蓝色箭头对应的是离线处理部分。
haungtan07
·
2022-12-06 14:44
数据挖掘
【方法】机器学习中的
数据清洗
与特征处理
来源:http://tech.meituan.com/machinelearning-data-feature-process.html背景随着美团交易规模的逐步增大,积累下来的业务数据和交易数据越来越多,这些数据是美团做为一个团购平台最宝贵的财富。通过对这些数据的分析和挖掘,不仅能给美团业务发展方向提供决策支持,也为业务的迭代指明了方向。目前在美团的团购系统中大量地应用到了机器学习和数据挖掘技术
一寒惊鸿
·
2022-12-06 14:14
机器学习
机器学习
机器学习中的
数据清洗
与特征处理综述
本文主要介绍在美团的推荐与个性化团队实践中的
数据清洗
与特征挖
Bryan__
·
2022-12-06 14:41
机器学习
机器学习预处理
数据清洗
请简述python数据分析流程_简单案例讲解Python数据分析的基本步骤
一、数据分析的基本步骤1.明确问题,理解数据(1)先把问题了解清楚,明确分析背景及目的(2)了解数据集的整体情况(3)明确分析思路2.
数据清洗
(1)确定数据集(2)处理重复值和缺失值(3)处理数据类型/
weixin_39737764
·
2022-12-06 12:41
请简述python数据分析流程
[R]_使用mutate_all(),mutate_at(),mutate_if()操纵数据框的列
用R做
数据清洗
的人应该对mutate()不会陌生,这个函数用来增加列变量,非常好用,不过它的一些同胞mutate_all(),mutate_at(),mutate_if()知名度就没有那么高,但其实这几个也是很好用的函数
吃过了没
·
2022-12-06 00:55
r语言
开发语言
大数据
算法
菜鸟窝出品】
数据清洗
、python与sklearn数据标准化实战(附项目源码)
本文是由菜鸟窝特邀清华的人工智能博士亲授,从零开始教你如何进行数据预处理,并通过实际案例手把手教会大家进行实操。相关的源码会发给大家实践,让你真正做到学以致用。阿里百度人工智能大神精讲的人工智能视频课程,领取地址:https://www.cniao5.com/course/10239或欢迎勾搭运营小姐姐(微信id:BT474849)免费领取63讲精品机器学习入门到实战视频哦~视频详解和实操代码可联
Bella人工智能爱好者
·
2022-12-05 22:58
机器学习
python数据分析
数据预处理
数据清洗
python数据清洗实操
【数据分析】电商平台订单报表分析思路及案例
分析问题诊断性、预测性分析、仿真分析线性回归、逻辑回归解决问题数据报告+决策性分析2.1相关数据商品编号、商品名称、商品价格、票号、座位、联系地址2.2订单数据分析一般思路数据抓取数据库数据调取
数据清洗
无效
数据清洗
♚人间海
·
2022-12-05 21:27
数据分析
数据挖掘
big
data
订单数据分析-实战
1.京东订单数据准备1.1京东订单数据介绍2020年5月25日10%抽样数据大家电-家用电器-冰箱70K+1.2
数据清洗
缺失值处理用户城市和省份信息有部分缺失,部分订单的订单中支付时间为空值数据逻辑错误格式内容一致性
avagogogo
·
2022-12-05 21:56
数据分析
数据可视化
【笔记】电商订单数据分析实战
文章目录一、
数据清洗
二、数据分析2.1计算总体指标2.2计算每月GMV及趋势分析2.3流量渠道来源拆解GMV占比2.4按星期几统计下单量2.5根据下单时段统计下单量(30分钟一段)2.6按月统计复购率三
Sprite.Nym
·
2022-12-05 21:55
python数据分析
数据分析
python
pandas
Python数据分析实战 —— 天猫订单数据分析
文章目录项目介绍数据介绍导入部分库数据预处理数据格式整理异常值分析数据分析描述性统计周趋势、日趋势分析产品价格分析地区分析转化率分析总结项目介绍本项目将对2020年2月份的真实天猫订单成交数据(共28010条记录)进行
数据清洗
zgrjddd
·
2022-12-05 21:55
Python
Python
数据分析
天猫
数据可视化
图表大全
使用LSTM进行多步预测
文章目录使用LSTM对PM2.5进行2步预测1.项目简介2.导入所需库3.导入数据4.
数据清洗
4.1缺失值处理4.2分类数据处理4.3构造数据集4.4拆分数据集4.5数据标准化5.建模5.1构造模型5.2
悬瓴木
·
2022-12-05 20:51
深度学习
神经网络
lstm
Spark数据分析及处理(实战分析)
项目需求:使用Spark完成下列日志分析项目需求:1.日志
数据清洗
2.用户留存分析1.
数据清洗
读入日志文件并转化为RDD[Row]类型按照Tab切割数据过滤掉字段数量少于8个的对数据进行清洗按照第一列和第二列对数据进行去重过滤掉状态码非
Mr.梧桐
·
2022-12-05 18:37
spark
数据库
mysql
Pandas+随机森林数模实战日记
提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档文章目录目录前言一、数据预处理1.数据表关联2.特征相关性分析3.
数据清洗
二、随机森林训练1.随机森林总结前言记录第一次单人参赛,用Pandas
auguste805
·
2022-12-05 14:36
随机森林
python
机器学习
数据清洗
_第一篇 缺失值处理(3)_常见插值法(均值、回归、EM、多重)
目录1.均值插值法2.回归插值法3.EM算法4.多重插值A12J1.均值插值法均值插补是利用样本数据平均值或众数作为其替代值对数据进行插值。均值插补的插补值计算方程为:(1)其中,为是否回答的描述符号表示,表示“是”,表示“否”,是个数2.回归插值法回归插值是根据样本中缺失变量和已得到变量构建回归方程,即根据已有的样本数据,对调查中目标变量的缺失值进行估算。构建自变量与目标变量Y的关系,且第个缺失
SMT深海的鱼
·
2022-12-05 12:21
数据质量
数据分析
上一页
34
35
36
37
38
39
40
41
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他