E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
pythonexcel数据清洗
python基础笔记(六)_
数据清洗
及建模
数据特征分析分布分析研究数据的分布特征和分布类型定量数据极差:max-min通过直方图直接判断分组组数简单查看数据分布,确定分布组数一般8-16即可求出分组区间pd.cut(x,bins,right)按照组数对x分组,且返回一个和x同样长度的分组dataframeright:是否包含右边,默认为True通过groupby查看不同组的数据频率分布求出目标字段下频率分布的其他统计量→频数,频率,累计频
FlizhN
·
2023-01-27 08:19
python
Pandas教程:20个pandas函数让你的“
数据清洗
“能力提升100倍
今天准备介绍一篇超级肝货!Pandas是基于NumPy的一种工具,该工具是为解决数据分析任务而创建的。它提供了大量能使我们快速便捷地处理数据的函数和方法。本文介绍的这20个【被分成了15组】函数,绝对是数据处理杀手,用了你会爱不释手。Pandas教程构造数据集这里为大家先构造一个数据集,用于为大家演示这20个函数。importpandasaspddf={'姓名':['黄同学','黄至尊','黄老邪
程序员二飞
·
2023-01-26 14:19
python
程序员
python
数据挖掘
数据分析
pandas
基于Python的世界各个国家的幸福度的公开数据集的数据挖掘 课程论文+答辩PPT+源码及数据
目录一.问题背景1二.准备工作2三.具体实施21.数据存储及基本加载2#数据整理到数组之中22.
数据清洗
2①多余列清除2②列属性归一3③空值处理43.数据挖掘算法6①基本特征6②总体热力图分析7③对指定数据的热力图分析
毕业设计论文资料
·
2023-01-26 14:43
数据分析项目入门案例
目录:案例一:互联网电商群组留存分析案例二:Boss直聘''数据分析''岗位分析及可视化附:数据分析流程及
数据清洗
常用方法[1]电商互联网行业关注方向:用户渠道产品营销营收平台类:淘宝,京东等,纯粹提供平台服务赚取费用
青尘梓
·
2023-01-26 11:10
Python数据分析(2)----------Numpy(ndarray)数组的基本操作1
其实我这一系列数据分析,是我学习python数据分析的一个笔记,也就是说,如果大家想自学数据分析,可以跟着我的博客来一起学习,可能更新有点慢,但是我尽量赶时间,在
数据清洗
结束后我会整理一个目录,供大家参考今天我们分享一下
国内知名退堂鼓演奏家
·
2023-01-25 11:47
python
机器学习
数据分析
numpy
Numpy基础
mmclassification使用步骤与心得/ACCV实验记录
www.cvmart.net/race/9917/base数据预处理参考博客:https://blog.csdn.net/u013347145/article/details/109250455主要包括:1.
数据清洗
由于图片直接由网上爬取得到
一杯西瓜籽
·
2023-01-22 18:03
计算机视觉
深度学习
神经网络
pytorch
Python——数据的清洗(2)
在对
数据清洗
的过程中,可能涉及将一列拆成多列、合并多个数据集等不同数据集之间的操作,可以使用一些python内置函数来达成目标。
Zzz.......
·
2023-01-22 13:08
Python
pandas
数学建模论文分析
CSDN博客_数学建模数据预处理一、“假设”的作用合理的模型假设,抛开了一些次要的因素(一些人为不可控因素),抓出主要因素,使用精确的语言对问题进行分析,做出假设二、数据预处理数据预处理主要有四个任务:
数据清洗
m0_52124992
·
2023-01-21 12:59
数学建模
算法
人工智能
机器学习中的
数据清洗
与特征处理综述
目录1、采样:2、
数据清洗
3、特征分类4、特征处理与分析5、特征降维6、特征选择7、特征监控8、参考1、采样:分类问题:选取正例,负例,比例确定。
不吃鱼的喵_sweet
·
2023-01-21 08:53
机器学习
大数据
pandas预处理部分地区数据案例
数据清洗
的任务是过滤那些不符合要求的数据,将过滤的结果交给业务主管部门,确认是否过滤掉还是由业务单位修正之后再进行抽取。不符合要求的数据主要是有不完整的数据、错误的数据、重复的数据三大类。
·
2023-01-21 00:31
天池入门赛- 新闻推荐-task4-特征工程
特征工程和
数据清洗
转换是比赛中至关重要的一块,因为数据和特征决定了机器学习的上限,而算法和模型只是逼近这个上限而已,所以特征工程的好坏往往决定着最后的结果,特征工程可以一步增强数据的表达能力,通过构造新特征
qq_41768189
·
2023-01-20 17:57
推荐系统
大数据
人工智能
机器学习
数据预处理之
数据清洗
案例
最全
数据清洗
指南让你所向披靡(qq.com
数据清洗
:从记录集、表或数据库中检测和修
sereasuesue
·
2023-01-19 19:48
数据分析
python
数据预处理
pandas预处理案例——数据分析师招聘
数据清洗
实战
数据分析师招聘
数据清洗
实战数据导入并查看重复数据处理异常值处理缺失值处理数据是数据分析师的招聘薪资,主要内容是进行数据读取,数据概述,
数据清洗
和整理数据获取:链接:https://pan.baidu.com
魔仙大佬
·
2023-01-19 19:48
python数据清洗
python
数据分析
字符串
csv
pandas案例——预处理部分地区数据
数据清洗
的任务是过滤那些不符合要求的数据,将过滤的结果交给业务主管部门,确认是否过滤掉还是由业务单位修正之后再进行抽取。不符合要求的数据主要是有不完整的数据、错误的数据、重复的数据三大类。
CarveStone
·
2023-01-19 19:17
数据分析
pandas
python
数据分析
数据挖掘--糖尿病遗传风险检测
文章目录赛事背景数据特征介绍数据处理导入数据并查看分析数据
数据清洗
特征工程构建模型建立训练数据集和测试数据集构建模型赛事背景截至2022年,中国糖尿病患者近1.3亿。
Nobitaxi
·
2023-01-19 17:30
数据挖掘
数据挖掘
人工智能
python
机器学习
2012美国大选献金项目数据分析
文章目录1、数据载入与预览1.1数据加载1.2数据合并1.3数据预览1.3.1查看是否有空值1.3.2用统计学指标快速描述数值型属性的概要2、数据的预处理2.1
数据清洗
2.1.1查看缺失值所在的列2.1.2
S.xavier
·
2023-01-19 15:00
数据分析
数据分析
大数据
pytorch
《Pandas数据处理》(二)——
数据清洗
及特征处理
那么在这里,我们主要是做数据分析的流程性学习,主要是包括了
数据清洗
以及数据的特征处理,数据重构以及数据可视化。这些内容是为数据分析最后的建模和模型评价做一个铺垫。
爱读Paper的Toby
·
2023-01-19 15:52
数据分析
数据分析
python-
数据清洗
及特征处理
数据清洗
及特征处理数据集下载:https://www.kaggle.com/c/titanic/overview在数据分析中我们拿到的数据通常是不干净的,所谓的不干净,就是数据中有缺失值,有一些异常点等
黎小强同学
·
2023-01-19 15:50
python
数据挖掘
数据分析
pandas
数据清洗
——缺失值处理
查看缺失值使用DataFrame对象的info()方法原始数据注:NaN为空缺值查看是否有缺失值print(df.info())#查看是否有缺失值Non-NullCount列显示的是每个索引中不是空缺的个数判断数据是否存在缺失值使用DataFrame的isnull()方法和notnull()方法1.isnull()方法——判断是否为空,输出结果为True和False,不为NaN时返回False,为
盖亚超人
·
2023-01-19 15:20
机器学习
pandas
python
pandas
python
Pandas
数据清洗
及特征处理
数据清洗
及特征处理
数据清洗
及特征处理缺失值处理重复值处理连续型数值特征和文本型特征处理连续型数值特征处理文本变量特征处理
数据清洗
及特征处理缺失值处理缺失值认定缺失值类型NaN,np.NaN,np.nan
STUffT
·
2023-01-19 15:48
pandas基础
python
pandas
scikit-learn——机器学习应用开发的步骤和理解
目录1.数据采集和标记2.特征选择3.
数据清洗
4.模型选择5.模型训练6.模型测试7.模型保存与加载8.实例数据采集和标记特征选择模型训练模型测试模型保存与加载1.数据采集和标记先采集数据,再
m0_65187443
·
2023-01-19 09:11
scikit-learn
python
机器学习
多元线性回归算法预测房价
文章目录一、多元线性回归理解二、波士顿房价案例三、
数据清洗
(数据预处理)1、数据预处理2、数据筛选3、非数值型数据转换四、使用Excel实现回归1.回归实现2、回归分析五、使用代码实现回归使用Statsmodels
菜虚鲲001
·
2023-01-18 22:18
算法
线性回归
机器学习
Python金融风控模型案例实战大全
包括风控建模全流程知识介绍,信用评分卡,信用评分卡知识包含个人信用评分卡和企业信用评分卡知识;集成树算法xgboost,lightgbm,catboost,神经网络算法,多个异常值检测算法,多个变量筛选算法,
数据清洗
全流程等
python风控模型
·
2023-01-18 19:52
论文毕设
python
人工智能
风控模型
风控模型案例
《数据分析》(一) ———— 数据基础操作
第二部分:
数据清洗
与重构。当
风是甜的耶耶耶
·
2023-01-18 14:10
数据分析
python
pandas
Datawhale---动手学数据分析---第二章:第二章:
数据清洗
及特征处理(泰坦尼克的任务)
那么在这里,我们主要是做数据分析的流程性学习,主要是包括了
数据清洗
以及数据的特征处理,数据重构以及数据可视化。这些内容是为数据分析最后的建模和模型评价做一个铺垫。开始之前,导入n
风筱~
·
2023-01-18 13:57
数据分析
numpy
pandas
jupter
python
0113学习记录
机器学习-数据科学库(HM)01【数据分析介绍和环境安装】01数据分析的介绍分析数据,就是进行
数据清洗
02【数据分析介绍和环境安装】02jupyter和conda的使用anacondacondajupyternotebook03
zhang,
·
2023-01-18 11:57
matplotlib
python
【数据爬取和数据分析】Q房网深圳二手房源分析
目录1数据爬取1.1目标网站及数据选择1.2编写爬虫2数据预处理2.1
数据清洗
2.3数据说明2.4描述性统计3数据可视化分析4聚类分析5结论1数据爬取1.1目标网站及数据选择1.1.1Q房网深圳二手房待售小区信息页
Huang Zenan
·
2023-01-18 01:59
数据分析
数据挖掘
python
jupyter
Pandas
数据清洗
Pandas
数据清洗
数据清洗
是对一些没有用的数据进行处理的过程。
川&泽
·
2023-01-17 21:53
#
Pandas
pandas
python
数据分析
四、Pandas
数据清洗
规整
四、Pandas
数据清洗
规整4.1数据加载、储存4.1.1从数据文件读取数据导入支持库:importnumpyasnpfrompandasimportSeries,DataFrameimportpandasaspd
小石小石摩西摩西
·
2023-01-17 21:23
机器学习
BRICS
MLBD
matplotlib
Python-pandas
数据清洗
pandas
数据清洗
数据清洗
是对一些没有用的数据进行处理的过程。很多数据集存在数据缺失、数据格式错误、错误数据或重复数据的情况,如果要对使数据分析更加准确,就需要对这些没有用的数据进行处理。
qq_41955225
·
2023-01-17 21:23
Python
python
西北乱跑娃 -- pandas
数据清洗
及转换
一、列表嵌套字典转DataFrameres=requests.post(url,headers=header,data=data).json()['rows']df=pd.DataFrame(res)二、删除没有用的字段名及对应数据df.drop(['id','consultationid','orgid','createuserid','modifyuserid','createuserid']
西北乱跑娃
·
2023-01-17 21:52
flask
数据库
python
python
pandas
数据清洗
实例-apply|applymap
pandas
数据清洗
实例-apply|applymap*pandas
数据清洗
*apply()函数、applymap()函数应用*正则表达式前言从某网中爬取了上海浦东地区的房价数据【数据下载】,如下所示,
liuyunfeng_c
·
2023-01-17 21:52
数据分析
爬虫
python
正则表达式
数据挖掘
Pandas
数据清洗
Pandas
数据清洗
数据清洗
是对一些没有用的数据进行处理的过程。很多数据集存在数据缺失、数据格式错误、错误数据或重复数据的情况,如果要对使数据分析更加准确,就需要对这些没有用的数据进行处理。
M_Q_T
·
2023-01-17 21:22
python学习
python
pandas
数据清洗
机器学习常用
数据清洗
方法
最近做机器学习的项目,汇总一下用得比较多的
数据清洗
方法,主要有:重新命名列名、去除空值、去除0值(或负值)、过采样、下采样1.重新命名列名平时读数据的时候,原始数据总是有各种乱七八糟的命名,可以通过命名便于理解第一种方法
蒽,开心(∩_∩)
·
2023-01-17 11:21
pandas
数据分析
机器学习
《
数据清洗
》知识总结------第一章
数据清洗
概述
涉及内容:
数据清洗
的背景/定义/原理/基本流程/策略与方法1.1
数据清洗
的背景数据质量的好坏决定了数据分析与数据挖掘能否获得理想的结果。
一只瓜瓜
·
2023-01-17 10:24
数据清洗
big
data
头歌:数据预处理之
数据清洗
本关任务:完成泰坦尼克号遇难数据的清洗。案例背景泰坦尼克号遭遇的灾难震惊世界,如何避免灾难甚至预测灾难呢?要实现首先要做好泰坦尼克号的损失数据统计,才能为数据分析打下基础。编程要求根据提示,你需要完成:缺失值填充离群点检测importnumpyasnpimportpandasaspd#读取数据df=pd.read_csv('/data/workspace/myshixun/step1/train.
poi192
·
2023-01-17 10:54
笔记
python
开发语言
【pandas之
数据清洗
和处理和空值处理】
提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档文章目录前言一、Pandas对缺失值的处理二、使用步骤0.数据处理1.空值处理2.删除全是空值的行和列3.填充空值3.补全姓名4.保存数据三、实例清洗买船票数据0.原始数据1.代码总结前言提示:这里可以添加本文要记录的大概内容:待处理表格提示:以下是本篇文章正文内容,下面案例可供参考一、Pandas对缺失值的处理Pandas使用这些函
qq_23605533
·
2023-01-17 10:53
python
python
数据清洗
该怎么做?
那么本文就从7个关键性的清理步骤入手,给大家阐明如何做
数据清洗
。可能破坏数据集预测有效性的最明显就是不属于集合的异常值。例如,iphone手机9.9元,那可能是并夕夕带来的噪声。
炼丹笔记
·
2023-01-17 10:23
机器学习
python
java
人工智能
数据分析
大数据的处理之
数据清洗
学习目标:1.学会查找脏数据2.学会清洗数据学习内容:1.脏数据”的脏数据的定义和判断标准2.在oracle数据库里清洗数据学习时间:有oracle基础的话,学习6个小时学习产出:1.技术笔记1篇2.
数据清洗
的相关代码
消失在人海中
·
2023-01-17 10:23
大数据
数据库
oracle
数据仓库
etl工程师
pandas:世界各国GDP数据集
数据清洗
案例
JupyterNotebook网盘链接:百度网盘-GDP数据集文章目录1.1依赖准备1.2数据准备1.3数据观察(1)观察数据形状(2)观察数据前五行(3)观察数据列名称列表(4)观察各列数据类型(5)观察结果1.4
数据清洗
这也是计划的一部分
·
2023-01-17 10:22
数据分析
pandas
python
数据分析
深圳租房数据可视化分析【Plotly库绘图】
深圳租房数据可视化分析【plotly库绘图】一、技术介绍1、可视化技术支持来源:2、选择plotly理由:二、代码实现及分析:1、导入库及解读数据集:2、
数据清洗
与转换3、统计数据4、不同区域之间的租金对比
有品位的小丑
·
2023-01-17 09:06
数据分析与可视化
plotly
python
数据分析
信息可视化
实例:【基于机器学习的NBA球员信息数据分析与可视化】
文章目录一、项目任务二、代码实现及分析1.导入模块2.导入文件并对文件信息进行整体探测3.数据预处理3.1查看数据集信息3.2
数据清洗
与转换3.3数据去重4.数据可视化4.1数据相关性4.2球员数据分析
有品位的小丑
·
2023-01-17 09:58
数据分析与可视化
机器学习
数据分析
python
lda 可以处理中文_商品评论情感化分析案例(LDA主题分析)
分析内容正负面高频词汇正负面情绪波动正负面情感倾向正负面LDA主题分析文章目录因为内容较长,这里附上文章内容目录(上传图片有些失真模糊,凑合看看了):
数据清洗
、预处理文本数据,是一种非结构化数据。
weixin_39667452
·
2023-01-16 20:56
lda
可以处理中文
数据分析项目实战1——淘宝用户购买行为分析(天池)
二、业务问题及分析思路三、
数据清洗
3.1子集选择选取10万条数据导入MySQL构成本次分析的数据集。3.2列名重命名给导入的数据各字段命名用户id:userid商品ID:itemid商品
Janice18
·
2023-01-15 17:32
数据分析师
数据分析项目实战
数据分析
mysql
【实战】淘宝电商用户行为分析——SQL
目录一、项目背景1.1分析目的1.2分析思路二、数据来源&清洗2.1数据集介绍2.2
数据清洗
2.2.1检查是否存在重复值2.2.2检查是否存在缺失值2.2.3一致化处理(对timestamp)2.2.4
Stella屿
·
2023-01-15 17:31
实战
sql
kaggle——泰坦尼克之灾2
1、流程就这个案例来讲,导入数据之后要做的,分为3步走:1、观察数据,了解特征的含义以及与生存率的关系,方便做特征工程2、特征工程&
数据清洗
,这一步是为了得到一个可以用于训练的好且完整的数据。
andyham
·
2023-01-15 16:49
Python爬虫、
数据清洗
与可视化-2 -request-练习-1-——爬baidu首页热点
练习:爬百度实时热点top10的排序,标题内容,链接#-*-coding:UTF-8-*-importrequestsfromlxmlimportetreeimportcsv#1.爬取urls="http://top.baidu.com/buzz?b=1"headers={"User-Agent":"Mozilla/5.0(WindowsNT6.1;WOW64)AppleWebKit/537.36
Adrian-11
·
2023-01-15 15:42
python项目练习记录
python
基于支持向量机的量化选股模型
要求开发一个基于支持向量机技术的多因子量化投资模型,以近五年沪深300成分股的交易与财务数据为样本,结合大数据相关技术进行
数据清洗
,整理,存储,并构建投资策略与回测框架,输出量化投资模型的结果,为投资者选股与择时提供参考信号
啊金曼
·
2023-01-15 14:41
python
支持向量机
机器学习
金融
Pandas groupby函数 transform函数 实战
但对于数据科学家来说,transform函数是一个用于
数据清洗
、转换或者生成报表的非常方便的工具,尤其是对于大量数据的处理速度上。
xcntime
·
2023-01-15 10:39
python
python
人工智能
数据分析
Pandas
数据清洗
函数总结
目录一、drop():删除指定行列1.删除指定行2.删除指定列二、del():删除指定列三、isnull():判断是否为缺失1.判断是否为缺失2.判断哪些列存在缺失3.统计缺失个数四、notnull():判断是否不为缺失五、dropna():删除缺失值1.导入数据2.删除含有NaN值的所有行3.删除含有NaN值的所有列4.删除元素都是NaN值的行5.删除元素都是NaN值的列6.删除指定列中含有缺失
·
2023-01-15 05:04
上一页
27
28
29
30
31
32
33
34
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他