E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
pythonexcel数据清洗
R 多变量数据预处理_数据科学 | 第3讲
数据清洗
与预处理
数据清洗
和预处理的主要目的是提高数据质量,从而提高挖掘结果的可靠度,这是数据挖掘过程中非常必要的一个步骤。否则“垃圾数据进,垃圾结果出”。一个典型的
weixin_39517400
·
2022-04-07 07:41
R
多变量数据预处理
python pandas excel 多线程_Python数据分析:pandas玩转Excel (一)
Pandas是一个强大的分析结构化数据的工具集;它的使用基础是Numpy(提供高性能的矩阵运算);用于数据挖掘和数据分析,同时也提供
数据清洗
功能。
知外君
·
2022-04-07 07:10
python
pandas
excel
多线程
Pandas 多进程处理数据提高速度
为了提高一点
数据清洗
的速度,找到一个Pandas多进程的方法,pandarallel库,做了一下测试。下面来看看具体过程吧【注】文末提供技术交流方式小数据集(先试过了1w)可能多进程还没单进程
·
2022-04-06 10:30
python数据分析基础01——numpy基础、pandas
数据清洗
文章目录Numpy常用属性索引和切片变形级联图片操作统计函数矩阵PandasSeriesDataFrame股票分析案例
数据清洗
空值数据重复数据异常数据Numpypython语言中做数据科学的基础库,注重数值的计算
友培
·
2022-04-03 07:11
python
数据分析
numpy
pandas
利用pandas对在链家网爬取的租房数据进行清洗
爬下来的数据就可以进行
数据清洗
啦!首先确定需要处理的字段。
treacherousfly
·
2022-04-03 07:09
数据分析
python
数据分析
etl
数据仓库
山东开创云:捷码数据中台打通水利数据应用“最后一公里”
“数据中台的核心价值,一是解决数据不同源问题,实现
数据清洗
、打通;二是数据打通后,叠上数据模型,可以进行数据分析;三是数据管理、决策和展示。开创云河长制系统欠缺的就是这三点,捷码数据中台全都做到了。”
·
2022-04-02 10:08
Python(三)pandas数据分析、Seaborn的数据可视化
:3、获取操作:获取列数据:获取行数据:根据具体条件获取数据4、文件操作四、使用jupyternotebook完成文件相关操作五、Seaborn可视化六、pandas数据写入mysql七、pandas
数据清洗
L缶神
·
2022-04-02 07:47
python
python
数据分析之实战项目——电商用户行为分析【python】
电商用户行为分析1、项目背景和目的2、数据集简介3、数据处理3.1加载数据3.2数据概览3.3
数据清洗
4、数据分析4.1电商数据分析4.1.1流量分析4.1.1.1总体流量分析4.1.1.2每日流量分析
珞沫
·
2022-04-01 07:12
数据分析
数据分析
python
天池竞赛入门实战——快来一起挖掘幸福感!
天池算法大赛是阿里巴巴的(阿里云)赛题链接:https://tianchi.aliyun.com/competition/entrance/231702/introduction数据获取
数据清洗
整理分析
hxxjxw
·
2022-04-01 07:25
天池
利用Python进行
数据清洗
的操作指南
如果你没有听过,那么请记住:
数据清洗
是数据科学工作流程的基础。机器学习模型会根据你提供的数据执行,混乱的数据会导致性能下降甚至错误的结果,而干净的数据是良好模型性能的先决条件。
·
2022-03-28 17:26
使用 Python 进行
数据清洗
的完整指南
如果你没有听过,那么请记住:
数据清洗
是数据科学工作流程的基础。机器学习模型会根据你提供的数据执行,混乱的数据会导致性能下降甚至错误的结果,而干净的数据是良好模型性能的先决条件。
·
2022-03-28 11:54
python爬虫--爬虫前奏
形象的比喻:采集程序就像一只辛勤的小蜜蜂,它飞到花(目标网页)上,采集花粉(需要的信息),经过处理(
数据清洗
、储存)变成蜂蜜(可用的数据)。
白菜胡萝丸子
·
2022-03-28 10:46
python
开发语言
后端
21 DataFrame入门
1DataFrame的组成2DataFrame的代码构建-基于RDD方式13DataFrame的入门操作4词频统计案例练习5电影评分数据分析案例6SparkSQLShuffle分区数目7SparkSQL
数据清洗
THE ORDER
·
2022-03-27 13:33
spark
hadoop
hdfs
big
data
dplyr包--数据操作与清洗
1.简介在我们数据分析的实际应用中,我们可能会花费大量的时间在
数据清洗
上,而如果使用R里面自带的一些函数(base包的transform等),可能会觉得力不从心,或者不是很人性化。好在我们有其他选择。
achuo
·
2022-03-27 07:47
其他相关技术学习
机器学习
数据建模
正则表达式在python中的简单使用(附带例子:正则表达式匹配+
数据清洗
)
来讲一下正则表达式在python中的简单使用,直接上例子吧~~题目:使用python正则表达式匹配文中所有的美元字样,并且将其转换成纯金额。dollar.txt:asdasfa$12342.492asgasg$231,999.00h$299124rher$345213asdasfa$12342.492asgasg$231,999.00h$299124rher$979699$231,999.00h$
mjybgn
·
2022-03-26 09:00
python
正则表达式
(一)大数据---Hadoop整体介绍(架构层)----(组件、引擎)分类
文章目录一、大数据介绍1、基本介绍2、大数据的特性二、大数据技术有哪些(`重点`)1、数据采集与预处理2、数据存储3、
数据清洗
(引擎)4、数据查询分析5、数据可视化大数据计算引擎的分类:三、大数据解决方案传统方案
(─__─)
·
2022-03-25 07:28
Hadoop
hadoop
架构
分类
阿里云天池学习赛【金融风控-贷款违约预测】task 2
零基础入门金融风控-贷款违约预测TASK22.探索性数据分析(EDA)2.1数据载入2.2初步观察2.2.1基本信息2.2.2统计数值型数据的各个统计量2.3
数据清洗
2.3.1缺省值观察以及处理2.3.2
菜菜のGUAGUA
·
2022-03-25 07:57
数据分析
数据挖掘导论——分类与预测
Sex:性别比例2、PClass:船舱等级3、PClass,Sex:船舱等级与性别4、Age:年龄5、Embarked:登船地点6、Sibsip:兄弟姐妹的数量7、Parch:8、Fare:船票的价格四、
数据清洗
上山打老虎D
·
2022-03-25 07:46
数据挖掘导论
预测
python
数据挖掘
数据分析
基于机器学习与深度学习的金融风控贷款违约预测
基于机器学习与深度学习的金融风控贷款违约预测目录一、赛题分析1.任务分析2.数据属性3.评价指标4.问题归类5.整体思路二、数据可视化分析1.总体数据分析2.数值型数据分析3.非数值型数据分析4.多变量分布与相关性分析三、
数据清洗
与特征工程
上山打老虎D
·
2022-03-25 07:04
数据挖掘导论
数据挖掘
数据分析
聚类
分类算法
机器学习
卡尔曼滤波算法
前言发现做静态轨迹纠偏还是有点用的,记录一下实现LoucsCleanUtil.java//
数据清洗
publicstaticListdataCleanWGS84(Listdata){//时间间隔(时间间隔
·
2022-03-22 12:39
java
python实现学生分组
显然是一个集合运算,但未找到excel相关功能,因此考虑脚本代码实现创建二维列表li=[[]foriinrange(40+1)]
pythonexcel
读、写的操作对象是分开独立的str判
Yah_da
·
2022-03-22 00:58
泰坦尼克号获救预测——数据处理分析部分
泰坦尼克号获救预测——数据处理分析部分一·背景介绍二·数据预处理导入数据粗略观察数据
数据清洗
一·背景介绍泰坦尼克号于1909年3月31日在爱尔兰动工建造,1911年5月31日下水,次年4月2日完工试航。
打火机烧水
·
2022-03-21 05:37
机器学习
数据挖掘
python
数据分析——泰坦尼克号乘客数据集
www.kaggle.com/c/titanic/overviewDatawhale开源课程:https://github.com/datawhalechina/hands-on-data-analysis二、
数据清洗
及特征处理
Compass_NULL
·
2022-03-21 05:30
数据分析
python
第十届“泰迪杯”数据挖掘挑战赛【B题:电力系统负荷预测分析】完整解题代码Python,共三套
第十届“泰迪杯”数据挖掘挑战赛B题完整解题代码(共三套)1、第一套完整解题代码①
数据清洗
处理代码+数据可视化代码+特征工程代码+模型预测代码+后期优化策略②第二大问第一小问:突变时间确定代码2、第二套完整解题代码
青青子衿-
·
2022-03-20 14:24
数据挖掘
python
人工智能
首次公开,用了三年的 pandas 速查表!
导读:Pandas是一个强大的分析结构化数据的工具集,它的使用基础是Numpy(提供高性能的矩阵运算),用于数据挖掘和数据分析,同时也提供
数据清洗
功能。
大数据v
·
2022-03-20 07:49
可视化
列表
glassfish
webgl
cobol
用python的pandas打开csv文件_python读写数据读写csv文件(pandas用法)
Pandas是一个强大的分析结构化数据的工具集;它的使用基础是Numpy(提供高性能的矩阵运算);用于数据挖掘和数据分析,同时也提供
数据清洗
功能。
weixin_39714307
·
2022-03-18 07:38
利用python进行数据分析—8.
数据清洗
与准备
文章目录引言8.1处理缺失值8.1过滤缺失值8.1.2补全缺失值8.2数据转换8.2.1删除重复值7.2.2使用函数或者映射进行数据转换8.2.3替代值8.2.4重命名轴索引8.2.5离散化与分箱8.2.6检测和过滤异常值8.2.7随机排序与随机抽样8.2.8计算指标/哑变量8.3字符串操作8.3.1python内建字符串对象方法8.3.2正则表达式8.3.3pandas中的向量化字符串函数引言
哎呦-_-不错
·
2022-03-17 07:05
#
数据清洗
pandas中字符串操作
旅游推荐系统毕业设计总结(包含旅游信息爬取、算法应用和旅游推荐系统实现)
虽然做毕设的整个过程并不是特别煎熬,也没有像别人一样熬夜写代码,但是通过毕设我确实了解很多计算机相关知识,现在进行一个简单的总结:整个推荐模型的设计和实现的大体结构如下:通过从数据库或csv文件中获取数据源,首先把数据进行
数据清洗
#Amark
·
2022-03-15 07:36
个人经验分享
算法
python
机器学习
推荐系统
(数据科学学习手札134)pyjanitor:为pandas补充更多功能
本文示例代码及文件已上传至我的Github仓库https://github.com/CNFeffery/DataScienceStudyNotes1简介pandas发展了如此多年,所包含的功能已经覆盖了大部分
数据清洗
费弗里
·
2022-03-12 18:00
Python 八个
数据清洗
实例代码详解
如果你经历过
数据清洗
的过程,你就会明白我的意思。而这正是撰写这篇文章的目的——让读者更轻松地进行
数据清洗
工作。事实上,我在不久前意识到,在进行
数据清洗
时,有一些数据具有相似的模式。
·
2022-03-10 10:30
R语言数据处理包dplyr、tidyr笔记
dplyr包是HadleyWickham的新作,主要用于
数据清洗
和整理,该包专注dataframe数据格式,从而大幅提高了数据处理速度,并且提供了与其它数据库的接口;tidyr包的作者是HadleyWickham
灏喾
·
2022-03-10 07:17
R语言
r语言
【转载】R语言dplyr包学习笔记(吐血整理宇宙无敌详细版)
出处:AI入门学习dplyr包介绍dplyr包主要用于
数据清洗
和整理,主要功能有:行选择、列选择、统计汇总、窗口函数、数据框交集等是非常高效、友好的数据处理包,学清楚了,基本上数据能随意玩弄,对的,随意玩弄
紧到长不胖
·
2022-03-09 08:30
R语言
r语言
数据预处理(七)——利用sklearn进行数据预处理
主要内容:数据预处理的必要性
数据清洗
数据集成数据标准化数据规约数据变换与离散化利用sklearn进行数据预处理小结七、利用sklearn进行数据预处理1.数据标准化、均值和方差缩放sklearn.preprocessing.scale
shi_jiaye
·
2022-03-09 08:23
python机器学习与数据挖掘
python
机器学习
Python 疫情数据的可视化与分析(二)
上次通过数据的预处理已经将疫情的
数据清洗
到excel中,详情见https://blog.csdn.net/qq_42695315/article/details/111411789这次将通过处理得到词云
敌人派
·
2022-03-09 08:53
数据分析
python
数据可视化
大数据
python3爬虫
数据清洗
与可视化实战pdf百度云_Python 3爬虫、
数据清洗
与可视化实战_PDF电子书...
前言==============================================================Python是军刀型的开源工具,被广泛应用于Web开发、爬虫、
数据清洗
、自然语言处理
weixin_39580748
·
2022-03-07 07:55
pandas
数据清洗
读入数据importosimportsysimportpandasaspdimportnumpyasnpdefreadpm(filename,startline=2):#读入数据函数returnpd.read_csv(filename,header=startline,usecols=[0,2,3,4,5,6,7,9,10])abspath=os.path.dirname(__file__)#运行
大义Python
·
2022-03-04 07:22
数据分析&文本挖掘
pandas
数据
去重
清洗
处理
手把手教你掌握4类
数据清洗
操作
本文介绍
数据清洗
的相关内容,主要涉及缺失值清洗、格式内容清洗、逻辑错误清洗和维度相关性检查四个方面。
Python学习与数据挖掘
·
2022-03-03 09:43
python
python
开发语言
后端
数据清洗
深度学习基础:基于人脸的常见表情识别(2)—数据获取与整理
项目背景数据获取2.1数据爬取数据整理3.1图片格式统一3.2
数据清洗
3.3提取嘴唇区域该Task就是本训练营的实战部分了,这一部分我们会讲解如何获取数据集,并对数据集进行整理。
xatop
·
2022-03-02 07:04
机器学习
深度学习
人工智能
python
数据仓库设计与开发-1-分层设计
分层设计为什么要分层如何分层理论技术实践举个例子如何更优雅一些问答总结其他参考ODS层的数据需要做
数据清洗
吗一种通用的数据仓库分层方法转载https://www.cnblogs.com/wang3680
Xu Kun
·
2022-02-28 15:07
数据仓库设计与开发
数据仓库
电商数据仓库—数据采集平台搭建
(比如
数据清洗
、拆分、统计等等)数据仓库的作用通过对数据仓库中的数据进行分析,可以帮助企业改进业务流程、控制成本、提高产品质量等。数据仓库的数据来源主要是三大来源:1.日志采集系统2.业务系统
YuBx
·
2022-02-28 15:17
大数据
hadoop
hadoop
hdfs
kafka
Flink 实战一用户行为分析
4.新老用户统计,按照deviceId来统计1.按照操作系统(iOS、Android…)分析新老用户关键字:操作系统os新老isNewUser日志中就有新老用户的字段是没有新老用户的字段开发流程:1.
数据清洗
大数据学习爱好者
·
2022-02-28 10:28
Flink
开发
flink
java
大数据
python - pandas 之 dataframe -
数据清洗
转换合集
目录1.dataframe查看属性2.dataframe转换数据类型3.dataframe缺失值判断处理4.修改索引index和列名5.index与列名互转6.replace替换值7.sort_values排序8.Series转Dataframe9.Series转List1.dataframe查看属性DataFrame.indexDataFrame的索引(行标签)。DataFrame.column
开码牛
·
2022-02-28 07:41
python
python
pandas
数据分析
图解数据分析 |
数据清洗
与预处理
作者:韩信子@ShowMeAI教程地址:http://www.showmeai.tech/tutorials/33本文地址:http://www.showmeai.tech/article-detail/138声明:版权所有,转载请联系平台与作者并注明出处数据分析分核心步骤分为:业务认知与数据探索、数据预处理、业务认知与数据探索等三个核心步骤。本文介绍第二个步骤——数据预处理。不能想当然地认为数据
·
2022-02-25 14:37
数据分析数据清洗
数据预处理与特征工程—12.常见的数据预处理与特征工程手段总结
文章目录引言1.数据预处理1.1
数据清洗
1.1.1异常值处理1.1.2缺失值处理1.2特征预处理1.2.1数值型特征无量纲化1.2.2连续数值型特征分箱1.2.2.1无监督分箱法1.2.2.2有监督分箱法
哎呦-_-不错
·
2022-02-23 07:18
#
数据预处理与特征工程
数据预处理
特征工程
特征选择
特征抽取
特征构造
Python数据分析,
数据清洗
常见方法|(《利用Python进行数据分析》)
处理缺失值先导入需要用的库importpandasaspdimportnumpyasnpfrompandasimportDataFramefrompandasimportSeries下面开始各种缺失值处理函数,其实只是罗列,具体的方法需要啥用啥第一步:先检查缺失值#检查缺失值string_data=pd.Series(['aardvark','artichoke',np.nan,'avocado'
独角兽�
·
2022-02-23 07:45
Python
python
数据分析
pandas
利用Python进行数据分析(Ⅲ)
利用Python进行数据分析(Ⅲ)本文参考书籍:《利用Python进行数据分析》目录利用Python进行数据分析(Ⅲ)7.
数据清洗
与准备7.1处理缺失值7.1.1过滤缺失值7.1.2补全缺失值7.2数据转换
小灵宝
·
2022-02-23 07:41
机器学习
python
数据分析
职场人必备:用python爬虫做Excel表格,一天的工作量一分钟完事。
很多人不知道,其实我们最常用的表格,在某些情况下也是可以用来做爬虫的,而且爬下来的数据规整,不需要花太多时间进行
数据清洗
,来看看是怎么实现的。
小马不会过河
·
2022-02-23 07:32
程序员
python
爬虫
python
数据分析
python爬虫技术如何挣钱?教你爬虫月入三万
爬虫技术挣钱方法1:接外包爬虫项目这是网络爬虫最通常的的挣钱方式,通过外包网站,熟人关系接一个个中小规模的爬虫项目,一般向甲方提供数据抓取,数据结构化,
数据清洗
等服务。python爬虫技术如何挣钱?
程序媛小本
·
2022-02-22 15:38
python
爬虫
开发语言
程序人生
数据分析
Python爬虫怎么挣钱?6个Python爬虫赚钱方式,搞搞副业不是问题
1.最典型的就是找爬虫外包活儿网络爬虫最通常的的挣钱方式通过外包网站,做中小规模的爬虫项目,向甲方提供数据抓取,数据结构化,
数据清洗
等服务。
Python不吃辣
·
2022-02-22 15:30
python
爬虫
开发语言
程序人生
数据分析
有意思的数据可视化案例:R语言ggplot2画小提琴图展示命中率
前面的
数据清洗
过程就不再介绍了,主要内容就是作图。做小提琴图需要准备的数据是两列,第一列是用来表示用来分组的标签,第二列是数据,实际数据如下image.png换成我们自己的实
小明的数据分析笔记本
·
2022-02-22 00:45
上一页
45
46
47
48
49
50
51
52
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他