E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
python后端数据清洗
尚硅谷直播课:(韩顺平)2020大数据学习路线图、大数据开发课程笔记
此链接放这只为方便自己查阅,无恶意分享他人劳动成果之意)大数据以集群方式运行,多个服务器构成一个集群,分为主服务器和从服务器Flume做数据采集Zookeeper做数据管理和配置Kafka做数据传输,同时对
数据清洗
ningmengshuxiawo
·
2020-09-12 19:13
大数据
Python基础入门 (四数据分析处理库Pandas应用)
相关操作(索引,查询,统计分析,SQL操作,对缺失值处理,excel的数据透视表功能,多层索引)1.Pandas简介Pandas是基于Numpy的一个开源python库,它被广泛用于快速分析数据,以及
数据清洗
和准备等工作
つき
·
2020-09-12 18:51
python
pandas 快速入门教程
pandas快速入门教程学习目的一、认识pandas二、安装pandas三、数据结构四、导入Excel数据五、输出Excel数据六、数据概览七、数据查看八、
数据清洗
九、数据选择十、数据排序十一、数据分组十二
down_12345
·
2020-09-12 18:43
pandas
学习笔记
pandas
入门教程
python
数据挖掘
大数据基础-数据重复值和缺失值处理
重复值处理""""在数据分析中,存在大量不完整、不一致、有异常的数据,严重影响到数据分析结果
数据清洗
就是处理缺失数据及清除无意义的信息,如删除原始数据集中的无关数据,重复数据,平滑噪声数据,筛选掉与分析主题无关的数据
**猿来是你**
·
2020-09-12 16:25
python大数据分析基础
数据&特征
首先面对的问题不是模型,而是数据和特征,在实际操作的过程中,我们发现,在数据和特征上花费的时间要远大于在模型上花费的时间,所以,这一节我们来总结一下数据和特征需要的事情数据上面临的问题以下几个:数据采集、数据格式化存储、
数据清洗
厚hou
·
2020-09-12 13:39
机器学习
Airbnb用户运营数据预测分析
用户运营数据预测分析项目背景分析目标涉及工具数据描述分析过程工具库导入数据准备数据链接:[link](https://www.kaggle.com/c/airbnb-recruiting-new-user-bookings/data)一、
数据清洗
二
守望者psh
·
2020-09-12 09:27
数据分析
数据分析
python
python
数据清洗
(字符串)
去除字符串两边的字符:str.strip()括号内写想要去除的内容,默认为空格,常用于去除换行,空格去除字符串中的字符:str.replace('想要去掉的字符’,‘替换字符’)将字符串内部的数据进行替换,可以去除内部空格str.replace(’’,‘’)去重字符串中所有空格
浪里小白虫
·
2020-09-12 09:17
推荐算法及其一个算法案例
三、推荐算法1)推荐模型构建流程Data(数据)—>Features(特征)—>MLAlgorithm(选择算法训练模型)—>PredictionOutput(预测输出)
数据清洗
/数据处理数据来源显性数据比如用户的评分
王涛涛.
·
2020-09-12 05:33
python
推荐系统
数据竞赛房租预测——整理
数据分析的初步流程:查看标签info——>具体分析标签特征(单调性、出现频次、缺失率、分布情况)——>分析训练集时别忘了兼顾测试集
数据清洗
查看数据缺失情况后对造成的原因进行分析及处理;异常值同理。
humashanshao
·
2020-09-12 03:54
数据挖掘
19年深圳二手房交易分析
分析2019年上半年的深圳二手房交易数据,数据集来自网络共享分析目的:看看2019年上半年深圳二手房交易情况,是否依旧火热,波动情况如何1数据预处理1.1
数据清洗
去除无用字段,更改数据类型等清洗,得到如下字段的数据之后
aqdob04840
·
2020-09-12 01:45
python作为后端接口实现简单微信小程序---来碗热汤
小程序二维码页面视频预览
python后端
做数据接口实现简单鸡汤文案小程序,开源视频展示使用,有需要源码的小伙伴滴滴我。
旋凯凯旋
·
2020-09-11 23:31
python小项目
python
小程序
js
深度之眼比赛实战班第一场比赛作业1.4 | 个人笔记
文章目录视频讲解
数据清洗
定义难点方法场景数据处理定义总结方法打卡作业作业问题作业回答1.读取文件2.两种数据结构3.pandas中的可视化函数.plot()方法.hist()方法.scatter()方法
BlackSheepX
·
2020-09-11 23:46
比赛班
思路
[爬虫]python下的xpath清洗数据之html
数据清洗
现在我们面对一些爬虫数据,特别是对于web网页的爬取的时候,网页总有一些不规整的数据来导致拿数据的麻烦,比如如下这种111222333444eeeeeeeeeeee555aabbccddd我只想拿到111,222,333,444,555这些有效的信息,因为有些p标签里面会引入script元素,导致我们还要在后期清洗,比较麻烦分析首先拿到问题我们就可以本能的想至少两种方式,如果当成是文本处理,使用排
wumxiaozhu
·
2020-09-11 23:55
python
pachong
pyspark ALS 简单总结
Pyspark常见
数据清洗
和补全指令:DataframeDf.select()选取某列Df.fillna(0)用0补全所有na位Df.filter(cond.)
Echosand
·
2020-09-11 23:30
pyspark
Hawk:开源贡献计划,设计,反思
不少朋友询问一些术语的意思,在下面解释一下:ETL:即
数据清洗
,包含抽取(E),转换(T)和加载(L)行,列:在数据表格上的行列流,子流:一个流代表一组模块构成链条,子流也是流,只不过是被别的流调用的,
weixin_34060741
·
2020-09-11 22:14
数据分析简单知识点(numpy)
数据分析基本概念明确思路→数据收集《分布式爬虫实战》→数据处理→数据分析→数据展现常用的收集途径:公开信息,外部数据库,自有数据库,调查问卷,客户数据
数据清洗
:可读性,完整性,唯一性,权威性及合法性常见的数据类型
、 ♥ 盖世英雄
·
2020-09-11 22:36
数据分析
python
数据分析
某证券公司
数据清洗
工具 20200911
功能:合并多表内指定sheet,指定字段importnumpyasnpimportpandasaspdimportosimportrepd.set_option('display.unicode.ambiguous_as_wide',True)pd.set_option('display.unicode.east_asian_width',True)defmain_and_outCSV(f_pat
船长_wang
·
2020-09-11 21:35
zkjs
keras进行时间序列预测
时间序列预测概述数据集的预处理基准方法调优增加dropout层增加网络深度小结和补充概述用深度学习的方法进行端到端的时间序列预测需要一下几个步骤1.对数据进行预处理,比如
数据清洗
,归一化等,然后把时间序列数据转化为监督问题数据
格拉迪沃
·
2020-09-11 21:47
keras学习
数据分析案例1.0——药品销售分析
药品销售分析前言数据获取
数据清洗
选择子集列名重命名缺失数据处理数据类型转换数据排序异常值处理构建模型业务指标1:月均消费次数业务指标2:月均消费金额业务指标3:客单价数据可视化消费趋势分析分析每天的消费金额分析每月的消费金额分析药品销售情况小结前言原始数据
DA_warmth
·
2020-09-11 18:28
数据分析案例实战
数据分析
基于Python3的网络爬虫脚本
其难点主要存在于
数据清洗
时Html语言的分析,以及得到数据进行转字符编码得到中文。我们所爬取的网页是笔趣阁的
D18002
·
2020-09-11 17:39
python
【Python
数据清洗
】pandas dataframe list(列表)数据列拆分成多行的方法
需要把下面的dataframe里面列的数据类型是list的列拆分成多个行:df=pd.DataFrame({‘A’:[1,2],‘B’:[[1,2],[1,2]]})dfOut[458]:AB01[1,2]12[1,2]所用代码如下:(1)如果你要拆分的dataframe只有两列,那么使用下面的方法(亲测非常高效):df=pd.DataFrame({‘A’:df.A.repeat(df.B.str
小猪课堂
·
2020-09-11 16:59
Python数据清洗
数据分析(五)--pandas(文件读写,合成表,增删改查,
数据清洗
,时间数据处理,统计函数)
一、文件的读写xlsx–工作簿–文件夹sheet–表importpandasaspddetail=pd.read_excel('data/meal_order_detail.xlsx')print(detail.shape)#默认读取的是sheet1如果想读别的sheet表,使用sheetname参数,指定想要读取的表的索引位置。detail_sheet2=pd.read_excel('data/
一个非常正经的人
·
2020-09-11 15:56
数据分析
ETL(数据仓库技术)
ETL是构建数据仓库的重要一环,用户从数据源抽取出所需的数据,经过
数据清洗
,最终按照预先定义好的数据仓库模型,将数据加载到数据仓库中去。信息是现代企业的重要资源,是企业运
caozhangcaoluo
·
2020-09-11 14:21
Python实现数据可视化,让你的数据清晰起来!
Python提供了很多数据可视化的库:matplotlibpandasmatlpotlib和pandas结合利用pandas进行数据读取、
数据清洗
和数据选取等操作,再使用matlpotlib显示数据。
爬遍天下无敌手
·
2020-09-11 13:36
Python
可视化
python
数据可视化
数据分析
java
传统机器学习——特征工程之
数据清洗
传统机器学习——特征工程之
数据清洗
前言
数据清洗
方法
数据清洗
的八大场景数据处理方法数据可视化工具前言学习了这么长时间的理论知识,开始着手理论联系实践了。
Macan_ML
·
2020-09-11 11:16
数据清洗
第一讲概述经验研究的基本流程选题-文献学习-理论构造-数据管理-数据分析-论文写作-投稿发表什么是数据管理我该用什么数据我从哪些找数据我怎么去熟悉数据我如何清洗数据我怎样发掘数据的根本规律第二讲数据管理前的必备工作所需数据的大概样貌(教育回报)1.时间:跨期,尽可能新2.地点:有全国代表性3.群体:至少包含劳动年龄人口4.变量:劳动收入、教育程度、常见人口学变量自己采集数据还是寻找既有数据1.理想
tangshuai96
·
2020-09-11 10:06
数据整理
数据整理
如何用Python爬取股市数据,并进行数据可视化
用到的开发工具:win10+pycharm知识点:爬虫基本原理与实现
数据清洗
数据可视化模块的使用代码全文importrequestsimportjsoncookies={'em_hq_fls':'js'
杰之行
·
2020-09-11 10:06
Python
股票爬取
python
可视化
数据可视化
json
淘宝婴儿产品销售的数据分析
数据来源:https://tianchi.aliyun.com/home/数据分析的步骤:提出问题,理解数据,
数据清洗
,模型构建,数据可视化一、提出问题用户分析:1、哪个月份用户最活跃?
NL不分的小墨迹
·
2020-09-11 09:35
excel
数据分析
excel
数据运营
用户行为分析
淘宝
机器学习:特征工程及编程实例实现
文章目录基础数据观察
数据清洗
特征选择无量钢化(特征预处理)缺失值标准化缩放归一化:normalization标准化降维分类变量编码连续型变量:二值化和分段特征工程特征数字的奇特效果机器学习降维数据可视化
缠禅可禅
·
2020-09-11 07:37
机器学习原理讲解与代码实现
python小工具封装
AI原理与概念
人生苦短,Python 当歌!
勤劳的小蜜蜂其实,网络数据采集程序就像一只辛勤采蜜的Bee,它飞到花(目标网页)上,采集花粉(需要的信息),经过处理(
数据清洗
、存储)变成蜂
mubaios
·
2020-09-11 07:54
网络数据采集
Spark中利用Scala进行
数据清洗
(代码)
2019-05-0718:56:181packagecom.amoscloud.log.analyze23importjava.text.SimpleDateFormat4importjava.util.Date56importorg.apache.spark.rdd.RDD7importorg.apache.spark.{SparkConf,SparkContext}89objectLogAna
dianhe8193
·
2020-09-11 07:16
Python
数据清洗
之处理缺失值
一、缺失值的处理1.常用方法dropnaimportnumpyasnpimportpandasaspdstring_data=pd.Series(['apple','banana',np.nan,'orange'])print(string_data.dropna())这样可去除含有NA的一行0apple1banana3orangedtype:objectfillnastring_data=pd.
TC_Yun
·
2020-09-11 05:25
[
数据清洗
]-Pandas 清洗“脏”数据(一)
概要准备工作检查数据处理缺失数据添加默认值删除不完整的行删除不完整的列规范化数据类型必要的转换重命名列名保存结果更多资源Pandas是Python中很流行的类库,使用它可以进行数据科学计算和数据分。他可以联合其他数据科学计算工具一块儿使用,比如,SciPy,NumPy和Matplotlib,建模工程师可以通过创建端到端的分析工作流来解决业务问题。虽然我们可以Python和数据分析做很多强大的事情,
weixin_30632883
·
2020-09-11 04:00
姓氏排行研究
1、
数据清洗
、整合要求:①将“data01”、“data02”分别读取,并且合并成一个数据②结合“户籍地城市编号”及“中国城市代码对照表”数据,将城市经纬度连接进数据中③分别提取“工作地”中的省、市提示
weixin_30315435
·
2020-09-11 04:30
git
json
python
Pandas 对DataFrame的缺失值NA值处理4种方法总结
数据清洗
是一项复杂且繁琐的工作,同时也是整个数据分析过程中最为重要的环节。有人说一个分析项目80%的时间都是在清洗数据,这听起来有些匪夷所思,但在实际的工作中确实如此。
小晓酱手记
·
2020-09-11 03:18
Pandas
Pandas
数据清洗
--空数据的处理
创建DataFrame结构数据:df=DataFrame(data=np.random.randint(0,150,size=(100,50)),index=np.arange(100,200),columns=['Python','En','Math','Physics','Chen'])对df中的空数据进行分析:#判断df中是否有空数据df.isnull().any()#any的作用在于:有一
Crystal_Coding
·
2020-09-11 02:15
#
python数据分析
pandas(一)pandas的数据结构
Python3TrustedFileEditViewInsertCellKernelWidgetsHelpCodeMarkdownRawNBConvertHeading-Pandas的数据结构pandas是数据分析的一个核心框架,集成了数据结构化和
数据清洗
以及分析的一些方法
每日一爬虫
·
2020-09-11 02:06
数据分析
Pandas清洗数据删除NaN (20)
Pandas的
数据清洗
-删除NaN
数据清洗
(TidyData),是对数据进行重新审查和校验的过程,目的在于删除重复信息、纠正存在的错误,并提供数据一致性。
†徐先森®
·
2020-09-10 23:17
Pandas总结
pandas
数据清洗
缺失值与空值处理
数据清洗
之前,我们必须先明白自己想要干什么,达成怎么样的效果,然后采取对应的方法来实现这个需求。
I_AM_KK
·
2020-09-10 22:38
Python
Python做出来的数据可视化真香!
最新可视化分析前程无忧招聘网1、数据预处理2、进行
数据清洗
3、数据可视化(pyecharts)1、数据预处理将存储在mysql中的数据进行数据预处理在jupyternotebook中进行调试导出至excel
爬遍天下无敌手
·
2020-09-10 20:42
Python
可视化
python
数据分析
大数据
机器学习
SAS进阶(一)— 字符型
数据清洗
文章目录一、字符型数据操作1)主要清洗方法2)字符型函数二、使用Perl正则表达式检查数据错误1)正则表达式2)正则表达式的应用3)正则表达式测试的宏程序三、数据标准化1)主要标准化方法2)两个文件数据的模糊匹配一、字符型数据操作1)主要清洗方法少量非法值检查FREQ过程*1.2非法值检查输出DATA_null_步+fileprint+PUT语句输出(字符数据模式判别)*1.4-1.5PRINT过
luminous_y
·
2020-09-10 17:02
SAS
Flowable 快速入门教程:任务驳回与回退
Flowable快速入门教程:任务驳回与回退前言支持场景功能描述驳回退回脏数据什么是脏数据串行样例并行样例会签样例脏
数据清洗
效果图完整代码效果图前言本文的代码中没有对流程做任何特殊处理,用的都是流程本身的数据
乐之终曲
·
2020-09-10 16:45
#
流程引擎
Python学到什么程度可以面试工作?
以
Python后端
开发工程师为例,你需要掌握Python语
九章算法
·
2020-09-10 11:30
python
面试
django
学习笔记(41):Python
数据清洗
实战-数据库文件读写
立即学习:https://edu.csdn.net/course/play/26990/361122?utm_source=blogtoedu更改路径
壬辰
·
2020-09-10 11:43
研发管理
学习笔记(39):Python
数据清洗
实战-csv文件读写
立即学习:https://edu.csdn.net/course/play/26990/361120?utm_source=blogtoeduos,用于更改路径
壬辰
·
2020-09-10 11:43
研发管理
学习笔记(47):Python
数据清洗
实战-日期格式数据处理
立即学习:https://edu.csdn.net/course/play/26990/361127?utm_source=blogtoedu
壬辰
·
2020-09-10 11:43
研发管理
基于Python的数据分析实战项目
目录1商铺数据加载及存储1.1项目要求1.2原始数据展示1.3实际操作1.3.1读取数据1.3.2
数据清洗
1.3.3拆分点评字段1.3.4解析数据1商铺数
跟江江学Python,零基础开始
·
2020-09-10 11:59
如何爬取百度热榜,百度热榜可以抓取吗
3.方案概述:访问网页得到状态码200,分析网页源代码,找出所需要的的标签,逐个提取标签保存到相同路径csv文件中,读取改文件,进行
数据清洗
,数据模型分析,数据可视化处理,绘制分布图,用最小二乘法分析两个变量间的二次拟合方程和绘制拟合曲线
涛(微信yetaoaiueo)专注互联网
·
2020-09-09 13:27
叶涛-专注于互联网优化
推广
品牌建设
web
如何爬取百度热榜
百度热榜可以抓取吗
美团外卖用户差评情况分析
文章目录分析背景和目的数据集介绍
数据清洗
数据分析1.站点分析2.标签分析2.1送达超时标签分析2.2态度不好标签分析3.总时长情况建议分析背景和目的该数据源自美团面试分析题,整个数据只有542条观测,比较适合做可视化分析
云之玥
·
2020-09-07 22:59
数据分析
数据可视化
数据分析
finance_demo
#coding=utf-8importpandasaspd#表格处理容器importnumpyasnp#科学计算importsys#设置断点'''第一步:
数据清洗
(finance_class_demo.py
萝卜青菌
·
2020-09-02 23:30
上一页
57
58
59
60
61
62
63
64
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他