E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
python后端数据清洗
【机器学习】机器学习之多元线性回归
目录一、多元线性回归基础理论二、案例分析三、数据预处理1.错误
数据清洗
2.非数值型数据转换四、使用Excel实现回归1.回归实现2.回归分析五、使用代码实现回归1.数据预处理2.使用Statsmodels
Max_Shy
·
2021-10-21 10:50
机器学习
机器学习
线性回归
回归
1024程序员节
思迈特软件Smartbi:企业数据化转型的发展阶段
阶段这个阶段属于纯劳动力密集型的数据分析,数据分析师还被行业内戏称为“表哥表姐”;Excel确实功能强大,但在数据分析上的局限性也非常明显,当数据量达到5万、10万时就会非常卡顿,更承担不了多表关联等
数据清洗
这样的工作
·
2021-10-21 09:23
数据挖掘
迅速入门爬虫
数据清洗
与可视化
数据爬取与分析1.基础知识1.1数据分析的基础知识数据分析的一般流程:明确目标-》采集数据-》
数据清洗
与分析-》绘制图表并且可视化-》得出结论1.2具有python特色的程序1.3字符串切片1循环打印嵌套列表
a Fang
·
2021-10-20 21:13
python
爬虫
python
数据挖掘
《长津湖》评价分析:Python爬虫的应用
这次我用爬虫从豆瓣上获取了评价数据:数据源:豆瓣数据抓取:requests
数据清洗
:lxml(Xpath)数据可视化:matplotlib代码如下:#!
科学的海洋
·
2021-10-17 18:27
python
爬虫
人工智能
用Python实现网易云音乐的数据进行
数据清洗
和可视化分析
目录Python实现对网易云音乐的数据进行一个
数据清洗
和可视化分析对音乐数据进行
数据清洗
与可视化分析对音乐数据进行
数据清洗
与可视化分析歌词文本分析总结Python实现对网易云音乐的数据进行一个
数据清洗
和可视化分析对音乐数据进行
数据清洗
与可视化分析关于数据的清洗
·
2021-10-15 12:53
5款优秀的
数据清洗
工具任你选择
数据是信息的基础,高质量的数据是帮助各种数据分析有序进行的基本条件。与过去相比,现在最重要的是数据。面对大量的数据,人们经常抱怨数据丰富,信息不足。造成这种情况的原因一般有两个:一是缺乏有效的数据分析技术。二是数据质量不高,后者是信息不足问题最常见的原因。数据质量低的主要原因是数据库中存在脏数据,数据输入错误。不同来源数据引起的不同表示方法和数据之间的不一致是脏数据的原因。因此,在进行数据分析之前
明月说数据
·
2021-10-15 11:36
数据库
数据清洗
思迈特软件Smartbi:一文带你了解关于
数据清洗
的三大问题
在数据分析工作中,有一个永远无法绕过的步骤,它在整个数据分析工作中起着至关重要的作用,但往往被忽视,即
数据清洗
。说到
数据清洗
,很多人脑子里都有这样一系列的问题:什么是
数据清洗
?
数据清洗
到底要洗什么?
·
2021-10-15 11:09
数据挖掘
分分钟自制人脸识别(如何快速识别心仪的小姐姐~)
所谓的web开发,服务器后端其实只是一个开始,玩了
python后端
也在体验spring全家桶(学习ing)只要做一个像样的“万人会话”基本上都不会只是靠那一套“增删改查
HUTEROX
·
2021-10-10 23:48
突发奇想
人工智能
python
女友想让我带她吃大闸蟹,我用Python做了一个最全吃蟹攻略!拿去用吧!
这样吃起来才最美味目录:1.聊聊大闸蟹2.数据采集2.1.页面分析2.2.采集程序3.
数据清洗
4.数据统计4.1.商品价格分布4.2.评论数分布4.3.店铺商品数分布4.4.好评率分布5.其他1.聊聊大闸蟹一般来说
Python是世界上最好的语言
·
2021-10-08 15:10
Python
程序员
python
爬虫
数据可视化
数据分析
词云图
数据清洗
——黑马程序员(学习笔记)
1抽取CSV文件1.1打开Kettle工具,创建转换通过使用Kettle工具,创建一个转换csv_extract,并添加“CSV文件输入”控件、“表输出”控件以及Hop跳连接线,具体如图所示。图1创建转换1.2配置CSV文件输入控件1)双击“CSV文件输入”控件,进入“CSV文件输入”界面。图2csv配置2)单击【浏览】按钮,选择要抽取的文件csv_extract.csv。图3选择3)单击【获取字
m0_59775560
·
2021-10-07 15:16
数据清洗
数据库
数据清洗
(二):python
数据清洗
python
数据清洗
Pandas
数据清洗
流程:1.数据的读写:read_csv、read_excel、to_csvto_excel2.数据的探索与描述:info、head、describe、shape、
古杜且偲
·
2021-10-04 12:52
python
python
Python数据分析9-综合案例-网站日志分析
目录9.1数据来源9.1.1网站日志解析9.1.2日志
数据清洗
9.2日志数据分析9.2.1网站流量分析9.2.2状态码分析9.2.3IP地址分析网站的日志数据记录了所有Web对服务器的访问活动。
查尔斯-狩乃
·
2021-10-03 17:01
Python数据分析
python
数据分析
黑马程序员《
数据清洗
》学习笔记CSV、JSON数据抽取
目录4.1抽取文本数据4.1.1CSV文件的抽取1.打开Kettle工具,创建转换2.配置“CSV文件输入”控件3.配置“表输出”控件4.运行转换csv_extract4.2抽取Web数据4.2.1JSON文件的数据抽取1.打开Kettle工具,创建转换2.配置JSONinput控件3.配置“表输出”控件4.运行转换json_extract4.1抽取文本数据4.1.1CSV文件的抽取CSV是Com
眨个眼就睡着
·
2021-10-02 10:45
黑马程序员《数据清洗》学习笔
json
数据清洗
《黑马程序员》著本人学习笔记
数据清洗
《黑马程序员》著本人学习笔记如有雷同,那就是我们是一个老师教的。数据抽取一、CSV文件的抽取CSV是Comma-SeparatedValues的缩写,即逗号分隔值。
weixin_48459732
·
2021-10-02 00:25
数据库
Python数据分析7-seaborn可视化
7.2分类图7.2.1分类散点图7.2.2箱线图与琴形图7.2.3柱状图7.3回归图与网格7.3.1回归图7.3.2网格7.4综合案例-泰坦尼克号生还者数据7.4.1数据来源7.4.2定义问题7.4.3
数据清洗
查尔斯-狩乃
·
2021-09-30 15:37
Python数据分析
python
数据分析
概念+实战讲解!一文带你了解RFM模型【kaggle项目实战分享】数据分析
基于RFM模型进行客户细分通过RFM模型评分后输出目标用户基于RFM的常用策略补充三、kaggle项目实战讲解1数据探索与
数据清洗
1.1数据探索1.2缺失值统计1.3日期格式的转换1.4去重1.5异常值处理
报告,今天也有好好学习
·
2021-09-29 14:55
数据分析
python
big
data
rfm
数据分析
MySQL实战演练——如何才能构建逾期用户画像?【数据可视化】
目录必须要看的前言1背景描述2业务指标3数据描述4提出问题4.1用户角度4.2业务角度5
数据清洗
5.1导入数据5.2字段重命名5.3缺失值、重复值处理5.4异常值处理6数据分析6.1用户维度6.1.1逾期用户画像分析用户的基本信息
报告,今天也有好好学习
·
2021-09-28 09:31
数据分析
mysql
数据库
excel
数据分析
利用pandas进行
数据清洗
的方法
目录1、完整性1.1缺失值1.2空行2、全面性列数据的单位不统一3、合理性非ASCII字符4、唯一性4.1一列有多个参数4.2重复数据我们有下面的一个数据,利用其做简单的数据分析。这是一家服装店统计的会员数据。最上面的一行是列坐标,最左侧一列是行坐标。列坐标中,第0列代表的是序号,第1列代表的会员的姓名,第2列代表年龄,第3列代表体重,第4~6列代表男性会员的三围尺寸,第7~9列代表女性会员的三围
·
2021-09-23 18:44
强大的ETL工具fme和python结合实现不动产登记确权项目入库扫描件自动分类归档
但是房地一体确权登记项目的扫描件相对很多不规范数据来说通过提取特征文字实现自动分类归档是可以通过用python调用谷歌的汉字识别库pytesseract来实现特征值提取,然后用fme进行
数据清洗
,最后整理数据输出成我们想要的档案档案结构
努力的悟空
·
2021-09-14 13:06
python
etl
opencv
Python数据挖掘项目:构建随机森林算法模型预测分析泰坦尼克号幸存者数据
本文为作者原创文章,未经作者同意禁止转载关于随机森林算法的介绍和原理,可以参阅我的另一篇博文:随机森林算法介绍项目说明该项目全流程通过Python实现,对泰坦尼克号幸存者数据集进行了专业全面的数据挖掘工作,包括
数据清洗
进击的西西弗斯
·
2021-09-09 11:26
数据分析项目
python
sklearn
机器学习
数据挖掘
数据分析
影像组学综述:Radiomics and “radi-…omics” in cancer immunotherapy: a guide for clinicians
影像组学的概念利用算法对医学影像数据进行分析,利用肉眼无法识别的、量化的特征进行建模,用于医学决策(Gilliesetal.,2016;Lambinetal.,2012)二、影像组学整体步骤2.1图像获取、存储(建库)、
数据清洗
ADO_AI
·
2021-09-09 01:46
Python数据分析——100个Pandas常用函数总结
目录1.统计汇总函数2.
数据清洗
函数3.数据筛选函数4.绘图与元素级运算函数5.时间序列函数6.其它函数1.统计汇总函数函数含义min()计算最小值max()计算最大值sum()求和mean()计算平均值
简时刻
·
2021-09-08 10:40
python
数据分析
蚂蚁智能监控
AntMonitor日常服务于蚂蚁全站100+业务域,分钟峰值
数据清洗
量20TB、数据聚合量1TB、数据存储量1.5亿条,大促期间这些指标更是成倍增长,如此庞大且复杂的系统是如何对自身
·
2021-09-07 17:50
智能应用监控工具
思迈特软件Smartbi:Get这些
数据清洗
小技巧,快速提高数据质量!
数据清洗
怎么做(一):准备工作拿到数据表之后,先做这些准备工作,方便之后的
数据清洗
。
·
2021-09-03 10:46
数据挖掘
Django3+Vue3进行前后端开发环境搭建
前后端开发环境搭建总结背景环境需求环境准备Node.jsVue-Cli创建前端项目创建后端项目连接前后端编译前端项目修改Django项目配置启动Django服务器背景本文基于具备一定
python后端
基础
阿刁阿
·
2021-08-21 19:54
Django
+
vue
python
django
vue
web
Hi ! 一起来学Python
如何系统性地把Python基础,
Python后端
开发,Pyth
kinfey
·
2021-08-19 11:56
Python
机器学习
python
django
flask
机器学习
数据分析项目:CDNOW用户消费数据分析(基于MySQL实现)
CDNow网站销售数据分析项目背景分析目的及思路数据处理数据导入
数据清洗
1、字段空格处理2、数据类型转换3、缺失数据处理4、数据重复处理5、数据0值数据分析产品销售分析产品价格分析1、所有订单CD均价2
LdyLLLLLLLD
·
2021-08-09 23:57
我爱数据分析
数据分析
mysql
CDNow数据集
大数据之路 ——(一)算法建模中的
数据清洗
这里简单分享一下我对
数据清洗
的理解,其具有很重要的地位,不然面对着脏乱差的西红柿炒鸡蛋,没人愿意下口。
·
2021-08-05 15:06
数据挖掘大数据人工智能
小白学数据分析-SQL每日练
数据分析框架下面是一整套数据分析方案,分为5个步骤:明确问题、获取数据、
数据清洗
、分析数据最后呈现报告。SQL语言在数据分析领域扮演着重要的角色,包括数据的存取、
·
2021-07-27 19:02
干货丨Hadoop MapReduce 作业长时间卡死怎么办?
源数据文件发到Hadoop集群后,我们的预处理程序会对源数据进行编码转换、数据去重、加时间拉链、
数据清洗
、错误数据处理等操作,生成贴源的ODS层数据,供上层建模使用。
·
2021-07-27 19:49
超全的 100 个 Pandas 函数汇总,建议收藏
分别分为6类:统计汇总函数、
数据清洗
函数、数据筛选、绘图与元素级运算函数、时间序列函数和其他函数。
Wang_AI
·
2021-07-13 08:51
数据分析
opengl
列表
clojure
数据挖掘
CDA学习之Pandas - 常用函数和75个高频操作
常用函数1.1.1导⼊数据1.1.2导出数据1.1.3查看数据1.1.4数据选取1.1.5数据处理1.1.6数据分组和排序1.1.7数据合并1.1.8数据显示1.2函数列表1.2.1统计汇总函数1.2.2
数据清洗
函数
岳涛@心馨电脑
·
2021-07-12 14:00
Pandas
数据分析
【数据处理】【
数据清洗
】【7.2 数据转换】 2021-07-03
7.2数据转换数据转换包括:处理重复值、使用函数/映射转换数据、替代值、重命名轴索引、离散化&分箱、异常值检测、置换&随机抽样、虚拟变量7.2.1删除重复值首先pandas对象可使用duplicated()方法查看数据是否存在重复(沿着行轴的轴向检查是否有相同的行)。其结果返回的是一个布尔值Series,True表示此行与之前的某一行重复。另外由于方法中没有axis参数,此方法无法检查是否有重复的
xrdcc
·
2021-07-04 13:28
【数据处理】【
数据清洗
】【7.1 处理缺失值】 2021-06-20
7.1处理缺失值Pandas中使用浮点值NaN(NataNumber)来标识缺失值。numpy的np.nan,和Python内建的None值并不是一回事,但使用二者为DataFrame对象赋值时,都会被pandas视作缺失值。image.png7.1.1过滤缺失值Series上使用dropna方法,会返回Series中所有非空数据及其索引值。处理DataFrame对象时dropna默认会删除所有包
xrdcc
·
2021-07-04 13:41
面试系列六 之 用户行为数据分析
更多干货等着你1.1、数仓分层架构分层优点:复杂问题简单化、清晰数据结构(方便管理)、增加数据的复用性、隔离原始数据(解耦)层级功能ods原始数据层存放原始数据,保持原貌不做处理dwd明细数据层对ods层
数据清洗
·
2021-06-27 22:34
面试大数据数据仓库
Python数据分析案例-药品数据分析案例
数据分析的步骤一般可以分为6个:1,明确分析的目的2,数据准备3,
数据清洗
4,数据分析5,数据可视化6,分析报告数据分析的目的:通过对朝阳区医院的药品销售数据的分析,了解朝阳医院的患者的月均消费次数,月均消费金额
小橙子_43db
·
2021-06-26 19:21
【数据分析/挖掘】【数据预处理&特征工程&数据处理】快速入门+案例+代码+GIF实操
前言:在我的上一份文章中,介绍到了
数据清洗
的常用方法及其Python实现。这篇文章主要是在
数据清洗
后的特征工程的实现,特征工程包含三个方面,分别为特征提取、特征创造、特征选择。
卯月七
·
2021-06-26 08:41
30+程序老兵转型路--数据分析实操篇
数据分析框架下面是一整套数据分析方案,分为5个步骤:明确问题、获取数据、
数据清洗
、分析数据最后呈现报告。明确问题,分析要解决的问题,定义出一些数字化的指标出来,
·
2021-06-24 18:31
python后端
架构
最近在做一个在线平台,架构思路如下架构演进:1、MVC2、服务拆分3、微服务架构4、领域驱动设计1、MVC这个阶段主要是快速实现产品,没考虑其他的,设计之初划分多个app,app内高类聚,app之间低耦合,DB表设计好了之后,实现view层功能需求,利用Django来快速实现功能,后端有许多预留设计,避免产品逻辑的变更带来整个表结构的变动,架构如下图;MVC架构nginx是负载均衡,通过权重法,把
Bili_bo
·
2021-06-22 02:07
详讲 Python 数据读写方式,面向Excel、Txt文档及Mongodb、MySQL等数据库
我是小张~在日常与Python打交道过程中,不可避免会涉及到数据读写业务,例如做爬虫时,需要将爬取的数据首先存储到本地然后再做下一步处理;做数据可视化分析时,需要将数据从硬盘中读入内存上,再进行后续的
数据清洗
小张Python
·
2021-06-21 12:41
Python
标准库
数据清洗
&预处理入门完整指南
数据清洗
和预处理是模型训练之前的必要过程,否则模型可能就「废」了。本文是一个初学者指南,将带你领略如何在任意的数据集上,针对任意一个机器学习模型,完成数据预处理工作。
yoku酱
·
2021-06-21 12:53
链家网二手房数据分析
(下次再写如何通过爬虫获取数据,确实没时间了)分析思路如下:分析思路.png1.
数据清洗
---这部分略,之后会单独开一篇。直接开始下一步,分析整体。导入常用包和数据。
Star英
·
2021-06-21 03:39
银行数据仓库体系实践(4)--数据抽取和加载
Extract、Transfrom、Load即抽取、转换、加载三个英文单词首字母的集合:E:抽取,从源系统(Souce)获取数据;T:转换,将源系统获取的数据进行处理加工,比如数据格式转化、数据精度转换、
数据清洗
acumen_leo
·
2021-06-19 14:48
一文梳理2019年腾讯广告算法大赛冠军方案
zhuanlan.zhihu.com/p/73062485https://zhuanlan.zhihu.com/p/72762888写在前面作为从本次比赛共157队伍中脱颖而出的冠军方案,评分达到87.9683,从
数据清洗
拼搏向上001
·
2021-06-19 07:50
Java学习笔记:十大数据挖掘算法
DM过程:a.目标定义(任务理解、指标确定)b.数据采集(建模抽样、质量把控、实时采集)c.数据整理(数据探索、
数据清洗
、数据变换)d.构建模
曲钟人散
·
2021-06-13 22:11
数据之路
概述导读搭建数据指标体系业务理解核心指标业务指标AARRR漏斗转化数据建设数据埋点数据上报&格式设计埋点类型上报策略安全性
数据清洗
pythonsqlhivehadoop报表建设指标确定数据计算可视化权限管控例行监控日志监控传输监控计算任务指标异常短信邮件提醒编程相关
啤酒找尿布
·
2021-06-13 15:59
数据挖掘:理论与算法笔记2-数据预处理
理论与算法笔记1-走进数据科学下一篇:[数据挖掘:理论与算法笔记3-从贝叶斯到决策树](https://www.jianshu.com/p/61e5ea13dfc8)2.数据预处理:抽丝剥茧,去伪存真2.1
数据清洗
数据缺失有以下几种类型
Jeru_d39e
·
2021-06-12 08:41
端午节将至,用Python爬取粽子数据并可视化,看看网友喜欢哪种粽子吧!
一、前言本文就从数据爬取、
数据清洗
、数据可视化,这三个方面入手,但你简单完成一个小型的数据分析项目,让你对知识能够有一个综合的运用。
·
2021-06-11 19:19
Python实战 | “端午节” 送亲戚,送长辈,粽子可视化大屏来帮忙!
本文就从数据爬取、
数据清洗
、数据可视化,三个方便,但你简单完成一个小型的数据分析项目,让你对知识能够有一个综合的运用。整个思路如下:爬取网页:https://www.jd.com/爬取说
数据分析与统计学之美
·
2021-06-11 17:34
python数据分析实战
python
可视化
可视化大屏
pyecharts
端午节
第7次作业 --
数据清洗
与可视化
plt.figure(figsize=(10,6))#设置图片大小plt.rcParams['font.sans-serif']=['simhei']#指定默认字体plt.rcParams['axes.unicode_minus']=False#解决保存图像是负号'-'显示为方块的问题labels=list(city_count.index)#刻度标签plt.xlabel('City')#设置X轴
史_学语言
·
2021-06-11 15:55
上一页
52
53
54
55
56
57
58
59
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他