E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
python后端数据清洗
pandas:世界各国GDP数据集
数据清洗
案例
JupyterNotebook网盘链接:百度网盘-GDP数据集文章目录1.1依赖准备1.2数据准备1.3数据观察(1)观察数据形状(2)观察数据前五行(3)观察数据列名称列表(4)观察各列数据类型(5)观察结果1.4
数据清洗
这也是计划的一部分
·
2023-01-17 10:22
数据分析
pandas
python
数据分析
深圳租房数据可视化分析【Plotly库绘图】
深圳租房数据可视化分析【plotly库绘图】一、技术介绍1、可视化技术支持来源:2、选择plotly理由:二、代码实现及分析:1、导入库及解读数据集:2、
数据清洗
与转换3、统计数据4、不同区域之间的租金对比
有品位的小丑
·
2023-01-17 09:06
数据分析与可视化
plotly
python
数据分析
信息可视化
实例:【基于机器学习的NBA球员信息数据分析与可视化】
文章目录一、项目任务二、代码实现及分析1.导入模块2.导入文件并对文件信息进行整体探测3.数据预处理3.1查看数据集信息3.2
数据清洗
与转换3.3数据去重4.数据可视化4.1数据相关性4.2球员数据分析
有品位的小丑
·
2023-01-17 09:58
数据分析与可视化
机器学习
数据分析
python
lda 可以处理中文_商品评论情感化分析案例(LDA主题分析)
分析内容正负面高频词汇正负面情绪波动正负面情感倾向正负面LDA主题分析文章目录因为内容较长,这里附上文章内容目录(上传图片有些失真模糊,凑合看看了):
数据清洗
、预处理文本数据,是一种非结构化数据。
weixin_39667452
·
2023-01-16 20:56
lda
可以处理中文
python+vue2+nodejs 搜索引擎课设 SCAU数信学院本科生通知检索(附代码)
前言这个系统主要实现了以下功能:爬虫:数据爬取及分词后端:数据库全文模糊搜索、高频词获取前端:输入拼音缩写或文字后匹配输入建议、搜索、列表分页、高亮关键词、相关度排序及时间排序、深色模式及浅色模式切换爬虫:
python
我先润了
·
2023-01-16 09:53
课设
python
爬虫
vue
数据分析项目实战1——淘宝用户购买行为分析(天池)
二、业务问题及分析思路三、
数据清洗
3.1子集选择选取10万条数据导入MySQL构成本次分析的数据集。3.2列名重命名给导入的数据各字段命名用户id:userid商品ID:itemid商品
Janice18
·
2023-01-15 17:32
数据分析师
数据分析项目实战
数据分析
mysql
【实战】淘宝电商用户行为分析——SQL
目录一、项目背景1.1分析目的1.2分析思路二、数据来源&清洗2.1数据集介绍2.2
数据清洗
2.2.1检查是否存在重复值2.2.2检查是否存在缺失值2.2.3一致化处理(对timestamp)2.2.4
Stella屿
·
2023-01-15 17:31
实战
sql
kaggle——泰坦尼克之灾2
1、流程就这个案例来讲,导入数据之后要做的,分为3步走:1、观察数据,了解特征的含义以及与生存率的关系,方便做特征工程2、特征工程&
数据清洗
,这一步是为了得到一个可以用于训练的好且完整的数据。
andyham
·
2023-01-15 16:49
Python爬虫、
数据清洗
与可视化-2 -request-练习-1-——爬baidu首页热点
练习:爬百度实时热点top10的排序,标题内容,链接#-*-coding:UTF-8-*-importrequestsfromlxmlimportetreeimportcsv#1.爬取urls="http://top.baidu.com/buzz?b=1"headers={"User-Agent":"Mozilla/5.0(WindowsNT6.1;WOW64)AppleWebKit/537.36
Adrian-11
·
2023-01-15 15:42
python项目练习记录
python
基于支持向量机的量化选股模型
要求开发一个基于支持向量机技术的多因子量化投资模型,以近五年沪深300成分股的交易与财务数据为样本,结合大数据相关技术进行
数据清洗
,整理,存储,并构建投资策略与回测框架,输出量化投资模型的结果,为投资者选股与择时提供参考信号
啊金曼
·
2023-01-15 14:41
python
支持向量机
机器学习
金融
Pandas groupby函数 transform函数 实战
但对于数据科学家来说,transform函数是一个用于
数据清洗
、转换或者生成报表的非常方便的工具,尤其是对于大量数据的处理速度上。
xcntime
·
2023-01-15 10:39
python
python
人工智能
数据分析
Pandas
数据清洗
函数总结
目录一、drop():删除指定行列1.删除指定行2.删除指定列二、del():删除指定列三、isnull():判断是否为缺失1.判断是否为缺失2.判断哪些列存在缺失3.统计缺失个数四、notnull():判断是否不为缺失五、dropna():删除缺失值1.导入数据2.删除含有NaN值的所有行3.删除含有NaN值的所有列4.删除元素都是NaN值的行5.删除元素都是NaN值的列6.删除指定列中含有缺失
·
2023-01-15 05:04
Brenda应用(2.0) - 构建(酶, 物质, 关系)0-1表格用于NBI推断新关系
目录目标输出实现数据来源问题应用/测试针对于感兴趣的十种酶进行数据生成代码问题本地记录不全
数据清洗
目标实现问题TODO网络结构深化酶空间化学空间目标提取Brenda的底物、产物表内容,构建(酶,物质,关系
ZOOEEER
·
2023-01-14 22:06
Brenda
python
挖掘建模⑤—因子分析与python实现
环境配置配置python基础知识及数据分析工具安装及简单使用(Numpy/Scipy/Matplotlib/Pandas/StatsModels/Scikit-Learn/Keras/Gensim))数据探索(
数据清洗
eeenkidu
·
2023-01-14 10:00
数据分析
python
python
数据分析
数据挖掘
浙江大学-数据挖掘课程-复习笔记
interestingpattern数据挖掘的过程:knowledgediscovery过程KDD可以被挖掘的patterngeneralization(概括)Informationintegration信息聚合,数据仓库的构建(
数据清洗
没有人比我更懂暴力算法
·
2023-01-14 01:48
数据挖掘
数据挖掘
算法
机器学习基础-30:特征工程与模型选择
1数据预处理数据预处理包括:
数据清洗
、数据格式转换和领域知识收集等。
数据清洗
的任务是过滤掉不符合要求的数据;不符合要求的数据主要是不完整的数据、错误的数据和重复的数据。
MTVideoAI
·
2023-01-13 16:03
机器学习专题
机器学习原理与实践
特征工程
模型选择
机器学习
常用的
数据清洗
方法
常用的
数据清洗
方法常用的
数据清洗
方法在数据处理过程中,一般都需要进行数据的清洗工作,如数据集是否存在重复、是否存在缺失、数据是否具有完整性和一致性、数据中是否存在异常值等。
lrjnumber
·
2023-01-13 13:15
数据分析与挖掘
数据分析
机器学习
利用Python进行数据分析之超市零售分析
[email protected]
,Pycharm2019.3.3,Python3.7.7,jupyternotebook超市零售数据分析1背景与需求2数据收集与整合3
数据清洗
Bryce230
·
2023-01-13 10:45
python
数据分析
Pandas
数据清洗
时的常用函数,叼爆了呀!
pands进阶使用来了,让你的
数据清洗
快人一步,Let‘sgo!
大数据之阴阳
·
2023-01-13 10:16
大数据附加篇
python
pandas
Pandas函数之数据筛选与清洗函数
文章目录数据筛选函数
数据清洗
函数拼接concatmergejoin缺失值、重复值处理str&dt数据筛选函数函数解释loc根据行列名筛选数据,第一个参数是行名,第二个参数是列名iloc根据行列号筛选数据
南方的孩子
·
2023-01-13 10:46
数据分析
python
pandas
筛选
清洗
合并
Pandas
数据清洗
总结
#导入importnumpyasnpimportpandasaspd#查看版本pd.__version__文本文件的读取:对于csv或txt后缀的文本文件,用read_csv函数来实现文件的导入。重要参数的含义如下pd.read_csv(file_path_or_buffer,#指定导入文件的具体路径sep=',',#指定元数据中各种变量之间的分割符,默认是逗号,可自行修改header='infe
Lyttonkeepgoing
·
2023-01-13 10:45
NLP学习笔记
机器学习
自然语言处理
nlp
人工智能
深度学习
盘点66个Pandas函数,轻松搞定“
数据清洗
”!
大家好,我是菜鸟哥今天我们重新盘点66个Pandas函数合集,包括数据预览、数值数据操作、文本数据操作、行/列操作等等,涉及“
数据清洗
”的方方面面。
菜鸟学Python
·
2023-01-13 10:44
字符串
python
数据分析
正则表达式
大数据
Pandas的
数据清洗
、函数应用、排序
Pandas的
数据清洗
、函数应用、排序1、pandas
数据清洗
1-1判断是否存在空值importpandasaspdimportnumpyasnp#新建一个df对象df1=pd.DataFrame([np.random.randint
TheBestKinlon
·
2023-01-13 10:43
python
数据分析
pandas
数据清洗
函数应用
排序
Pandas
数据清洗
常用函数
构造一个数据集,便于演示这些函数。importpandasaspddf={'姓名':['漩涡鸣人','宇智波佐助','旗木卡卡西','春野樱','宇智波鼬'],'性别':['男','男','men','women','男'],'身份证':['463895200003128433','429475199912122345','420934199110102311','4310852000052301
Eureka丶
·
2023-01-13 10:13
数据处理&分析
python
pandas
pandas自定义函数进行
数据清洗
定义函数defdata_cleaning(arguments):#
数据清洗
函数arguments=str(arguments)#arguments=re.sub('[\s]+','',arguments
繁梦溪
·
2023-01-13 10:42
Python
数据分析
python
Pandas
数据清洗
函数大全
文章目录一、drop():删除指定行列1.删除指定行2.删除指定列二、del():删除指定列三、isnull():判断是否为缺失1.判断是否为缺失2.判断哪些列存在缺失3.统计缺失个数四、notnull():判断是否不为缺失五、dropna():删除缺失值1.导入数据2.删除含有NaN值的所有行3.删除含有NaN值的所有列4.删除元素都是NaN值的行5.删除元素都是NaN值的列6.删除指定列中含有
非常颜色
·
2023-01-13 09:41
python
pandas
大数据
pandas
python
数据分析
主数据管理平台功能模型介绍
MDM基础数据管理平台是进行清洗和治理企业的主数据,使企业的主数据具有唯一性、准确性、一致性、及时性,通过主数据的
数据清洗
功能将错误数据和重复数据进
数通畅联
·
2023-01-12 19:58
产品文档
数据治理
主数据管理
如何使用 Pandas 清洗的二手房数据并存储文件
一、实战场景如何使用Pandas清洗的二手房数据并存储文件二、知识点python基础语法python文件读写pandas
数据清洗
三、菜鸟实战清洗前的文件读取源文件defdo_clean_data(self
·
2023-01-12 17:17
python后端数据清洗
python 剔除nan_Pandas的
数据清洗
-删除NaN数据
20.Pandas的
数据清洗
-删除NaN
数据清洗
(TidyData),是对数据进行重新审查和校验的过程,目的在于删除重复信息、纠正存在的错误,并提供数据一致性。
weixin_39941847
·
2023-01-12 11:53
python
剔除nan
数据分析工具--pandas
一、简介1.1定义Pandas是一个强大的分析结构化数据的工具集;它的使用基础是Numpy(提供高性能的矩阵运算);用于数据挖掘和数据分析,同时也提供
数据清洗
功能。
太原浪子
·
2023-01-12 10:17
数据分析
python
数据分析
numpy
Python实现RFM模型
数据清洗
impor
Happy丶lazy
·
2023-01-12 09:27
项目
RFM
python
Python
数据清洗
之List去除空格
Python-
数据清洗
之List去除空格原文档中有很多空格,需要去掉#读取文件temp=open(r"nz.txt",encoding="utf-8")#每行读取为list形式,为之后批量处理做准备txtbuffer
在楼梯口吃芒果的是我
·
2023-01-12 08:01
python学习
python
【
数据清洗
】python 实现数据分裂
这次完全是为了备注一个自己常用的代码,由于经常换写代码的终端,所以有些代码真的不想重写了,所以就在这里备注一下有关
数据清洗
的一些代码:原始数据是想要变成python代码如下:new_data=data_one.str.split
WilliamCHW
·
2023-01-11 23:10
Feature
Engineering
python
python
数据分析
数据清洗
超全的 100 个 Pandas 函数汇总,建议收藏
来源:吊车尾学院我整理了100个Pandas常用的函数,分别分为6类:统计汇总函数、
数据清洗
函数、数据筛选、绘图与元素级运算函数、时间序列函数和其他函数。
Python小二
·
2023-01-11 18:30
数据分析
python
html
数据挖掘
opengl
r语言插补法_R语言︱缺失值处理之多重插补
笔者寄语:缺失值是
数据清洗
过程中非常重要的问题(其他方法可见:R语言︱异常值检验、离群点分析、异常值处理),笔者在进行mice包的多重插补过程中遇到相当多的问题。
weixin_39901213
·
2023-01-11 16:28
r语言插补法
前端数据监控
各维度数据量化,去衡量真实用户的加载速度监控平台链路:sdk上报,上报到服务器和数据存储(接收上报心想、
数据清洗
、入库),展示分析有什么数据需要收集?
sayid760
·
2023-01-11 13:46
js
这个横行霸道的美食,也是中秋节的一大特色,我用Python爬取京东1546条大闸蟹商品数据带大家看看
目录:文章目录1.聊聊大闸蟹2.数据采集2.1.页面分析2.2.采集程序3.
数据清洗
4.数据统计4.1.商品价格分布4.2.评论数分布4
可以叫我才哥
·
2023-01-11 10:20
Python爬虫
python
爬虫
深度学习
【数据分析】认识Pandas:DataFrame和Series结构、属性
DataFrame构造方法dtype参数Series结构Series构造方法DataFrame和Series属性认识PandasPandas是Python语言的一个扩展程序库,用于数据挖掘和数据分析,同时也提供
数据清洗
功能
胡桃の壶
·
2023-01-11 09:50
Pandas
数据分析
数据挖掘
python
损失函数出现nan的原因分析及对策
文章目录nan出现的原因对策1-1
数据清洗
1-2数据增强2-1梯度清零2-2调整网络结构2-3改变损失函数计算方法2-4更换参数初始化策略2-5anchors初始化3-1防止网络过拟合3-2修改超参数设置
Los Merengues
·
2023-01-10 17:03
深度学习
python
神经网络
数据清洗
(一):拉勾网数据分析案例
1.导入数据#导入相应的包importpandasaspdimportnumpyasnpimportmatplotlib.pyplotasplt%matplotlibinline#%matplotlibinline在这个notebook里显示图片df=pd.read_csv('data/2.lagou/lagou_recruitment.csv')df.head()Unnamed:0岗位名称公司名
古杜且偲
·
2023-01-10 15:05
python
python
掌财社:pyspark怎么创建DataFrame?
所以我们在
数据清洗
前需要先使用pyspark创建dataframe并配置dataframe。接下来我们就来看看具体怎么操作。
weixin_45378258
·
2023-01-10 09:38
it
文本聚类(二)—— KMeans 聚类
目录二、KMeans聚类2.1加载数据集2.2
数据清洗
2.3文本向量化2.4文本聚类2.5关键词展示2.6判定最佳聚类数参考文档在第一篇内容中,我们介绍了LDA主题模型,这一篇,我们将介绍经典的KMeans
dfsj66011
·
2023-01-10 08:03
NLP
kmeans算法
Python用逻辑回归、决策树、SVM、XGBoost 算法机器学习预测用户信贷行为数据分析报告
p=31201原文出处:拓端数据部落公众号摘要:此报告首先将dataset进行
数据清洗
,得到dataset_new。
·
2023-01-09 22:49
数据挖掘深度学习机器学习算法
2021年全国大学生数据统计与分析竞赛赛题B—基于机器学习的用户消费行为预测(上)
2021年全国大学生数据统计与分析竞赛赛题B—基于机器学习的用户消费行为预测(上)一、赛题B:用户消费行为价值分析二、基于机器学习的用户消费行为预测1、数据简介及清洗(一)数据简介(二)
数据清洗
2、数据的可视化分析
努力的可乐罐
·
2023-01-09 16:58
可视化
数据挖掘
数据分析
贝叶斯新闻分类实战项目详解
贝叶斯新闻分类前言一、贝叶斯公式推导二、拼写纠正实例三、垃圾邮件过滤实例四、新闻分类实战1.文本分词1.1数据加载1.2jieba分词基本步骤1.3加载停用词字典数据进行
数据清洗
1.4词云图绘制2.TF-IDF
百木从森
·
2023-01-09 14:14
机器学习实例详解
python
机器学习
深度学习
人工智能
朴素贝叶斯算法
R语言中的dplyr包
介绍dplyr是一个常用的用于
数据清洗
的R包,其中主要的函数有:select()从数据中选择列filter()数据行的子集group_by()汇总数据summarise()汇总数据(计算汇总统计信息)arrange
zoujiahui_2018
·
2023-01-09 13:22
R
r语言
开发语言
【R语言】dplyr包
出处:AI入门学习dplyr包主要用于
数据清洗
和整理,主要功能有:行选择、列选择、统计汇总、窗口函数、数据框交集等是非常高效、友好的数据处理包,学清楚了,基本上数据能随意玩弄,对的,随意玩弄,简直大大提高数据处理及分析效率
大火收汁
·
2023-01-09 13:52
R语言
r语言
python分析excel数据-像Excel一样使用python进行数据分析
在Python中pandas库用于数据处理,我们从1787页的pandas官网文档中总结出最常用的36个函数,通过这些函数介绍如何通过python完成数据生成和导入,
数据清洗
,预处理,以及最常见的数据分类
weixin_37988176
·
2023-01-09 13:43
python学习(2)— 就业岗位准备
一、岗位表职位技能
Python后端
开发工程师Python基础Django/Flask/Tornado/SanicRESTful/接口文档撰写MySQL/Redis/MongoDB/ElasticSearchLinux
Hubert_xx
·
2023-01-09 12:33
python入门经典书籍知乎_知乎问题回答 - 《Python100天从新手到大师》 - 开源书籍(oscbook.com)...
职位所需技能招聘需求量
Python后端
开发工程师Python基础Dja
weixin_39750731
·
2023-01-09 12:02
python入门经典书籍知乎
上一页
29
30
31
32
33
34
35
36
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他