E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
python后端数据清洗
电影评论 R文本挖掘-情感分析
数据集说明:本次情感分析使用电影评论数据1500条,包含好评、中评、差评各500条;【1】数据读取;【2】
数据清洗
;【3】评论分词;【4】数据整理(方便情感打分);【5】词典读取;【6】定位情感词;【7
Mrrunsen
·
2022-07-18 11:13
R语言
r语言
数据挖掘比赛笔记总结
数据挖掘流程记录
数据清洗
数据清洗
之异常值处理的常用方法异常值的处理异常值处理箱型图特征选择特征选择方法最全总结数据挖掘之特征选择_dragon的专栏-CSDN博客_数据挖掘特征选择比赛实战项目推荐1.天池二手车交易价格预测
GoAI
·
2022-07-18 07:57
数据分析与数据挖掘
数据挖掘
特征选择
特征处理
机器学习
数据分析
[Kaggle比赛] 高频股价预测小结
高频股价预测文章目录高频股价预测问题描述问题分析数据分析数据集
数据清洗
解决方案数据预处理归一化PricesVolume时间信息对于预测值的处理噪声模型探索基于LSTM的RNN模型递归神经网络(RNN)长短期记忆
karmayh
·
2022-07-18 07:22
Kaggle
股指期货高频数据机器学习预测(Python)
代码详见:股指期货高频数据机器学习预测主要学习本文对特征的提取和数据预处理操作文章目录问题描述问题分析数据分析数据集
数据清洗
数据预处理归一化PricesVolume时间信息对于预测值的处理噪声模型探索基于
稚嫩的劢劢
·
2022-07-18 07:16
Quant
python
机器学习
神经网络
机器学习强基计划0-1:教程导读
举例而言:强化学习结合蚁群算法增强路径规划寻优性;决策树与整数规划算法结合增强任务调度可解释性;聚类与降维应用于
数据清洗
,提高数据质量;…在机器学习这门课程的学习过程中,不难体会到这是一门“推公式”、“
Mr.Winter`
·
2022-07-14 07:40
机器学习强基计划
机器学习
人工智能
python
python数据挖掘与分析
2、数据挖掘建模的流程目标定义:任务理解、指标确定数据采集:建模抽样、质量把控、实时采集数据整理:数据探索、
数据清洗
、数据变化表构建模型:算法选择、模型搭建、模型验证模型评价:模型评价指标选择、模型优化模型发布
zzb103749
·
2022-07-13 07:45
机器学习
数据挖掘
python
python 使用Pandas进行
数据清洗
文章目录数据缺失缺失值检测isnull()丢弃缺失值dropna()缺失值填充fillna()数据重复去重复值drop_duplicates()数据不一致值替换replace异常值处理
数据清洗
:对采集的数据进行重新审查和校验的过程
锵锵锵锵~蒋
·
2022-07-13 07:39
Python初学
python
数据挖掘
数据分析
2022年首届“钉钉杯”大学生大数据挑战赛
资料流程主要是,
数据清洗
,数据可视化,特征工程,算法,模型评价。如果有其他详细需求,一天之内可以解决。需要私聊即可。
专注数据挖掘
·
2022-07-13 07:40
大数据
python数据分析之numpy与pandas入门
目录简介一、numpy常用数据结构1、数组和矩阵2、访问方法二、numpy矩阵运算(加减乘逆)1、加减2、乘法(普通乘,矩阵乘,点乘)3、逆和伪逆4、转置和计算行列式三、numpy常用
数据清洗
方法1、sort
英雄各有见
·
2022-07-11 07:08
python基础知识
python
数据挖掘
基于双语数据集搭建seq2seq模型
作者:raelum️博客主页:https://raelum.blog.csdn.net如果这篇文章有帮助到你,可以关注❤️+点赞+收藏⭐+留言,这将是我创作的最大动力目录一、前言二、数据预处理2.1
数据清洗
aelum
·
2022-07-10 07:16
PyTorch
#
Natural
Language
Processing
深度学习
python
pytorch
自然语言处理
seq2seq
大数据技术期末复习重点,不挂科看这里~
二、数据采集与预处理1.Kafka数据采集2.数据预处理原理3.数据预处理方法4.
数据清洗
有哪些方法?5.数据集成要考虑的问题有哪些?6.数据变换主要涉及哪些内容?三.数据挖掘1.数据挖掘的概念2.数
转行卖煎饼
·
2022-07-07 12:45
大数据的期末复习指南
big
data
python
大数据
Spark数据分析及处理
文章目录用例1:
数据清洗
用例2:用户留存分析用例3:活跃用户分析用例4:活跃用户地域信息分析用例5:用户浏览深度分析本项目用到的文件获取如下,提取码:6xdx点我获取文件注意:本文都是在spark-shell
sun_0128
·
2022-07-05 19:10
spark
大数据
数据分析
spark
数据分析及处理
【Spark】(十三)Spark数据分析及处理
用例一:
数据清洗
基本步骤:1、读入日志文件并转化为RDD[Row]类型按照Tab切割数据过滤掉字段数量少于8个的2、对数据进行清洗按照第一列和第二列对数据进行去重过滤掉状态码非200过滤掉event_time
屡傻不改
·
2022-07-05 19:38
Spark
spark
日志数据清洗及分析
【Spark】SparkSQL练习--出租车
数据清洗
SparkSQL练习--出租车
数据清洗
数据分析数据读取准备工作读取文件
数据清洗
数据类型转换解决报错问题剪除异常数据完整代码显示数据分析数据集结构其中有几点需要注意hack_license是出租车执照,可以唯一标识一辆出租车
飝鱻.
·
2022-07-05 19:36
Spark
spark
scala
big
data
基于Spark的
数据清洗
与转换
基于Spark的
数据清洗
与转换一、实验目的二、实验内容三、实验原理四、实验环境五、实验步骤5.1启动HDFS集群、Spark集群和Zeppelin服务器5.2准备实验数据5.3数据整合5.4
数据清洗
5.5
不懂开发的程序猿
·
2022-07-05 19:34
Spark
spark
hadoop
大数据
数据挖掘:比赛的流程干货分享
比赛基本流程做一个数据挖掘比赛,主要包含了数据分析,
数据清洗
,特征工程,模型训练和验证等四个大的模块。
凌贤文
·
2022-07-05 07:11
数据挖掘和数据分析
大数据
数据挖掘
机器学习
【爬虫|数据分析|Hadoop】利用scrapy框架爬取小说信息并进行数据分析
文章目录爬虫部分1.创建项目2.修改配置文件3.编写items.py4.编写爬虫脚本5.编写pipeline.py6.运行项目数据分析部分1.导包2.数据预处理2.1读取文件2.2查看前5行3.
数据清洗
别来BUG求求了
·
2022-07-02 07:15
爬虫
数据分析
hadoop
端到端的机器学习项目
端到端的机器学习项目一、关于RMSE和MAE的理解二、快速查看数据结构三、创建测试集四、地理数据可视化可视化参数查找关联五、
数据清洗
pandas的dropna()函数pandas的drop函数Imputerfit
「已注销」
·
2022-07-01 07:10
机器学习基础python实现
python
机器学习
数据分析
Python Pandas数据处理高频操作详解
重命名列增加列缺失值处理独热编码替换值删除列数据筛选差值计算数据修改时间格式转换设置索引列折线图散点图柱状图热力图66个最常用的pandas数据分析函数从各种不同的来源和格式导入数据导出数据创建测试对象查看、检查数据数据选取数据清理筛选,排序和分组依据数据合并数据统计16个函数,用于
数据清洗
·
2022-06-30 17:59
基于LSTM的IMDB电影评论情感分析
基于LSTM的IMDB电影评论情感分析步骤加载数据(50KIMDBMovieReview)
数据清洗
编码“情感”数据集划分(训练集和测试集)对评论进行分词和截断/补零操作构建神经网络模型训练模型并测试导入相关工具箱
qq_48566899
·
2022-06-30 07:23
机器学习
python
lstm
自然语言处理
python
时间序列预测——GRU
整个过程主要包括:数据导入、
数据清洗
、结构转化、建立GRU模型、训练模型(包括动态调整学习率和earlystopping的设置)、预测、结果展示、误差评估等完整的时间序列预测流程。
行者无疆_ty
·
2022-06-30 07:10
人工智能
人工智能
深度学习
tensorflow
python
DL之GRU:基于2022年6月最新上证指数数据集结合Pytorch框架利用GRU算法预测最新股票上证指数实现回归预测
算法预测最新股票上证指数实现回归预测目录基于2022年6月最新上证指数数据集结合Pytorch框架利用GRU算法预测最新股票上证指数实现回归预测#0、数据集预整理#1、读取数据集#2、数据预处理#2.1、
数据清洗
一个处女座的程序猿
·
2022-06-30 07:49
DL
DataScience
GRU
回归预测
深度学习
Pandas缺失值处理超强讲解
缺失值处理常用于数据分析
数据清洗
阶段;Pandas中将如下类型定义为缺失值:NaN:‘’,‘#N/A’,‘#N/AN/A’,‘#NA’,‘-1.#IND’,‘-1.
·
2022-06-29 11:56
pandas
机器学习实战——泰坦尼克号
该项目从数据获取->
数据清洗
->特征处理->构建模型->模型评估5个步骤进行分析。
G_瑞琴
·
2022-06-28 20:45
机器学习
机器学习
Python3利用Pandas类库生成多Sheet的Excel
一、PandasPandas是Python语言的一个扩展程序库,可以对各种数据进行运算操作,比如归并、再成形、选择,还有
数据清洗
和数据加工特征。
网络达人丶
·
2022-06-28 11:02
Python
python
sklearn
开发语言
如何通过测试提升 Python 代码的健壮性
0x00前言本文的更多的是写给
Python后端
的程序员。来简单分享一下我对写测试的理解。本期就聊聊测试这件小事情。
·
2022-06-27 12:34
python
详解Python中的
数据清洗
工具flashtext
目录1、准备flashtext环境2、添加关键词3、提取关键词4、替换关键词5、获取所有关键词6、批量的添加关键词7、批量删除关键词8、执行效率对比在平常的一些的小规模的数据的过滤、清洗过程中使用最多的就是正则表达式,但是随着数据规模的增大,正则表达式就显得有些心有余力不足了。正则表达式在一个10k的词库中查找15k个关键词的时间差不多是0.165秒。但是对于Flashtext而言只需要0.002
·
2022-06-27 08:16
数据清洗
工具flashtext,效率直接提升了几十倍数
在平常的一些的小规模的数据的过滤、清洗过程中使用最多的就是正则表达式,但是随着数据规模的增大,正则表达式就显得有些心有余力不足了。【阅读全文】正则表达式在一个10k的词库中查找15k个关键词的时间差不多是0.165秒。但是对于Flashtext而言只需要0.002秒。因此,在这个问题上Flashtext的速度大约比正则表达式快82倍。从上面的示例图的性能对比中,可以发现随着我们需要处理的字符越来越
·
2022-06-26 22:58
python
爬虫+数据可视化分析
提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档简单爬虫及数据分析一、前程无忧数据分析岗位爬虫二、Python
数据清洗
+可视化分析1.
数据清洗
2.数据可视化分析结论一、前程无忧数据分析岗位爬虫利用
Janniffer218
·
2022-06-26 07:45
数据分析python
爬虫
python
数据分析
python箱线图异常值_Python
数据清洗
--异常值识别与处理01
前言在《Python
数据清洗
--类型转换和冗余数据删除》和《Python
数据清洗
--缺失值识别与处理》文中已经讲解了有关数据中重复观测和缺失值的识别与处理,在本节中将分享异常值的判断和处理方法。
李祯煜
·
2022-06-22 07:38
python箱线图异常值
机器学习---第一个应用——鸢尾花分类
同时介绍了机器学习中数据及数据的处理过程---《机器学习---数据简介及
数据清洗
概述》,今天我们来介绍或许在入门机器学习过程中每个人都可能会接触的一个项目---鸢尾花分类。
此间过客~
·
2022-06-20 07:48
机器学习
python
机器学习
人工智能
pandas
数据清洗
实现删除的项目实践
目录准备工作(导入库、导入数据)检测数据情况DataFrame.drop(labels=None,axis=0,index=None,columns=None,inplace=False)方式一:删除指定行或列方式二:利用boolean删除满足条件元素所在的行准备工作(导入库、导入数据)importpandasaspdimportmatplotlib.pyplotaspltimportnumpya
·
2022-06-17 11:27
powerbi招聘分析
・数据选取boss直聘A市数据分析师数据本文按照5个步骤来进行1.提出问题2.理解数据3.
数据清洗
4.数据可视化与分析5.提出结论提出问题1.数据分析职位需求分析,主要分布在哪些行业2.数据分析职位在A
datagirl
·
2022-06-16 16:55
Python数据集库Vaex秒开100GB加数据
目录前言Vaex数据准备
数据清洗
具体分析更深入的分析结论前言如果你50GB甚至500GB的数据集,打开他们都很困难了,更别说分析了。在处理这样的数据集时,我们通常采用3种方法。
·
2022-06-13 16:11
超参数优化:贝叶斯优化
文章目录贝叶斯优化在机器学习和深度学习的使用1.项目简介2.机器学习案例2.1导入相关库2.2导入数据及
数据清洗
2.3拆分数据集2.4贝叶斯优化2.5使用最优参数组合重新训练模型,并进行预测3.深度学习案例
悬瓴木
·
2022-06-12 12:55
深度学习
机器学习
深度学习
python
pandas-
数据清洗
pandas
数据清洗
01|
数据清洗
常用方法02|数据集03|
数据清洗
1.查看基本信息2.处理空格3.处理重复值4.异常值处理5.缺失值处理6.处理文本数据7.转换时间序列8.时间序列切分04|数据提取1
冷淡的蛋黄酱
·
2022-06-11 15:01
数据分析案例
pandas数据分析之
数据清洗
(上)
1、预备知识-python核心用法常用数据分析库(上)文章目录1、预备知识-python核心用法常用数据分析库(上)概述实验环境任务一:环境安装与配置【实验目标】【实验步骤】任务二:Pandas数据分析实战【任务目标】【任务步骤】概述Python是当今世界最热门的编程语言,而它最大的应用领域之一就是数据分析。在python众多数据分析工具中,pandas是python中非常常用的数据分析库,在数据
小鲁班哦
·
2022-06-11 15:01
数据分析
python
数据挖掘
数据清洗
实例
下面介绍一下基本的
数据清洗
操作:代码:importrefromnltk.corpusimportstopwordss='RT@Amila#Test\nTom\'snewlylistedCo&Mary
不写代码的程序员~zs
·
2022-06-11 15:30
自然语言处理
python
自然语言处理
知识图谱
深度学习
nlp
【pandas drop()和dropna()函数使用详解】
drop和dropna的用法详解进行
数据清洗
时,经常会遇到缺失值。
一杯冰糖
·
2022-06-11 15:00
pandas
数据挖掘
数据分析
python
常用pandas
数据清洗
操作已备好
文章中所总结的pandas
数据清洗
操作,是以微软
数据清洗
利器PowerQuery为依据,将其中涉及的
数据清洗
操作用pandas来实现。
m0_67900893
·
2022-06-11 15:00
python
Python数据分析与展示——Pandas基本操作
Pandas可以对各种数据进行运算操作,比如归并、再成形、选择,还有
数据清洗
和数据加工特征。pandas的好处:便捷的数据处理能力读取文件方便封装了Matplotlib、Numpy的画图和计
看看别人看看你
·
2022-06-11 15:59
python
数据分析
数据挖掘
Pandas基本操作总结 excel读取和
数据清洗
#1读取表格df=pd.read_excel("目标文件路径",skiprows=要跳过的行数)┗━━━━━━━┳━━━━━━━┛指定读取表格时要跳过前面空行的行数#2筛选某列不是空值的所有行df.loc[df["某列"].notnull(),:]┗━━━━━━━┳━━━━━━━┛↓筛选某列不为空值的所有行筛选行后选取所有列#3删掉整个的空行或空列df.dropna(axis=0,how='all
ddxn417
·
2022-06-11 15:29
python
pandas
python
用Pandas进行
数据清洗
Pandas是Python中很流行的类库,使用它可以进行数据科学计算和数据分析,并且可以联合其他数据科学计算工具一块儿使用,比如,SciPy,NumPy和Matplotlib,建模工程师可以通过创建端到端的分析工作流来解决业务问题。虽然我们可以Python和数据分析做很多强大的事情,但是我们的分析结果的好坏依赖于数据的好坏。很多数据集存在数据缺失,或数据格式不统一(畸形数据),或错误数据的情况。不
bullnfresh
·
2022-06-11 15:29
big
data
数据仓库
【pandas 基本操作:
数据清洗
】
pandas基本操作第一章
数据清洗
第二章数据合并第三章数据重塑第四章数据转换文章目录pandas基本操作前言1.空值和缺失值的处理2.重复值的处理3.更改数据类型前言
数据清洗
是一项复杂且繁琐的工作,同时也是整个数据分析过程中最为重要的环节
一杯冰糖
·
2022-06-11 15:58
数据处理
pandas
数据分析
python
Python+Django+sqlite3实现基于内容的音乐推荐系统
设计结构数据处理需要对标签
数据清洗
以及将音频信号转化为频谱信号。本次数据集采用公开音频数据集GTZAN,其中包含了10种不同风格的音乐,每一种音乐都包含100个音频文件,每个音频文件都是30秒。
biyezuopinvip
·
2022-06-11 12:12
python
人工智能
Django
基于内容的推荐系统
音乐推荐系统
机器学习算法优缺点
LogisticRegression)五、SVM支持向量机常见问题过拟合交叉验证算法的误差集成学习bagging和boosting的区别XGBOOST和GDBT的区别AdaBoost和GBDT的区别主成分分析PCA回归常见问题步骤
数据清洗
lady_rui
·
2022-06-09 07:00
机器学习
Python数据分析实战之葡萄酒质量分析
文章目录1.明确需求和目的2.数据收集3.数据预处理3.1数据整合3.1.1加载相关库和数据集3.1.2数据概览3.2
数据清洗
3.2.1列名重命名3.2.2数据类型处理3.2.3缺失值处理3.2.4异常值处理
BHW233
·
2022-06-08 07:49
python
数据分析
推荐七个Python工具,效率翻倍
1、Pandas-用于数据分析Pandas是一个强大的分析结构化数据的工具集;它的使用基础是Numpy(提供高性能的矩阵运算);用于数据挖掘和数据分析,同时也提供
数据清洗
功能。
程序员枸杞.
·
2022-06-08 06:16
python
开发语言
特征工程系列:
数据清洗
文章系列:特征工程系列:
数据清洗
特征工程系列:特征筛选的原理与实现特征工程系列:特征预处理特征工程系列:特征构造特征工程系列:时间特征构造以及时间序列特征构造前言数据和特征决定了机器学习的上限,而模型和算法只是逼近这个上限而已
安替-AnTi
·
2022-06-06 07:51
机器学习
数据清洗
特征工程
R数据分析:如何简洁高效地展示统计结果
之前给大家写过一篇
数据清洗
的文章,解决的问题是你拿到原始数据后如何快速地对数据进行处理,处理到你基本上可以拿来分析的地步,其中介绍了如何选变量如何筛选个案,变量重新编码,如何去重,如何替换缺失值,如何计算变量等等
Codewar
·
2022-06-04 21:00
上一页
44
45
46
47
48
49
50
51
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他