E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
pythonexcel数据清洗
python预测糖尿病_使用机器学习的算法预测皮马印第安人糖尿病
皮马印第安人糖尿病预测pima_diabetes_analysis_and_prediction文件夹:data-->存储原始样本和
数据清洗
后的样本data_analysis_after_clean--
weixin_39613433
·
2022-11-21 07:36
python预测糖尿病
python学习 --DataFrame
数据清洗
(空值、重复值)
目录空值的处理1、检查是否有空值2、统计空值的数量3、删除空值4、填补空值用value参数替换空值将空值替换成上一列的值将空值替换成上一行的值将空值替换成下一列的值将空值替换成下一行的值重复值的处理1、检查是否有重复值2、删除重复行一、空值的处理importpandasaspdlist1=[['赵一',23,'男'],['钱二',27,'女'],['孙三',26,'女']]list2=[['赵一
悠闲的小鱼Liu
·
2022-11-21 06:41
python
python
pandas
数据分析
天池长期赛:二手车价格预测(422方案分享)
前言一、赛题介绍及评测标准二、数据探索(EDA)1.读取数据、缺失值可视化2.特征描述性统计3.测试集与验证集数据分布4.特征相关性三、
数据清洗
四、特征工程1.构建时间特征2.匿名特征交叉3.平均数编码五
wjzeroooooo
·
2022-11-21 05:27
数据挖掘
Python
大数据
python
数据挖掘
阿里云天池大数据长期赛:金融风控-贷款违约预测(含代码)
赛题介绍二、数据描述性统计2.1.读取数据2.2.查看重复值2.3.统计目标变量比例2.4.查看数据的统计量2.5.统计每个变量的种类2.6.查看训练集与测试集的特征分布是否一致2.7查看数据相关性三、
数据清洗
wjzeroooooo
·
2022-11-21 05:56
大数据
Python
数据挖掘
数据分析
数据挖掘
anaconda tensorflow 2.3_TensorFlow 速成 | 统计师的Python日记 第13天
第7天开始学习
数据清洗
,着手学会了重复值删除、异常值处理、替换、创建哑变量等技能。第8天接着学习
数据清洗
,一些常见的数
weixin_39808143
·
2022-11-21 05:23
anaconda
tensorflow
2.3
python
mean函数
python
minimize
python
minimize用法
python
sklearn
logistic
【数据竞赛】消费金融场景下的用户购买预测冠军方案分享
我们在全景智额、千人千面、大数据风控等金融科技方面的尝试与创新,也正是因为打造了从数据收集到
数据清洗
、再到数据挖掘和商业应用的一体化大
风度78
·
2022-11-21 05:11
人工智能
大数据
机器学习
python
深度学习
景联文科技:一起聊聊数据标注那些事儿
数据标注的主要流程图像标注的标注流程分为
数据清洗
、数据标注和标注检验三类。清洗数据
数据清洗
就是排除数据所存在缺失值、噪声数据、重复数据等质量问题。
景联文科技
·
2022-11-21 02:29
数据标注
数据采集
人工智能
机器学习
深度学习
python
数据清洗
工具、方法、过程整理归纳(七、
数据清洗
之数据预处理(二)——异常值处理、数据离散化处理)
文章目录数据预处理7.3异常值处理7.4数据离散化处理数据预处理7.3异常值处理异常值指那些偏离正常范围的值,不是错误值异常值出现频率较低,但又会对实际项目分析造成偏差异常值一般用箱线图法(分位差法)或者分布图法(标准差法)来判断异常值往往采取盖帽法或者数据离散化来解决df.head()ConditionCondition_DescPriceLocationModel_YearMileageExt
favorbanana
·
2022-11-20 22:39
#
数据清洗
python
数据分析
python评论数据分析_Python亚马逊智能产品评论数据分析
一、概述本文主要使用Python对亚马逊智能产品评论数据集进行
数据清洗
,通过对不同产品的评分进行变换后得到产品的好评数、中评数、差评数以及对应的比率等,通过上述这些指标,找到好评率最高的产品、并尝试通过词云图对差评率最高的产品进行原因分析
张雪峰老师
·
2022-11-20 19:33
python评论数据分析
总结一些 spark 处理小trick
前言最近做了很多
数据清洗
以及摸底的工作,由于处理的数据很大,所以采用了spark进行辅助处理,期间遇到了很多问题,特此记录一下,供大家学习,。
weixin_42001089
·
2022-11-20 18:29
程序人生
深度学习导论与应用实践(机器学习篇)
深度学习导论与应用实践(机器学习篇)前言机器学习概述机器学习基本定义和基本术语数据预处理
数据清洗
数据集拆分机器学习三要素1、模型判别模型和生成模型概率模型和非概率模型机器学习方法概述数据集分类方法数据集不平衡特征工程前言本章较为详细
唐十
·
2022-11-20 18:23
2022暑期集训
深度学习
人工智能
基于YoloV5+目标追踪算法的越界识别项目——从
数据清洗
到边缘设备部署,全面掌握项目流程
而本次训练营全程“硬菜”,保姆式教学,以“基于YoloV5+目标追踪算法的越界识别项目”,图文并茂讲述了如何从开始的
数据清洗
到边缘设备部署。所谓“实践出真知”,“工欲善其事,必先利其器”
学算法的小猴子
·
2022-11-20 17:41
算法
人工智能
2023届-计算机视觉算法岗实习面经
ViT的计算量5、如何降低Transformer的计算量6、开放性问题如何从零开始完成一个基于深度学习的业务在已有的业务基础上,如何开展一个类似的新业务unseendata,openset问题如何进行图像
数据清洗
liuz_notes
·
2022-11-20 15:38
学习成长
计算机视觉
实习
经验分享
面试
算法
大数据、云计算系统高级架构师课程学习路线图
大数据、云计算系统高级架构师课程学习路线图大数据之Linux+大数据开发篇JavaLinux基础Shell编程Hadoop2.xHDFSYARNMapReduceETL
数据清洗
HiveSqoopFlume
tao_wei162
·
2022-11-20 13:55
大数据
数据库
操作系统
Pandas数据预处理_持续更新
Pandas数据预处理_持续更新一、
数据清洗
1.1字符串数据分列1.2Series提取字符串部分元素1.3Series替换\删除字符串部分元素1.4重复值处理1.5缺失值处理1.6异常值处理1.7数据合并
金针菇玉米肠
·
2022-11-20 12:11
pandas
python
数据分析
数据挖掘
Paper再现:MD+AI自动编码机探测蛋白变构(二):MD数据处理及特征化
original_dataset保存的是MD生成的PDB结构,是datsetsplit.ipynb进行
数据清洗
分割以后的结果,分为两个holo和opo两个文件夹,其中opo就是文献中提及的Unbound
wufeil
·
2022-11-20 06:12
图神经网络
药物设计
机器学习
python
神经网络
临床大数据分析与挖掘
分布分析2.1.1.定量数据分析2.2.2.定性数据分析2.2.对比分析2.2.1.对比分析的形式2.2.2.对比分析的标准2.3.描述性统计分析2.4.周期性分析2.5.贡献度分析2.6.相关性分析3.
数据清洗
_森罗万象
·
2022-11-20 03:50
杂七杂八
python
算法
机器学习
神经网络
sklearn
数据建模初入门笔记
班级成绩案例之大数据分析相关矩阵热图柱状图直方图散点图UCI肿瘤数据集之大数据分析准备阶段数据集模型训练预测结果UCI观影数据集之大数据分析读取CSV数据清理统计数据与作图Kaggle竞赛之“泰坦尼克号”大数据分析准备工作
数据清洗
探索可视化特征工程基本建模和评估炼丹集成方法预测前言
望向天空的恒毅
·
2022-11-20 02:09
小白的成长
数据挖掘
机器学习
人工智能
数据建模
基于RFM的航空公司客户价值分析模型
目录一、背景二、分析方法与过程2.1数据抽取2.2数据探索分析2.3数据预处理2.3.1
数据清洗
2.3.2属性规约2.3.3数据变换2.4聚类分析2.5特征分析三、分析结果四、模型应用4.1会员的升级与保级
猪逻辑公园
·
2022-11-19 23:50
数据挖掘
机器学习应用
工业大数据在铅粉机的应用(二)
从第一批数据开始建模,持续了三个月,发现模型精度始终不高,一直没有达到我要的效果;我反复检查了模型参数,
数据清洗
过程,代码bug等等,就是找不到问题。我最后猜测是不是输入数据
DATARUSHER
·
2022-11-19 22:39
数据挖掘案例
大数据
机器学习中缺失值处理方法大全(附代码)
目录
数据清洗
简介填补缺失值的重要性缺失值导致的问题缺失数据类型如何处理数据集中缺失的数据干货推荐浙大博士导师深度整理:Tensorflow和Pytorch的笔记(包含经典项目实战)值得收藏,这份机器学习算法资料着实
机器学习社区
·
2022-11-19 19:46
机器学习
机器学习
人工智能
python
【机器学习】机器学习中缺失值处理方法大全(附代码)
目录
数据清洗
简介填补缺失值的重要性缺失值导致的问题缺失数据类型如何处理数据集中缺失的数据
数据清洗
数据预处理中的
数据清洗
与机器学习方法、深度学习架构或数据科学领域的任何其他复杂方法无关。
风度78
·
2022-11-19 19:42
算法
人工智能
大数据
python
机器学习
城市规划与大数据学习网址
常见有用网址一、空间地理数据分析常用的软件二、可视化工具三、关于地图坐标转换的方法:四、在线数据的爬取五、数据分析(用于
数据清洗
)六、大数据的获取方式其它最近在学习的城市规划大数据理论与方法学习,其中涉及到的工具和软件
美滋滋(你猜
·
2022-11-19 16:02
笔记
arcgis
python
数据库
大数据
数据挖掘——数据采集和
数据清洗
数据采集和
数据清洗
一、
数据清洗
1.数据去重(一)相关知识1>pandas读取csv文件-read_csv()2>pandas的去重函数-drop_duplicates()(二)本关任务(三)参考代码2.
zkinglin
·
2022-11-19 15:43
数据挖掘
习题
python
数据分析
数据挖掘
数据挖掘:
数据清洗
——数据不平衡处理
数据挖掘:
数据清洗
——数据不平衡处理一、什么是数据不平衡?不平衡数据集指的是数据集各个类别的样本数目相差巨大,也叫数据倾斜。以二分类问题为例,即正类的样本数量远大于负类的样本数量。
AvenueCyy
·
2022-11-19 15:16
数据挖掘
机器学习
数据挖掘
python
实验三 线性回归
二、多项式回归1.数据集构建2.模型构建3.模型训练4.模型评估三、Runner类介绍四、基于线性回归的波士顿房价预测1.数据处理1.1数据集介绍1.2
数据清洗
1.3
沐一mu
·
2022-11-19 14:53
线性回归
回归
机器学习
深度学习
pytorch
NNDL 实验三 线性回归
2.3多项式回归2.3.1数据集构建2.3.2模型构建2.3.3模型训练2.3.4模型评估2.4Runner类介绍2.5基于线性回归的波士顿房价预测2.5.1数据处理2.5.1.1数据集介绍2.5.1.2
数据清洗
Persevere~~~
·
2022-11-19 13:05
线性回归
机器学习
深度学习
基于Keras深度学习LSTM模型 预测黄金主力收盘价
深度学习框架Keras,深度学习LSTM模型1数据源:黄金主力数据来源于JQData(数据由JQData支持)2
数据清洗
3使用黄金主力数据进⾏预测的2个实验数据集:70%用做训练集训练模型;30%测试集
DavidDing2088
·
2022-11-19 12:53
量化交易
挖掘用户购物信息--关联规则
提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档文章目录前言背景介绍关联规则(AssociationRules)一、项目目的二、操作步骤1.引入库2.读入数据3.
数据清洗
与加工三、结论与总结建议前言背景介绍通过挖掘客户购物信息
奔跑的小绵羊02
·
2022-11-19 12:40
数据挖掘
python
算法
【数据分析】用户价值分析
●R:最近一次消费时间(最近一次消费到参考时间的间隔)●F:消费的频次●M:消费的金额(总消费金额)
数据清洗
数据格式InvoiceNo:订单编号,每笔交易有6个整数,退货订单编号开头有字母’C’。
叶柖
·
2022-11-19 11:52
数据分析
python
数据分析
电商用户价值分析——基于RFM模型、KMeans聚类
电商用户价值分析——基于RFM模型、KMeans聚类一、背景二、RFM模型、KMeans聚类三、分析框架四、具体分析1.导入所需的库2.导入数据3.
数据清洗
4.数据分析4.1核心数据分析4.2用户分析5
奔跑的小绵羊02
·
2022-11-19 11:38
python
数据分析
kmeans
k-means
数据挖掘
泰坦尼克号python数据分析统计服_用Python分析泰坦尼克号乘客生还率
kaggle竞赛(Titanic:MachineLearningfromDisaster)上入门机器学习(ML)的一个高质量的可选数据集,我们可以用这个数据集实践我们的机器学习知识,熟悉数据分析“数据获取→
数据清洗
weixin_39669075
·
2022-11-19 08:29
【数据分析】 Titanic乘客获救预测(2)数据处理
Titanic乘客获救预测(2)数据处理1
数据清洗
及特征处理1.1缺失值处理1.1.1查看缺失值1.1.2缺失值处理1.2重复值处理1.3特征处理1.3.1连续型数值离散化处理1.3.2类别型文本特征转换
baekii
·
2022-11-19 07:45
数据分析
python
数据分析
泰坦尼克号数据分析 预测建模 准确率测算
b.可对数据情况进行各种分析c.对于已经被拆分为训练集和测试集的,可以通过合并再清洗的方式,简化工作(此处的
数据清洗
逻辑与上文的清洗逻辑相同,但代码不同
dai_ricky
·
2022-11-19 07:09
Python
python
机器学习
csv
数据分析
Pandas
数据清洗
深入浅出Pandas读书笔记C10Pandas
数据清洗
10.1缺失值的认定10.1.1缺失值类型一般使用NaN代表缺失值,可以使用Numpy定义为np.nan或np.NaN.在Pandas1.0以后的版本中
EricZHAOedu
·
2022-11-19 06:40
深入浅出Pandas
pandas
python
数据分析
pandas学习笔记1: DataFrame和ndarray类
其实就是
数据清洗
过程。我的原表是DataFrame类,这是我的代码。
Elophredr
·
2022-11-19 05:37
学习
python
数据挖掘
矩池云|Python生态下用GPU进行数据科学计算加速的实践经验&案例
在Python相关数据科学领域的社区中,近年来有一个计算资源选择的趋势:在数据挖掘阶段,比如
数据清洗
、抽取和特征工程,开发者基本倾向使用CPU,调CPU下的一些包;进入建模阶段之后,尤其在深度学习任务中
矩池云Matpool
·
2022-11-19 04:16
机器学习
python
数据分析
人工智能
机器学习
深度学习
数据清洗
:缺失值识别和处理方法
缺失值识别数据缺失分为两种:一是行记录的缺失;二是列值的缺失。不同的数据存储和环境中对于缺失值的表示不同,例如数据库中是Null、Python返回对象是None、Pandas或Numpy中是NaN。构造数据:#导入相关库importpandasaspdimportnumpyasnp#生成缺失数据df=pd.DataFrame(np.random.randn(6,4),columns=['col1'
大哇唧
·
2022-11-19 04:37
pandas
数据挖掘
python
数据分析
pandas基础学习
pandas常用的基本功能如下:从Excel、CSV、网页、SQL、剪切板等文件或工具中读取数据合并多个文件或电子表格中的数据,将数据拆分为独立的文件
数据清洗
、如去重、处理缺失值、填充默认值、补全格式,
~hello world~
·
2022-11-19 03:53
学习笔记
pandas
学习
python
学习笔记:情感分析
一、项目目标(一)将Twitter数据集可视化,制作出直方图、词云等;(二)掌握LSTM算法原理;(三)学会利用NLTK语料库进行
数据清洗
;(四)可以用深度学习进行预测分析。
海盐味的小圆饼
·
2022-11-19 02:22
学习笔记
学习
自然语言处理
python
人脸表情分类算法设计
文章目录前言一、KDEF数据集介绍二、数据集处理1.数据集划分2.
数据清洗
3.训练集和测试集划分三、数据增强四、训练代码五、测试代码六、结果前言表情分类是深度学习中一个重要的应用领域。
新嬉皮士
·
2022-11-19 00:45
人脸算法
python
分类
深度学习
人脸识别
Rust机器学习之Polars
Rust机器学习之Polars本文将带领大家学习Polars的基础用法,通过数据加载→\rarr→数据探索→\rarr→
数据清洗
→\rarr→数据操作一整个完整数据处理闭环,让大家学会如何用Polars
JarodYv
·
2022-11-19 00:02
Rust
Machine
Learning
rust
python
pandas
polars
django+vue实现机器学习代码生成系统(
数据清洗
、数据探索、机器学习模型构建、模型评估)
文章目录一、背景说明二、系统架构三、系统功能界面3.1数据导入/数据分析报告生成3.2
数据清洗
配置3.3模型构建界面配置3.4机器学习代码生成四、源码获取一、背景说明我们平常在对一些相对简单的数据集进行分类
Demonslzh
·
2022-11-18 07:22
数据挖掘
数据分析
机器学习
django
学习笔记(03):自然语言处理实战——LSTM情感分析-自然语言处理实战—LSTM情感分析-3...
utm_source=blogtoedu深度学习框架1、IMDB影评数据集(英文)文章长度不同,但要求矩阵大小要相同,所以要取统一维度文章预处理,
数据清洗
——难点算法+数据,决定系统效果保存中间结果2、
xubing_hit
·
2022-11-17 17:24
研发管理
自然语言处理
深度学习
人工智能
毕业设计 - 题目:基于深度学习的中文对话问答机器人
文章目录0简介1项目架构2项目的主要过程2.1
数据清洗
、预处理2.2分桶2.3训练3项目的整体结构4重要的API4.1LSTMcells部分:4.2损失函数:4.3搭建seq2seq框架:4.4测试部分
DanCheng-studio
·
2022-11-17 13:05
毕业设计系列
算法
大数据
深度学习
人工智能
python
对话机器人
毕业设计
Python爬虫大作业+数据可视化分析(抓取python职位)
目录一、抓取并解析数据1.导入相关库2、获取网页信息3.
数据清洗
4.爬取结果:二、保存数据1.保存到excel中2.保存到数据库中3.调用三、使用flask,实现可视化1.主函数2.可视化界面:2.1职位信息展示
Hertz_2
·
2022-11-17 09:30
python
flask
爬虫
Python实现对网易云音乐的数据进行一个
数据清洗
和可视化分析
Python实现对网易云音乐的数据进行一个
数据清洗
和可视化分析对音乐数据进行
数据清洗
与可视化分析关于数据的清洗,实际上在上一一篇文章关于抓取数据的过程中已经做了一部分,后面我又做了一下用户数据的抓取歌曲评论
Deng872347348
·
2022-11-17 09:00
数据可视化
python
数据预处理与特征工程
数据预处理与特征工程一、数据预处理在利用机器学习处理问题的过程中,通常会对原始数据进行
数据清洗
操作来提高数据质量。这一过程被称为数据预处理。
abtgu
·
2022-11-16 13:23
机器学习
人工智能
大数据技能大赛题目(高职组,模块C和D)
模块C:
数据清洗
与挖掘分析(25分)项目背景说明餐饮外卖平台的核心价值体现在配送,而配送的价值则依赖于商家与客户的双向选择。外卖平台通常会通过内容激活消费者和商家两个群体的活跃度。
-starshine丨
·
2022-11-16 07:26
大数据技能大赛题目
big
data
人工智能
大数据
数据清洗
正则表达式学习 (工具:python re模块)
偶尔会用到正则,用到的时候去查效率又太低,这里更新以后遇到的常用的处理方法。⭐详细正则表达式学习链接:菜鸟教程-正则表达式导航:ID算法NO.1常用元字符含义[]、()、\s等NO.2re.escape()NO.3re.compile()NO.4re.findall()NO.5re.match()NO.6(?:pattern)、(?=pattern)、(?!pattern)、(?<=pattern
#苦行僧
·
2022-11-16 00:33
算法岗面试
正则表达式
python
学习
上一页
38
39
40
41
42
43
44
45
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他