E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
python后端数据清洗
Excel数据分析项目——电商数据分析实战
Excel数据分析项目——电商数据分析实战一、明确目的——以业务为核心目的二、理解数据①商品购买记录数据购买用户信息表三、提出问题四、
数据清洗
①选择子集②列名重命名③数据类型转换④数据去重⑤缺失值处理⑥
深瀬桃
·
2022-10-30 07:24
Excel数据分析项目
excel
数据挖掘常用算法总结
知识发现的过程包含了
数据清洗
,数据集成,数据选择,数据转换,数据挖掘,模式评估和知识表现。数据挖掘功能:特征,区别,关联,分类,聚类,孤立点和趋势分析等.(3)数据挖掘系
小北呱
·
2022-10-29 07:39
数据挖掘算法
数据挖掘
数据分析
太香了,这 10 个 Pandas 函数让你的代码能力起飞
今天我们将学习Pandas,一个非常强大的数据分析、
数据清洗
和读取的工具,也是在Kaggle竞赛中必备的库。在这篇文章中,我将通过最常见的一些Pandas函数,希望入门的同学在学习完成后可以掌握。
Python数据挖掘
·
2022-10-29 07:01
python
python
数据分析
数据挖掘
数据清洗
:异常值识别和处理方法
异常数据识别异常数据是数据分布的常态,处于特定分布区域之外的数据通常会被定义为异常或“噪音”。产生数据“噪音”的原因很多,例如业务运营操作、数据采集问题、数据同步问题等。对异常数据进行处理前,需要先辨别出哪些是真正的数据异常。从数据异常的状态看分为两种:一种是“伪异常”,这些异常是由于特定的运营动作产生,其实正常反映了业务状态。一种是“真异常”,这些异常并不是由于特定的业务动作引起,而是客观反映了
大哇唧
·
2022-10-28 21:36
pandas
数据分析
python信用卡欺诈检(
数据清洗
,数据分析,数学建模, 模型预测和比较)
导入工具包#Numpy,Pandasimportnumpyasnpimportpandasaspdimportdatetimeasdatetime#matplotlibimportmatplotlib.pyplotaspltimportmatplotlib.gridspecasgridspecimportseabornassnsimportmissingnoasmsno%matplotlibinl
涛涛涛不淘
·
2022-10-28 21:01
python
数据分析
开发语言
2021年MathorCup高校数学建模挑战赛——大数据竞赛赛道A -思路分享
好了胡扯到此结束,言归正传,这次比赛题目和数据下载链接:https://pan.baidu.com/s/1RsQkTcERxgmHisMEGt62vA提取码:60t9初赛1读入数据和
数据清洗
导入需要的包
开始King
·
2022-10-28 07:49
机器学习
回归
数据分析
机器学习
python语音识别预处理_自然语言处理之数据预处理
摘要:数据预处理的整个步骤流程在自然语言处理的工程中要比其在机器学习的工程中精简一些,最大的区别就在
数据清洗
和特征构造这两个至关重要的过程。
weixin_39890289
·
2022-10-28 05:02
python语音识别预处理
python 爬虫爬取疫情数据,爬虫思路和技术你全都有哈(一)
python爬虫爬取疫情数据,爬虫思路和技术你全都有哈(二、
数据清洗
及存储)爬起疫情数据,有两个网址:1、百度:链接2、丁香园疫情:链接在这两个中,丁香园的爬虫相对简单一点,所以今天就展示一哈,百度的,
源源佩奇
·
2022-10-26 12:52
python爬虫
基础
python
爬虫
【Python】DataFrame学习02_聚合与分组、透视表、大数据预处理技术
本人依据上课学习内容,将dataframe内容浓缩为代码块,一下是今天学习的第二部分:1.dataframe聚合函数与分组2.dataframe透视表数据预处理技术:3.数据集成(合并)4.
数据清洗
5.
Amakusa_
·
2022-10-25 11:16
数据可视化
python
big
data
数据挖掘
Python3 - 三天学会微信小程序(
Python后端
研习)
文章目录一、day01微信小程序1.问题2.环境的搭建2.1Python环境2.2小程序环境2.2.1申请一个微信公众平台2.2.2保存自己的appid2.2.3下载开发者工具2.2.4创建项目3.开发小程序3.1全局配置3.2组件3.2.1text3.2.2view3.2.3image3.3样式3.3.14.flex布局5.实战二、day02微信小程序内容回顾今日概要今日内容1.跳转1.1标签绑
韩俊强
·
2022-10-25 11:05
从零开始学习Python
微信小程序
1024程序员节
python
微信小程序
pycharm
linux
文本挖掘和可视化案例:基于文本内容的垃圾短信分类
基于文本内容的垃圾短信分类一、总体流程1.数据展示2.数据抽取二、数据预处理1.
数据清洗
去除空格x序列x序列文本去重2.分词中文分词添词典去停用词3.去停用词4.绘制词云三、文本向量的表示1.One-Hot
zczczcc
·
2022-10-25 07:13
自然语言处理
自然语言处理
数据挖掘
nlp
【Python数据分析】数据预处理1——
数据清洗
在数据挖掘过程中,数据预处理过程是占比很大的一部分工作数据预处理过程主要有以下几个部分1、
数据清洗
——2.数据集成——3.数据变换——4.数据规约本文介绍
数据清洗
部分一、缺失值分析与处理1.缺失值分析缺失值的影响
阿丢是丢心心
·
2022-10-24 07:46
python
数据分析
数据挖掘
基于python的微博舆情分析与研究—以《北京冬奥会》为关键词
在PyCharm、JupiterNotebook开发环境下,首先利使用python的requests库对微博进行分时段多进程爬取,并利用lxml解析库对爬取到的数据解析并做简单的
数据清洗
且保存到数据库;
Leadingme
·
2022-10-24 07:51
课程设计
python
数据挖掘
数据分析
文本情感分析
#第23篇分享:一个北京二手房价格数据挖掘实例(python语言:sklearn随机森林)
#本次是做一个北京二手房的数据挖掘案例,主要是汇总一下学过的知识,并且通过实例加深一下印象,话不多说,开干:目的:预测二手房的价格;工具:语言python;爬虫模块scrapy,
数据清洗
:xpath;数据分析
天甜费,
·
2022-10-21 07:34
python
pandas
Skicit-learn
数据分析
机器学习
其他
【机器学习】最经典案例:房价预测(完整流程:数据分析及处理、模型选择及微调)
环境:anaconda+jupyternotebook文章目录数据处理前导:(一)、数据分析1、收集数据2、查看数据结构3、划分数据集4、数据相关性可视化(二)、
数据清洗
1、缺失值2、文本/分类属性3、
Rosyy_
·
2022-10-21 07:33
机器学习
机器学习
数据分析
python
数据分析--数据预处理
数据预处理数据分类定量数据定性数据数据质量
数据清洗
特征工程特征选择特征构建特征提取数据分类定量数据离散变量连续变量定性数据定序变量名义变量集中趋势主要测度是均值,中位数,和众数离散程度考虑变量的离散程度
小鱼干儿♛
·
2022-10-20 22:21
数据分析
数据挖掘
数据挖掘-数据的预处理(三)
目录一、找到数据二、数据探索三、
数据清洗
1、缺失值的处理2、异常值的处理3、数据偏差的处理4、数据标准化5、特征选择6、构建训练集与测试集准备数据:如何处理出完整、干净的数据?
Lingxw_w
·
2022-10-20 22:27
数据挖掘和数据分析
数据挖掘
人工智能
特征
数据清洗
编码 标准化
特征工程是机器学习的第一步,涉及清理现有数据集、提高信噪比和降低维数的所有技术。大多数算法对输入数据有很强的假设,当使用原始数据集时,它们的性能可能会受到负面影响。另外有些特征之间高度相关,在其中一个特征提供了足够的信息之后,与之相关的其他特征往往无法提供额外的信息。这时我们就需要了解如何减少特征数量或者仅选择最佳特征。一、scikit-learn数据集scikit-learn提供了一些用于测试的
SamWang_333
·
2022-10-18 14:32
机器学习
dataprepare
机器学习第三周-归一化和预处理
DataPreprocessing(数据预处理),FeatureExtraction(特征提取),FeatureSelection(特征选择)和FeatureConstruction(特征构造)等子问题,而数据预处理又包含了
数据清洗
和特征预处理的子问题
笨鸟的GPS
·
2022-10-18 14:31
Python 算法实战案例:如何预测客户是否会购买存款产品
文章目录解惑答疑1\.分析框架2\.数据读取,
数据清洗
3\.探索性数据分析3.1查看各年龄段的人数的分布3.2其他特征的一些分布3.3各特征的相关性4\.特征规范化4.1将自变量的特征值转换成标签类型4.2
Python数据挖掘
·
2022-10-15 07:05
python
python
算法
机器学习
python如何从一个dataframe提取相应的行组成一个新的dataframe_Python|专题(1)——数据处理常规操作集(1)...
我们希望通过它们,带领大家了解和熟悉一些python做
数据清洗
,数据整合等的常见操作。请注意我们这是专题文章,也就是说这一系列文章并不假设你对python是零基础的。
weixin_39927378
·
2022-10-14 10:09
大数据采集技术工具及应用场景
大数据采集可以细分为数据抽取、
数据清洗
、数据集成、数据转换等过程,将分散、零乱、不统一的数据整合到一起,以一种结构化、可分析的形态加载到数据仓库中,从而为后续的数据使用奠定坚实基础。
梯度科技
·
2022-10-13 15:02
hadoop
大数据
分布式
flume
数据库
基于python数据可视化论文-基于Python的数据脱敏与可视化分析
首先利用tkinter库设计出数据导入的界面;其次阐述
数据清洗
、分组、集成以及脱敏等数据预处理的常用算法,并结合高校教学评价这一实际案例进行了演示,借助pandas库中的dataframe数据类型实现了对
weixin_39645249
·
2022-10-12 17:43
第五章-Python数据处理工具--Pandas
常用的数据清理方法:数据处理的过程中,一般都要进行
数据清洗
,如数据集是否存在重复、是否存在缺失、数据是否具有完整性和一致性、数据中是否存在异常值等。当存在上述的问题时,就要进行有针对性地处理。
小飞猪Jay
·
2022-10-12 17:42
零碎知识点
python
pandas
数据挖掘
Python
数据清洗
& 预处理入门完整指南
数据清洗
和预处理是模型训练之前的必要过程,否则模型可能就废了。本文是一个初学者指南,将带你领略如何在任意的数据集上,针对任意一个机器学习模型,完成数据预处理工作。
我爱Python数据挖掘
·
2022-10-12 07:29
python
机器学习
pandas
《利用Python进行数据分析·第2版》第13章 Python建模库介绍
章准备工作第2章Python语法基础,IPython和Jupyter第3章Python的数据结构、函数和文件第4章NumPy基础:数组和矢量计算第5章pandas入门第6章数据加载、存储与文件格式第7章
数据清洗
和准备第
weixin_33923762
·
2022-10-12 07:58
python
人工智能
开发工具
大数据可视化技术
数据可视化的标准实用性完整性真实性艺术性交互性数据可视化流程数据采集数据预处理:数据质量、
数据清洗
、数据集成数据可视化映射用户感知数据可视化的作用数据表达:是通过计算机图形技术来更加友好地显示数据信息,
@从心
·
2022-10-12 07:27
大数据可视化
可视化
毕业设计 基于大数据的共享单车数据分析与可视化
文章目录0前言1课题背景2
数据清洗
3数据可视化热力图整体特征分布**查看2011-2012间的单车租借情况**天气对于租借数量的影响湿度与温度对于租借数量的影响注册用户与未注册用户4总结:5最后0前言这两年开始毕业设计和毕业答辩的要求和难度不断提升
DanCheng-studio
·
2022-10-12 07:56
计算机专业
毕设选题
毕业设计系列
数据分析
大数据
数据挖掘
66个最常用的pandas数据分析函数
说起pandas这个是python
数据清洗
的利器,它可以让你像sql一样操作数据,同时可以对数据进行各种计算,转换完成后还可以方便的存储到excel,转化为array、Matrix供进一步(模型)使用。
菜鸟学Python数据分析
·
2022-10-11 19:21
列表
python
数据分析
大数据
数据库
pandas
数据清洗
的7种方式
1.处理数据中的空值我们在处理真实的数据时,往往会有很多缺少的的特征数据,就是所谓的空值,必须要进行处理才能进行下一步分析空值的处理方式有很多种,一般是删除或者填充Excel通过“查找和替换”功能实现空值的统一替换:通过“定位”删除空值:pandas处理空值的方式比较灵活,可以使用dropna函数删除空值import pandas as pddata=pd.read_csv('成绩表.csv',e
菜鸟学Python数据分析
·
2022-10-11 19:21
数据分析
数据可视化
js
分布式存储
python
基于pandas的
数据清洗
假设我们有一份不完整的DataFrame类型的数据,我们在使用它之前要对其进行数据的清洗。使用pandas我们可以有两种方式来实现对数据的清洗先假设我们存在下面一组不完整的数据:importnumpyasnpimportpandasaspdfrompandasimportDataFrame,Seriesdf=DataFrame(data=np.random.randint(0,100,(12,10
Windy.Zhhh
·
2022-10-11 19:19
Python
pandas
数据分析
pandas
数据清洗
pandas
数据清洗
1、使用pandas进行
数据清洗
1.1、数据问题1.2、读取数据1.3、切分列1.4、删除列1.5、使用布尔索引筛选1.6、应用函数1.7、删除空行1.8、去重1、使用pandas进行
数据清洗
清梦清河
·
2022-10-11 19:16
python
数据挖掘
数据分析
python
Pandas系列(三):
数据清洗
Pandas系列目录文章目录一、简介二、思维导图三、Pandas
数据清洗
1.空值、缺失值处理1.1空值、缺失值判断1.2空值处理2.异常数据替换2.1条件替换2.2replace函数替换3.重复值处理4
hustlei
·
2022-10-11 19:46
Python科学计算和数据分析
python
数据挖掘
数据分析
数据清洗
pandas
利用pandas进行
数据清洗
Pandas进行
数据清洗
1、完整性1.1缺失值1.2空行2、全面性列数据的单位不统一3、合理性非ASCII字符4、唯一性4.1一列有多个参数4.2重复数据我们有下面的一个数据,利用其做简单的数据分析。
sharon@zhang
·
2022-10-11 19:16
pandas
数据清洗
python
pandas
数据分析
python数据分析之pandas
数据清洗
(数据查看、空值的处理)
文章目录一、准备工作(导入数据)二、数据查看1、查看数据表的基本信息2、空值的与缺失值概念(NAN、NAT)3、查看所有值是否为空值4、判断是否存在空值5、唯一值查看三、
数据清洗
1、空值的处理2、格式转换
Chung丶无际鹰
·
2022-10-11 19:15
数据分析之路
python
数据分析
数据挖掘
【Pandas数据分析5】
数据清洗
文章目录五、
数据清洗
1、查看缺失值2、判断数据是否存在缺失值3、缺失值的处理方式4、重复值处理5、异常值的检测与处理五、
数据清洗
源数据:importpandasaspdpd.set_option('display.unicode.east_asian_width
LeoATLiang
·
2022-10-11 19:42
Pandas数据分析
pandas
数据分析
python
数据挖掘
大数据
数据挖掘——数据预处理
《数据挖掘》国防科技大学《数据挖掘》青岛大学《数据挖掘与python实践》数据挖掘之数据预处理1.
数据清洗
DataCleaning
数据清洗
:缺失值、噪声数据、离群点、不一致数据(1)对于丢失数据:忽略元组
木夕敢敢
·
2022-10-10 07:08
数据挖掘
数据挖掘
大数据数仓项目实战
1、项目需求分析数据采集平台搭建;实现数据仓库分层的搭建;实现
数据清洗
、聚合、计算等操作;统计各指标,如统计通过各地址跳转注册的用户人数、统计各平台的用户人数、统计支付金额topN的
wespten
·
2022-10-09 10:04
Hadoop
Hive
Spark
大数据安全
大数据
论文翻译之——《基于XGBoost的房价预测优化》-陶然
目录摘要1介绍2.相关工作2.1文献综述2.2研究方法3.特征重要性和准确性改进3.1特征工程3.1.1数据描述3.1.2
数据清洗
3.1.3响应变量归一化3.1.4特征相关性3.2随机森林回归3.2.1
白日梦想家_胖七七
·
2022-10-07 13:56
机器学习
深度学习模型预测
机器学习
人工智能
深度学习
创新实训(一)计划
项目)暑假期间思考项目3.1—3.5号写申请书3.9—3.10号答辩准备项目目标构建一个比价与旅游住宿推荐系统,可根据用户点击经验进行深度学习,使得后期查询得到更理想的排序结果;针对各大平台的信息进行
数据清洗
并进一步比较
散月
·
2022-10-06 07:29
创新实训—项目
我操作MySQL的惊险一幕
Python量化交易实战入门级手把手带你打造一个易扩展、更安全、效率更高的量化交易系统背景前几天因工作需要,组长给我安排了一个
数据清洗
的任务。任务:把A表的数据洗到B表。
[虚幻私塾】
·
2022-10-05 20:50
11
mysql
flask
python
计算机
基于python实现TF-IDF算法
特点:简单高效,用于最开始的文本
数据清洗
。TF-IDF(1)TF:词频可以统计到停用词
芊欣欲
·
2022-10-05 07:57
python
算法
自然语言处理
tf-idf
Kaggle——海星目标检测比赛
文章目录一、赛事简介二、数据描述三、数据预处理3.1导入相关库,设置超参数3.2
数据清洗
3.3✏️写入标注图片3.4获取bbox,生成标注文件3.5创建Folds字段,划分训练集和验证集四、数据分析,可视化展示
神洛华
·
2022-10-04 21:45
CV
赛事
目标检测
深度学习
人工智能
Python
数据清洗
与可视化——北京租房数据统计分析05
北京租房数据统计分析5.1数据的爬取代码:#5北京租房数据统计分析#5.1数据的爬取importpandasaspdimportnumpyasnpfile_path=open(r"D:\python课设\数据\数据\5、北京租房数据统计分析\链家北京租房数据.csv")file_data=pd.read_csv(file_path,encoding="utf-8")file_data运行结果:首先
a Fang
·
2022-10-04 15:08
python
python
数据挖掘
数据清洗
数据可视化
热力图
MapReduce----电信
数据清洗
MapReduce---电信
数据清洗
数据解析及题目分析数据解析题目及分析代码实现自定义类Map阶段Reduce阶段Driver阶段数据解析及题目分析数据解析数据一18620192711,15733218050,1506628174,1506628265,650000,81000018641241020,15733218050,1509757276,1509757464,330000,6200001
飝鱻.
·
2022-10-04 08:10
MapReduce
大数据
hadoop
mapreduce
我操作MySQL的惊险一幕
背景前几天因工作需要,组长给我安排了一个
数据清洗
的任务。任务:把A表的数据洗到B表。我的第一反应,什么是「洗」?洗数据是什么?洗钱我倒是知道。不过我不能慌啊,于是问了问组长。
·
2022-10-03 22:36
mysqljava后端
实战2-电商平台零售数据分析
lambdamatplotlib和pyecharts基础绘图及美化pandas模块的数据透视表pivot_table函数、分类groupby函数、分段cut函数文章目录电商平台零售数据分析1.明确目标2.读取和理解数据3.
数据清洗
Yph_Jerry
·
2022-10-03 20:01
数据分析实战
python
数据分析
数据探索(数据集成、数据变换、数据规约)③—Python对数据规范化、数据离散化、属性构造、主成分分析 降维
环境配置配置python基础知识及数据分析工具安装及简单使用(Numpy/Scipy/Matplotlib/Pandas/StatsModels/Scikit-Learn/Keras/Gensim))数据探索(
数据清洗
eeenkidu
·
2022-10-03 15:46
python
数据分析
数据挖掘
python
数据分析
数据预处理(六)——数据变换与离散化
主要内容:数据预处理的必要性
数据清洗
数据集成数据标准化数据规约数据变换与离散化利用sklearn进行数据预处理小结六、数据变换与离散化在数据预处理过程中,不同的数据适合不同的数据挖掘算法。
shi_jiaye
·
2022-10-03 15:16
python机器学习与数据挖掘
python
机器学习
数据仓库系列7-ETL 子系统与技术
ETL的34个子系统三.获取:将数据插入到数据仓库中3.1子系统1:数据分析3.2子系统2:变化数据获取系统3.3子系统3:获取系统3.4清洗与整合数据3.4.1提高数据质量文化与过程3.4.2子系统4:
数据清洗
系统
只是甲
·
2022-10-03 07:54
大数据和数据仓库
#
数据仓库
数据仓库
etl
big
data
ETL
34个子系统
ETL系统
上一页
41
42
43
44
45
46
47
48
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他