E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
pythonexcel数据清洗
超硬核--Pandas
数据清洗
常用4板斧
这是Python数据分析把实际
数据清洗
场景下常用但零散的方法,按增、删、查、分四板斧的逻辑进行归类,以减少记忆成本,提升学习和使用效率。首先,导入案例数据集。
普通网友
·
2022-09-15 14:51
[2022-09-12]神经网络与深度学习第1章-regression
写在开头前期准备线性回归数据集构建模型构建损失函数模型优化经验风险最小化优化函数模型训练模型评估样本数量&正则化系数多项式回归数据集构建模型构建模型训练模型评估使用均方误差评估多项式回归(以sin函数为例)自定义Runner类基于线性回归的波士顿房价预测数据处理准备工作
数据清洗
数据集划分模型构建完善
三工修
·
2022-09-14 07:22
[DL]神经网络与深度学习
机器学习之特征工程(特征选择)
接上篇:机器学习之特征工程(
数据清洗
)文章目录1、Filter(过滤法)1.1、方差选择法1.2、相关系数法1.3、卡方检验1.4、互信息法2、Wrapper(包装法)2.1、递归特征消除法3、Embedded
小磊要努力哟
·
2022-09-11 07:39
机器学习
机器学习
数据挖掘
python
回归
sklearn
pandas官方中文手册pdf下载
Pandas是一个强大的分析结构化数据的工具集,用于数据挖掘和数据分析,同时也提供
数据清洗
功能。学习Pandas最好的方法就是看官方文档。
小bird
·
2022-09-08 10:50
python
数据分析 pandas库常用操作 (上)
目录1、读取文件2、Series3、DataFrame4、pandas查询数据5、新增数据6、统计数据7、
数据清洗
使用pandas库首先导入:importpandasaspd1、读取文件defpandas_handle_csv
Dragon Wu
·
2022-09-08 10:48
数据挖掘
python
数据分析
数据挖掘
python
【毕业设计】基于大数据的航空公司客户价值分析系统 - python
文章目录0前言1数据分析背景2分析策略2.1航空公司客户价值分析的LRFMC模型2.2数据2.3分析模型3开始分析3.1数据预处理3.1.1数据预览3.1.2
数据清洗
3.2变量构建3.3建模分析4数据分析结论
Mr_DC_IT
·
2022-09-07 10:02
大数据
毕业设计
python
大数据
数据挖掘
数据分析
大数据开发必须掌握的五大核心技术
首先给出一个通用化的大数据处理框架,主要分为下面几个方面:数据采集与预处理、数据存储、
数据清洗
、数据查询分析和数据可视化。
xyzkenan
·
2022-09-07 10:39
大数据核心技术
大数据开发
大数据
机器学习中的
数据清洗
与特征处理综述
【学习】机器学习中的
数据清洗
与特征处理综述写文章【学习】机器学习中的
数据清洗
与特征处理综述小莹莹发表于PPV课数据科学社区订阅306背景随着美团交易规模的逐步增大,积累下来的业务数据和交易数据越来越多,
stay_foolish12
·
2022-09-07 08:34
机器学习
特征
特征分解
特征提取
【C++项目】boost搜索引擎
1.1boost基本介绍1.2为什么要自主实现boost搜索引擎二、搜索引擎的相关宏观原理和项目演示2.1项目演示:三、搜索引擎技术栈和项目环境四、正排索引vs倒排索引-搜索引擎具体原理五、编写数据去标签与
数据清洗
的模块
小唐学渣
·
2022-09-05 19:48
项目
搜索引擎
c++
开发语言
人工智能科学计算库—Pandas教程
文章目录1.0Pandas简介2.0Pandas安装2.0数据结构-Series3.0数据结构-DataFrame4.0PandasCSV5.0PandasJSON6.0Pandas
数据清洗
Pandas
Fang GL
·
2022-09-05 07:16
#
AI—科学计算库
pandas
人工智能
python
Python数据分析与挖掘进阶篇3——数据的预处理(清洗、集成、变换)附实例!
阅读提示本文主要介绍数据分析与挖掘中的数据预处理知识点:包括各类数据缺失值填充、数据类型转换、函数值转换、贝叶斯插值法等目录阅读提示四、数据的预处理1、
数据清洗
2、数据集成3、数据变换四、数据的预处理在数据挖掘中
高羊羊羊羊羊杨
·
2022-09-02 10:41
Python
数据分析
数据挖掘
神经网络学习流程
步骤:1、数据获取图片、声音、股票等数据2、
数据清洗
归一化:数据转化成[-1,1]多维数据矩阵,需要对应的是tensor(张量)才可以使用神经网络;确定输入:输入数据及其维度输出:确定输出维度,监督学习需要给出结果
Hiking_Yu
·
2022-08-31 07:43
深度学习
神经网络
人工智能
机器学习
深度学习
强化学习
关于ETL的两种架构(ETL架构和ELT架构)
ETL是构建数据仓库的重要一环,用户从数据源抽取出所需的数据,经过
数据清洗
,最终按照预先定义好的数据仓库模型,将数据加载到数据仓库中去。ETL在转化的过程中,主要体现在以
微服务 spring cloud
·
2022-08-30 16:39
etl
数据仓库
数据库
Python项目实战 —— 04. 淘宝用户行为分析
Python项目实战Python项目实战——04.淘宝用户行为分析一、背景二、解题思路三、数据分析3.1
数据清洗
3.2数据分析3.2.1用户整体行为分析3.2.2用户每日行为分析3.2.3用户每时行为分析
share16
·
2022-08-30 07:26
项目实战
python
数据分析流程——业务需求分析
甚至引导行业决策和产业变革落地方案通过数据算法分析出来的结果,引导事件达成和方案落地,输出的结果作为决策的重要依据分析结果汇报输出报表,输出算法结果,能够提供决策数据分析、建模初步数据分析搭建模型业务理解,数据抽取,
数据清洗
迭代中
·
2022-08-30 02:32
大数据
Python爬虫(1)基础概念
文章目录Python爬虫前言一、爬虫语言的选择二、需要用的库1.爬取要用的库2.
数据清洗
用
快乐很重要的汪
·
2022-08-28 07:14
python
python
爬虫
开发语言
如何在5分钟内发现 SQL 语言中的数据血缘
数据仓库和数据湖中处理数据用的最多的工具就是SQL语言,无论是数据加载、数据转换、还是
数据清洗
,都会用到SQL查询语言,更不用说数据查询和分析了。
.Zeoy
·
2022-08-26 10:58
SQLFlow
sql
数据库
数据仓库
python
数据清洗
---实战案例(清洗csv文件)
我也是最近才开始这方面的学习,这篇就当作学习的笔记,记录一下学习的过程目录所以我们现在要解决的问题就是删除列名中的空格接下来要解决的问题就是处理文件中的重复数据接下来要处理的问题就是补全数据中的缺失值全部代码所要处理的数据数据中主要存在的问题包括:1.列名中存在空格2.存在重复数据3.存在缺失数据导入pandas模块,打开数据文件importpandasaspddf=pd.read_csv("Re
SmallSweets
·
2022-08-26 07:58
Python
数据清洗
python
数据清洗
pandas
数据清洗
——删除
文章目录准备工作(导入库、导入数据)检测数据情况DataFrame.drop(labels=None,axis=0,index=None,columns=None,inplace=False)方式一:删除指定行或列方式二:利用boolean删除满足条件元素所在的行准备工作(导入库、导入数据)importpandasaspdimportmatplotlib.pyplotaspltimportnump
ACxz
·
2022-08-25 15:45
python
数据分析小计
pandas
numpy
matplotlib
pandas
数学建模
数据分析
python
经验分享
get数据技能
今天小编就盘点了一下有关数据的图书,有一本免费码农杂志,三本R,三本数据科学,还有数据采集、
数据清洗
、数据挖掘、python数据分析、spark数据分析……,最后还有一本非技术数据分析的书。
turingbooks
·
2022-08-25 14:24
图灵书讯
数据
【01】Hadoop开篇
1_课程整体介绍2_大数据的概念03_尚硅谷_Hadoop_概论_大数据的特点从海量数据中抓取我关心的数据—
数据清洗
和提纯04_尚硅谷_Hadoop_概论_大数据的应用场景05_尚硅谷_Hadoop_概论
饮马翰海
·
2022-08-24 18:37
尚硅谷大数据Hadoop教程
hadoop
大数据
hdfs
2020讯飞AI开发者大赛-温度预测赛道baseline改进
2020讯飞AI开发者大赛-温度预测赛道baseline改进分享写在前面
数据清洗
缺失值处理异常值处理特征工程模型训练写在最后写在前面这是我参加的第二次数据竞赛,上次是上个月的“传染病趋势预测”,西交是主办方的那个
他说民谣很穷
·
2022-08-24 15:18
机器学习
数据挖掘
Python数据分析案例07——二手车估价(机器学习全流程,
数据清洗
、特征工程、模型选择、交叉验证、网格搜参、预测储存)
案例背景本次案例来自2021年matchcop大数据竞赛A题数据集。要预测二手车的价格。训练集3万条数据,测试集5千条。官方给了二手车的很多特征,有的是已知的,有的是匿名的。要求就是做模型去预测测试集的二手车的价格。价格是一个连续变量,所以这是一个回归问题。(需要数据集可以留言)特征和数据集如下:特征名称和含义数据集:说实话有点复杂,给的是txt文件,而且各种花样缺失数据.....要是新手估计读取
阡之尘埃
·
2022-08-23 08:37
实用的Python机器学习
数据分析
数据挖掘
python
机器学习
pandas
前程无忧岗位数据爬取+Tableau可视化分析
目录一、项目背景二、数据爬取1、相关库的导入与说明2、获取二级页面链接1)分析一级页面url特征2)构建一级url库3)爬取所有二级url链接3、获取岗位信息并保存三、
数据清洗
1、数据读取、去重、空值处理
Nick-洪仔
·
2022-08-23 07:05
python
爬虫
可视化
数据分析
大数据计算服务MaxCompute
数据采集(ETL)获取数据
数据清洗
数据转换数据分析计算根据需求获取想要的数据分析的结果需要存储起来MySQLredisES数据展示其他的业务系统需要使用分析计算好的数据从存储系统中查询数据大屏显示01MaxCompute
撸码的xiao摩羯
·
2022-08-23 07:29
笔记
big
data
大数据
XCel 项目总结 - Electron 与 Vue 的性能优化
XCEL是由凹凸实验室推出的一个Excel
数据清洗
工具,其通过可视化的方式让用户轻松地对Excel数据进行筛选。
a949199259
·
2022-08-22 12:46
json
操作系统
javascript
ViewUI
学神经网络需要什么基础,深度神经网络怎么用
想做好深度学习开发,在编程方面除了掌握python自身语法外,还应该着重掌握下面这些库:pandas:超级excel,表格式操作数据,
数据清洗
和预处理的强大工具。num
塑胶技术
·
2022-08-22 11:40
神经网络
dnn
python
算法
数字货币回测准备:下载与清洗全量历史数据
期货量化投资Python数字货币量化投资C++语言CTP期货交易系统开发数字货币JavaScript语言量化交易系统开发数据:回测到实盘的第一步我们实现一个完整的量化投资策略,一般要经历历史数据准备、
数据清洗
数量技术宅
·
2022-08-20 20:40
python实现kmeans图像分割_Python实现K-means聚类算法
一机器学习项目的主要流程机器学习项目的主要流程有五步:1.数据提取2.
数据清洗
3.特征工程4.训练模型5.验证模型并优化之前讲到的PYTHON爬虫可以算是第一步数据提取里面的内容,数据提取的作用就是想方设法获取源数据
weixin_39589644
·
2022-08-20 07:44
python模块之pandas前置知识与
数据清洗
、合并、集成、选取
一、前置知识1、区别偏差、方差、标准差样本中各数据比平均值大多少或小多少,这个数值在统计学中称为“偏差”(deviation)。将差值进行平方再取平均,得出的统计量成为“方差”(variance)。这个值可以评价数据的波动。方差开方后的数值称为“标准差”(standarddeviation),标准差也即偏差的均方根值2、np.random.randn()、np.random.rand()和np.r
尚墨1111
·
2022-08-20 07:06
深度学习Tersorflow
python 文件读写和
数据清洗
目录一、文件操作1.1csv文件读写1.2excel文件读写二、
数据清洗
2.1删除空值2.2删除不需要的列2.3删除不需要的行2.4重置索引2.5统计缺失2.6排序一、文件操作pandas内置了10多种数据源读取函数
·
2022-08-19 18:14
MDM主数据平台使用总结
MDM基础数据管理平台是进行清洗和治理企业的主数据,使企业的主数据具有唯一性、准确性、一致性、及时性,通过主数据
数据清洗
功能将错误数据和重复数据
数通畅联
·
2022-08-18 15:27
产品文档
MDM主数据平台
数据分析
数据清洗
如何进行MDM的产品测试
从系统应用度而言,主数据管理是把企业的多个业务系统中最核心的、最需要共享的数据(主数据)进行整合,集中进行
数据清洗
和标准化,并且以集成服务的方式把统一的、完整的、准确的、具有权威性的主数据,分发给需要使用这些数据的应用系统
数通畅联
·
2022-08-18 15:51
产品文档
数据清洗
数据分析
产品测试
电商销售数据分析(Python)
目录1.背景2.分析目标3.数据准备4.
数据清洗
4.1查看是否含有缺失值4.2查看是否有异常值4.3数据整理5.具体目标分析5.1分析每年销售额的增长率5.2各个地区分店的销售额5.3销售淡旺季分析5.4
QYiRen
·
2022-08-18 07:58
数据分析与挖掘
学习
python
数据分析
基于boost库的搜索引擎
文章目录一.项目介绍二.搜索引擎相关的宏观原理三.搜索引擎技术栈和项目环境四.正排索引vs倒排索引-搜索引擎的具体原理五.编写数据去标签与
数据清洗
的模块Parser1.下载数据源2.建立项目结构3.编写
c铁柱同学
·
2022-08-17 10:58
服务器
c++
搜索引擎
实战项目:Boost搜索引擎
目录1.项目的相关背景与目标2.相关宏观原理3.技术栈和项目环境4.正排索引、倒排索引5.数据去标签与
数据清洗
Parser5.1下载文件&&准备工作5.2编写parser解析文档5.2.1整体架构5.2.2EnumFile5.2.3ParseHtml5.2.3.1
sakeww
·
2022-08-17 10:27
项目实战
搜索引擎
服务器
运维
【项目】 基于BOOST的站内搜索引擎
目录1.简介建立搜索引擎的宏观体系技术栈和项目环境正排索引and倒排索引2.数据去标签与
数据清洗
模块——Parser数据去标签parser.ccparser.cc的代码结构EnumFile()函数——枚举筛选
大桑树保安队
·
2022-08-17 10:56
项目
搜索引擎
【项目实现】Boost搜索引擎
文章目录前言一.项目的相关背景二.搜索引擎的相关宏观原理三.搜索引擎技术栈和项目环境四.搜索引擎具体原理4.1正排索引4.2倒排索引五.编写数据去标签与
数据清洗
的模块Parser5.1数据导入5.2数据清理
同途异梦
·
2022-08-17 10:55
搜索引擎
c++
前端框架
json
【C++项目】boost搜索引擎项目
文章目录项目的gitee地址项目基本演示讲解思路一:项目相关背景二:搜索引擎的相关宏观原理三:搜索引擎技术栈和项目环境四:正排索引vs倒排索引-搜索引擎具体原理五:编写数据去标签与
数据清洗
的模块Parser5.1parser
呋喃吖
·
2022-08-17 10:52
项目
搜索引擎
服务器
网络
boost
Python数据预处理,
数据清洗
的全过程复习
Python数据预处理步骤:数据导入数据查看
数据清洗
数据提取&筛选数据排序数据汇总&统计数据标准化导入相关包数据存储
数据清洗
的详细全过程(带案例思路写)1、导入相关包ImportpandasaspdImportnumpyasnp
进阶的怪兽
·
2022-08-16 17:59
数据分析
数据清洗
python
python
数据分析
数据库
Python数据探索性分析和预处理
数据质量分析1.缺失值查看缺失情况缺失值处理2.异常值异常值检测(查看)异常值处理2.数据特征分析1.分布定量数据定性数据2.对比3.统计量分析4.相关性定量数据相关性定性数据相关性二.预处理1.数据取样2.
数据清洗
小陈步吃人
·
2022-08-16 17:27
数据分析学习笔记
python
数据挖掘
数据分析
天池NL2SQL Top15方案
目录代码地址Part0:参赛成绩Part1:代码环境环境配置步骤如下:Part2:预处理一.数值类型转化二.训练集
数据清洗
与分类Part3:模型介绍目录代码地址Part0:参赛成绩Part1:代码环境环境配置步骤如下
yscoder
·
2022-08-16 07:55
NLP
【实战】——基于机器学习回归模型对广州二手房价格进行分析及模型评估
目录1、数据导入2、
数据清洗
2.1、变量选取2.2、空值处理2.3、类型转化2.4、数据再处理3、机器学习sklearn的实现3.1、训练集和测试集的拆分3.2、数据的标准化3.3、线性回归模型3.4、
貮叁
·
2022-08-16 07:24
金融数据分析
python
python
数据分析
金融
机器学习
文本聚类(一)—— LDA 主题模型
目录文本聚类一、LDA主题模型1.1加载数据集1.2
数据清洗
、分词1.3构建词典、语料向量化表示1.4构建LDA模型1.5模型的保存、加载以及预测1.6小结Updatelog2021.07.08:主要上传停用词表
dfsj66011
·
2022-08-14 20:22
NLP
机器学习
自然语言处理
python
【计算机设计大赛近年获奖信息】数据分析及可视化
【计算机设计大赛近年获奖信息】数据分析及可视化写在前面数据读取及描述数据预处理各年数据集格式化数据合并
数据清洗
数据分析及可视化各年奖项数量分布各年得奖最多的学校Top10各学校参加次数统计各年参赛学校层次划分参赛人数与奖项分布获奖作品名称热词总结写在前面本文通过最近三年
Dream丶Killer
·
2022-08-14 09:08
Python数据分析
python
可视化
数据分析
【毕业设计】Python B站数据分析 用户情感分析 - 大数据项目
文章目录前言0数据分析目标1B站整体视频数据分析1.1数据预处理1.2数据可视化1.3分析结果2单一视频分析2.1数据预处理2.2
数据清洗
2.3数据可视化3文本挖掘(NLP)3.1情感分析前言Hi,大家好
Mr_DC_IT
·
2022-08-14 07:46
毕业设计
大数据
大数据
python
数据分析
实现MySQL同步数据到ES构建宽表
开发流程详见官方文档《CloudCanal自定义代码实时加工》能力特点包括:灵活,支持反查打宽表,特定逻辑
数据清洗
,对账,告警等场景调试方便,通过任务参数配置自动打开debug端口,对接IDE调试S
ClouGence
·
2022-08-13 18:14
CloudCanal
数据迁移
数据同步
canal
【一点分享】Python数据分析(6):Pandas的字段操作,lambda函数原来是这样用。
Pandas还有个最常用的操作字段,这样才能把
数据清洗
干净,为统计分析顺滑使用提供基础。本文分3个部分介绍:修改或新增字段、字段类型转换、总结。
或许能用上
·
2022-08-13 07:53
Python
python
pandas
数据分析
数据分析:实战模拟
数据分析的综合应用
数据清洗
数据整理数据分析(可视化)在之前的讲述之中,我们已经介绍了数据分析的各种基本技能,这节就来把这些技能综合起来使用,进行一套完整的数据分析。首先下载我们的学习资源。
有理想的打工人
·
2022-08-12 13:26
Python
数据分析
数据分析
数据挖掘
python
2021年最有用的
数据清洗
Python 库
对于许多数据工作者来说,数据的清理和准备也往往是他们工作中最不喜欢的部分,因此他们将另外20-30%的时间花在抱怨上,这虽然是一个玩笑,但是却很好的反应了
数据清洗
在数据分析工作当中的特殊地位在平时的工作生活中
·
2022-08-11 21:26
程序员
上一页
41
42
43
44
45
46
47
48
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他