E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
pythonexcel数据清洗
数据挖掘(2)数据预处理
数据预处理的常见方法
数据清洗
:去掉数据中的噪声,纠正不一致。数据集成:将多个数据源合成一致的数据存储数据变换(转换):对数据的格式进行转换,如数据的归一化处理。
烟雨平生9527
·
2023-10-03 18:53
数据挖掘
人工智能
python123练习-组合数据类型、文件和数据格式化
《沉默的羔羊》之最多单词6.数字不同数之和7.人名最多数统计8.文件行数9.文件字符分布10.文件独特行数11.CSV格式列变换12.CSV格式
数据清洗
13.文本的平均列数14.CSV格式清洗与转换1.
ccaere
·
2023-10-03 03:36
python
超实用,精心整理了34个Python+Excel+Word+PDF自动化库!
PythonExcel
自动化库1.xlwings库官网:https://www.xlwings.org/特点:xlwings是开源且免费的,预装了Anaconda和WinPython,可在Windows
欣一2002
·
2023-10-02 13:26
python
excel
word
pdf
自动化
涵盖了Excel、Word、PPT、ODF、PDF、邮件、微信、文件处理等所有能在办公场景实现自动化的库
PythonExcel
自动化库//1.xlwings库官网:https://www.xlwings.org/特点:xlwings是开源且免费的,预装了Anaconda和WinPython,可在Windows
K'illCode
·
2023-10-02 13:25
python_模块
python
正则表达式的应用领域及基本语法解析
目录一、正则表达式的应用领域1.文本搜索和替换2.表单验证3.数据提取和分析4.
数据清洗
和处理5.URL路由和路由匹配二、正则表达式的基本语法1.字符匹配2.元字符和字符类3.量词和边界4.分组和捕获5
小五Five
·
2023-10-02 09:49
正则表达式
ElasticSearch工具
ElasticSearch工具1.介绍elasticsearch分布式全文搜索引擎,的主要功能是搜索(全文搜索、结构化搜索、分析)、
数据清洗
,安装工具时最低要求为JDK1.8,可以处理PB级数据;ELK
우리帅杰
·
2023-10-02 04:33
软件测试
elasticsearch
大数据
big
data
大数据毕设 - 大数据二手房数据分析与可视化(python 爬虫)
文章目录1前言1课题背景2实现效果2.1二手房基本信息可视化分析2.2二手房房屋属性可视化分析3数据采集3.1链家网网站结构分析3.2网络爬虫程序关键问题说明4
数据清洗
4.1原始数据主要需要清洗的部分5
caxiou
·
2023-10-01 21:07
毕业设计
大数据
python
大数据
数据分析
二手房数据分析可视化
大数据毕设 - 校园卡数据分析与可视化(python 大数据)
文章目录0前言1课题介绍2数据预处理2.1
数据清洗
2.2数据规约3模型建立和分析3.1不同专业、性别的学生与消费能力的关系3.2消费时间的特征分析4Web系统效果展示5最后0前言Hi,大家好,这里是丹成学长的毕设系列文章
caxiou
·
2023-10-01 21:07
大数据
毕业设计
大数据
python
数据分析
校园卡数据分析可视化
[数据分析实战]对比用Excel和Python用来做数据分析的优缺点,用Python的Pandas操作Excel数据表格原来如此简单?还不赶紧学起来?
Python做数据分析的缺点:1.展示本例子中使用的数据2.开始动手一、导入数据以及理解数据部分1.1查看数据维度(行列)2.2.查看数据格式1.3指定一列查看:1.4查看统计信息1.5查看列名称二、
数据清洗
部分
布丁_码到成功
·
2023-10-01 09:35
数据分析
学习技巧
python学习
excel
数据分析
python
使用Python处理json字符串中的非法双引号
工作中
数据清洗
时遇到以下情况:a='{"地区":"湖南","描述":"精通软件开发、"数据挖掘"和分布式"}'由于读取出的json字符串中包含有非法双引号,在使用json.loads()处理的时候报错json.decoder.JSONDecodeError
Nick_Spider
·
2023-09-30 16:19
python
json
python
loads
双引号
转义
数据预处理与模型评估【机器学习、人工智能、实际事例】
数据预处理是机器学习中不可或缺的步骤,它包括
数据清洗
和特征工程两个主要方面。
数据清洗
数据清洗
涉及识别和处理数据中的错误、异常或
修炼室
·
2023-09-30 15:13
AI
人工智能
机器学习
用户召回建模和模型评测
数据清洗
先导入
数据清洗
需要用到的包,读入数据并且观察一下数据大概情况。数据类型为Int、float等的一些字段为通话时长的特征。
Mddull
·
2023-09-30 08:54
Power BI--
数据清洗
(整理)
目录
数据清洗
整理Step1:数据汇总Step2:筛选Step3:删除列Step4:删除重复项Step5:删除空值
数据清洗
由于导入的数据中存在很多脏数据或异常数据,我们需要通过一定的方法将这些数据处理清理好以便于后期使用数据
爱学习_程序员
·
2023-09-29 11:24
#
PowerBI
数据分析
数据分析
Power BI--
数据清洗
(清洁)
目录PowerBI--
数据清洗
(清洁)Step1:排序Step2:逆透视Step3:条件列Step4:索引列Step5:重复列Step6:数字计算Step7:日期Step8:示例中的列Step9:自定义列
爱学习_程序员
·
2023-09-29 11:24
数据分析
#
PowerBI
数据分析
2023年职业院校技能大赛中职组----大数据应用与服务赛项任务书试题
大数据应用与服务赛项任务书试题模块一:数据库系统运维(25分)任务一:数据库系统搭建(10分)任务二:房源数据库系统运维(15分)模块二:数据采集与处理(30分)任务一:二手房源数据采集(10分)任务二:房源信息
数据清洗
落寞的魚丶
·
2023-09-28 18:34
网络空间安全(职业技能大赛)
全国职业技能大赛
中职组
大数据应用与服务赛项
数据处理
Python
GEO生信数据挖掘(五)提取临床信息构建分组,分组数据可视化(绘制层次聚类图,绘制PCA图)
检索到目标数据集后,开始数据挖掘,本文以阿尔兹海默症数据集GSE1297为例上节做了很多的基因
数据清洗
(离群值处理、低表达基因、归一化、log2处理)操作,本节介绍构建临床分组信息。
人工智能学术前沿(真)
·
2023-09-28 09:36
数据挖掘
人工智能
生信分析
GEO数据挖掘
基因数据分析
python金融数据分析和可视化--03利用Akshare获取股票数据
1.AKShare的介绍AKShare是基于Python的财经数据接口库,目的是实现对股票、期货、期权、基金、外汇、债券、指数、加密货币等金融产品的基本面数据、实时和历史行情数据、衍生数据从数据采集、
数据清洗
到数据落地的一套工具
zhh_920509
·
2023-09-28 00:41
python
数据分析
金融
GEO生信数据挖掘(四)
数据清洗
(离群值处理、低表达基因、归一化、log2处理)
检索到目标数据集后,开始数据挖掘,本文以阿尔兹海默症数据集GSE1297为例目录离群值处理删除低表达基因函数归一化,矫正差异数据标准化—log2处理完整代码上节围绕着探针ID和基因名称做了一些清洗工作,还做了重复值检查,空值删除操作。#查看重复值table(duplicated(matrix$Gene.Symbol))#去掉缺失值matrix_na=na.omit(matrix)#基因名称为空删除
人工智能学术前沿(真)
·
2023-09-27 22:24
GEO数据挖掘
R
基因数据分析
生信分析
Hive电商数仓实战
数据源可通过日志采集、爬虫、数据库中取得,经过
数据清洗
转换导入数据仓库,通过数仓中数据分析得到数据总结,用于企业决策。
GoAI
·
2023-09-27 20:14
数据仓库
大数据
python
hive
电子商务
〔024〕Stable Diffusion 之 模型训练 篇
✨目录训练集准备训练集预处理
数据清洗
下载训练源码训练文件配置脚本运行实战测试训练集准备声明:该文中所涉及到的女神图片均来自于网络,仅用作技术教程演示,图片已码一般同一个训练集需要准备20~40张不同角度的照片
极客飞兔
·
2023-09-27 19:19
《全套
Stable
Diffusion
教程》
stable
diffusion
人工智能
深度学习
ai绘画
文生图
图生图
模型训练
【爬虫+
数据清洗
+可视化】用Python分析“淄博烧烤“的评论数据
一、背景介绍自从2023.3月以来,"淄博烧烤"现象持续占领热搜流量,体现了后疫情时代众多网友对人间烟火气的美好向往,本现象级事件存在一定的数据分析实践意义。我用Python爬取并分析了B站众多网友的评论,并得出一系列分析结论。二、爬虫代码2.1展示爬取结果首先,看下部分爬取数据:爬取字段含:视频链接、评论页码、评论作者、评论时间、IP属地、点赞数、评论内容。2.2爬虫代码讲解导入需要用到的库:i
2201_75761617
·
2023-09-27 15:43
爬虫
python
开发语言
关于ETL的两种架构(ETL架构和ELT架构)
ETL是构建数据仓库的重要一环,用户从数据源抽取出所需的数据,经过
数据清洗
,最终按照预先定义好的数据仓库模型,将数据加载到数据仓库中去。ETL在转化的过程中,主要体现在
2301_78385600
·
2023-09-27 07:31
etl
架构
数据仓库
【大数据毕设】基于Hadoop的音乐推荐系统的设计和实现(六)
文末获取项目联系,有偿部署文章目录基于Hadoop的音乐推荐系统的设计和实现1.1研究的背景及意义1.1.1选题的背景1.1.2国内外研究现状1.1.3研究的意义1.2系统目标2.1功能需求2.1.1
数据清洗
Maynor996
·
2023-09-26 16:52
#
课设&毕设
大数据
课程设计
Python实战实例代码-网络爬虫-数据分析-机器学习-图像处理
Python实战实例代码-网络爬虫-数据分析-机器学习-图像处理Python实战实例代码1.网络爬虫1.1爬取网页数据1.2爬取图片1.3爬取动态数据(使用Selenium)2.数据分析2.1
数据清洗
2.2
华为奋斗者精神
·
2023-09-26 09:38
Python
Linux
ARM
MCU
python
爬虫
数据分析
开发语言
机器学习
图像处理
正则表达式相关知识点
数据清洗
:可以用来清理和转换数据,去除无用字符、提取关键信息
Rsun04551
·
2023-09-26 00:29
JavaSE
正则表达式
大数据-案例-离线数仓-在线教育:MySQL(业务数据)-ETL(Sqoop)->Hive数仓【ODS层-
数据清洗
->DW层(DWD-统计分析->DWS)】-导出(Sqoop)->MySQL->可视化
一、商业BI系统概述商业智能系统,通常简称为商业智能系统,是商业智能软件的简称,是为提高企业经营绩效而采用的一系列方法、技术和软件的总和。通常被理解为将企业中的现有数据转换为知识并帮助企业做出明智的业务决策的工具。BI系统中的数据来自企业的其他业务系统。例如,一个面向业务的企业,其业务智能系统数据包括业务系统订单、库存、交易账户、客户和供应商信息,以及企业所属行业和竞争对手的数据,以及其他外部环境
u013250861
·
2023-09-25 21:37
#
大数据/离线数仓(Hive)
大数据
数据仓库
2——Hive数仓项目完整流程(在线教育)
2.1HUE的使用2.2Sqoop的使用三、全部流程3.1全量数据流程3.1.1需求分析3.1.2分析总结~~3.1.3业务数据准备~~3.1.4建模分析3.1.5建模操作3.1.6数据采集3.1.7
数据清洗
转换
@—笨小孩—@
·
2023-09-25 20:06
python大数据
数仓实战
hive
大数据
数据仓库
利用QueryList采集17173资讯文章
2.QueryList是一款开源的渐进式PHP采集框架,上手容易(从入门到采集到数据用了大约半小时,不含后期
数据清洗
)。
KoPa
·
2023-09-25 16:19
计算机毕设 基于大数据的抖音短视频数据分析与可视化 - python 大数据 可视化
文章目录0前言1课题背景2
数据清洗
3数据可视化地区-用户观看时间分界线每周观看观看路径发布地点视频时长整体点赞、完播4进阶分析相关性分析留存率5深度分析客户价值判断5最后0前言这两年开始毕业设计和毕业答辩的要求和难度不断提升
DanCheng-studio
·
2023-09-25 16:10
毕业设计
python
毕设
Task02:
数据清洗
及特征处理
数据清洗
及特征处理1.导入numpy、pandas包和数据importnumpyasnpimportpandasaspddf=pd.read_csv('train.csv')df.head(3)拿到的数据通常是不干净的
cherry_7
·
2023-09-25 13:46
【实现一套爬虫数据抓取平台】[0-0] 序篇
一、调度平台1.1、整体架构【1-1-01】系统拓扑结构1.2、调度服务1.3、任务执行服务1.4、
数据清洗
服务1.5、监控服务1.6、报警服务二、爬虫相关2.1、爬虫实现2.2、Web站
Bottle
·
2023-09-25 09:41
实现一套爬虫数据抓取平台
爬虫
数据抓取
调度服务
反爬
数据预处理技术(全面概述)
数据预处理技术主要包括四类,即
数据清洗
、数据集成、数据归约和数据变换。具体形式表示如下:
做最好的me !
·
2023-09-25 03:04
人工智能
深度学习
机器学习
数据挖掘
Boost搜索引擎的实现
搜索引擎技术栈和项目环境4.正排索引vs倒排索引-搜索引擎具体原理正排索引:就是从文档ID找到文档内容(文档内的关键字)倒排索引:根据文档内容,分词,整理不重复的各个关键字,对应联系到文档ID的方案5.编写数据去标签与
数据清洗
的模块
汐 风
·
2023-09-25 00:26
项目笔记
搜索引擎
c++
STL
linux
正排/倒排索引
【项目】Boost搜索引擎
项目介绍1.1项目背景1.2模块划分二、搜索引擎原理2.1基本原理2.2正排索引和倒排索引三、环境搭建3.1升级GCC-G++3.2安装JsonCpp库3.3引入httplib库3.4安装Boost库四、
数据清洗
模块
求知.
·
2023-09-25 00:23
项目
搜索引擎
Boost搜索引擎项目
项目的相关背景写在前面Boost库简介期望结果2.搜索引擎的宏观原理3.搜索引擎的技术栈和项目环境4.正排索引和倒排索引--->搜索引擎原理样例正排索引文档分词倒排索引模拟一次查找过程5.数据的去标签与
数据清洗
模块作用获取
m0_62180986
·
2023-09-25 00:53
搜索引擎
问卷制作好了,怎么分析?
一、
数据清洗
与整理在进行数据分析之前,我们需要对收集到的问卷数据进行清洗和整理。这是为了
courage576
·
2023-09-24 20:29
调查问卷工具
问卷
问卷工具
网络问卷
《利用Python进行数据分析·第2版》第2章 Python语法基础,IPython和Jupyter Notebooks
Python语法基础,IPython和JupyterNotebooks第3章Python的数据结构、函数和文件第4章NumPy基础:数组和矢量计算第5章pandas入门第6章数据加载、存储与文件格式第7章
数据清洗
和准备第
Seurat_
·
2023-09-24 15:27
python中的dropna()函数的作用
它用于
数据清洗
和预处理阶段,以便去除缺失值,使数据更加规整。
Wzideng
·
2023-09-24 15:35
各种计算机相关小知识
python学习
python
开发语言
pandas
关于Pandas数据分析
pandas的数据加载与预处理
数据清洗
:洗掉脏数据整理分析:字不如表数据展现:表不如图环境搭建python+jupyteranacondaJupyterNotebookJupyterNotebook可以在网页页面中直接编写代码和运行代码
小袁同学爱学习
·
2023-09-24 07:33
pandas
数据分析
数据挖掘
android
数据库
mysql
servlet
大数据从入门到精通(超详细版)之Hive的案例实战,ETL
数据清洗
!!!
前言嗨,各位小伙伴,恭喜大家学习到这里,不知道关于大数据前面的知识遗忘程度怎么样了,又或者是对大数据后面的知识是否感兴趣,本文是《大数据从入门到精通(超详细版)》的一部分,小伙伴们如果对此感谢兴趣的话,推荐大家按照大数据学习路径开始学习哦。以下就是完整的学习路径哦。前面我们已经学习完了Hive的各自基本操作与基础知识,本文主要介绍Hive的实战篇章,主要关于真实环境下会遇到的各种问题,其中主要是H
木 木 水.
·
2023-09-24 06:23
大数据从入门到精通(超详细版)
大数据
hive
etl
hadoop
linux
数据仓库整理
数据清洗
:对抽取出来的数据进行
haobu枳
·
2023-09-24 04:17
数据仓库
针对舆情分析近五年参考文献的分析报告
1.特征少,价值密度不足(数据来源)爬虫获取评论信息,
数据清洗
,进行主题挖掘,采用的主要主题模型算法有(潜在语义分析模型LSA、概率潜在语义分析模型PLSA、潜在狄利克雷分配模型LDA【三层贝叶斯结构】
~晚风微凉~
·
2023-09-23 21:34
数据分析
bert
cnn
数据挖掘
自然语言处理
基于Python flask 的某招聘网站爬虫,招聘岗位可视化系统
本项目利用Python从某招聘网站抓取海量招聘数据,进行
数据清洗
和格式化后存储到关系型数据库中(如mysql、sqlite等),利用Flask+Bootstrap+Ec
计算机徐师兄
·
2023-09-23 16:15
Python
项目
python
flask
爬虫
招聘岗位可视化
招聘网站爬虫
物流行业数据分析
文章目录物流行业数据分析一、数据预处理1、
数据清洗
①重复值、缺失值、格式调整②异常值处理2、数据规整二、数据分析1、配送服务是否存在问题2、是否存在尚有潜力的销售区域3、商品是否存在质量问题三、总结参考物流行业数据分析
yiluohan0307
·
2023-09-23 13:04
python
数据挖掘
数据分析
jupyter
Python数据处理与数据可视化入门教程 | Numpy | Pandas | Matplotlib | Seaborn
文章内容预览引言数据可视化的重要性和应用场景简介所使用的库NumpyNumpy的基本介绍和安装Numpy数组的创建和操作Numpy的数学运算和统计函数使用Numpy进行数据可视化的示例PandasPandas的基本介绍和安装Pandas的数据结构和操作
数据清洗
和预处理使用
这丸子
·
2023-09-23 10:00
python
信息可视化
pandas
不吹不黑!Python办公自动化,全网最全整理!
今天给大家分享一篇Python自动化办公干货,内容很干,Excel操作大全,可以码住细品~0.
PythonExcel
库对比我们先来看一下python中能操作Excel的库对比(一共九个库):1.Pythonxlrd
菜鸟学Python
·
2023-09-22 18:11
列表
python
webgl
数据分析
脚本语言
Python 自动化办公库清单 (共34个)
PythonExcel
自动化库//1.xlwings库官网:https://www.xlwings.org/特点:xlwings是开源且免费的,预装了Anaconda和WinPython,可在Windows
菜鸟学Python
·
2023-09-22 18:40
python
编程语言
大数据
人工智能
数据分析
量化投资入门指南:数据和研究
目录7.数据7.1数据类型7.2数据来源7.3
数据清洗
7.4数据存储8.研究8.1科学的方法8.2思想的产生8.3检验8.3.1样本内测试8.3.2模型好坏的度量指标8.3.3过拟合8.3.4样本外检验
GottdesKrieges
·
2023-09-22 14:14
其他内容
金融
数据挖掘
量化交易
宽客
实用!Python大型Excel文件处理:快速导入、导出与批量处理
以下是一些常用的
PythonExcel
处理库:1、Pandas:Pandas是一个强大的数
虚无火星车
·
2023-09-22 00:40
python
excel
开发语言
当我用Python进行数据分析,我分析什么
Pandas是一个强大的分析结构化数据的工具集;它的使用基础是numpy(提供高性能的矩阵运算);用于数据挖掘和数据分析,同时也提供
数据清洗
功能。
快乐星球没有乐
·
2023-09-21 18:31
python
数据分析
pandas
上一页
12
13
14
15
16
17
18
19
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他