E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
数据竞赛(数据挖掘)
数据挖掘
学习笔记2-数据预处理
一、数据清洗1.数据缺失:①忽视(删除)仅占比较小(2-3%)时可用②填充——固定填充;根据经验、样本猜测2.离群点(正常)V.S.异常点离群点是相对概念(根据平均距离算)3.重复数据①使用滑动窗口,窗口内两两比较(假设:高度疑似的数据是紧挨的→生成KEY(根据相关知识),按key排序)二、数据转换1.类型转换2.标准化(编码化,需要注意非顺序类的编码化,如果默认按0、1、2编码,则暗含了距离的属
irony_202
·
2023-10-19 22:10
数据挖掘
数据预处理
3.原因:真实的数据是很混乱的,真实的
数据挖掘
过程中,数据预处理所占时间可能是整个项目时间的70%,就比如调查问卷中答非所问,也比如样本过多,超过我的需求。缺失数据往往是
两个鼻孔的猪
·
2023-10-19 22:08
数据处理
数据挖掘
数据预处理
7000字,详解仓湖一体架构!
本文转载自公众号:数据学堂全文共7110个字,建议阅读15分钟在了解湖仓一体化之前,我们先来看一则有关数据仓库的有趣故事吧~沃尔玛拥有世界上最大的数据仓库系统,它利用
数据挖掘
方法对交易数据进行分析后发现
浪尖聊大数据-浪尖
·
2023-10-19 18:09
数据仓库
大数据
编程语言
hadoop
数据库
当当API关键字搜索接口技术:实现快速商品搜索与推荐
技术原理当当关键字搜索接口主要基于搜索引擎算法和
数据挖掘
技术。搜索引擎算法是指通过一定的算法策略,对大量商品信息进行索引和排序,以
Ace19970108110
·
2023-10-19 17:25
API
Python
python
某百亿量化私募-校园招聘/实习生招聘/应届生招聘-量化研究员
https://www.题解|#平均播放进度大于60%的视频类别#SELECTtp.tag,CONCAT(avg_play_progress,"%")avg_play_progressFROM(S莉莉丝游戏
数据挖掘
huaxinjiayou
·
2023-10-19 16:45
java
【Python
数据挖掘
】Python自动售货机销售数据分析与应用
python01案例背景02分析目标03分析过程04数据预处理4.1.清洗数据4.1.1合并订单表并处理缺失值4.1.2增加“市”属性4.1.3处理订单表中的“商品详情”属性4.1.4处理“总金额(元)”属性4.2.属性选择4.3.属性规约05销售数据可视化分析5.1.销售额和自动售货机数量的关系5.2.订单数量和自动售货机数量的关系5.3.畅销和滞销商品5.4.自动售货机的销售情况5.5.订单支
洁洁!
·
2023-10-19 15:08
python
数据挖掘
python
数据分析
中国xx集团信息技术工程师面试
二、看你学过
数据挖掘
这门课,能简单介绍一下有哪些章节,学了些什么?
数据挖掘
主要内容是从大数据中筛选过滤得到我们想要的数据。
zkzq
·
2023-10-19 13:43
面试分享
面试
职场和发展
网络安全
web安全
网络
安全
GEO生信
数据挖掘
(九)肺结核数据-差异分析-WGCNA分析(900行代码整理注释更新版本)
第六节,我们使用结核病基因数据,做了一个数据预处理的实操案例。例子中结核类型,包括结核,潜隐进展,对照和潜隐,四个类别。第七节延续上个数据,进行了差异分析。第八节对差异基因进行富集分析。本节进行WGCNA分析。WGCNA分析分段代码(附运行效果图)请查看上节运行后效果rm(list=ls())######清除环境数据#========================================
人工智能学术前沿(真)
·
2023-10-19 11:08
数据挖掘
人工智能
基因数据分析
R
GEO数据挖掘
生信分析
【淘宝用户购物行为分析】
数据挖掘
实验四
文章目录I、项目任务要求任务描述:主要任务要求:II、原理描述III、数据集描述数据集来源数据描述变量分析数据预处理IV、具体实现过程V、结果分析VI、完整代码I、项目任务要求任务描述:关联分析用于发现用户购买不同的商品之间存在关联和相关联系,比如A商品和B商品存在很强的相关性,常用于实体商店或在线电商的推荐系统,例如某一客户购买A商品,那么他很有可能会购买B商品,通过大量销售数据找到经常在一起购
小手の冰凉
·
2023-10-19 11:21
【数据科学与大数据技术】
数据挖掘
人工智能
python端午节快乐_两个惊艳的python库:tqdm和retry
Python基本是我目前工作、计算、
数据挖掘
的唯一编程语言(除了符号计算用Mathematica外)。当然,基本的Python功能并不是很强大,但它胜在有巨量的第三方扩展库。
weixin_39731271
·
2023-10-19 10:58
python端午节快乐
【
数据挖掘
】
数据挖掘
、关联分析、分类预测、决策树、聚类、类神经网络与罗吉斯回归
目录一、简介二、关于
数据挖掘
的经典故事和案例2.1正在影响中国管理的10大技术2.2从数字中能够得到什么?
TJUTCM-策士之九尾
·
2023-10-19 09:04
数据科学
数据挖掘
人工智能
数据分析
机器学习
决策树
聚类
分类
.NET平台机器学习资源汇总,有你想要的么?
机器学习并不等于大数据或者
数据挖掘
,还有有些区别,有些东西可以用来处理大数
weixin_34194551
·
2023-10-19 08:46
c#
xcode
人工智能
决策树
数据挖掘
中决策树是一种经常要用到的技术,可以用于分析数据,同样也可以用来作预测。从
聪慧达芬奇
·
2023-10-19 08:18
scrapy
Scrapy用途广泛,可以用于
数据挖掘
、监测和自动化测试。Scrapy吸引人的地方在于它是一个框架,任何人都可以根据需求方便的修改。
jsd2honey
·
2023-10-19 06:17
python
Scrapy
Scrapy用途广泛,可以用于
数据挖掘
、监测和自动化测试Scrapy使
edge_god
·
2023-10-19 06:15
Scarpy2.5从入门到高级系列教程(一):快速了解Scrapy框架
Scrapy快速一览Scrapy是一个用于抓取网站和提取结构化数据的应用程序框架,可用于各种有用的应用程序,如
数据挖掘
、信息处理或历史存档。
大器晚成你别不信
·
2023-10-19 06:45
Scrapy2.5从初级到高级
爬虫
python
爬虫五(Scrapy框架整体流程介绍、Scrapy解析数据爬取Cnblogs文章信息、Settings相关配置提高爬取效率、持久化方案保存到本地数据库、爬虫中间件)
但目前Scrapy的用途十分广泛,可用于如
数据挖掘
、监测和自动化测
LoisMay
·
2023-10-19 06:45
爬虫
爬虫
scrapy
数据库
python
数据挖掘
(6)聚类分析
一、什么是聚类分析1.1概述无指导的,数据集中类别未知类的特征:类不是事先给定的,而是根据数据的相似性、距离划分的聚类的数目和结构都没有事先假定。挖掘有价值的客户:找到客户的黄金客户ATM的安装位置1.2区别·二、距离和相似系数2.1概述原则:组内数据有较高相似度、不同组数据不相似相似性的度量(统计学角度):Q型聚类:对样本聚类(行聚类)R型聚类:对变量聚类(列聚类)2.2Q型聚类(样本聚类、行聚
烟雨平生9527
·
2023-10-19 01:20
数据挖掘
人工智能
指数随机变量 泊松过程跳_
数据挖掘
图书:应用随机过程:概率模型导论(第10版) [平装]...
第1章概率论引论1.1引言1.2样本空间与事件1.3定义在事件上的概率1.4条件概率1.5独立事件1.6贝叶斯公式习题参考文献第2章随机变量2.1随机变量2.2离散随机变量2.2.1伯努利随机变量2.2.2二项随机变量2.2.3几何随机变量2.2.4泊松随机变量2.3连续随机变量2.3.1均匀随机变量2.3.2指数随机变量2.3.3伽玛随机变量2.3.4正态随机变量2.4随机变量的期望2.4.1离
奈若何丷
·
2023-10-19 00:55
指数随机变量
泊松过程跳
二蛋赠书五期:《Python
数据挖掘
:入门、进阶与实用案例分析》
前言大家好!我是二蛋,一个热爱技术、乐于分享的工程师。在过去的几年里,我一直通过各种渠道与大家分享技术知识和经验。我深知,每一位技术人员都对自己的技能提升和职业发展有着热切的期待。因此,我非常感激大家一直以来对我的关注和支持。为了回馈大家的厚爱,我决定启动一项特别的赠书活动。我希望通过这个活动,能够让更多的读者获得有价值的技术支持,并提高自己的技能水平。在这个活动中,我将不定期向大家赠送一本技术相
叫我二蛋
·
2023-10-18 18:09
赠书专栏
python
数据挖掘
开发语言
为什么Python不是未来的编程语言?
策划|刘燕作者|RheaMoutafis翻译|Sambodhi编辑|LindaPython现在如此火爆,已发展成为一种非常通用的语言,无论是从入门级选手到专业技术
数据挖掘
、科学计算、图像处理、人工智能,
喜欢打酱油的老鸟
·
2023-10-18 17:02
人工智能
小结-
数据挖掘
-Pandas的常见用法
Pandas用途高效处理结构化数据,方便于数据导入、清理、建模、可视化。缺失数据的处理数据的插入删除分组聚合查询切片、索引、截取合并、连接数据...Pandas常见用法导入、导出数据参考pd.readcsv()pd.read_csv(filepath_or_buffer,sep=',',delimiter=None,header='infer',names=None,index_col=None,
Andrew0000
·
2023-10-18 16:13
Python 官方研讨会:彻底移除 GIL 真的可行么?
点击上方“Python爬虫与
数据挖掘
”,进行关注回复“书籍”即可获赠Python从入门到进阶共10本电子书今日鸡汤忽见陌头杨柳色,悔教夫婿觅封侯。
Python进阶者
·
2023-10-18 16:43
大数据
编程语言
python
人工智能
java
什么是网络爬虫,爬虫的机制是那些
它们广泛应用于搜索引擎、
数据挖掘
、竞争情报、价格监测等各种互联网应用中。爬虫机制是爬虫程序或机器人用来访问、抓取、索引以及最终存储互联网上数据的过程。这包括但不限于万维网、社交媒体平台、数据库等。
tbApi
·
2023-10-18 15:52
爬虫
大数据
开发语言
视频信息检索与
数据挖掘
引子-信息检索信息检索是用来处理文本数据的技术,信息检索领域的传统模型是海量的数据被组织成具有一定形式的文档。用户通过交互界面输入查询关键词,系统在后台为用户执行查询操作,生成准确的符合要求的查询结果。信息检索和数据库技术并行发展,但与数据库查找有着本质的区别,信息检索利用查准率与查全率来衡量检索的结果。一、基于关键字的查询文档被看成字符串,通过关键字进行匹配,简单的查询用此方法即可查到结果,但是
weixin_33866037
·
2023-10-18 14:32
数据库
人工智能
大数据
大数据 | 实验一:大数据系统基本实验 | MapReduce 初级编程
2)掌握用MapReduce解决一些常见的数据处理问题,包括数据去重、数据排序和
数据挖掘
等。
啦啦右一
·
2023-10-18 14:28
大数据与数据分析
#
大数据管理与分析实验
大数据
mapreduce
hadoop
信息检索与
数据挖掘
|(四)索引构建
目录硬件基础基于块的排序索引方法BSBI算法(blockedsort-basedindexing)内存式单遍扫描索引构建方法SPIMI算法(single-passin-memoryindexing)分布式索引构建方法硬件基础访问内存数据比访问磁盘数据快得多。进行磁盘读写时,磁头移到数据所在的磁道需要一段时间,该时间称为寻道时间。寻道期间并不进行数据的传输。操作系统往往以数据块为单位进行读写。因此,
啦啦右一
·
2023-10-18 14:53
#
信息检索与数据挖掘
大数据与数据分析
数据挖掘
信息检索
索引构建
直播预约丨《实时湖仓实践五讲》第二讲:实时湖仓功能架构设计与落地实战
如今,大规模、高时效、智能化数据处理已是“刚需”,企业需要更强大的数据平台,来应对数据查询、数据处理、
数据挖掘
、数据展示以及多种计算模型并行的挑战,湖仓一体方案应运而生。
袋鼠云数栈
·
2023-10-18 13:55
大数据
PyTorch指南:17个技巧让你的深度学习模型训练变得飞快!
FlyAI是为AI开发者提供
数据竞赛
并支持GPU离线训练的一站式服务平台。每周免费提供项目开源算法样例,支持算法能力变现以及快速的迭代算法模型。
iFlyAI
·
2023-10-18 12:35
人工智能竞赛
人工智能
深度学习
算法
神经网络
机器学习
人工智能
深度学习
系统架构师上午题部分知识点汇总
系统架构师系统架构师上午题知识树系统架构师计算机组成与体系结构计算机系统组成存储器系统流水线操作系统操作系统的类型与结构操作系统的基本原理数据库系统数据库管理系统的类型数据库的模式与范式数据库设计事物管理分布式数据库系统数据仓库
数据挖掘
Miaow.Y.Hu
·
2023-10-18 11:50
软考
系统架构
网络社区挖掘-图论部分的基本知识笔记
1网络社区挖掘定义网络社区挖掘是指利用
数据挖掘
技术和机器学习算法,分析社交网络、在线社区或互联网上的各种交互数据,以揭示其中隐藏的模式、关系和信息。
Wency(王斯-CUEB)
·
2023-10-18 07:28
图论
笔记
php
[ Spark ] Spark核心概念
1)MR由于其设计初衷并不是为了满足循环迭代式数据流处理,因此在多并行运行的数据可复用场景(如:机器学习、图挖掘算法、交互式
数据挖掘
算法)中存在诸多计算效率等问题。
bone_ds
·
2023-10-18 07:25
Spark
spark
big
data
hadoop
(3)
数据挖掘
与数据化运营
数据挖掘
的指导思想是以业务为核心,思路为重点,挖掘技术为辅助的。一、常见数据分析类型(1)用户特征分析通过对用户特征分析,实现对用户个性化服务对精细化运营。
顽皮的石头7788121
·
2023-10-18 01:41
CBLab: Supporting the Training of Large-scale Traffic Control Policies with Scalable Traffic...
文章目录1简介2Introduction3CBEngine4CBData5CBScenario1简介该文章预发表于arXiv,后为KDD2023(CCF-A,数据库/
数据挖掘
/内容检索)接收2Introduction
PinkGranite
·
2023-10-17 21:45
论文解读与学习
城市模拟
交通模拟
KDD
论文阅读
数据挖掘
算法-关联算法-Apriori
一、Apriori算法简介:关联规则挖掘是
数据挖掘
领域的热点,关联规则反映一个对象与其他对象之间的相互依赖关系,如果多个对象之间存在-定的关联关系,那么一个对象可以通过其他对象进行预测。
止水。。
·
2023-10-17 20:22
数据挖掘
机器学习
深度学习
关联规则挖掘算法--Apriori算法
一、Apriori算法简介关联规则分析是
数据挖掘
中最活跃的研究方法之一,目的是在一个数据集中找到各项之间的关联关系,而这种关系并没有在数据中直接体现出来。
Arrogant-cell
·
2023-10-17 20:51
算法
算法
数据挖掘
人工智能
机器学习
关联规则挖掘理论和算法(
数据挖掘
十大算法---Apriori算法)
一、(Apriori)发现频繁项目集通过用户给定的最小支持度,寻找所有频繁项目集(满足Support不小于Minsupport的所有项目子集)逐层发现算法,按照项集的长度由下到大逐级进行,并最后发现频繁几项集项(Item)购物篮(Transcation):交易项集(Itemset):所有项的集合K项集:在集合中包含K个项的项集支持度:support(x)=count(x)/|D|*100%——x出
Gyanga
·
2023-10-17 20:48
算法
数据挖掘
python
数据挖掘
十大算法--Apriori算法
一、Apriori算法概述Apriori算法是一种用于关联规则挖掘的经典算法。它用于在大规模数据集中发现频繁项集,进而生成关联规则。关联规则揭示了数据集中项之间的关联关系,常被用于市场篮分析、推荐系统等应用。以下是Apriori算法的基本概述:频繁项集:项集(Itemset):项集是数据集中的一个或多个项(item)的集合。项可以是任何可以在数据集中唯一标识的元素,例如购物篮中的商品。支持度(Su
Wzideng
·
2023-10-17 20:17
各种计算机相关小知识
大数据学习
python学习
算法
数据挖掘
人工智能
python
大数据
排序算法
精排模型-从MLP到行为序列:DIN、DIEN、MIMN、SIM、DSIN
©作者|Glenn单位|腾讯研究方向|
数据挖掘
、计算广告背景如下图[1][2],阿里妈妈的精排模型,经历了从传统LR、MLR到深度模型GwEN,再到用户兴趣建模的过程。
PaperWeekly
·
2023-10-17 20:35
大数据
算法
python
机器学习
人工智能
Python 数据可视化
Seaborn是一个基于matplotlib的高级可视化效果库,针对的点主要是
数据挖掘
和机器学习中的变量特征选取,seaborn可以用短小的代码去绘制描述更多维度数据的可视化效果
木叶苍蓝
·
2023-10-17 19:37
【精华系列】跟着Token学习
数据挖掘
-1
这里是Token的博客,欢迎您的到来今天整理的笔记时
数据挖掘
方向的基础入门,了解数据分析使用的一些基础的Python库,为后面的数据处理做好准备01-数据分析工具介绍准备:Python的安装、平台搭建、
Token_w
·
2023-10-17 17:28
数据挖掘
学习
数据挖掘
人工智能
【好书推荐】Python
数据挖掘
:入门、进阶与实用案例分析
文章目录摘要:案例背景分析目标分析过程数据预处理⭐清洗数据1.1合并订单表并处理缺失值1.2增加“市”属性1.3处理订单表中的“商品详情”属性1.4处理“总金额(元)”属性⭐属性选择⭐属性规约好书推荐彩蛋摘要:本案例将主要结合自动售货机的实际情况,对销售的历史数据进行处理,利用pyecharts库、Matplotlib库进行可视化分析,并对未来4周商品的销售额进行预测,从而为企业制定相应的自动售货
在下小吉.
·
2023-10-17 17:26
送书活动
python
数据挖掘
开发语言
Python
数据挖掘
:入门进阶与实用案例分析-自动售货机销售数据分析与应用
更多详细内容请参考**《Python
数据挖掘
:入门进阶与实用案例分
后端小知识
·
2023-10-17 17:25
福利
数据分析
python
数据挖掘
开发语言
Python
数据挖掘
入门进阶与实用案例:自动售货机销售数据分析与应用
文章目录写在前面01案例背景02分析目标03分析过程04数据预处理1.清洗数据2.属性选择3.属性规约05销售数据可视化分析1.销售额和自动售货机数量的关系2.订单数量和自动售货机数量的关系3.畅销和滞销商品4.自动售货机的销售情况5.订单支付方式占比6.各消费时段的订单用户占比06销售额预测1.统计周销售额2.平稳性检验3.差分处理4.模型定阶5.模型预测写作末尾写在前面本案例将主要结合自动售货
东离与糖宝
·
2023-10-17 17:23
合作推广
数据挖掘
python
数据分析
大数据
五级
数据挖掘
工程师,你处在哪一级?
数据挖掘
很大工作不就是调参吗?为什么他提到的这些“厉害”的人物不会做事?这个就涉及专业的评价体系问题。世界上有一套针对专业人士的评价体系,它的发明人是苏联著名物理学家列夫·达维多维奇·朗道。
dbLenis
·
2023-10-17 17:20
数据挖掘
(二)
一,体系结构典型
数据挖掘
系统数据的来源数据库服务器,数据库
数据挖掘
的引擎
数据挖掘
的模式数据可视化技术的展示二,数据类型关系数据库使用最广泛数据仓库各个分立的数据库统一事务数据库高级数据库系统和信息库空间数据库时间数据库和时间序列数据库时间数据库和时间序列数据库都存放与时间有关的数据
行走记忆时光
·
2023-10-17 12:13
python 操作数据库-sqlite篇
作为一名
数据挖掘
工程师,除了挖掘算法外,最常打交道的就是各类数据库了,为了对自己的工作做个记录,准备对接触到的数据库及相关工具做个通述,因为只是做个引导,所以不会深入去讲,供查阅使用~targetgoon
晓东邪
·
2023-10-17 06:33
数据库
GEO生信
数据挖掘
(八)富集分析(GO 、KEGG、 GSEA 打包带走)
第六节,我们使用结核病基因数据,做了一个数据预处理的实操案例。例子中结核类型,包括结核,潜隐进展,对照和潜隐,四个类别。第七节延续上个数据,进行了差异分析。本节对差异基因进行富集分析。目录数据展示GO富集分析-对基因名称映射基因IDGO富集分析-从org.Hs.eg.db库中去匹配基因KEGG富集分析(不详细讲了看注释)GSEA富集分析更多复杂的图(关联网络图、八卦图、弦图)数据展示差异基因计算完
人工智能学术前沿(真)
·
2023-10-17 05:52
R
GEO数据挖掘
基因数据分析
生信分析
数据挖掘
GEO生信
数据挖掘
(九)WGCNA分析
第六节,我们使用结核病基因数据,做了一个数据预处理的实操案例。例子中结核类型,包括结核,潜隐进展,对照和潜隐,四个类别。第七节延续上个数据,进行了差异分析。第八节对差异基因进行富集分析。本节进行WGCNA分析。目录加载数据,进行聚类初次聚类观察自己定义红线位置,进行切割划分载入性状数据增加形状信息后,再次聚类网络构建选取soft-thresholdingpowers基于tom的差异的基因聚类,绘制
人工智能学术前沿(真)
·
2023-10-17 04:13
机器学习
数据挖掘
生信分析
基因数据分析
R
GEO数据挖掘
python 评论分析_基于Python-Snownlp的新闻评论数据分析
基于Python-Snownlp经过数据采集,数据预处理,建立向量模型,
数据挖掘
与分析对新闻评论中用户观点与情绪进行研究,有效實现舆情分析和监控。
weixin_39866087
·
2023-10-17 03:43
python
评论分析
上一页
21
22
23
24
25
26
27
28
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他