E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
数据挖掘#特征工程
2023年度盘点:AIGC、AGI、GhatGPT、人工智能大模型必读书单
通用人工智能》写在末尾:主页传送门:传送送书系列:送书第一期:考研必备书单送书第二期:CTF那些事儿送书第三期:数据要素安全流通送书第四期:MLOps工程实践:工具、技术与企业级应用送书第五期:Python
数据挖掘
家有娇妻张兔兔
·
2024-01-07 02:20
粉丝送书活动
AIGC
agi
人工智能
福利
送书
机器学习(四) -- 模型评估(3)
系列文章目录机器学习(一)--概述机器学习(二)--数据预处理(1-3)机器学习(三)--
特征工程
(1-2)机器学习(四)--模型评估(1-4)未完待续……目录机器学习(四)--模型评估(1)机器学习(
₫从心
·
2024-01-07 02:15
人工智能
#
机器学习
机器学习
人工智能
数据挖掘
聚类算法--划分(partitioning)
数据挖掘
--聚类算法简介聚类是对物理的或者抽象的对象集合分组的过程,聚类生成的组称为簇,而簇是数据对象的集合。
Mr_Peter_Hu
·
2024-01-06 21:55
数据挖掘
clustering
partition
数据挖掘
经典算法之K-邻近算法(超详细附代码)
简介又叫K-邻近算法,是监督学习中的一种分类算法。目的是根据已知类别的样本点集求出待分类的数据点类别。基本思想kNN的思想很简单:在训练集中选取离输入的数据点最近的k个邻居,根据这个k个邻居中出现次数最多的类别(最大表决规则),作为该数据点的类别。kNN算法中,所选择的邻居都是已经正确分类的对象。算法复杂度kNN是一种lazy-learning算法,分类器不需要使用训练集进行训练,因此训练时间复杂
Python研究者
·
2024-01-06 19:37
贷款违约预测-Task2 数据分析
Task2数据分析此部分为零基础入门金融风控的Task2数据分析部分,带你来了解数据,熟悉数据,为后续的
特征工程
做准备,欢迎大家后续多多交流。
致Great
·
2024-01-06 17:51
特征工程
-特征预处理
1什么是特征预处理1.1特征预处理定义scikit-learn的解释providesseveralcommonutilityfunctionsandtransformerclassestochangerawfeaturevectorsintoarepresentationthatismoresuitableforthedownstreamestimators.翻译过来:通过一些转换函数将特征数据转
谛君_是心动啊
·
2024-01-06 17:27
AI技术体系和领域浅总结
信息论基础》(机械工业出版社)集合论和图论《离散数学》博弈论《博弈论》(中国人民大学出版社)张量分析现代几何计算机基础计算机原理程序设计语言操作系统分布式系统算法基础机器学习算法机器学习基础(估计方法
特征工程
TisUs
·
2024-01-06 16:26
高可用分布式部署Spark、完整详细部署教程
mapreduce算法实现的分布式计算,拥有HadoopMapReduce所具有的优点;但不同于MapReduce的是Job中间输出和结果可以保存在内存中,从而不再需要读写HDFS,因此Spark能更好地适用于
数据挖掘
与机器学习等需要迭代的
一座野山
·
2024-01-06 16:15
spark
bigdata
hadoop
分布式
spark
大数据
linux
深度学习(学习记录)
题型:填空题+判断题30分、简答题20分、计算题20分、综合题(30分)综合题(解决实际工程问题,不考实验、不考代码、考思想)一、深度学习绪论(非重点不做考察)1、传统机器学习:人工
特征工程
+分类器概念
学数学的懒哥
·
2024-01-06 13:49
期末学习分享
深度学习
学习
人工智能
python
一个月读完6本书?这些烧脑神书,你能读完1本,就是学霸!
1
数据挖掘
导论(原书第2版)
大数据v
·
2024-01-06 11:05
今年最值得期待的美股IPO(三):硅谷最神秘独角兽Palantir
事实上,这家
数据挖掘
和分析公司常常被称作是“硅谷最神秘的科技独角兽”。随着IPO提上议程,Palantir的面纱可能要被逐渐揭开。
HOX币股世界
·
2024-01-06 11:42
数据探索 —— 数据预处理 1
在
数据挖掘
中,海量的原始数据中存在着大量不完整(有缺失值)、不一致、有异常的数据,严重影响到
数据挖掘
建模的执行效率,甚至可能导致挖掘结果的偏差,所以进行数据清洗就显得尤为重要,数据清洗完成后接着进行或者同时进行数据集成
冰度猎魂
·
2024-01-06 10:33
机器学习——
特征工程
之K均值降维
机器学习——
特征工程
之K均值降维前言一、K-均值聚类(K-means)1、算法推导2、举例二、降维前言1、先直观解释什么是平面(线性子空间)和流形(非线性子空间):答:如果线性子空间是一张平展的纸,那么非线性流形的一个简单例子就是卷起来的纸
macan_dct
·
2024-01-06 09:11
特征工程
机器学习
特征工程
K-means
计算机毕业设计 基于SpringBoot的公司资产网站的设计与实现 Java实战项目 附源码+文档+视频讲解
博主介绍:✌从事软件开发10年之余,专注于Java技术领域、Python人工智能及
数据挖掘
、小程序项目开发和Android项目开发等。
IT学长编程
·
2024-01-06 07:38
计算机毕业设计1000套
毕业论文
毕业设计
课程设计
Java
springboot
Kaggle之泰坦尼克号(2)
文章目录一、
特征工程
缺失值处理文本型数据处理-Sex文本型数据处理-Name文本型数据处理-Ticket文本型数据处理-Cabin文本型数据处理-Embarked特征扩充-SibSp、Parch特征扩充
学海一叶
·
2024-01-06 06:39
Kaggle
python
数据挖掘
机器学习
scikit-learn
算法
numpy 稀疏矩阵
常见的,在
特征工程
中,进行one-hot编码时会产生稀疏矩阵,因此需
阿君聊风控
·
2024-01-06 02:13
python基础
机器学习算法分类
分类问题目标值:连续型的数据--回归问题分类模型k近邻算法,贝叶斯分类,决策树与随机森林,逻辑回归,SVM,回归模型线性回归,岭回归无监督学习目标值:无聚类模型k-means机器学习开发流程获取数据数据清洗
特征工程
学了忘了学
·
2024-01-06 01:40
数据仓库系列7-OLAP是什么
数据挖掘
中的这些OLAP操作是资源密集型的。使用OLAP可以预先计算和预先聚合数据,从而加快分析速度。OLAP数据库被分成一个或多个多维数据集。多维数据集
allwit
·
2024-01-05 21:32
Torch-Rechub学习分享2
有些特征是易于理解的,可以通过领域专家进行人工
特征工程
抽取特征。但是对于不易于理解的特征,如“啤酒和尿布”,则只能通过机器学习的方法得到。同样的对于需要特别
xdyhk
·
2024-01-05 20:42
GBDT、XGBoost、LightGBM的区别与联系
GBDT也是各种
数据挖掘
竞赛的致命武器,据统计Kaggle上的比赛有一半以上的冠军方案都是基于GBDT。
徐卜灵
·
2024-01-05 19:32
《
数据挖掘
基础》实验:Weka平台实现聚类算法
实验目的进一步理解聚类算法(K-平均、PAM、层次聚类、密度聚类),利用weka实现数据集的聚类处理,学会调整模型参数,以图或树的形式给出挖掘结果,并解释规则的含义。实验要求(1)随机选取数据集(UCI或data文件夹),需要做预处理的,单独说明处理过程。完成以下内容:(用四种方法:K-means、K-中心法、层次、密度)文件导入与编辑参数设置说明结果截图结果分析与对比(2)以AQI.xls中1-
lazyn
·
2024-01-05 18:08
数据挖掘原理
聚类
数据挖掘
算法
机器学习
Weka
【
数据挖掘
】聚类趋势估计、簇数确定、质量测定等评估方法详解(图文解释 超详细)
需要PPT和源码请点赞关注收藏后评论区留言私信~~~聚类评估用于对在数据集上进行聚类的可行性和被聚类方法产生的结果的质量进行评估。聚类评估主要包括以下任务估计聚类趋势对于给定的数据集聚类趋势估计用于评估该数据集是否存在非随机结构,如果盲目地在数据集上使用聚类方法返回一些簇所挖掘的簇可能是误导因为数据集上的聚类分析仅当数据中存在非随机结构时才有意义确定数据集中的划分簇数一些聚类算法需要数据集划分的簇
showswoller
·
2024-01-05 18:37
机器学习
数据挖掘
聚类
数据挖掘
评估
sklearn
【亚马逊云科技】自家的AI助手 - Amazon Q
本人的技术路线从Java全栈工程师一路奔向大数据开发、
数据挖掘
领域,如今终有小成,愿将昔日所获与大家交流一二,希望对学习路上的你有所助益。
一头小山猪
·
2024-01-05 14:00
征文联动
#
亚马逊云
亚马逊
Amazon
AI
Amazon
Q
人工智能
【Python机器学习系列】建立逻辑回归模型预测心脏疾病(完整实现过程)
一文彻底搞懂机器学习中的归一化与反归一化问题【Python机器学习系列】一文彻底搞懂机器学习中表格数据的输入形式(理论+源码)【Python
特征工程
系列】利用随机森林模型
数据杂坛
·
2024-01-05 12:22
机器学习
机器学习
python
逻辑回归
【Python机器学习系列】建立支持向量机模型预测心脏疾病(完整实现过程)
一文彻底搞懂机器学习中的归一化与反归一化问题【Python机器学习系列】一文彻底搞懂机器学习中表格数据的输入形式(理论+源码)【Python
特征工程
系列】利用随机森林模型
数据杂坛
·
2024-01-05 12:47
机器学习
机器学习
支持向量机
python
计算机毕业设计 基于Java的供应商管理系统的设计与实现 Java实战项目 附源码+文档+视频讲解
博主介绍:✌从事软件开发10年之余,专注于Java技术领域、Python人工智能及
数据挖掘
、小程序项目开发和Android项目开发等。
IT学长编程
·
2024-01-05 11:57
计算机毕业设计1000套
毕业设计
毕业论文
课程设计
Java
idea
MySQL
Python数据处理 ——展现Pandas 的强大
Pandas被普遍用于
数据挖掘
和数据分析,同时也提供数据清洗、数据I/O、数据可视化等辅助功能。Pandas不仅简洁,还拥有出众的数据处理能力和完备的辅助功能。归纳起来,Pandas有以下5大特点。
Zouia Gail(修行中)
·
2024-01-05 11:57
python
pandas
开发语言
数据挖掘
与数据分析的主要区别是什么
在当今数字化时代,数据已经成为了企业决策的重要依据,而
数据挖掘
与数据分析作为数据处理的重要工具,都在帮助企业从数据中发现价值,从而提升业务效益。然而,许多人对于
数据挖掘
与数据分析的区别并不清晰。
qingyunliushuiyu
·
2024-01-05 09:16
BI
数据挖掘
数据分析
数据分析系统
数据挖掘
总结(考试版)
数据挖掘
总结:第一章:
数据挖掘
KDD步骤:数据清理:(消除噪声和删除不一致的数据)数据集成(多种数据源可以组合在一起)数据选择(从数据库中提取与分析任务相关的数据)数据变换(数据变换或统一成适合挖掘的形式
acmakb
·
2024-01-05 09:45
考前冲刺
数据挖掘
人工智能
机器学习(四) -- 模型评估(2)
系列文章目录机器学习(一)--概述机器学习(二)--数据预处理(1-3)机器学习(三)--
特征工程
(1-2)机器学习(四)--模型评估(1-4)未完待续……目录系列文章目录前言三、分类模型评估指标1、错误率与精度
₫从心
·
2024-01-05 02:23
机器学习
人工智能
灰度共生矩阵纹理特征提取matlab,灰度共生矩阵纹理特征提取的Matlab实现
灰度共生矩阵纹理特征提取的Matlab实现焦蓬蓬,郭依正,刘丽娟,卫星(南京师范大学泰州学院,江苏泰州225300)摘要:图像的特征提取是图像的识别和分类、基于内容的图像检索、图像
数据挖掘
等研究内容的
陆牙
·
2024-01-05 02:21
python数据分析
更多详细内容请参考《Python
数据挖掘
:入门进阶与实用案例分析》一书。1.案例背景 近年来,随着我国经济技术的不断提升,自动化机械在人们日常生活中扮演着越来越重
青花锁
·
2024-01-04 23:22
AI
送书活动
python
数据分析
开发语言
超详细EM算法举例及推导
最好先学习一下极大似然EM(Expectation-Maximum)算法也称期望最大化算法,曾入选“
数据挖掘
十大算法”中,可见EM算法在机器学习、
数据挖掘
中的影响力。
老实人小李
·
2024-01-04 21:33
聚类算法
聚类
《数据仓库与
数据挖掘
》期末复习总结
《数据仓库与
数据挖掘
》期末复习总结适用教材:《
数据挖掘
概念与技术(第3版)》,JiaweiHan,MiehelineKamber,JianPei著,机械工业出版社提示:与教材内容不完全匹配,有所取舍写在前面
炼魂
·
2024-01-04 18:43
复习笔记
数据仓库
数据挖掘
笔记
学习
Python
数据挖掘
与机器学习实践技术应用
近年来,Python编程语言受到越来越多科研人员的喜爱,在多个编程语言排行榜中持续夺冠。同时,伴随着深度学习的快速发展,人工智能技术在各个领域中的应用越来越广泛。机器学习是人工智能的基础,因此,掌握常用机器学习算法的工作原理,并能够熟练运用Python建立实际的机器学习模型,是开展人工智能相关研究的前提和基础。为各领域人员量身定制课程内容,让你畅学Python编程及机器学习理论与代码实现方法,从“
思考的小猴子
·
2024-01-04 18:03
机器学习
python
数据挖掘
机器学习
公共
数据挖掘
竟然还可以发到15分+?
Identificationofacytokine-dominatedimmunosuppressiveclassinsquamouscelllungcarcinomawithimplicationsforimmunotherapyresistance鳞状细胞肺癌中细胞因子为主的免疫抑制类的鉴定,对免疫疗法抗性的影响发表期刊:GenomeMed发表日期:2022Jul8影响因子:15.266DOI
生信学霸
·
2024-01-04 14:55
表达矩阵的归一化和标准化,去除极端值,异常值
在
数据挖掘
过程,数据的归一化和标准化是必须的。取log值就是一种归一化的方法,z-score是常用的标准正态分布化的方法。归一化和标准化的区别实际上口语里面通常是没办法很便捷的区分这两个概念。
天明豆豆
·
2024-01-04 14:44
机器学习常用算法模型总结
文章目录1.基础篇:了解机器学习1.1什么是机器学习1.2机器学习的场景1.2.1模式识别1.2.2
数据挖掘
1.2.3统计学习1.2.4自然语言处理1.2.5计算机视觉1.2.6语音识别1.3机器学习与深度学习
几窗花鸢
·
2024-01-04 12:23
机器学习
机器学习
算法
人工智能
回归
分类
机器学习(四) -- 模型评估(1)
系列文章目录机器学习(一)--概述机器学习(二)--数据预处理(1-3)机器学习(三)--
特征工程
(1-2)机器学习(四)--模型评估(1-2)未完待续……目录系列文章目录前言一、模型评估概述1、模型评估定义
₫从心
·
2024-01-04 09:54
人工智能
#
机器学习
机器学习
人工智能
大数据HCIE成神之路之
特征工程
——特征选择
特征选择1.1特征选择-Filter方法1.1.1实验任务1.1.1.1实验背景1.1.1.2实验目标1.1.1.3实验数据解析1.1.1.4实验思路1.1.2实验操作步骤1.2特征选择-Wrapper方法1.2.1实验任务1.2.1.1实验背景1.2.1.2实验目标1.2.1.3实验数据解析1.2.1.4实验思路1.2.2实验操作步骤1.3特征选择-Embedding方法1.3.1实验任务1.3
邵奈一
·
2024-01-04 08:57
数据挖掘
机器学习
HCIE之路
大数据
HCIE
数据挖掘
SuperMap & YashanDB联合解决方案发布,赋能更强大的地理智慧
携手超图软件集团(简称“超图”)重磅推出基于崖山数据库的空间数据管理解决方案,基于YashanDB空间数据库能力,与超图SuperMapGIS平台深度适配,共同为各行业提供更高效、更灵活的空间数据管理及空间大
数据挖掘
分析能力
YashanDB
·
2024-01-04 08:26
数据库
YashanDB
国产数据库
数据库
Spark二、Spark技术栈之Spark Core
累加器和广播变量学习链接:https://mp.weixin.qq.com/s/caCk3mM5iXy0FaXCLkDwYQ一、RDD1.1为什么要有RDD在许多迭代式算法(比如机器学习、图算法等)和交互式
数据挖掘
中
eight_Jessen
·
2024-01-04 08:51
spark
scala
spark
大数据
分布式
DataFrameMapper做
特征工程
前言在
数据挖掘
流程中,
特征工程
是极其重要的环节,我们经常要结合实际数据,对某些类型的数据做特定变换,甚至多次变换,除了一些常见的基本变换(参考我之前写的『
数据挖掘
比赛通用框架』)外,还有很多非主流的奇技淫巧
Han_Sen
·
2024-01-04 06:02
机器学习
代理IP在SEO优化、市场调研和
数据挖掘
中的应用实例
代理IP在SEO优化、市场调研和
数据挖掘
中的应用实例广泛且实用,下面分别详细说明:1.SEO优化:排名追踪:SEO专家可以利用代理IP模拟不同地理位置的用户访问搜索引擎,获取特定关键词下的搜索结果排名。
liuguanip
·
2024-01-04 06:55
tcp/ip
数据挖掘
网络协议
数据挖掘
--决策树
近来的调查表明决策树也是最经常使用的
数据挖掘
算法,它的概念非常简单。决策树算法之所以如此流行,一个很重要的原因就是使用者基本上不用了解机器学习算法,也不用深究它是如何工作的。
人工智能MOS
·
2024-01-04 06:25
深度学习
人工智能
机器学习
数据挖掘
【
数据挖掘
】基于 LightGBM 的系统访问风险识别(附源码)
基于LightGBM的系统访问风险识别文章目录基于LightGBM的系统访问风险识别一、课题来源二、任务描述三、课题背景四、数据获取分析及说明(1)登录https://www.datafountain.cn并获取相关数据(2)数据集文件说明(3)训练集和测试集含义说明五、实验过程详细描述及程序清单(1)数据处理(2)特征抽取(3)模型训练(4)预测六、个人总结七、源码一、课题来源分类预测/回归预测
the_coco
·
2024-01-04 06:41
jupyter
python
数据挖掘
如何构建大数据指标分析系统
分析分为实事状态分析和预测分析(
特征工程
),本文用对事实状态指标分析为例,用多种技术方案构建指标分析系统。
i7杨
·
2024-01-04 03:37
大数据指标分析
大数据
计算机毕业设计 基于SpringBoot的工作量统计系统的设计与实现 Java实战项目 附源码+文档+视频讲解
博主介绍:✌从事软件开发10年之余,专注于Java技术领域、Python人工智能及
数据挖掘
、小程序项目开发和Android项目开发等。
IT学长编程
·
2024-01-04 02:18
计算机毕业设计1000套
毕业设计
毕业论文
课程设计
Java
SpringBoot
Vue
机器学习-4:机器学习的建模流程
机器学习的建模流程流程为:原始数据-->数据预处理-->
特征工程
-->建模-->验证。
Doawen
·
2024-01-04 01:43
数据可视化习题
可视化的分类包含:(ABD)A.科学可视化B.信息可视化C.智能可视化D.可视分析学张量场可视化属于可视化的哪个分支学科:科学可视化可视分析学涉及到的学科包括(ABCD)A.计算机图形学B.
数据挖掘
C.
夜をむかえる
·
2024-01-03 22:21
信息可视化
上一页
7
8
9
10
11
12
13
14
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他