数据挖掘#特征工程第11页

2023年度盘点：AIGC、AGI、GhatGPT、人工智能大模型必读书单

通用人工智能》写在末尾：主页传送门：传送送书系列：送书第一期：考研必备书单送书第二期：CTF那些事儿送书第三期：数据要素安全流通送书第四期：MLOps工程实践：工具、技术与企业级应用送书第五期：Python数据挖掘

家有娇妻张兔兔·2024-01-07 02:20

机器学习（四） -- 模型评估（3）

系列文章目录机器学习（一）--概述机器学习（二）--数据预处理（1-3）机器学习（三）--特征工程（1-2）机器学习（四）--模型评估（1-4）未完待续……目录机器学习（四）--模型评估（1）机器学习（

₫从心·2024-01-07 02:15

数据挖掘聚类算法--划分(partitioning)

数据挖掘--聚类算法简介聚类是对物理的或者抽象的对象集合分组的过程，聚类生成的组称为簇，而簇是数据对象的集合。

Mr_Peter_Hu·2024-01-06 21:55

数据挖掘经典算法之K-邻近算法（超详细附代码）

简介又叫K-邻近算法，是监督学习中的一种分类算法。目的是根据已知类别的样本点集求出待分类的数据点类别。基本思想kNN的思想很简单：在训练集中选取离输入的数据点最近的k个邻居，根据这个k个邻居中出现次数最多的类别（最大表决规则），作为该数据点的类别。kNN算法中，所选择的邻居都是已经正确分类的对象。算法复杂度kNN是一种lazy-learning算法，分类器不需要使用训练集进行训练，因此训练时间复杂

Python研究者·2024-01-06 19:37

贷款违约预测-Task2 数据分析

Task2数据分析此部分为零基础入门金融风控的Task2数据分析部分，带你来了解数据，熟悉数据，为后续的特征工程做准备，欢迎大家后续多多交流。

致Great·2024-01-06 17:51

特征工程-特征预处理

1什么是特征预处理1.1特征预处理定义scikit-learn的解释providesseveralcommonutilityfunctionsandtransformerclassestochangerawfeaturevectorsintoarepresentationthatismoresuitableforthedownstreamestimators.翻译过来：通过一些转换函数将特征数据转

谛君_是心动啊·2024-01-06 17:27

AI技术体系和领域浅总结

信息论基础》（机械工业出版社）集合论和图论《离散数学》博弈论《博弈论》（中国人民大学出版社）张量分析现代几何计算机基础计算机原理程序设计语言操作系统分布式系统算法基础机器学习算法机器学习基础（估计方法特征工程

TisUs·2024-01-06 16:26

高可用分布式部署Spark、完整详细部署教程

mapreduce算法实现的分布式计算，拥有HadoopMapReduce所具有的优点；但不同于MapReduce的是Job中间输出和结果可以保存在内存中，从而不再需要读写HDFS，因此Spark能更好地适用于数据挖掘与机器学习等需要迭代的

一座野山·2024-01-06 16:15

深度学习（学习记录）

题型：填空题+判断题30分、简答题20分、计算题20分、综合题（30分）综合题（解决实际工程问题，不考实验、不考代码、考思想）一、深度学习绪论（非重点不做考察）1、传统机器学习：人工特征工程+分类器概念

学数学的懒哥·2024-01-06 13:49

一个月读完6本书？这些烧脑神书，你能读完1本，就是学霸！

1数据挖掘导论（原书第2版）

大数据v·2024-01-06 11:05

今年最值得期待的美股IPO（三）：硅谷最神秘独角兽Palantir

事实上，这家数据挖掘和分析公司常常被称作是“硅谷最神秘的科技独角兽”。随着IPO提上议程，Palantir的面纱可能要被逐渐揭开。

HOX币股世界·2024-01-06 11:42

数据探索 —— 数据预处理 1

在数据挖掘中，海量的原始数据中存在着大量不完整（有缺失值）、不一致、有异常的数据，严重影响到数据挖掘建模的执行效率，甚至可能导致挖掘结果的偏差，所以进行数据清洗就显得尤为重要，数据清洗完成后接着进行或者同时进行数据集成

冰度猎魂·2024-01-06 10:33

机器学习——特征工程之K均值降维

机器学习——特征工程之K均值降维前言一、K-均值聚类（K-means）1、算法推导2、举例二、降维前言1、先直观解释什么是平面（线性子空间）和流形（非线性子空间）：答：如果线性子空间是一张平展的纸，那么非线性流形的一个简单例子就是卷起来的纸

macan_dct·2024-01-06 09:11

计算机毕业设计基于SpringBoot的公司资产网站的设计与实现 Java实战项目附源码+文档+视频讲解

博主介绍：✌从事软件开发10年之余，专注于Java技术领域、Python人工智能及数据挖掘、小程序项目开发和Android项目开发等。

IT学长编程·2024-01-06 07:38

Kaggle之泰坦尼克号（2）

文章目录一、特征工程缺失值处理文本型数据处理-Sex文本型数据处理-Name文本型数据处理-Ticket文本型数据处理-Cabin文本型数据处理-Embarked特征扩充-SibSp、Parch特征扩充

学海一叶·2024-01-06 06:39

numpy 稀疏矩阵

常见的，在特征工程中，进行one-hot编码时会产生稀疏矩阵，因此需

阿君聊风控·2024-01-06 02:13

机器学习算法分类

分类问题目标值：连续型的数据--回归问题分类模型k近邻算法，贝叶斯分类，决策树与随机森林，逻辑回归,SVM,回归模型线性回归，岭回归无监督学习目标值：无聚类模型k-means机器学习开发流程获取数据数据清洗特征工程

学了忘了学·2024-01-06 01:40

数据仓库系列7-OLAP是什么

数据挖掘中的这些OLAP操作是资源密集型的。使用OLAP可以预先计算和预先聚合数据，从而加快分析速度。OLAP数据库被分成一个或多个多维数据集。多维数据集

allwit·2024-01-05 21:32

Torch-Rechub学习分享2

有些特征是易于理解的，可以通过领域专家进行人工特征工程抽取特征。但是对于不易于理解的特征，如“啤酒和尿布”，则只能通过机器学习的方法得到。同样的对于需要特别

xdyhk·2024-01-05 20:42

GBDT、XGBoost、LightGBM的区别与联系

GBDT也是各种数据挖掘竞赛的致命武器，据统计Kaggle上的比赛有一半以上的冠军方案都是基于GBDT。

徐卜灵·2024-01-05 19:32

《数据挖掘基础》实验：Weka平台实现聚类算法

实验目的进一步理解聚类算法（K-平均、PAM、层次聚类、密度聚类），利用weka实现数据集的聚类处理，学会调整模型参数，以图或树的形式给出挖掘结果，并解释规则的含义。实验要求（1）随机选取数据集（UCI或data文件夹），需要做预处理的，单独说明处理过程。完成以下内容：（用四种方法：K-means、K-中心法、层次、密度）文件导入与编辑参数设置说明结果截图结果分析与对比（2）以AQI.xls中1-

lazyn·2024-01-05 18:08

【数据挖掘】聚类趋势估计、簇数确定、质量测定等评估方法详解（图文解释超详细）

需要PPT和源码请点赞关注收藏后评论区留言私信~~~聚类评估用于对在数据集上进行聚类的可行性和被聚类方法产生的结果的质量进行评估。聚类评估主要包括以下任务估计聚类趋势对于给定的数据集聚类趋势估计用于评估该数据集是否存在非随机结构，如果盲目地在数据集上使用聚类方法返回一些簇所挖掘的簇可能是误导因为数据集上的聚类分析仅当数据中存在非随机结构时才有意义确定数据集中的划分簇数一些聚类算法需要数据集划分的簇

showswoller·2024-01-05 18:37

【亚马逊云科技】自家的AI助手 - Amazon Q

本人的技术路线从Java全栈工程师一路奔向大数据开发、数据挖掘领域，如今终有小成，愿将昔日所获与大家交流一二，希望对学习路上的你有所助益。

一头小山猪·2024-01-05 14:00

【Python机器学习系列】建立逻辑回归模型预测心脏疾病（完整实现过程）

一文彻底搞懂机器学习中的归一化与反归一化问题【Python机器学习系列】一文彻底搞懂机器学习中表格数据的输入形式（理论+源码）【Python特征工程系列】利用随机森林模型

数据杂坛·2024-01-05 12:22

【Python机器学习系列】建立支持向量机模型预测心脏疾病（完整实现过程）

一文彻底搞懂机器学习中的归一化与反归一化问题【Python机器学习系列】一文彻底搞懂机器学习中表格数据的输入形式（理论+源码）【Python特征工程系列】利用随机森林模型

数据杂坛·2024-01-05 12:47

计算机毕业设计基于Java的供应商管理系统的设计与实现 Java实战项目附源码+文档+视频讲解

博主介绍：✌从事软件开发10年之余，专注于Java技术领域、Python人工智能及数据挖掘、小程序项目开发和Android项目开发等。

IT学长编程·2024-01-05 11:57

Python数据处理 ——展现Pandas 的强大

Pandas被普遍用于数据挖掘和数据分析，同时也提供数据清洗、数据I/O、数据可视化等辅助功能。Pandas不仅简洁，还拥有出众的数据处理能力和完备的辅助功能。归纳起来，Pandas有以下5大特点。

Zouia Gail(修行中)·2024-01-05 11:57

数据挖掘与数据分析的主要区别是什么

在当今数字化时代，数据已经成为了企业决策的重要依据，而数据挖掘与数据分析作为数据处理的重要工具，都在帮助企业从数据中发现价值，从而提升业务效益。然而，许多人对于数据挖掘与数据分析的区别并不清晰。

qingyunliushuiyu·2024-01-05 09:16

数据挖掘总结(考试版）

数据挖掘总结：第一章：数据挖掘KDD步骤：数据清理:(消除噪声和删除不一致的数据)数据集成（多种数据源可以组合在一起）数据选择（从数据库中提取与分析任务相关的数据）数据变换（数据变换或统一成适合挖掘的形式

acmakb·2024-01-05 09:45

机器学习（四） -- 模型评估（2）

系列文章目录机器学习（一）--概述机器学习（二）--数据预处理（1-3）机器学习（三）--特征工程（1-2）机器学习（四）--模型评估（1-4）未完待续……目录系列文章目录前言三、分类模型评估指标1、错误率与精度

₫从心·2024-01-05 02:23

灰度共生矩阵纹理特征提取matlab,灰度共生矩阵纹理特征提取的Matlab实现

灰度共生矩阵纹理特征提取的Matlab实现焦蓬蓬，郭依正，刘丽娟，卫星(南京师范大学泰州学院，江苏泰州225300)摘要:图像的特征提取是图像的识别和分类、基于内容的图像检索、图像数据挖掘等研究内容的

陆牙·2024-01-05 02:21

python数据分析

青花锁·2024-01-04 23:22

超详细EM算法举例及推导

最好先学习一下极大似然EM（Expectation-Maximum）算法也称期望最大化算法，曾入选“数据挖掘十大算法”中，可见EM算法在机器学习、数据挖掘中的影响力。

老实人小李·2024-01-04 21:33

《数据仓库与数据挖掘》期末复习总结

《数据仓库与数据挖掘》期末复习总结适用教材：《数据挖掘概念与技术（第3版）》，JiaweiHan，MiehelineKamber，JianPei著，机械工业出版社提示：与教材内容不完全匹配，有所取舍写在前面

炼魂·2024-01-04 18:43

Python数据挖掘与机器学习实践技术应用

近年来，Python编程语言受到越来越多科研人员的喜爱，在多个编程语言排行榜中持续夺冠。同时，伴随着深度学习的快速发展，人工智能技术在各个领域中的应用越来越广泛。机器学习是人工智能的基础，因此，掌握常用机器学习算法的工作原理，并能够熟练运用Python建立实际的机器学习模型，是开展人工智能相关研究的前提和基础。为各领域人员量身定制课程内容，让你畅学Python编程及机器学习理论与代码实现方法，从“

思考的小猴子·2024-01-04 18:03

公共数据挖掘竟然还可以发到15分+？

Identificationofacytokine-dominatedimmunosuppressiveclassinsquamouscelllungcarcinomawithimplicationsforimmunotherapyresistance鳞状细胞肺癌中细胞因子为主的免疫抑制类的鉴定，对免疫疗法抗性的影响发表期刊：GenomeMed发表日期：2022Jul8影响因子：15.266DOI

生信学霸·2024-01-04 14:55

表达矩阵的归一化和标准化，去除极端值，异常值

在数据挖掘过程，数据的归一化和标准化是必须的。取log值就是一种归一化的方法，z-score是常用的标准正态分布化的方法。归一化和标准化的区别实际上口语里面通常是没办法很便捷的区分这两个概念。

天明豆豆·2024-01-04 14:44

机器学习常用算法模型总结

文章目录1.基础篇：了解机器学习1.1什么是机器学习1.2机器学习的场景1.2.1模式识别1.2.2数据挖掘1.2.3统计学习1.2.4自然语言处理1.2.5计算机视觉1.2.6语音识别1.3机器学习与深度学习

几窗花鸢·2024-01-04 12:23

机器学习（四） -- 模型评估（1）

系列文章目录机器学习（一）--概述机器学习（二）--数据预处理（1-3）机器学习（三）--特征工程（1-2）机器学习（四）--模型评估（1-2）未完待续……目录系列文章目录前言一、模型评估概述1、模型评估定义

₫从心·2024-01-04 09:54

大数据HCIE成神之路之特征工程——特征选择

特征选择1.1特征选择-Filter方法1.1.1实验任务1.1.1.1实验背景1.1.1.2实验目标1.1.1.3实验数据解析1.1.1.4实验思路1.1.2实验操作步骤1.2特征选择-Wrapper方法1.2.1实验任务1.2.1.1实验背景1.2.1.2实验目标1.2.1.3实验数据解析1.2.1.4实验思路1.2.2实验操作步骤1.3特征选择-Embedding方法1.3.1实验任务1.3

邵奈一·2024-01-04 08:57

SuperMap & YashanDB联合解决方案发布，赋能更强大的地理智慧

携手超图软件集团（简称“超图”）重磅推出基于崖山数据库的空间数据管理解决方案，基于YashanDB空间数据库能力，与超图SuperMapGIS平台深度适配，共同为各行业提供更高效、更灵活的空间数据管理及空间大数据挖掘分析能力

YashanDB·2024-01-04 08:26

Spark二、Spark技术栈之Spark Core

累加器和广播变量学习链接：https://mp.weixin.qq.com/s/caCk3mM5iXy0FaXCLkDwYQ一、RDD1.1为什么要有RDD在许多迭代式算法(比如机器学习、图算法等)和交互式数据挖掘中

eight_Jessen·2024-01-04 08:51

DataFrameMapper做特征工程

前言在数据挖掘流程中，特征工程是极其重要的环节，我们经常要结合实际数据，对某些类型的数据做特定变换，甚至多次变换，除了一些常见的基本变换（参考我之前写的『数据挖掘比赛通用框架』）外，还有很多非主流的奇技淫巧

Han_Sen·2024-01-04 06:02

代理IP在SEO优化、市场调研和数据挖掘中的应用实例

代理IP在SEO优化、市场调研和数据挖掘中的应用实例广泛且实用，下面分别详细说明：1.SEO优化：排名追踪：SEO专家可以利用代理IP模拟不同地理位置的用户访问搜索引擎，获取特定关键词下的搜索结果排名。

liuguanip·2024-01-04 06:55

数据挖掘--决策树

近来的调查表明决策树也是最经常使用的数据挖掘算法，它的概念非常简单。决策树算法之所以如此流行，一个很重要的原因就是使用者基本上不用了解机器学习算法，也不用深究它是如何工作的。

人工智能MOS·2024-01-04 06:25

【数据挖掘】基于 LightGBM 的系统访问风险识别（附源码）

基于LightGBM的系统访问风险识别文章目录基于LightGBM的系统访问风险识别一、课题来源二、任务描述三、课题背景四、数据获取分析及说明（1）登录https://www.datafountain.cn并获取相关数据（2）数据集文件说明（3）训练集和测试集含义说明五、实验过程详细描述及程序清单（1）数据处理（2）特征抽取（3）模型训练（4）预测六、个人总结七、源码一、课题来源分类预测/回归预测

the_coco·2024-01-04 06:41

如何构建大数据指标分析系统

分析分为实事状态分析和预测分析（特征工程），本文用对事实状态指标分析为例，用多种技术方案构建指标分析系统。

i7杨·2024-01-04 03:37

计算机毕业设计基于SpringBoot的工作量统计系统的设计与实现 Java实战项目附源码+文档+视频讲解

博主介绍：✌从事软件开发10年之余，专注于Java技术领域、Python人工智能及数据挖掘、小程序项目开发和Android项目开发等。

IT学长编程·2024-01-04 02:18

机器学习-4：机器学习的建模流程

机器学习的建模流程流程为：原始数据-->数据预处理-->特征工程-->建模-->验证。

Doawen·2024-01-04 01:43

数据可视化习题

可视化的分类包含：（ABD）A.科学可视化B.信息可视化C.智能可视化D.可视分析学张量场可视化属于可视化的哪个分支学科:科学可视化可视分析学涉及到的学科包括（ABCD）A.计算机图形学B.数据挖掘C.

夜をむかえる·2024-01-03 22:21

推荐频道

数据挖掘#特征工程

2023年度盘点：AIGC、AGI、GhatGPT、人工智能大模型必读书单

机器学习（四） -- 模型评估（3）

数据挖掘聚类算法--划分(partitioning)

数据挖掘经典算法之K-邻近算法（超详细附代码）

贷款违约预测-Task2 数据分析

特征工程-特征预处理

AI技术体系和领域浅总结

高可用分布式部署Spark、完整详细部署教程

深度学习（学习记录）

一个月读完6本书？这些烧脑神书，你能读完1本，就是学霸！

今年最值得期待的美股IPO（三）：硅谷最神秘独角兽Palantir

数据探索 —— 数据预处理 1

机器学习——特征工程之K均值降维

计算机毕业设计 基于SpringBoot的公司资产网站的设计与实现 Java实战项目 附源码+文档+视频讲解

Kaggle之泰坦尼克号（2）

numpy 稀疏矩阵

机器学习算法分类

数据仓库系列7-OLAP是什么

Torch-Rechub学习分享2

GBDT、XGBoost、LightGBM的区别与联系

《数据挖掘基础》实验：Weka平台实现聚类算法

【数据挖掘】聚类趋势估计、簇数确定、质量测定等评估方法详解（图文解释 超详细）

【亚马逊云科技】自家的AI助手 - Amazon Q

【Python机器学习系列】建立逻辑回归模型预测心脏疾病（完整实现过程）

【Python机器学习系列】建立支持向量机模型预测心脏疾病（完整实现过程）

计算机毕业设计 基于Java的供应商管理系统的设计与实现 Java实战项目 附源码+文档+视频讲解

Python数据处理 ——展现Pandas 的强大

数据挖掘与数据分析的主要区别是什么

数据挖掘总结(考试版）

机器学习（四） -- 模型评估（2）

灰度共生矩阵纹理特征提取matlab,灰度共生矩阵纹理特征提取的Matlab实现

python数据分析

超详细EM算法举例及推导

《数据仓库与数据挖掘》期末复习总结

Python数据挖掘与机器学习实践技术应用

公共数据挖掘竟然还可以发到15分+？

表达矩阵的归一化和标准化，去除极端值，异常值

机器学习常用算法模型总结

机器学习（四） -- 模型评估（1）

大数据HCIE成神之路之特征工程——特征选择

SuperMap & YashanDB联合解决方案发布，赋能更强大的地理智慧

Spark二、Spark技术栈之Spark Core

DataFrameMapper做特征工程

代理IP在SEO优化、市场调研和数据挖掘中的应用实例

数据挖掘--决策树

【数据挖掘】基于 LightGBM 的系统访问风险识别（附源码）

如何构建大数据指标分析系统

计算机毕业设计 基于SpringBoot的工作量统计系统的设计与实现 Java实战项目 附源码+文档+视频讲解

机器学习-4：机器学习的建模流程

数据可视化习题

计算机毕业设计基于SpringBoot的公司资产网站的设计与实现 Java实战项目附源码+文档+视频讲解

【数据挖掘】聚类趋势估计、簇数确定、质量测定等评估方法详解（图文解释超详细）

计算机毕业设计基于Java的供应商管理系统的设计与实现 Java实战项目附源码+文档+视频讲解

计算机毕业设计基于SpringBoot的工作量统计系统的设计与实现 Java实战项目附源码+文档+视频讲解