E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
数据挖掘#特征工程
从《猩球崛起》中看到人类对于人工智能的恐惧
智搜(Giiso)信息成立于2013年是国内领先的“人工智能+资讯”领域技术服务商,在大
数据挖掘
、智能语义、知识图谱等领域都拥有国内顶尖技术。
weixin_34268310
·
2024-02-13 23:07
人工智能
探索XGBoost:时间序列数据建模
本教程将深入探讨如何在Python中使用XGBoost建模时间序列数据,包括数据准备、
特征工程
和模型训练等方面,并提供相应的代码示例。准备数据在处理时间序列数据之前,首先需要准备数据。
Echo_Wish
·
2024-02-13 05:22
Python
笔记
Python算法
python
算法
开发语言
葫芦书第一章——
特征工程
特征工程
,顾名思义,是对原始数据进行一系列工程处理,将其提炼为特征,作为输入供算法和模型使用。从本
单调不减
·
2024-02-12 22:08
Python建模复习 :
数据挖掘
技术理论
第二部分
数据挖掘
技术理论2.1数据分析方法论KDD知识发现KnowledgeDiscoveryfromDatabase:数据清理、数据集成、数据选择、数据变换(正规化、泛化、离散化)、
数据挖掘
、模式评估
啾啾二一
·
2024-02-12 13:50
XGBoost算法
在
数据挖掘
和数据科学竞赛中,XGBoost因其出色的性能而被频繁使用。例如,在Kaggle平台上的许多获奖方案中,XGBoost都发挥了重要作用。此外,它在处理缺失值和大规模数据集上也有很好的表现。
小森( ﹡ˆoˆ﹡ )
·
2024-02-12 04:11
机器学习算法
算法
人工智能
机器学习
task3
特征工程
1.采用tsfresh工具包提取时间序列特征导入工具包:提取特征:融合之前单变量特征之后,预测变差......哭
1598903c9dd7
·
2024-02-12 01:03
IronWebScraper for net 2024.2.2 Crack
IronWebScraper是一个多功能C#框架,旨在从HTMLWeb应用程序中提取结构化数据,服务于各种目的,例如系统迁移、搜索引擎填充、竞争分析和
数据挖掘
。
sdk大全
·
2024-02-11 22:40
笔记
IronWebScraper
问题驱动结合系统思维搭建有序的知识体系
社会在发展,也许在未来大家都使用爬虫大
数据挖掘
在看问题的时候,这项搜索技能也过时了,但是唯一不会被淘汰的就是解决问题的智慧和思维。1、问题驱动:高效行动的秘密什么是问题驱动?以解决问题出发。
yufawu
·
2024-02-11 21:48
Python
数据挖掘
指南
1、
数据挖掘
和算法
数据挖掘
是从大型数据库的分析中发现预测信息的过程。对于数据科学家来说,
数据挖掘
可能是一项模糊而艰巨的任务-它需要多种技能和许多
数据挖掘
技术知识来获取原始数据并成功获取数据。
代码输入中...
·
2024-02-11 18:59
python
数据挖掘
数据分析
pycharm
task 13 集成学习
蒸汽量预测1.
特征工程
一般流程:1.去掉无用特征2.去掉冗余特征3.利用存在的特征、特征转换、内容中的特征以及其他数据源生成新特征4.特征转换(数值化、类别转换、归一化)5.特征处理(异常值、最大值、最小值
罐罐儿111
·
2024-02-11 17:30
2021-06-10
大数据曾经是野蛮生长的,在利益的驱使下浮华起来;但不可否认,在大数据时代,
数据挖掘
、分析,不仅能从各个
清风徐徐吹来
·
2024-02-11 05:01
机器学习各种算法汇总模板
机器学习算法模板包含了KNN,线性回归,逻辑回归,朴素贝叶斯,决策树,支持向量机,随机森林,kmeans,集成算法各种算法,
特征工程
,评估方式任你选择!!!
怎么菜成这样
·
2024-02-10 22:28
机器学习
机器学习
python
算法
随机森林
支持向量机
Apriori介绍及代码批注
一、Apriori原理解析1.概述关联规则分析是
数据挖掘
中最活跃的研究方法之一,目的是在一个数据集中找到各项之间的关联关系,而这种关系并没有在数据中直接体现出来。
Fishermen_sail
·
2024-02-10 20:45
机器学习
数据挖掘
scikit-learn
python
机器学习
推荐算法
特征工程
:数据平衡
目录一、前言二、正文Ⅰ.基于过采样算法Ⅱ.基于欠采样算法Ⅲ..基于过采样和欠采样的综合算法三、结语一、前言大多数情况下,使用的数据集是不完美的,会出现各种各样的问题,尤其针对分类问题的时候,会出现类别不平衡的问题。例如:在垃圾邮件分类时,垃圾邮件数据会有较少的样本量,从而导致两种类型的邮件数据量差别很大;在欺诈监测数据集中,往往包含的欺诈样本并没有那么多。处理这类数据集的分类的时候,需要对数据集的
林浩杨
·
2024-02-10 18:02
数据探索与可视化
机器学习
python
人工智能
机器学习
算法
数据挖掘
掌握XGBoost:
特征工程
与数据预处理
掌握XGBoost:
特征工程
与数据预处理导言在应用XGBoost模型之前,
特征工程
和数据预处理是至关重要的步骤。良好的
特征工程
和数据预处理可以显著提高模型的性能。
Echo_Wish
·
2024-02-10 17:34
Python算法
Python
笔记
机器学习
python
人工智能
IOBR:一个R包带你走进
数据挖掘
的殿堂
虽然近几年产生了大量的单细胞数据,但bulk数据是基础,是
数据挖掘
之源头,当然作为主打生信主题的公众号生信宝库肯定也会关注对bulk数据的挖掘。
生信宝库
·
2024-02-10 08:36
机器学习系列——(十九)层次聚类
引言在机器学习和
数据挖掘
领域,聚类算法是一种重要的无监督学习方法,它试图将数据集中的样本分组,使得同一组内的样本相似度高,不同组间的样本相似度低。
飞影铠甲
·
2024-02-10 07:47
机器学习
机器学习
聚类
人工智能
2023计算机(AI)领域相关期刊的SCI分区
就在昨天(12月27日)2023年中科院分区表公布,本文总结了有关计算机领域(尤其是AI(机器学习,CV,NLP,
数据挖掘
等))的一些期刊的SCI分区,供大家参考学习。
STLearner
·
2024-02-10 06:08
人工智能
大数据
深度学习
数据挖掘
计算机视觉
论文阅读
机器学习
单细胞
数据挖掘
(10a)-基于FPKM标准化的单细胞差异分析
本笔记来源于B站@生信技能树-jimmy;学习视频链接:「生信技能树」单细胞
数据挖掘
以下内容是我拷贝自学习资料里的markdown文件,作者信息如文件所示。本人在学习的过程中做了一些注释、删减和改动。
北欧森林
·
2024-02-10 06:08
数据挖掘
(Data Mining, uva1591)
本题主要在于理解题意,Q数组可以不连续存储指的是只要公式能够满足即可,不一定有规律的存储。比如,先11个byte存储数据,1个byte空闲,再12个byte存储数据,1个byte空闲。简单计算可以得出K>=Sq*N为充要条件测试数据NortheasternEurope(NEERC)2003//uva1591.cpp#include#include#defineMAXN31intmain(){lon
谭树杰的博客
·
2024-02-10 05:08
成长日志
数据挖掘
uva
OLAP 和
数据挖掘
的关系
从技术角度看,商务智能的过程是企业的决策人员以企业中的数据仓库为基础,经由
数据挖掘
工具、联机分析处理工具加上决策规划人员的专业知识,从数据中获得有用的信息和知识,帮助企业获取更多的利润。
挣扎的菜鸟
·
2024-02-09 18:02
数据库
梯度提升树系列6——GBDT在异常检测领域的应用
目录写在开头1异常检测的基本概念1.1定义和目标1.2GBDT在异常检测中的适用性2信用卡欺诈检测案例分析2.1场景介绍2.2收集数据和
特征工程
2.3进行异常值识别2.4模型效果评估2.5模型优化3策略和技巧
theskylife
·
2024-02-09 14:32
数据挖掘
机器学习
数据挖掘
GBDT
分类
python
机器学习 | 深入集成学习的精髓及实战技巧挑战
算法简介泰坦尼克号乘客生存预测(实操)lightGBM算法简介《绝地求生》玩家排名预测(实操)xgboost算法简介XGBoost全名叫极端梯度提升树,XGBoost是集成学习方法的王牌,在Kaggle
数据挖掘
比赛中
亦世凡华、
·
2024-02-09 10:16
#
机器学习
机器学习
集成学习
人工智能
boosting
xgboost
机器学习系列——(十七)聚类
其中,聚类作为机器学习领域的一个重要分支,广泛应用于
数据挖掘
、模式识别、图像分析等多个领域。本文旨在深入探讨聚类技术的原理、类型及其应用,为读者提供一个全面而深入的了解。一、什么是聚类?
飞影铠甲
·
2024-02-09 09:08
机器学习
机器学习
聚类
人工智能
【深度学习:掌握监督学习】掌握监督学习综合指南
基本概念主要组件:输入要素和目标标签训练监督式学习模型监督学习算法的类型分类回归每个类别中的流行算法示例监督学习的数据预处理数据清洗数据转换数据缩减
特征工程
概念简介及其对模型性能的影响模型评估和验证评估和验证监督学习模型的重要性常见评估指标概述模型评估技术挑战和未来方向监督
jcfszxc
·
2024-02-09 09:11
深度学习知识专栏
深度学习
学习
人工智能
图论与图数据应用综述:从基础概念到知识图谱与图智能
1.3邻接矩阵2探索图的高级概念2.1最短路径的关键性2.2图的直径与平均路径的意义2.3循环与路径类型的多样性3深入探讨图的广泛应用领域3.1知识图谱的知识管理3.2图智能在复杂决策中的应用3.3图
数据挖掘
与分析的多领域应用
cooldream2009
·
2024-02-09 08:08
AI技术
知识图谱
图论
知识图谱
人工智能
数据挖掘
应用领域
目前
数据挖掘
在各行各业应用广泛,尤其在金融、保险、电子商务和电信方面得到了很好的效果,下面简单阐述一下在金融行业
数据挖掘
的应用。
Liam_ml
·
2024-02-09 06:50
Titanic - 1
复习一下,完成这篇分析报告需要进行的几个步骤:一、导入数据包与数据集二、数据分析1、总体预览2、描述性统计分析:使用统计学与绘图,初步了解数据之间相关性,为构造
特征工程
和模型建立做准备3、数据清洗4、建模与优
silent_eyes_77
·
2024-02-09 04:30
数据挖掘
——
特征工程
文章目录
特征工程
3.3.1删除异常值3.3.2特征构造批量处理时间数据1.归一化2.标准化3.3.3特征筛选
特征工程
在EDA中我们更多的操作是针对数据本身与分析而
特征工程
是针对数据的进一步处理来最终选择出我们模型中需要的特征
run_session
·
2024-02-09 01:18
Kaggle
python
机器学习
数据分析
什么是
数据挖掘
文章目录什么是
数据挖掘
1.分类问题2.聚类问题3.回归问题
数据挖掘
相关的标准库
数据挖掘
模型训练分类问题聚类问题回归问题关联问题模型集成模型评估评估指标混淆矩阵与标准率指标泛化能力评估什么是
数据挖掘
数据挖掘
就是寻找数据中隐含的知识并用于生产产业价值
菜鸟长安
·
2024-02-09 01:44
python基础
数据挖掘
python
人工智能
特征工程
:特征提取、特征预处理、特征选择
一、特征提取1.字典特征提取sklearn.feature_extraction.DictVectorizer(sparse=True,…)dict=DictVectorizer(sparse=False)data=dict.fit_transform([{'city':'北京','temperature':100},{'city':'上海','temperature':60},{'city':'
xiaobai_IT_learn
·
2024-02-09 00:02
人工智能
python
特征工程
特征提取
特征预处理
特征选择
特征工程
:衡量特征的重要型
知乎特征选择:https://zhuanlan.zhihu.com/p/32749489结合sklearn的几种特征选择方法:https://www.cnblogs.com/hhh5460/p/5186226.html结合sklearn的几种特征选择方法2:https://blog.csdn.net/bryan__/article/details/51607215
千寻~
·
2024-02-09 00:32
数据处理
机器学习
特征工程
特征选择
特征工程
:特征构建
前言二、正文Ⅰ.分类特征重新编码①分类特征②离散特征③多标签类别编码Ⅱ.数值特征重新编码①多项式②多个变量的多项式特征Ⅲ.文本数据的特征构建①文本词频条形图②词袋模型③TF-IDF矩阵三、结语一、前言
特征工程
中的特征构建的主要目的是生成新的特征
林浩杨
·
2024-02-09 00:31
数据探索与可视化
机器学习
数据分析
python
机器学习
算法
特征工程
:特征提取和降维-下
目录一、前言二、正文Ⅰ.流形学习Ⅱ.t-SNEⅢ.多维尺度分析三、结语一、前言通过上篇对线性与非线性的数据的特征提取和降维的学习之后,我们来介绍其他方法,分别有流行学习、多维尺度分析、t-SNE。二、正文Ⅰ.流形学习流形学习是借鉴拓扑流形的概念的一种降维的方法。用于数据降维,降到二维或者三维时可以对数据进行可视化。因为流形学习利用近邻的距离来计算高维空间的样本距离,所以近邻个数对其降维的结果影响甚
林浩杨
·
2024-02-09 00:31
数据探索与可视化
机器学习
人工智能
数据分析
python
算法
特征工程
:特征提取和降维-上
目录一、前言二、正文Ⅰ.主成分分析Ⅱ.核主成分分析三、结语一、前言前面介绍的特征选择方法获得的特征,是从原始数据中抽取出来的,并没有对数据进行变换。而特征提取和降维,则是对原始数据的特征进行相应的数据变换,并且通常会选择比原始特征数量少的特征,同时达到数据降维的目的。常用的数据特征提取和降维的方法有主成分分析,核成分分析,流行学习,t-SNE,多维尺度分析等方法。二、正文fromsklearn.d
林浩杨
·
2024-02-09 00:01
数据探索与可视化
机器学习
人工智能
机器学习
算法
python
数据分析
特征工程
:特征选择
目录一、前言二、正文Ⅰ.基于统计方法的特征选择Ⅱ.基于递归消除特征发Ⅲ.基于机器学习的方法三、结语一、前言特征选择是使用某些特征统计的方法,从数据中选出有用的特征,把数据中无用的特征抛弃掉,该方法不会产生新的特征,常用的方法有基于统计方法的特征选择、利用地柜消除法选择有用的特征、利用机器学习算法选择重要的特征等。二、正文Ⅰ.基于统计方法的特征选择fromsklearn.feature_select
林浩杨
·
2024-02-09 00:00
数据探索与可视化
机器学习
人工智能
数据分析
Task 4:建模调参
Datawhale零基础入门
数据挖掘
-Task4建模调参四、建模与调参4.1学习目标了解常用的机器学习模型,并掌握机器学习模型的建模与调参流程完成相应学习打卡任务4.2内容介绍线性回归模型:线性回归对于特征的要求
我是曾阿牛
·
2024-02-08 13:36
每天一个数据分析题(一百五十五)
D.在
数据挖掘
的实践中,最佳实践是建立一个包含所有变量的大模型来处理不同情况。题目来源于CDA模拟题库点击此处获取
紫色沙
·
2024-02-08 09:20
数据分析题库
数据分析
数据挖掘
机器学习:
特征工程
笔记
在实践中,收集到的数据往往是不完整、含有噪声和不一致的,这对模型的性能构成挑战,因为其很大程度上依赖于输入数据的质量,因此,
特征工程
应运而生。
Ningbo_JiaYT
·
2024-02-08 07:09
机器学习
机器学习
算法
笔记
机器学习:朴素贝叶斯笔记
朴素贝叶斯(NaiveBayes)是一种基于贝叶斯定理的简单概率分类算法,广泛应用于机器学习和
数据挖掘
中。
Ningbo_JiaYT
·
2024-02-08 07:39
机器学习
机器学习
笔记
分类算法
【最大似然估计】详解概率论之最大似然估计
个人主页:有梦想的程序星空个人介绍:小编是人工智能领域硕士,全栈工程师,深耕Flask后端开发、
数据挖掘
、NLP、Android开发、自动化等领域,有较丰富的软件系统、人工智能算法服务的研究和开发经验。
程序遇上智能星空
·
2024-02-08 05:22
深入浅出讲解自然语言处理
机器学习
概率论
机器学习
算法
收藏 | 统计学最全思维导图,附下载链接
众所周知,「统计学」是深入理解「机器学习/
数据挖掘
」的重要基础学科。
一木Campus
·
2024-02-08 04:12
docker数据科学与spark镜像源与使用常见问题疑难解答
以下是一些与
数据挖掘
和数据科学相关的Docker镜像源:jupyter/all-spark-notebook:此镜像包含JupyterNotebook和Spark的完整环境,用于Spark开发和学习。
DreamNotOver
·
2024-02-08 01:16
eureka
java
spring
cloud
梯度提升树系列3——利用GBDT进行回归分析
房价预测模型案例研究2.1数据准备和预处理2.2模型构建和评估方法2.3具体代码3模型调优和评估3.1参数调优的详细策略3.2模型性能评估的详细方法3.3模型优化3.4可视化写在最后写在开头回归分析在
数据挖掘
领域扮演着至关重要的角色
theskylife
·
2024-02-07 23:58
数据挖掘
回归
数据挖掘
人工智能
解析基于检索排序的知识图谱问答系统
实体链接的关键性2.4路径的构建与系统优化3难点与挑战3.1实体链接、命名实体识别和消歧3.2排序模型的挑战4优势4.1框架的灵活性4.2容易整合的端到端网络优化4.3综合运用排序模型5劣势5.1依赖
特征工程
cooldream2009
·
2024-02-07 22:40
AI技术
NLP知识
知识图谱
知识图谱
人工智能
问答技术
检索排序
【MATLAB】使用梯度提升树在回归预测任务中进行特征选择(深度学习的数据集处理)
此外,特征选择可以帮助理解数据,并为进一步的
特征工程
提供指导,有效地提高模型的预测性能。梯度提升树(GBT)是一种强大的监督学习算法,常用于回归和分类问题。通过利用多棵决策树的集成学
编程到天明
·
2024-02-07 15:59
MATLAB
matlab
深度学习
梯度提升树
特征选择
大数据应用工具有哪些
大数据分析工具:RapidMiner在世界范围内,RapidMiner是比较领先的一个
数据挖掘
的解决方案。很大程度上,RapidMiner有比较先进的技术。
QFdongdong
·
2024-02-07 14:40
01 数据分析与可视化概述
数据挖掘
则指的是从大量的,不完全的,有噪声的,模糊的和随机的实际应用数据中,通过应用聚合,分类,回归和关联规则等技术,挖掘潜在价值的过程。数据分析有狭义和广义之分。
flysh05
·
2024-02-07 12:07
Python
数据分析
数据挖掘
python
教程:教你一个简单快速能够掌握监督学习算法的方法
监督学习作为运用最广泛的机器学习方法,一直以来都是从
数据挖掘
信息的重要手段。即便是在无监督学习兴起的近日,监督学习也依旧是入门机器学习的钥匙。这篇监督学习教程适用于刚入门机器学习的小白。
妄心xyx
·
2024-02-07 11:52
金融信贷风控业务详解
带大家以全新的角度了解风控,包括风控信贷业务讲解、风控决策树、风控决策流、
特征工程
、三方数据对比和风控系统搭建等一系列知识。
RobinCode
·
2024-02-07 11:48
风控系统
金融
java
上一页
1
2
3
4
5
6
7
8
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他