E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
数据挖掘-特征选择
盘点算法比赛中常见的AutoEDA工具库
在完成竞赛和
数据挖掘
的过程中,数据分析一直是非常耗时的一个环节,但也是必要的一个环节。能否使用一个工具代替人来完成数据分析的过程呢,现有的AutoEDA工具可以一定程度上完成上述过程。
Python数据开发
·
2023-10-26 03:31
学习笔记
算法
特征工程-特征预处理
特征工程-DataPreProcessing(数据预处理)-FeatureExtraction(特征提取)-FeatureSelection(
特征选择
)-Featureconstruction(特征构造
maybelillian_gu
·
2023-10-26 00:02
初学Python
因为机缘巧合转到审计岗位几年之后,完成了中级会计的考试,决定想着
数据挖掘
和处理方向发展,努力在审计的大数据方面习得一些特长,避免冲着所有人都去的CPA方向发展。
a9a77229c1a6
·
2023-10-25 23:28
信息检索与
数据挖掘
| 【实验】排名检索模型
文章目录实验内容相关概念实验步骤分词预处理构建倒排索引表计算query和各个文档的相似度queries预处理及检索函数对输入的文本进行词法分析和标准化处理检索函数调试结果实验内容在Experiment1的基础上实现最基本的RankedretrievalmodelInput:aquery(likeRonWeasleybirthday)Output:ReturnthetopK(e.g.,K=100)r
啦啦右一
·
2023-10-25 19:34
#
信息检索与数据挖掘
大数据与数据分析
数据挖掘
人工智能
基于机器学习与大数据的糖尿病预测 计算机竞赛
文章目录1前言1课题背景2数据导入处理3数据可视化分析4
特征选择
4.1通过相关性进行筛选4.2多重共线性4.3RFE(递归特征消除法)4.4正则化5机器学习模型建立与评价5.1评价方式的选择5.2模型的建立与评价
Mr.D学长
·
2023-10-25 14:16
python
java
【尘缘赠书活动:01期】Python
数据挖掘
——入门进阶与实用案例分析
更多详细内容请参考**《Python
数据挖掘
:入门进阶与实用案例分析》**一书。1案例背景为了更好地监测用电设备的能耗情况,电力分项计量技术随之诞生。
尘缘..
·
2023-10-25 13:23
赠书活动
python
数据挖掘
开发语言
人工智能
数据库
数据挖掘
和大数据的区别
数据挖掘
一般用于对企业内部系统的数据库进行筛选、整合和分析。操作对象是数据仓库,数据相对有规律,数据量较少。大数据一般指对互联网中杂乱无章的数据进行筛选、整合和分析。
秋不溜啾
·
2023-10-25 12:54
数据库
1024程序员节
大数据
数据挖掘
安装Python及爬虫入门介绍
一.大数据及
数据挖掘
基础第一部分主要简单介绍三个问题(觉得无聊的直接调至第二部分):1、什么是大数据?2、什么是
数据挖掘
?3、大数据和
数据挖掘
的区别?
进击的雷神
·
2023-10-25 09:42
selenium
1024程序员节
python
基于Python制作一个动物识别小程序
目录引言研究背景目的与意义动物识别技术概述基本原理图像处理与特征提取机器学习与深度学习方法数据集与数据预处理数据收集与构建数据预处理步骤数据增强技术特征提取与选择基础特征提取方法
特征选择
与降维引言研究背景动物识别是计算机视觉和模式识别领域的重要研究方向
无语猫子
·
2023-10-25 08:41
python
开发语言
图像处理
scrapy的安装和使用
一、scrapy是什么:Scrapy是一个为了爬取网站数据,提取结构性数据而编写的应用框架,可以应用在包括
数据挖掘
,信息处理或存储历史数据等一系列的程序二、scrapy的安装:pipinstallscrapy-ihttps
马龙强_
·
2023-10-24 23:43
1024程序员节
基于大数据的社交平台数据爬虫舆情分析可视化系统 计算机竞赛
文章目录0前言1课题背景2实现效果**实现功能****可视化统计****web模块界面展示**3LDA模型4情感分析方法**预处理**特征提取
特征选择
分类器选择实验5部分核心代码6最后0前言优质竞赛项目系列
Mr.D学长
·
2023-10-24 23:36
python
java
数据挖掘
算法原理与实践:数据预处理
目录第1关:标准化相关知识为什么要进行标准化Z-score标准化Min-max标准化MaxAbs标准化代码文件第2关:非线性转换相关知识为什么要非线性转换映射到均匀分布映射到高斯分布Yeo-Johnson映射Box-Cox映射代码文件第3关:归一化相关知识为什么使用归一化L1范式归一化L2范式归一化代码文件第4关:离散值编码相关知识LabelEncoderOneHotEncoder代码文件第5关:
01==零壹
·
2023-10-24 20:46
机器学习
1024程序员节
机器学习
数据预处理
CRM销售管理系统:如何精细化管理客户
管理者则可以根据
数据挖掘
业务发展趋势。在销售过程中,销售人员全面了解并记录客户的相关信息,建立良好的关系,并在系统上与其他
TICKI™
·
2023-10-24 16:03
1024程序员节
用 Rust 和 cURL 库制作一个有趣的爬虫
爬虫技术广泛应用于搜索引擎、
数据挖掘
、信息
小小卡拉眯
·
2023-10-24 15:28
1024程序员节
机器学习学习笔记 1 Bagging模型
每个基模型可以分别、独立、互不影响地生成最典型的代表就是随机森林随机:数据采样随机,
特征选择
随机森林:很多决策树并行放在一起由于二重随机性,使得每个树基本上都不会一样,最终的结果也会不一样之所以随机选择
锋锋的快乐小窝
·
2023-10-24 09:17
机器学习学习笔记
机器学习
笔记
决策树
【Java】智慧工地云SaaS源码,AI服务器、硬件设备讲解视频
智慧工地是指运用信息化手段,通过三维设计平台对工程项目进行精确设计和施工模拟,围绕施工过程管理,建立互联协同、智能生产、科学管理的施工项目信息化生态圈,并将此数据在虚拟现实环境下与物联网采集到的工程信息进行
数据挖掘
分析
源码技术栈
·
2023-10-24 07:47
智慧工地云平台源码
智慧工地APP
智慧工地源码
智慧工地平台
智慧工地云平台
智慧工地管理
危大工程
智慧工地项目
第七届
数据挖掘
、通信与信息技术国际会议征稿通知(DMCIT 2023)
重要信息会议网址:第七届
数据挖掘
、通信与信息技术国际会议会议时间:2023年5月26-28日召开地点:中国-重庆截稿时间:2023年3月30日录用通知:投稿后1-2周收录检索:EI/Scopus会议简介
MeetConf学术会议
·
2023-10-24 06:42
会议
数据挖掘
人工智能
信息与通信
机器学习全套教程(五)-- 特征降维
Python爬虫人工智能教程:www.python88.cn编程资源网:www.python66.cn2.5特征降维学习目标目标知道
特征选择
的嵌入式、过滤式以及包裹氏三种方式应用VarianceThreshold
python爬虫人工智能大数据
·
2023-10-24 02:13
机器学习
深度学习
数据分析
python
特征工程之
特征选择
(6)----降维算法PCA初探
文章目录维度的概念降维的目的:PCA的信息衡量指标----可解释性方差降维过程简述降维算法与前面的
特征选择
算法的区别sklearn中的降维算法示例导入相关库提取特征和标签降维探索降维后的数据总结维度的概念对于
iostreamzl
·
2023-10-24 02:43
机器学习
#
sklearn
python
机器学习
数据分析
特征工程
新星计划
特征选择
与降维2--降维
特征选择
与降维2–降维什么是降维?降维是通过获得一组基本上是重要特征的主变量来减少所考虑的特征变量的过程。
TKE_manman
·
2023-10-24 01:11
大数据学习
大数据
pca降维
机器学习(3)--特征工程之数据降维
三、降维这里的维度指降低特征的数量【这里的降维不是指数组的维度】方式:1.
特征选择
2.主成分分析3.神经网络【之后补充,它也有降维的作用】1.
特征选择
特征选择
原因冗余:部分特征的相关度高,容易消耗计算性能噪声
Ona_Soton
·
2023-10-24 01:09
机器学习
机器学习
python
概率论
数据集-特征降维
如果特征本身存在问题或者特征之间相关性较强,对于算法学习预测会影响较大1.2、降维的两种方式
特征选择
主成分分析(可以理解一种特征提取的方式)2、什么是
特征选择
2.1
靓仔写sql
·
2023-10-24 01:08
机器学习
scikit-learn
机器学习
组间差异分析神器-STAMP | 分析技能
那么,该如何根据自己的数据
特征选择
不同的差异统计方法并获得相应的差异分析结果呢?今天将给大家介绍一款简单实用的组间差异分析软件-STAMP,而且该软件分析获得的图片可直接用于文章的发表。
斗战胜佛oh
·
2023-10-23 15:27
数据挖掘
之时间序列模型(最全流程分析)
时间序列模型一、获取数据源二、缺失值处理三、检验序列的稳定性四、序列平稳化五、参数寻优六、建立模型七、模型检验八、模型预测美股封盘(close)数据获取数据源—>缺失值处理—>检验数据稳定性—>序列平稳—>参数寻优—>建立模型—>模型检验—>模型预测一、获取数据源#以谷歌美股封盘数据来构建时间序列模型|导入库包frompandas_datareaderimportdatafromstatsmode
Cold姜
·
2023-10-23 11:40
Python
数据挖掘
数据挖掘
时序模型
机器学习
python
数据可视化技术是指运用计算机,计算机图形技术在数据计算方面的应用
李震摘要:本文探讨了交互式计算机图形技术,分析了可视化技术在
数据挖掘
中的应用,研究了可视化
数据挖掘
模型的构建,希望能够为相关工作者带来一定的参考,打造更加安全可靠的网络环境。
weixin_39750598
·
2023-10-23 10:45
数据可视化技术是指运用计算机
信息检索与
数据挖掘
| (五)文档评分、词项权重计算及向量空间模型
目录词项频率及权重计算词项频率逆文档频率tf-idf权重计算向量空间模型余弦相似度查询向量向量相似度计算其他tf-idf权值计算方法tf的亚线性尺度变换方法基于最大值的tf归一化文档权值和查询权重机我们需要一种方法分配一个分数,如果查询项不出现在文档,分数应该是0,更频繁的查询项的文档,分数越高。在文档集规模很大的情况下,满足布尔查询的结果文档数量可能非常多,往往会大大超过用户能够浏览的文档数目。
啦啦右一
·
2023-10-23 10:07
#
信息检索与数据挖掘
大数据与数据分析
数据挖掘
人工智能
四川大学软件学院|
数据挖掘
课程|期末复习
基本概念
数据挖掘
从数据源中探寻有用的模式(Pattern)或知识的过程。机器学习机器学习是对能通过经验自动改进的计算机算法的研究,是用数据或以往的经验,以此优化计算机程序的性能标准。
油条生煎
·
2023-10-23 06:52
数据挖掘
机器学习
人工智能
数据挖掘
概述
数据挖掘
:是数据库知识发现(KDD)中的一个步骤,一般指大量数据中通过算法自动发现隐藏于其中的信息和知识的过程。大数据的5V特点:实时性、多样性、价值大、真实性、体量大。
菜鸟一千零八十六号
·
2023-10-23 05:24
数据挖掘
数据分析
机器学习(一)Spark机器学习基础
文章目录1.Spark机器学习基础1.0机器学习和大数据的区别和联系1.1机器学习引入1.2机器学习三次浪潮1.3人工智能领域基础概念区别1.3.1人工智能、机器学习、深度学习关系1.3.2数据分析、
数据挖掘
基本概念区别
大模型Maynor
·
2023-10-23 03:22
#
机器学习
机器学习
spark
人工智能
今天头条月入百万背后的真相竟然是!
今日头条是北京字节跳动科技有限公司开发的一款基于
数据挖掘
的推荐引擎产品,为用户推荐信息,提供连接人与信息的服务的产品。
小智他爸
·
2023-10-23 02:07
解读大数据与Hadoop之间的关系
大数据,一种新兴的
数据挖掘
技术,它正在让数据处理和分析变得更便宜更快速。随着它的重要性,越来越多的人开始学习大数据或者进行相关培训。
qunqun8889
·
2023-10-23 01:05
大数据
大数据
大数据开发
大数据学习
大数据分析
Hadoop
UCAS - AI学院 - 自然语言处理专项课 - 第13讲 - 课程笔记
信息抽取概述互联网和社交媒体快速发展文本信息资源极大丰富信息过载问题日益显现高效准确的信息获取手段成为必需(文本)信息抽取技术应运而生非结构化文本数据占据约80%信息抽取从非结构化、半结构化的自然语言文本中抽取实体、实体属性、实体间的关系以及事件等事实信息,并形成结构化数据输出的一种文本
数据挖掘
技术信息抽取
支锦铭
·
2023-10-23 01:34
UCAS-课程笔记
自然语言处理
人工智能
TCGA
数据挖掘
(3):miRNA数据的下载
knitr::opts_chunk$set(collapse=TRUE,comment="#>")knitr::opts_chunk$set(fig.width=6,fig.height=6,collapse=TRUE)knitr::opts_chunk$set(message=FALSE)本文的内容是用GDC下载并整理表达矩阵和临床信息数据。1.从网页选择数据,下载manifest文件数据存放网
呆呱呱
·
2023-10-22 19:09
用户画像相关的
3.
数据挖掘
;构建智能推荐系统,利用关联规则计算,喜欢这类平台的投资人还喜欢那些平台,用户喜欢看这些明星文章还喜
行李箱向日葵
·
2023-10-22 18:07
利用jupyter进行分类
数据准备:准备数据集,包括数据清洗、
特征选择
和标签编码。确保数据集包含特征(自变量)和目标变量(因变量)
猫一样的女子245
·
2023-10-22 13:31
jupyter
分类
ide
NLP task3
特征选择
_文本挖掘预处理之TF-IDF
文本挖掘预处理之TF-IDFcorpus=[“IcometoChinatotravel”,“ThisisacarpoluparinChina”,"IloveteaandApple",“Theworkistowritesomepapersinscience”][u’and’,u’apple’,u’car’,u’china’,u’come’,u’in’,u’is’,u’love’,u’papers’,
沐漜
·
2023-10-22 12:53
NLP
NLP
TF-IDF
文本挖掘
自然语言处理时,通常的文本清理流程是什么?
我们的文本基本都是网络文本,主要是网页html的形式,网页中存在很多不必要的信息,比如说一些广告、导航栏,html、JS代码,注释等等,无用的价值信息,可以合理的清理掉,如果需要正文提取,可以利用标签用途、标签密度判定、
数据挖掘
思想
一抹斜阳尽余辉
·
2023-10-22 12:16
人工智能
自然语言处理
时空
数据挖掘
数据挖掘
已经成为当代显学,只要是个公司可能都需要
数据挖掘
,由此也衍生除了金融
数据挖掘
、生物
数据挖掘
、时空
数据挖掘
、XX
数据挖掘
。那到底什么是
数据挖掘
呢?
擎码
·
2023-10-22 08:51
想用数字可视化工具看看这三款就够了
Excel融合分析、自然语言分析、自助仪表盘是Smartbi的特色功能,可以满足最终用户在企业级报表、数据可视化分析、自助探索分析、
数据挖掘
建模、AI智能
枝上棉蛮
·
2023-10-22 05:07
数据可视化
数字孪生
服务器
3d
前端
大数据
数据库开发
探索大数据时代的关键技术:
数据挖掘
、可视化和数据仓库
文章目录大数据和数据分析技术引言
数据挖掘
数据可视化数据仓库结论我是廖志伟,一名Java开发工程师、Java领域优质创作者、CSDN博客专家、51CTO专家博主、阿里云专家博主、清华大学出版社签约作者、产品软文创造者
我是廖志伟
·
2023-10-22 05:32
#
博主活动
大数据
数据挖掘
数据仓库
这是一个小“废”贴
我的学习目录一,数据处理Pandas数据处理二,机器学习上课进度及练习应用部分生成自己的数据集广义线性模型交叉验证:评估估算器的表现计算f1_score数据降维
特征选择
集成学习1,k-邻近算法2,线性回归
壮壮不太胖^QwQ
·
2023-10-22 04:16
算法
数据库
决策树
机器学习
sql
到底什么才是大数据开发?
大数据作为时下火热的IT行业的词汇,随之而来的数据开发、数据仓库、数据安全、数据分析、
数据挖掘
等等围绕大数据的商业价值的利用逐渐成为行业人士争相追捧的利润焦点。
金光闪闪耶
·
2023-10-22 04:47
数据异常值检测
14种数据异常值检验的方法浅谈
数据挖掘
中的数据处理(缺失值处理以及异常值检测)删除异常值方法总结
扫寰宇
·
2023-10-22 02:21
python
聚类分析 | 聚类分析(K-means、层次聚类、密度聚类、高斯混合模型)
聚类算法在
数据挖掘
、模式识别、图像分析等领域具有重要应用。聚类算法的作用在于发现数据的内在结构和规律,将数据进行分组,从而帮助我们理解数据的特征和相互关系。
码农腾飞
·
2023-10-22 02:52
聚类分析算法(CLA)
kmeans
聚类
层次聚类
密度聚类
高斯混合模型
6. 常见降维算法原理与Python实现
常见方法2.1SVD2.2PCA2.3LDA2.4LLE2.5降维理解三、SVD3.1概念3.2原理3.3实现四、PCA4.1概念4.2原理4.4实现五、LDA5.1概念5.2原理5.3实现5.4小结六、
特征选择
与降维一
许久是混子
·
2023-10-21 22:47
数据挖掘
数据预处理
python
算法
机器学习
数据分析
数据挖掘
python sklearn安装_SKLearn安装
一、sklearn简介sklearn(scikit-learn)是基于Python语言的机器学习工具具有如下特点:简单高效的
数据挖掘
和数据分析工具可供大家在各种环境中重复使用建立在NumPy,SciPy
weixin_39679370
·
2023-10-21 19:38
python
sklearn安装
Python自动化办公之PDF版本发票识别并提取关键信息实战教程(中篇)
点击上方“Python爬虫与
数据挖掘
”,进行关注回复“书籍”即可获赠Python从入门到进阶共10本电子书今日鸡汤军书十二卷,卷卷有爷名。大家好,我是皮皮。
Python进阶者
·
2023-10-21 13:06
python
自动化
pdf
开发语言
运维
Pandas怎样设置处理后的第一行为索引?
点击上方“Python爬虫与
数据挖掘
”,进行关注回复“书籍”即可获赠Python从入门到进阶共10本电子书今日鸡汤愿为市鞍马,从此替爷征。大家好,我是皮皮。
Python进阶者
·
2023-10-21 13:06
pandas
Python自动化办公之PDF版本发票识别并提取关键信息实战教程(下篇)
点击上方“Python爬虫与
数据挖掘
”,进行关注回复“书籍”即可获赠Python从入门到进阶共10本电子书今日鸡汤阿爷无大儿,木兰无长兄。大家好,我是皮皮。
Python进阶者
·
2023-10-21 13:06
python
自动化
pdf
开发语言
运维
使用Python指定列提取连续6位数据的单号(上篇)
点击上方“Python爬虫与
数据挖掘
”,进行关注回复“书籍”即可获赠Python从入门到进阶共10本电子书今日鸡汤东市买骏马,西市买鞍鞯。大家好,我是皮皮。
Python进阶者
·
2023-10-21 13:01
上一页
24
25
26
27
28
29
30
31
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他