E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
数据挖掘#特征工程
【小沐学NLP】Python实现TF-IDF算法(nltk、sklearn、jieba)
nltk)2.3TF-IDF(Jieba)2.4TF-IDF(python)结语1、简介TF-IDF(termfrequency–inversedocumentfrequency)是一种用于信息检索与
数据挖掘
的常用加权技术
爱看书的小沐
·
2024-01-01 00:26
Python
AI
python
自然语言处理
tf-idf
jieba
nltk
sklearn
分词
解密垃圾邮件分类:基于SVM的
数据挖掘
项目
垃圾邮件(Spam)的泛滥成灾一直是电子邮件系统中的一个严峻问题。随着垃圾邮件技术的不断演变,传统的过滤方法逐渐显得力不从心。因此,本项目旨在利用支持向量机(SVM)这一强大的机器学习工具,实现对垃圾邮件的高效分类,为用户提供更清爽、高效的电子邮件体验。一、项目目标本项目的主要目标是构建一个基于SVM的垃圾邮件分类系统。通过对两个不同来源的数据集(trec和enron)进行综合分析和处理,我将展示
袁既望
·
2023-12-31 21:24
数据挖掘
分类
支持向量机
30个最受欢迎的
数据挖掘
面试问题答案-第1部分
本文将给大家介绍30个热门
数据挖掘
面试问题答案。这些问题在数据科学访谈中经常被问到。此外,这个热门面试问题
数据挖掘
答案包含的问题的答案,以帮助您破解数据科学家工作的面试。
栀子花_ef39
·
2023-12-31 18:54
【亚马逊云科技】使用Amazon Lightsail快速建站
本人的技术路线从Java全栈工程师一路奔向大数据开发、
数据挖掘
领域,如今终有小成,愿将昔日所获与大家交流一二,希望对学习路上的你有所助益。
一头小山猪
·
2023-12-31 17:57
征文联动
#
亚马逊云
aws
亚马逊云
快速建站
计算机毕业设计 基于SpringBoot的高校竞赛管理系统的设计与实现 Java实战项目 附源码+文档+视频讲解
博主介绍:✌从事软件开发10年之余,专注于Java技术领域、Python人工智能及
数据挖掘
、小程序项目开发和Android项目开发等。
IT学长编程
·
2023-12-31 16:15
计算机毕业设计1000套
毕业设计
毕业论文
课程设计
Java
spring
boot
idea
MySQL
计算机毕业设计 基于SpringBoot的高校危化试剂仓储管理系统的设计与实现 Java实战项目 附源码+文档+视频讲解
博主介绍:✌从事软件开发10年之余,专注于Java技术领域、Python人工智能及
数据挖掘
、小程序项目开发和Android项目开发等。
IT学长编程
·
2023-12-31 16:15
计算机毕业设计1000套
毕业设计
毕业论文
课程设计
Java
SpringBoot
Vue
计算机毕业设计 基于HTML5+CSS3的在线英语阅读分级平台的设计与实现 Java实战项目 附源码+文档+视频讲解
博主介绍:✌从事软件开发10年之余,专注于Java技术领域、Python人工智能及
数据挖掘
、小程序项目开发和Android项目开发等。
IT学长编程
·
2023-12-31 16:11
计算机毕业设计1000套
html5
毕业论文
毕业设计
课程设计
Java
css3
Coursera上10个值得去学习的机器学习课程(有字幕)
本课程为你提供有关机器学习、
数据挖掘
和统计模式识别的广泛介绍。本课程详细讨论了机器学习所需的所有数学知识。本课程使用开源编程语言Octave。Octave提供了一种理解机器学习基础
加百力
·
2023-12-31 15:24
深度学习
学习
机器学习
人工智能
【Python机器学习系列】一文带你了解机器学习中的Pipeline管道机制(理论+源码)
引言对于表格数据,一套完整的机器学习建模流程如下:背景知识1:机器学习中的学习器【Python机器学习系列】一文搞懂机器学习中的转换器和估计器(附案例)背景知识2:机器学习中的管道机制简介:转换器用于数据的预处理和
特征工程
数据杂坛
·
2023-12-31 14:36
机器学习
python
机器学习
开发语言
【Python
特征工程
系列】教你利用XGBoost模型分析特征重要性(源码)
这是Python
特征工程
系列原创文章,我的第186篇原创文章。一、问题应用背景介绍:如果有一个包含数十个甚至数百个特征的数据集,每个特征都可能对你的机器学习模型的性能有所贡献。
数据杂坛
·
2023-12-31 14:34
特征工程
python
机器学习
人工智能
【2023最新】Scrapy框架教程一-Scrapy的创建与启动及Scrapy基础命令
它可以被使用用途广泛,从
数据挖掘
到监控和自动化测试。scrapy官网学习网址:https://docs.scrapy.org/e
大聪明_花
·
2023-12-31 14:32
Scrapy
scrapy
python
爬虫
讨论k值以及初始聚类中心对聚类结果的影响_K均值聚类需要标准化数据吗
摘要:进入二十一世纪以来,科学技术的不断发展,使得
数据挖掘
技术得到了学者越来越多的关注。
数据挖掘
是指从数据库中发现隐含在大量数据中的新颖的、潜在的有用信息和规则的过程,是一种处理数据库数据的知识发现。
是空空呀
·
2023-12-31 12:33
聚类
均值算法
【12月比赛合集】22场可报名的
数据挖掘
大奖赛,任君挑选!
CompHub[1]实时聚合多平台的数据类(Kaggle、天池…)和OJ类(Leetcode、牛客…)比赛。本账号会推送最新的比赛消息,欢迎关注!以下信息仅供参考,以比赛官网为准目录Kaggle(5场比赛)阿里天池(3场比赛)ZINDI(2场比赛)和鲸(Heywhale)(1场比赛)BaiduAIStudio(3场比赛)DataCastle(3场比赛)华为云(1场比赛)AIcrowd(2场比赛)C
CompHub
·
2023-12-31 10:30
人工智能
数据挖掘
算法
java
开发语言
九-1.聚类分析
聚类通常作为其他
数据挖掘
或建模的前奏一.特征认知1.有监督无监督分类:有监督学习(有标签学习)数据特征聚类:无监督学习(没有标签)数据特征2.聚类概念聚类是把各不相同的个体分割为有更多相似性子集合的工作
唐-import-某人
·
2023-12-31 08:46
机器学习
python
机器学习
聚类
SEER数据库系列|SEER
数据挖掘
文章有哪些研究模式
SEER数据的大规模数据优势是无可比拟的。大规模的病例数还可以减轻病理学诊断的少数或随机错误分类的影响。SEER依靠实验室的质量规范来最大程度地减少此类错误肿瘤发病率的研究SEER能发现一些无法通过简单的估计病例数和频数分布得出的结论。率(rates)告诉我们的是某个地区个体的发病率。而百分比(Percentages)只是告诉我们特定时间点上特定癌症的数量占所有癌症的比例。即使在从人群中收集每种癌
医科研
·
2023-12-31 06:48
大数据应用发展史:从搜索引擎时代到机器学习时代
文章目录搜索引擎时代数据仓库时代
数据挖掘
时代机器学习时代小结大数据技术的使用经历了一个发展过程从最开始的Google在搜索引擎中开始使用大数据技术,到现在无处不在的各种人工智能应用,伴随着大数据技术的发展
善守的大龙猫
·
2023-12-31 05:11
大数据
大数据
我体验了《怪物猎人:崛起》五月新版本后,发现新主线boss蛮有趣
值得一提的是:博士在四月末和大家分享了文章《在的后续游戏更新中,这五只魔物可能会出现》,其中玩家们通过
数据挖掘
的方式“预测”的新怪物已经全部应验!
爱游戏的萌博士
·
2023-12-31 01:28
CDA level1 学习笔记(已通过考试)
数据挖掘
:是一个跨学科的计算机科学分支,它是用人工智能、机器学习、统计学和数据库的交叉方法在
Sunshinetongtong856
·
2023-12-31 00:15
学习
笔记
big
data
数据分析
你为什么需要考研
比如,
数据挖掘
的知识,研究生懂很多,本科生基
Lio5n
·
2023-12-30 21:09
基于
数据挖掘
的会务管理系统-计算机毕业设计源码84883
摘要随着计算机技术的发展,特别是计算机网络技术与数据库技术的发展,使用人们的生活与工作方式发生了很大的改观。本课题研究的会务管理系统,主要功能模块包括用户管理,会议信息,会议签到,请假管理,评分记录,听会感受,意见箱等,采取面对对象的开发模式进行软件的开发和硬体的架设,能很好的满足实际使用的需求,完善了对应的软体架设以及程序编码的工作,采取MySQL作为后台数据的主要存储单元,采用SpringBo
vx_bysj1330
·
2023-12-30 20:22
课程设计
java-ee
vue.js
python
django
flask
java
学计算机必参加的含金量赛事!但凡参加一个面试都要简单一倍
文章目录一、ACM国际大学生程序设计竞赛二、GPLT团队程序设计天梯赛三、蓝桥杯四、百度之星五、中国大学生计算机设计大赛六、
数据挖掘
及AI比赛七、结语一、ACM国际大学生程序设计竞赛ACM是美国计算机协会的简称
程序员刘皇叔
·
2023-12-30 20:48
面试
职场和发展
Python
数据挖掘
与机器学习实践技术应用
掌握Python编程的基础知识与技巧、
特征工程
(数据清洗、变量降维、特征选择、群优化算法
思考的小猴子
·
2023-12-30 19:34
机器学习
遥感
python
数据挖掘
机器学习
【Python百宝箱】《AI之道:自动化机器学习与智能决策的终极指南》
本文深入探讨了多个强大的Python库,涵盖了从自动化模型选择、
特征工程
到模型解释性的全方位工具,为读者提供了丰富而实用的资源。
friklogff
·
2023-12-30 15:28
人工智能
自动化
机器学习
完成一个预测建模项目一般需要多长时间?
为了回答这个问题,我们先来了解一下建模的流程,通常一个完整的
数据挖掘
项目包含以下流程(1)业务理解、(2)数据理解、(3)数据准备、(4)数据预处理和建模、(5)模型评估、(6)模型部署应用。
小黄鸭呀
·
2023-12-30 15:48
数据分析流程
数据分析的流程可以分为以下几个步骤:问题定义--
数据挖掘
--数据准备--模型化--数据认证--实施跟踪模型部分:探索--建立--评估--调优--应用理解业务问题:首先明确数据分析的目标和业务问题,确定需要解决的具体问题
Oo_Amy_oO
·
2023-12-30 09:12
数据分析
数据挖掘
共享单车之租赁需求预估
文章目录第1关:数据探索与可视化第2关:
特征工程
第3关:租赁需求预估第1关:数据探索与可视化相关知识为了完成本关任务,你需要掌握:读取数据数据探索与可视化读取数据数据保存在.
柔雾
·
2023-12-30 09:42
python
大数据
数据分析
数据可视化
读书笔记--构建数据湖仓阅读有感
我们知道数据因业务运行而产生,后续数据收集汇总后,数据需要用来分析和使用,进而形成分析服务,用于支持企业的战略决策和价值挖掘,用于商业战略决策,而分析数据需要不同类型数据的融合关联,以及提供
数据挖掘
的分析基础设施环境
一马平川的大草原
·
2023-12-30 07:38
读书笔记
数据应用
数据治理
数据湖仓
数据仓库
数据湖
【
数据挖掘
】模型融合
模型融合是指将多个不同的机器学习模型组合起来,通过综合多个模型的预测结果来得到更准确的预测结果。模型融合可以提高模型的鲁棒性,减小模型的方差,提高模型的泛化能力。常见的模型融合方法包括平均法、投票法和堆叠法。平均法(Averaging):将多个模型的预测结果进行平均,可以是简单的算术平均或加权平均。平均法适用于模型预测结果的方差较小的情况。投票法(Voting):根据多个模型的预测结果,统计出现频
Oo_Amy_oO
·
2023-12-30 07:28
数据挖掘
机器学习
算法
利用clusterProfiler进行富集分析
前言:微博参与话题#给你四年时间你也学不会生信#主要参考:GEO
数据挖掘
小尝试:(三)利用clusterProfiler进行富集分析Y叔开发的R包clusterProfiler的确是最好用的,没有之一,
谢俊飞
·
2023-12-30 07:33
数据分析概述
从本质上看,要理解数据分析应从三个方面去把握:一是目标,数据分析的关键在于设立目标,专业上叫作“有针对性”,其实就是对业务需求的把握;二是方法,数据分析的方法包括描述性分析、统计分析、
数据挖掘
和大数据分析四种
大帅_1061
·
2023-12-30 02:30
如何使用人工智能算法解决实际业务问题?
特征工程
:接下来,需要对数据进行特征提取和转换,以便算法可以更好地理解和处理数据。这一过程也称为
特征工程
,包括特
ldxxxxll
·
2023-12-30 01:32
人工智能
算法
优惠券app哪个好?好用的优惠券app大全-手机优惠券
创始人员基于在这个行业里多年的经验和认识,基于第三方电商平台海量
数据挖掘
与分析,“高
一起高省
·
2023-12-30 00:14
An Overview:Maritime Spatial-Temporal Trajectory Mining 论文阅读笔记
1引言在轨迹
数据挖掘
研究中,大多数研究都是集中在城市轨迹上,这些研究有更多的数据来源,如交通监控系统,手机和GPS等。然而,随着海上目标数量的增加,海洋空间-时空轨迹挖掘逐渐变的重要起来。
m0_59167578
·
2023-12-29 22:26
笔记
论文阅读
2018-12-28
可优化误差Variance:方差,训练集与测试集的差距处理高avoidablebias:1.增大模型的规模,也就是增加模型复杂度2.调整入模变量处理高variance:1.增加训练集数据2.增加正则项3.
特征工程
Louis1994
·
2023-12-29 20:03
AI训练师常用的ChatGPT通用提示词模板
特征工程
:如何进行特征选择和
特征工程
?超参数调整:如何调整训练过程中的超参数?模型训练:如何进行模型的训练?模型评估:如何评估模型的性能?模型调优:如何优化模型的性能?
BTCKing
·
2023-12-29 18:26
人工智能
chatgpt
深度学习
数据挖掘
、机器学习、自然语言处理Python工具包(持续更新)
数据挖掘
、机器学习、自然语言处理Python工具包(持续更新)科学计算Python包NumpyNumpy中文学习文档Numpy官方文档Numpy是一个功能强大的Python库,主要用于对多维数组执行计算
fpzRobert
·
2023-12-29 14:10
机器学习
自然语言处理
数据挖掘
机器学习
深度学习
自然语言处理
数据挖掘
用Python和Scrapy来构建强大的网络爬虫
网络爬虫可以用于各种目的,如
数据挖掘
、搜索引擎优化等。它可以
小文没烦恼
·
2023-12-29 13:22
python
scrapy
爬虫
机器学习三要素与拟合问题
机器学习工作流程总结1.获取数据2.数据基本处理3.
特征工程
4.机器学习(模型训练)5.模型评估结果达到要求,上线服务,没有达到要求,重新上面步骤我们使用机器学习监督学习分类预测模型的工作流程讲解机器学习系统整套处理过程
小森( ﹡ˆoˆ﹡ )
·
2023-12-29 12:19
机器学习
人工智能
数据挖掘
聚类度量
格式化之前的代码:importnumpyasnp#计算importpandasaspd#处理结构化表格importmatplotlib.pyplotasplt#绘制图表和可视化数据的函数,通常与numpy和pandas一起使用。fromsklearnimportmetrics#聚类算法的评估指标。fromsklearn.clusterimportKMeans#K均值聚类算法fromhopkins_
亖嘁
·
2023-12-29 09:01
数据挖掘
聚类
人工智能
数据挖掘
分类模型选择
选择的模型有:决策树、朴素贝叶斯、K近邻、感知机调用的头文件有:importnumpyasnpimportpandasaspdfrommatplotlibimportpyplotaspltfromsklearn.linear_modelimportPerceptronfromsklearn.naive_bayesimportGaussianNBfromsklearn.neighborsimport
亖嘁
·
2023-12-29 09:31
数据挖掘
分类
人工智能
数据挖掘
K-Means聚类
未格式化之前的代码:importpandasaspd#数据处理frommatplotlibimportpyplotasplt#绘图fromsklearn.preprocessingimportMinMaxScaler#归一化fromsklearn.clusterimportKMeans#聚类importos#处理文件os.environ["OMP_NUM_THREADS"]='4'df=pd.re
亖嘁
·
2023-12-29 09:55
数据挖掘
kmeans
聚类
数据清洗与融合期末考试(常见理论题)
请根据自己的理解论述大数据、数据分析和
数据挖掘
之间的联系。注意答,大数据,数据分析,
数据挖掘
的概念大数据是
数据挖掘
和数据分析的基础,数据分析和
数据挖掘
的区别和联系除Python外,你所知
@Yauo
·
2023-12-29 07:59
信息可视化
满足企业数据需求的大数据平台系统
大数据平台系统的开发可以给我们提供强大的储存能力、技术能力,在符合大数据时代下的发展轨迹,实现了现代化
数据挖掘
,满足了诸多企业及平台对数据方面的需求。一、大数据平台系统开发具有什么好处呢?
泰迪智能科技
·
2023-12-28 18:51
大数据
机器学习笔记--图的基本表示和
特征工程
斯坦福大学CS224W图机器学习笔记学习参考CS224W公开课:双语字幕斯坦福CS224W《图机器学习》课程(2021)byJureLeskove官方课程主页:官方主页子豪兄精讲:斯坦福CS224W图机器学习、图神经网络、知识图谱同济子豪兄子豪兄公开代码:同济子豪兄CS224W公开课基于图的项目:读论文、搜论文、做笔记、吐槽论文的社区:ReadPaper可以画出来论文之间的应用关系:CONNECT
Runjavago
·
2023-12-28 15:30
机器学习专栏
深度学习专栏
人工智能学习专栏
机器学习
笔记
人工智能
数据挖掘
--聚类
1.什么是聚类?按照某个特定标准(如距离)把一个数据集分割成不同的类或簇,使得同一个簇内的数据对象的相似性尽可能大,同时不在同一个簇中的数据对象的差异性也尽可能地大。也即聚类后同一类的数据尽可能聚集到一起,不同类数据尽量分离。2.聚类分析应用将相关的文档分组便于浏览将具有相似功能的基因和蛋白质分组将具有相似价格波动的股票分组3.聚类的类型划分聚类(非嵌套层次聚类(嵌套4.聚类算法4.1划分式聚类算
全是头发的羊羊羊
·
2023-12-28 12:10
数据挖掘
数据挖掘
聚类
机器学习
数据挖掘
(作业3
任务一对以下数据集使用K均值聚类算法:1)观察实验结果是否符合预期;2)利用SSE标准确定K值;3)自行调参并观察对聚类结果的影响。注意:需要把类别信息去掉。“tutorial3_DataExploration”中的鸢尾花数据集“iris.data”“tutorial4_DataPreprocessing”中的癌症数据集“breast-cancer-wisconsin.data”breast-ca
全是头发的羊羊羊
·
2023-12-28 11:59
数据挖掘
人工智能
基于Python的城市热门美食数据可视化分析系统
温馨提示:文末有CSDN平台官方提供的学长QQ名片:)1.项目简介本项目利用网络爬虫技术从XX点评APP采集北京市的餐饮商铺数据,利用
数据挖掘
技术对北京美食的分布、受欢迎程度、评价、评论、位置等情况进行了深入分析
Python极客之家
·
2023-12-28 11:28
美食
学习笔记:
数据挖掘
与机器学习
文章目录一、
数据挖掘
、机器学习、深度学习的区别(一)
数据挖掘
(二)机器学习(三)深度学习(四)总结二、
数据挖掘
体系三、
数据挖掘
的流程四、典型的
数据挖掘
系统一、
数据挖掘
、机器学习、深度学习的区别(一)
数据挖掘
数据挖掘
howard2005
·
2023-12-28 11:28
数据挖掘基础
学习
笔记
数据挖掘
机器学习概述(一)
机器学习概述sklearn.datasets
特征工程
特征提取特征预处理特征降维sklearn.datasetssklearn.datasets模块用于获取较为经典的数据集。
写进メ诗的结尾。
·
2023-12-28 11:43
机器学习
机器学习
人工智能
机器学习之
特征工程
-降维
当特征选择完成后,可以直接训练模型了,但是可能由于特征矩阵过大,导致计算量大,训练时间长的问题,因此降低特征矩阵维度也是必不可少的。但不要盲目降维,当你在原数据上跑到了一个比较好的结果,又嫌它太慢的时候才进行降维,不然降了半天白降了。常见的降维方法有主成分分析法(PCA)和线性判别分析(LDA),线性判别分析本身也是一个分类模型。PCA和LDA有很多的相似点,其本质是要将原始的样本映射到维度更低的
城市中迷途小书童
·
2023-12-28 10:31
上一页
9
10
11
12
13
14
15
16
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他