E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
数据挖掘数据集
AI场景下存储架构有哪些?
优势在于能够实现多节点并行读写,支持大规模
数据集
的
古猫先生
·
2024-01-31 05:25
云技术
服务器
人工智能
linux
3.1 数据结构和序列
虽然拓展库,比如Pandas和Numpy使处理大
数据集
很方便,但它们需要和Python的内置数据处理工具一同使用。
米小河123
·
2024-01-31 04:13
【2019-03-16】神经网络简单认识和应用
神经网络如何通过反向传播与梯度下降进行学习(1)初识神经网络加载Keras中的MNIST
数据集
fromkeras.datasetsimportmnist(train_images,train_labels
BigBigFlower
·
2024-01-31 04:02
PCA填坑篇——使用PCA到底需不需要数据去量纲?
我们先看看PCA的原理PCA有个规则就是:使得新
数据集
中各属性之间没有相关性。(1)当:
皮皮蒋
·
2024-01-31 04:54
读论文Google-MapReduce
论文大体内容什么是MapReduceMapReduce是一个编程模型,也是一个处理和生成超大
数据集
的算法模型的相关实现。用户首先
.金木研.
·
2024-01-31 04:03
论文阅读
论文阅读-MapReduce
MapReduce:SimplifiedDataProcessingonLargeClusters中文翻译版(转)-阿洒-博客园(cnblogs.com)概要MapReduce是一种处理和生成大
数据集
的编程模型和相关实现
向来痴_
·
2024-01-31 04:31
mapreduce
大数据
xLearn机器学习库:安装与实践指南
特别是对于那些需要处理大规模稀疏
数据集
的用户,如点击率预测(CTR)、推荐系统和反欺诈检测,xLearn提供了一个高效、易于使用的解决方案。
uncle_ll
·
2024-01-31 03:56
机器学习
机器学习
xlearn
fm
ffm
lr
SaaS介绍
在这种交付模式中,软件仅需通过网络,不须经过传统安装步骤即可使用,软件及相关的
数据集
中托管于云端服务。用户通常使用精简的客户端,一般即经由网页浏览器来访问、访问软件即服务。
发疯的小猿
·
2024-01-31 03:54
轻知识
笔记
HBase 1.2.0源码分析:MemStoreFlusher
流程为了减少flush过程对读写的影响,HBase采用了类似于两阶段提交的方式,将整个flush过程分为三个阶段:prepare阶段:遍历当前Region中的所有Memstore,将Memstore中当前
数据集
Alex90
·
2024-01-31 03:35
Python实现OCR大批量识别图片文字,并将文字保存到txt文档中,文末源码直接拿!
OCR技术可以将印刷体文字转化为可编辑的文本格式,从而方便进行文本分析、
数据挖掘
等操作。Python作为一种简洁、易用的编程语言,提供了丰富的图像处理和机器学习库,使得实现图像文字识别变得简单而高效。
认真写程序的强哥
·
2024-01-31 01:27
python
ocr
深度学习
Python爬虫
Python学习
人工智能
开发语言
特征选择综述论文阅读笔记
当
数据挖掘
和机器学习算法应用于高维数据时,一个关键问题被称为维数诅咒:数据在高维空间中变得更加稀疏,对为低维空间设计的算法产生不利影响的现象。
wyn20001128
·
2024-01-31 01:23
数据挖掘
数据挖掘
机器学习
算法
ClickHouse分析效率翻倍提升,揭秘奇点云对归因分析场景的优化实践
奇点云DataKun是大
数据集
群管理系统,负责企业大数据底层存算及运维,对接并管理离线、实时、图、时序等不同引擎,确保数据能得到高效处理和分析。
奇点云
·
2024-01-31 00:47
clickhouse
奇点云
【推荐实践】多场景多任务学习在美团到店餐饮推荐的实践
全面的营销策划方案库【免费下载】2023年2月份热门报告合集ChatGPT团队背景研究报告ChatGPT的发展历程、原理、技术架构及未来方向ChatGPT使用总结:150个ChatGPT提示此模板ChatGPT
数据集
之谜
智能推荐系统
·
2024-01-30 23:07
学习
人工智能
1 月 29日算法练习-二分法
二分法适用于有序
数据集
合,并且每次迭代可以将搜索范围缩小一半。
小蒋的学习笔记
·
2024-01-30 22:58
算法
算法
机器学习 | 掌握 K-近邻算法 的理论实现和调优技巧
目录初识K-近邻算法距离度量K值选择kd树
数据集
划分特征预处理莺尾花种类预测(实操)交叉验证与网格搜索初识K-近邻算法K-近邻算法(K-NearestNeighbor,KNN)是一种基本的分类和回归算法
亦世凡华、
·
2024-01-30 22:47
#
机器学习
机器学习
近邻算法
人工智能
k-近邻算法
ICLR2024 | Harvard FairSeg: 第一个研究分割算法公平性的大型医疗分割
数据集
来源:ScienceAI本文约3700字,建议阅读5分钟哈佛大学(HarvardUniversity)的Harvard-Ophthalmology-AI-Lab团队提出了第一个用于医学分割的公平性
数据集
数据派THU
·
2024-01-30 22:31
算法
R语言学习case7:ggplot基础画图(核密度图)
step1:导入ggplot2库文件library(ggplot2)step2:带入自带的iris
数据集
iris<-datasets::irisstep3:查看数据信息dim(iris)维度为[150,5
早起CaiCai
·
2024-01-30 22:00
R语言
r语言
学习
开发语言
数据可视化
欠拟合和过拟合
本文介绍了欠拟合和过拟合的定义、产生原因以及正则化、正则化的分类;关键字:欠拟合过拟合正则化欠拟合和过拟合的定义欠拟合:一个假设在训练数据上不能获得更好的拟合,并且在测试
数据集
上也不能很好地拟合数据,此时认为这个假设出现了欠拟合的现象
谛君_是心动啊
·
2024-01-30 22:02
数据挖掘
之聚类
聚类一、聚类综述聚类分析提供由个别数据对象到数据对象所指派到簇的抽象。此外,一些聚类技术使用簇原型(即代表簇中其他对象的数据对象)来刻画簇的特征。聚类分析是研究发现最具有代表性的簇原型的技术。回归和PCA的时间复杂度都是O(m2)。注意:簇的定义是不精确的,而最好的定义依赖于数据的特征和期望的结果。聚类分析与其他将数据对象分组的技术有关。监督学习(也叫监督分类或分类):使用一个由类标号已知的对象开
风雪夜归子
·
2024-01-30 22:54
数据挖掘
数据挖掘
聚类
山东大学信息检索与
数据挖掘
期末2023.2
山东大学计算机科学与技术学院提示:有1~2道题忘了,但影响不大第一部分信息检索画倒排表根据倒排表写ANDORNOT的结果写xORy的伪代码最坏情况下复杂度IDF的定义IDF的公式IDF为什么是有限的IDF的最大值最小值IDF与停用词的关系给出一个查询的前20个结果共10000个文档8个标准答案求AP给出前20个结果共10000个文档8个标准答案求AP的可能范围(最大值最小值)BM25中参数k1和b
千寒
·
2024-01-30 22:54
学习记录
数据挖掘
python
信息检索与
数据挖掘
| (十二)聚类
文章目录聚类KMeans层次聚类层次聚类概述dendrogram-树状图linkages-衡量两个类之间的距离Lance-Williams算法K-meansVS层次聚类DBSCAN聚类定义:聚类是一种无监督学习,样本没有标签,将一群样本划分到一个类中,使得:最大化类间距,最小化类内距离测量指标:四种聚类:基于质心的聚类,使用中心表示该簇(K-means,K-medoids)基于链接的聚类:层次聚类
啦啦右一
·
2024-01-30 22:52
#
信息检索与数据挖掘
大数据与数据分析
数据挖掘
聚类
机器学习
信息检索及
数据挖掘
必备知识总结
信息检索和网络数据领域(WWW,SIGIR,CIKM,WSDM,ACL,EMNLP等)的论文中常用的模型和技术总结引子:对于这个领域的博士生来说,看懂论文是入行了解大家在做什么的研究基础,通常我们会去看一本书。看一本书固然是好,但是有一个很大的缺点:一本书本身自成体系,所以包含太多东西,很多内容看了,但是实际上却用不到。这虽然不能说是一种浪费,但是却没有把有限力气花在刀口上。我所处的领域是关于网络
Towan
·
2024-01-30 22:52
数据挖掘
数据挖掘
基础知识
开源工具
基于PCA算法的人脸识别介绍
降维具有如下一些优点:使得
数据集
更易使用、降低算法的计算开销、去除噪声、使得结果容易理解。
Clearlovekui9
·
2024-01-30 20:54
SPSS保姆式安装教程,超详细,附安装链接
SPSS最初由IBM公司推出,用于统计学分析运算、
数据挖掘
、预测分析和决策支持任务。SPSS的基本功能包括数据管理、统计分析、图表分析、输出管理等。其统计分析过程涵盖描述性统计、均值比较、
juechen333
·
2024-01-30 20:06
软件安装
SPSS
统计学
数据处理
数据挖掘
YOLOV5训练标准
数据集
miniconda环境变量配置二、创建虚拟环境和安装Pytorch1.创建虚拟环境2.安装pytorch三、Pycharm和yolov5模型环境配置1.PyCharm下载2.yolov5模型环境配置四、VOC
数据集
的划分以及参数文件配置
Jokey__
·
2024-01-30 20:23
YOLO
YOLO
大创项目推荐 题目:基于深度学习的中文对话问答机器人
API4.1LSTMcells部分:4.2损失函数:4.3搭建seq2seq框架:4.4测试部分:4.5评价NLP测试效果:4.6梯度截断,防止梯度爆炸4.7模型保存5重点和难点5.1函数5.2变量6相关参数7桶机制7.1处理
数据集
laafeer
·
2024-01-30 20:17
python
《Numpy 简易速速上手小册》第5章:Numpy高效计算与广播(2024 最新版)
5.2广播机制5.2.1基础知识5.2.2完整案例:二维数据与一维数据运算5.2.3拓展案例1:标准化二维数据5.2.4拓展案例2:多维度广播5.3性能优化技巧5.3.1基础知识5.3.2完整案例:大型
数据集
处理
江帅帅
·
2024-01-30 20:15
《Numpy
简易速速上手小册》
numpy
复现Reasoning with Heterogeneous Graph Alignment for Video Question Answering
tgif其实就是gif
数据集
,feat,vocabulary还有datasets获取参见https://github.com/fanchenyou/HME-VideoQA/tree/master/gif-qaNomodulenamed
Mighty_Crane
·
2024-01-30 20:11
论文
小白
python
mysql中groupby用法_详解SQL中GroupBy的用法
1、概述“GroupBy”从字面意义上理解就是根据“By”指定的规则对数据进行分组,所谓的分组就是将一个“
数据集
”划分成若干个“小区域”,然后针对若干个“小区域”进行数据处理。
Mars Ma
·
2024-01-30 19:54
mysql中groupby用法
MySQL中 GROUP BY 语句的优化
在数据库查询中,GROUPBY语句允许我们按某些字段对
数据集
进行分组,并在每个分组上应用聚合函数。但是,当处理大量数据时,如果不加优化,GROUPBY操作可能会导致性能问题。
半桶水专家
·
2024-01-30 19:23
mysql
mysql
数据库
银行数据仓库的架构
1.数据仓库的定义官方定义数据仓库是一个面向主题的、集成的、随时间变化的、但信息本身相对稳定的
数据集
合,用于对管理决策过程的支持。这个定义的确官方,但是却指出了数据仓库的四个特点。
specila_coder
·
2024-01-30 18:46
数据仓库
数据仓库
架构
spark
oracle
mysql
sql
数据仓库实践杂谈(十八)——关于报表
增量/全量第十章:拉链处理第十一章:分布式处理增量第十二章:列式存储第十三章:逻辑数据模型(数仓模型)第十四章:数据模型参考第十五章:维模型第十六章:渐变维第十七章:数据回滚第十八章:关于报表第十九章:
数据挖掘
数据仓库实践杂谈
老程序员一叶知秋
·
2024-01-30 18:45
数据仓库实践
数据库
大数据
java
链表
数据分析
使用Redis LIst 实现数据库分页快速查询的方法
分页查询允许用户在大型
数据集
中浏览数据,并提供了更好的用户体验。然而,对于大型
数据集
,传统的数据库分页查询可能会导致性能下降和延迟增加。
张万森的救赎
·
2024-01-30 18:27
数据库
redis
oracle
【论文阅读|半监督小苹果检测方法S3AD】
然而,由于缺乏大规模
数据集
以及图像中农作物的相对尺
Dymc
·
2024-01-30 18:07
程序人生
UL 9540A-2019【中文】 评估电池储能系统中热失控火灾传播的测试方法的安全标准
UL9540A-2019中文评估电池储能系统中热失控火灾传播的测试方法的安全标准.pdf-
数据集
文档类资源-CSDN下载UL9540A-2019中文评估电池储能系统中热失控火灾传播的测试方法的安全标准.
std7879
·
2024-01-30 18:34
标准知道
ul
9540a
Pandas实战:3分钟玩转数据加载技巧,事半功倍(附代码示例)
微信搜索关注《Python学研大本营》,加入读者群,分享更多精彩一、简介高效的数据处理是使用Pandas的基石,特别是在处理大型
数据集
时。在这里,我们将重点介绍如何优化数据加载过程。
Python学研大本营
·
2024-01-30 17:50
pandas
中电金信“一表通”一揽子解决方案 助力构建监管数据体系新格局
”是国家金融监督管理总局2021年在试点金融机构推行的一套创新的监管数据报送平台,提供统一的监管数据标准和加工逻辑,要求金融机构端设置监管数据可信区,以完善监管数据采集、存储、应用和管理体系,旨在强化
数据集
成
中电金信
·
2024-01-30 17:37
人工智能
大数据
Tensorflow2.0基础-笔记-图像识别-猫狗
数据集
/DataSet/猫狗
数据集
_2000/dc_2000/train/cat/*.jpg')image_filenames2=glob.glob('./DataSe
二流子学程序
·
2024-01-30 17:58
tensorflow2.0
tensorflow
图像识别
西瓜书学习笔记——层次聚类(公式推导+举例应用)
文章目录算法介绍实验分析算法介绍层次聚类是一种将
数据集
划分为层次结构的聚类方法。它主要有两种策略:自底向上和自顶向下。其中AGNES算法是一种自底向上聚类算法,用于将
数据集
划分为层次结构的聚类。
Nie同学
·
2024-01-30 16:25
机器学习
学习
笔记
聚类
黑猴子的家:Hive 分区表基本操作
Hive中的分区就是分目录,把一个大的
数据集
根据业务需要分割成小的
数据集
。在查询时通过WHERE子句中的表达式选择查询所需要的指定的分区,这样的查询效率会提高很多。
黑猴子的家
·
2024-01-30 16:59
第一个诞生自中国的
数据集
成平台项目!Apache SeaTunnel 解一下?
ApacheSeaTunnel是中国开发者主导的项目,也是Apache基金会中第一个诞生自中国的
数据集
成平台项目。简
灯惉
·
2024-01-30 16:39
机器学习复习(4)——CNN算法
目录数据增强方法CNN图像分类
数据集
构建导入
数据集
定义trainer超参数设置数据增强构建CNN网络开始训练模型测试数据增强方法#一般情况下,我们不会在验证集和测试集上做数据扩增#我们只需要将图片裁剪成同样的大小并装换成
不会写代码!!
·
2024-01-30 16:12
机器学习算法
人工智能
机器学习复习
机器学习
cnn
人工智能
机器学习复习(1)——任务整理流程
目录固定的随机数种子定义predict功能拆分
数据集
定义trainer超参数设置
数据集
载入固定的随机数种子在大量的机器学习与深度学习实验中,如果不进行特殊设置,我们的结果将不可复现,固定的随机数种子将会解决这个问题
不会写代码!!
·
2024-01-30 16:39
机器学习复习
机器学习算法
人工智能
机器学习
人工智能
快乐学Python,使用爬虫爬取电视剧信息,构建评分
数据集
这一篇文章,我们通过实际操作来将三个环节串联起来,以国产电视剧为例,构建我们的电视剧评分
数据集
。1、需求描述收集目前国产电视剧的相关数据,需要构建国产电视剧和评分的
数据集
。
小敢摘葡萄
·
2024-01-30 15:53
python
爬虫
开发语言
数据分析
Python基础
excel
Python 数据分析实战——社交游戏的用户流失?酒卷隆治_案例2
#什么样的顾客会选择离开#
数据集
DAU:每天至少来访问一次的用户数据数据内容数据类型字段名访问时间string(字符串)log_data应用名称string(字符串)app_name用户IDint(数值
6sigma
·
2024-01-30 15:48
python
学习笔记
python
数据分析
批量修改gis属性表字段别名2018-11-15
近日偶遇一个问题,就是需要对地理数据库的多个
数据集
内的众多要素类的字段按照固定的要求进行字段别名的设置,当初创建要素类的时候并没有这个需求,所以每个字段的别名都要重新设置。
一名跨界的giser
·
2024-01-30 15:38
Spark的核心RDD(Resilient Distributed Datasets弹性分布式
数据集
)
Spark的核心RDD(ResilientDistributedDatasets弹性分布式
数据集
)铺垫在hadoop中一个独立的计算,例如在一个迭代过程中,除可复制的文件系统(HDFS)外没有提供其他存储的概念
fcyh
·
2024-01-30 15:46
Spark
Spark RDD(弹性分布式
数据集
)
1.RDD1.1RDD是什么RDD(ResilientDistributedDataset):弹性分布式
数据集
,是Spark对
数据集
的抽象,代表一个只读、不可变、可分区、其中元素可进行并行计算的集合,并且是可跨越集群节点进行并行操作的有容错机制的集合
JOEL-T99
·
2024-01-30 15:15
BigData
spark
RDD
Spark RDD基础实战(弹性分布式
数据集
)
http://spark.apache.org/docs/latest/sql-data-sources-json.htmlhttp://jsonlines.org/examples/官网的准备的
数据集
合启动
蜗牛杨哥
·
2024-01-30 15:14
Spark
RDD编程实战指南
大数据
Spark弹性分布式
数据集
(Resilient Distributed Dataset)
1.弹性分布式
数据集
RDD1.1.RDD概述1.1.1.什么是RDDRDD(ResilientDistributedDataset)叫做分布式
数据集
,是Spark中最基本的数据抽象,它代表一个不可变、可分区
你狗
·
2024-01-30 15:14
大数据
scala
上一页
30
31
32
33
34
35
36
37
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他