E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
las数据集
PCA填坑篇——使用PCA到底需不需要数据去量纲?
我们先看看PCA的原理PCA有个规则就是:使得新
数据集
中各属性之间没有相关性。(1)当:
皮皮蒋
·
2024-01-31 04:54
读论文Google-MapReduce
论文大体内容什么是MapReduceMapReduce是一个编程模型,也是一个处理和生成超大
数据集
的算法模型的相关实现。用户首先
.金木研.
·
2024-01-31 04:03
论文阅读
论文阅读-MapReduce
MapReduce:SimplifiedDataProcessingonLargeClusters中文翻译版(转)-阿洒-博客园(cnblogs.com)概要MapReduce是一种处理和生成大
数据集
的编程模型和相关实现
向来痴_
·
2024-01-31 04:31
mapreduce
大数据
xLearn机器学习库:安装与实践指南
特别是对于那些需要处理大规模稀疏
数据集
的用户,如点击率预测(CTR)、推荐系统和反欺诈检测,xLearn提供了一个高效、易于使用的解决方案。
uncle_ll
·
2024-01-31 03:56
机器学习
机器学习
xlearn
fm
ffm
lr
SaaS介绍
在这种交付模式中,软件仅需通过网络,不须经过传统安装步骤即可使用,软件及相关的
数据集
中托管于云端服务。用户通常使用精简的客户端,一般即经由网页浏览器来访问、访问软件即服务。
发疯的小猿
·
2024-01-31 03:54
轻知识
笔记
HBase 1.2.0源码分析:MemStoreFlusher
流程为了减少flush过程对读写的影响,HBase采用了类似于两阶段提交的方式,将整个flush过程分为三个阶段:prepare阶段:遍历当前Region中的所有Memstore,将Memstore中当前
数据集
Alex90
·
2024-01-31 03:35
ClickHouse分析效率翻倍提升,揭秘奇点云对归因分析场景的优化实践
奇点云DataKun是大
数据集
群管理系统,负责企业大数据底层存算及运维,对接并管理离线、实时、图、时序等不同引擎,确保数据能得到高效处理和分析。
奇点云
·
2024-01-31 00:47
clickhouse
奇点云
【推荐实践】多场景多任务学习在美团到店餐饮推荐的实践
全面的营销策划方案库【免费下载】2023年2月份热门报告合集ChatGPT团队背景研究报告ChatGPT的发展历程、原理、技术架构及未来方向ChatGPT使用总结:150个ChatGPT提示此模板ChatGPT
数据集
之谜
智能推荐系统
·
2024-01-30 23:07
学习
人工智能
1 月 29日算法练习-二分法
二分法适用于有序
数据集
合,并且每次迭代可以将搜索范围缩小一半。
小蒋的学习笔记
·
2024-01-30 22:58
算法
算法
机器学习 | 掌握 K-近邻算法 的理论实现和调优技巧
目录初识K-近邻算法距离度量K值选择kd树
数据集
划分特征预处理莺尾花种类预测(实操)交叉验证与网格搜索初识K-近邻算法K-近邻算法(K-NearestNeighbor,KNN)是一种基本的分类和回归算法
亦世凡华、
·
2024-01-30 22:47
#
机器学习
机器学习
近邻算法
人工智能
k-近邻算法
ICLR2024 | Harvard FairSeg: 第一个研究分割算法公平性的大型医疗分割
数据集
来源:ScienceAI本文约3700字,建议阅读5分钟哈佛大学(HarvardUniversity)的Harvard-Ophthalmology-AI-Lab团队提出了第一个用于医学分割的公平性
数据集
数据派THU
·
2024-01-30 22:31
算法
R语言学习case7:ggplot基础画图(核密度图)
step1:导入ggplot2库文件library(ggplot2)step2:带入自带的iris
数据集
iris<-datasets::irisstep3:查看数据信息dim(iris)维度为[150,5
早起CaiCai
·
2024-01-30 22:00
R语言
r语言
学习
开发语言
数据可视化
欠拟合和过拟合
本文介绍了欠拟合和过拟合的定义、产生原因以及正则化、正则化的分类;关键字:欠拟合过拟合正则化欠拟合和过拟合的定义欠拟合:一个假设在训练数据上不能获得更好的拟合,并且在测试
数据集
上也不能很好地拟合数据,此时认为这个假设出现了欠拟合的现象
谛君_是心动啊
·
2024-01-30 22:02
基于PCA算法的人脸识别介绍
降维具有如下一些优点:使得
数据集
更易使用、降低算法的计算开销、去除噪声、使得结果容易理解。
Clearlovekui9
·
2024-01-30 20:54
YOLOV5训练标准
数据集
miniconda环境变量配置二、创建虚拟环境和安装Pytorch1.创建虚拟环境2.安装pytorch三、Pycharm和yolov5模型环境配置1.PyCharm下载2.yolov5模型环境配置四、VOC
数据集
的划分以及参数文件配置
Jokey__
·
2024-01-30 20:23
YOLO
YOLO
大创项目推荐 题目:基于深度学习的中文对话问答机器人
API4.1LSTMcells部分:4.2损失函数:4.3搭建seq2seq框架:4.4测试部分:4.5评价NLP测试效果:4.6梯度截断,防止梯度爆炸4.7模型保存5重点和难点5.1函数5.2变量6相关参数7桶机制7.1处理
数据集
laafeer
·
2024-01-30 20:17
python
《Numpy 简易速速上手小册》第5章:Numpy高效计算与广播(2024 最新版)
5.2广播机制5.2.1基础知识5.2.2完整案例:二维数据与一维数据运算5.2.3拓展案例1:标准化二维数据5.2.4拓展案例2:多维度广播5.3性能优化技巧5.3.1基础知识5.3.2完整案例:大型
数据集
处理
江帅帅
·
2024-01-30 20:15
《Numpy
简易速速上手小册》
numpy
复现Reasoning with Heterogeneous Graph Alignment for Video Question Answering
tgif其实就是gif
数据集
,feat,vocabulary还有datasets获取参见https://github.com/fanchenyou/HME-VideoQA/tree/master/gif-qaNomodulenamed
Mighty_Crane
·
2024-01-30 20:11
论文
小白
python
mysql中groupby用法_详解SQL中GroupBy的用法
1、概述“GroupBy”从字面意义上理解就是根据“By”指定的规则对数据进行分组,所谓的分组就是将一个“
数据集
”划分成若干个“小区域”,然后针对若干个“小区域”进行数据处理。
Mars Ma
·
2024-01-30 19:54
mysql中groupby用法
MySQL中 GROUP BY 语句的优化
在数据库查询中,GROUPBY语句允许我们按某些字段对
数据集
进行分组,并在每个分组上应用聚合函数。但是,当处理大量数据时,如果不加优化,GROUPBY操作可能会导致性能问题。
半桶水专家
·
2024-01-30 19:23
mysql
mysql
数据库
银行数据仓库的架构
1.数据仓库的定义官方定义数据仓库是一个面向主题的、集成的、随时间变化的、但信息本身相对稳定的
数据集
合,用于对管理决策过程的支持。这个定义的确官方,但是却指出了数据仓库的四个特点。
specila_coder
·
2024-01-30 18:46
数据仓库
数据仓库
架构
spark
oracle
mysql
sql
使用Redis LIst 实现数据库分页快速查询的方法
分页查询允许用户在大型
数据集
中浏览数据,并提供了更好的用户体验。然而,对于大型
数据集
,传统的数据库分页查询可能会导致性能下降和延迟增加。
张万森的救赎
·
2024-01-30 18:27
数据库
redis
oracle
【论文阅读|半监督小苹果检测方法S3AD】
然而,由于缺乏大规模
数据集
以及图像中农作物的相对尺
Dymc
·
2024-01-30 18:07
程序人生
UL 9540A-2019【中文】 评估电池储能系统中热失控火灾传播的测试方法的安全标准
UL9540A-2019中文评估电池储能系统中热失控火灾传播的测试方法的安全标准.pdf-
数据集
文档类资源-CSDN下载UL9540A-2019中文评估电池储能系统中热失控火灾传播的测试方法的安全标准.
std7879
·
2024-01-30 18:34
标准知道
ul
9540a
Pandas实战:3分钟玩转数据加载技巧,事半功倍(附代码示例)
微信搜索关注《Python学研大本营》,加入读者群,分享更多精彩一、简介高效的数据处理是使用Pandas的基石,特别是在处理大型
数据集
时。在这里,我们将重点介绍如何优化数据加载过程。
Python学研大本营
·
2024-01-30 17:50
pandas
中电金信“一表通”一揽子解决方案 助力构建监管数据体系新格局
”是国家金融监督管理总局2021年在试点金融机构推行的一套创新的监管数据报送平台,提供统一的监管数据标准和加工逻辑,要求金融机构端设置监管数据可信区,以完善监管数据采集、存储、应用和管理体系,旨在强化
数据集
成
中电金信
·
2024-01-30 17:37
人工智能
大数据
Tensorflow2.0基础-笔记-图像识别-猫狗
数据集
/DataSet/猫狗
数据集
_2000/dc_2000/train/cat/*.jpg')image_filenames2=glob.glob('./DataSe
二流子学程序
·
2024-01-30 17:58
tensorflow2.0
tensorflow
图像识别
西瓜书学习笔记——层次聚类(公式推导+举例应用)
文章目录算法介绍实验分析算法介绍层次聚类是一种将
数据集
划分为层次结构的聚类方法。它主要有两种策略:自底向上和自顶向下。其中AGNES算法是一种自底向上聚类算法,用于将
数据集
划分为层次结构的聚类。
Nie同学
·
2024-01-30 16:25
机器学习
学习
笔记
聚类
黑猴子的家:Hive 分区表基本操作
Hive中的分区就是分目录,把一个大的
数据集
根据业务需要分割成小的
数据集
。在查询时通过WHERE子句中的表达式选择查询所需要的指定的分区,这样的查询效率会提高很多。
黑猴子的家
·
2024-01-30 16:59
第一个诞生自中国的
数据集
成平台项目!Apache SeaTunnel 解一下?
ApacheSeaTunnel是中国开发者主导的项目,也是Apache基金会中第一个诞生自中国的
数据集
成平台项目。简
灯惉
·
2024-01-30 16:39
机器学习复习(4)——CNN算法
目录数据增强方法CNN图像分类
数据集
构建导入
数据集
定义trainer超参数设置数据增强构建CNN网络开始训练模型测试数据增强方法#一般情况下,我们不会在验证集和测试集上做数据扩增#我们只需要将图片裁剪成同样的大小并装换成
不会写代码!!
·
2024-01-30 16:12
机器学习算法
人工智能
机器学习复习
机器学习
cnn
人工智能
机器学习复习(1)——任务整理流程
目录固定的随机数种子定义predict功能拆分
数据集
定义trainer超参数设置
数据集
载入固定的随机数种子在大量的机器学习与深度学习实验中,如果不进行特殊设置,我们的结果将不可复现,固定的随机数种子将会解决这个问题
不会写代码!!
·
2024-01-30 16:39
机器学习复习
机器学习算法
人工智能
机器学习
人工智能
快乐学Python,使用爬虫爬取电视剧信息,构建评分
数据集
这一篇文章,我们通过实际操作来将三个环节串联起来,以国产电视剧为例,构建我们的电视剧评分
数据集
。1、需求描述收集目前国产电视剧的相关数据,需要构建国产电视剧和评分的
数据集
。
小敢摘葡萄
·
2024-01-30 15:53
python
爬虫
开发语言
数据分析
Python基础
excel
Python 数据分析实战——社交游戏的用户流失?酒卷隆治_案例2
#什么样的顾客会选择离开#
数据集
DAU:每天至少来访问一次的用户数据数据内容数据类型字段名访问时间string(字符串)log_data应用名称string(字符串)app_name用户IDint(数值
6sigma
·
2024-01-30 15:48
python
学习笔记
python
数据分析
批量修改gis属性表字段别名2018-11-15
近日偶遇一个问题,就是需要对地理数据库的多个
数据集
内的众多要素类的字段按照固定的要求进行字段别名的设置,当初创建要素类的时候并没有这个需求,所以每个字段的别名都要重新设置。
一名跨界的giser
·
2024-01-30 15:38
Spark的核心RDD(Resilient Distributed Datasets弹性分布式
数据集
)
Spark的核心RDD(ResilientDistributedDatasets弹性分布式
数据集
)铺垫在hadoop中一个独立的计算,例如在一个迭代过程中,除可复制的文件系统(HDFS)外没有提供其他存储的概念
fcyh
·
2024-01-30 15:46
Spark
Spark RDD(弹性分布式
数据集
)
1.RDD1.1RDD是什么RDD(ResilientDistributedDataset):弹性分布式
数据集
,是Spark对
数据集
的抽象,代表一个只读、不可变、可分区、其中元素可进行并行计算的集合,并且是可跨越集群节点进行并行操作的有容错机制的集合
JOEL-T99
·
2024-01-30 15:15
BigData
spark
RDD
Spark RDD基础实战(弹性分布式
数据集
)
http://spark.apache.org/docs/latest/sql-data-sources-json.htmlhttp://jsonlines.org/examples/官网的准备的
数据集
合启动
蜗牛杨哥
·
2024-01-30 15:14
Spark
RDD编程实战指南
大数据
Spark弹性分布式
数据集
(Resilient Distributed Dataset)
1.弹性分布式
数据集
RDD1.1.RDD概述1.1.1.什么是RDDRDD(ResilientDistributedDataset)叫做分布式
数据集
,是Spark中最基本的数据抽象,它代表一个不可变、可分区
你狗
·
2024-01-30 15:14
大数据
scala
Spark——(RDD(弹性分布式
数据集
),RDD的创建和操作,Transformation 算子)
文章目录RDD(弹性分布式
数据集
)RDD的创建和操作常见的Transformation算子RDD(弹性分布式
数据集
)RDD(ResilientDistributedDataset)是Spark中的核心概念
想做CTO的任同学...
·
2024-01-30 15:12
Spark
spark
大数据
后端
开发语言
java
Sparse Model Soups稀疏模型汤
论文链接:https://arxiv.org/pdf/2306.16788.pdf源码链接:https://github.com/zib-iol/sms简介一些研究表明,通过利用多个模型,而不是保留验证
数据集
上选择最优的模型并丢弃其余模型
qgh1223
·
2024-01-30 15:42
计算机视觉
人工智能
剪枝
初识 RDD 弹性分布式
数据集
(Resilient Distributed Datasets)
RDD是什么RDD,全称为弹性分布式
数据集
(ResilientDistributedDatasets),是一个容错的,并行的数据结构,可以让用户显式地将数据存储到磁盘和内存中,并能控制数据的分区.同时,
腹黑客
·
2024-01-30 15:42
spark
spark
spark学习笔记:弹性分布式
数据集
RDD(Resilient Distributed Dataset)
弹性分布式
数据集
RDD1.RDD概述1.1什么是RDDRDD(ResilientDistributedDataset)叫做弹性分布式
数据集
,是Spark中最基本的数据抽象,它代表一个不可变、可分区、里面的元素可并行计算的集合
黄道婆
·
2024-01-30 15:39
bigdata
【Spark】之 RDD(Resilient Distributed Dataset)
二、RDD计算(1)RDD获得数据(2)RDD计算任务(3)RDD操作算子三、RDD容错(1)`Lineage`(2)`checkpoint`机制RDD编程模型需求:需要在多个并行操作之间重用工作
数据集
fanfan4569
·
2024-01-30 15:39
【Spark】
Spark
RDD
SparkCore之RDD---弹性分布式
数据集
目录:RDD的设计与运行原理一、RDD设计背景二、RDD概念1.什么是RDD?2.RDD的属性三、RDD特点1.可分区2.不可变3.依赖关系4.缓存(cache)5.检测点(CheckPoint)四、RDD的创建1.通过并行化的方式创建RDD2.读取文件生成RDD3.通过其他RDD转换五、RDD运行过程RDD的设计与运行原理Spark的核心是建立在统一的抽象RDD上的,使得Spark的各个组件可以
孤独の√ 3
·
2024-01-30 15:09
大数据
#
spark
分布式
横扫Spark之 - RDD(Resilient Distributed Dataset)弹性分布式
数据集
水善利万物而不争,处众人之所恶,故几于道文章目录一、概念二、理解1.弹性2.分布式3.
数据集
三、5个主要特性1.一个分区列表2.作用在每个分区上的计算函数3.一个和其他RDD的依赖列表4.一个分区器(可选
阿年、嗯啊
·
2024-01-30 15:07
Spark
分布式
spark
大数据
RDD
RDD的5个主要特性
基于paddlepaddle的yolo基本实现
数据集
:https://aistudio.baidu.com/datasetdetail/94809构建骨干网
繁星意未平
·
2024-01-30 15:37
AI
paddlepaddle
YOLO
人工智能
【R语言】factoextra生成发表级PCA主成分分析图(二)
今天我们来讲讲如何展示特征的分布,我们还是使用iris这套
数据集
#加载这两个R包library(FactoMineR)library(factoextra)#做PCA分析,第五列
生信交流平台
·
2024-01-30 15:01
浅谈数据中台架构设计
何为数据中台数据中台是将企业的数据变成数据资产,并提供数据能力组件和运行机制的平台,简单来说就是
数据集
散中心,企业所
何处生才
·
2024-01-30 14:51
微软声称其AI框架比最新基准更好地发现虚假新闻
他们说,在真实世界的
数据集
上对模型进行训练和测试后,该模型的性能优于许多最新的基线,可早期检测假新闻。如果该系统的准确性达到要求并投入生产,它将有助于防止传播有关美国总统候选人和其他
月影沙丘的故事
·
2024-01-30 14:49
上一页
27
28
29
30
31
32
33
34
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他