E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
Spark生态系统
spark
学习资料
AdvancedApache
Spark
-SameerFarooqui(Databricks)”(https://www.youtube.com/watch?
Liam_ml
·
2024-08-22 16:24
Spark
MLlib模型训练—分类算法Multilayer Perceptron Classifier
Spark
MLlib模型训练—分类算法MultilayerPerceptronClassifierMultilayerPerceptronClassifier(多层感知器分类器,简称MLP)是
Spark
MLlib
猫猫姐
·
2024-08-22 12:39
Spark实战
spark-ml
spark
机器学习
每天一个数据分析题(四百九十三)- 主成分分析与因子分析
主成分载荷矩阵D.解释方差比例数据分析认证考试介绍:点击进入题目来源于CDA模拟题库点击此处获取答案数据分析专项练习题库内容涵盖Python,SQL,统计学,数据分析理论,深度学习,可视化,机器学习,
Spark
跟着紫枫学姐学CDA
·
2024-08-22 11:34
数据分析题库
数据分析
数据挖掘
每天一个数据分析题(四百九十一)- 主成分分析与因子分析
最小方差正交旋转D.最大方差正交旋转数据分析认证考试介绍:点击进入题目来源于CDA模拟题库点击此处获取答案数据分析专项练习题库内容涵盖Python,SQL,统计学,数据分析理论,深度学习,可视化,机器学习,
Spark
跟着紫枫学姐学CDA
·
2024-08-22 11:33
数据分析题库
数据分析
数据挖掘
Python :wxauto 库——解锁微信自动化
微信作为一个封闭的
生态系统
,其API并不对外开放,因此直接通过第三方库进行深度自动化(如发送消息、自动回复等)可能会违反微信的使用条款,并可能导致账号被封禁。
Soft_Leader
·
2024-08-22 05:55
自动化
运维
Amazon EFS:云端弹性文件系统的多元化应用场景
引言AmazonElasticFileSystem(EFS)作为AWS
生态系统
中的关键组件,为用户提供了一个可扩展、完全托管的弹性NFS文件系统。
ivwdcwso
·
2024-08-22 04:51
运维
EFS
AWS
Apache Paimon:实时湖仓架构构建工具
实时湖仓架构构建工具paimonApachePaimonisalakeformatthatenablesbuildingaRealtimeLakehouseArchitecturewithFlinkand
Spark
forbothstreamingandbatchoperations
乔如黎
·
2024-08-22 03:15
探索实时湖仓架构的新星:Apache Paimon
ApachePaimonpaimonApachePaimonisalakeformatthatenablesbuildingaRealtimeLakehouseArchitecturewithFlinkand
Spark
forbothstreamingandbatchoperations
幸愉旎Jasper
·
2024-08-22 03:39
MAP REDUCE
Apache
Spark
:可以整合进Hadoop,取代MapReduce的框架
Xiao_die888
·
2024-08-22 01:58
大数据分析与应用
mapreduce
afsim V2.9版本介绍
支持afsim整个软件原
生态系统
的所有功能、模型支持win、linux等包含说明文档、以及编译好的windows运行环境、原生系列demo应用
a731687096
·
2024-08-21 22:12
c++
Azkaban各种类型的Job编写
command:Linuxshell命令行任务gobblin:通用数据采集工具hadoopJava:运行hadoopMR任务java:原生java任务hive:支持执行hiveSQLpig:pig脚本任务
spark
__元昊__
·
2024-03-28 21:00
关于HDP的20道高级运维面试题
HDP(HortonworksDataPlatform)的主要组件包括Hadoop框架、HDFS、MapReduce、YARN以及Hadoop
生态系统
中的其他关键工具,如
Spark
、Flink、Hive
编织幻境的妖
·
2024-03-26 15:34
运维
【Hadoop】使用Scala与
Spark
连接ClickHouse进行数据处理
风不懂不懂得叶的梦月不听不听闻窗里琴声意难穷水不见不曾见绿消红霜不知不知晓将别人怎道珍重落叶有风才敢做一个会飞的梦孤窗有月才敢登高在夜里从容桃花有水才怕身是客身是客此景不能久TieYann(铁阳)、薄彩生《不知晓》在大数据分析和处理领域,Apache
Spark
音乐学家方大刚
·
2024-03-26 09:56
Scala
Hadoop
hadoop
scala
spark
告全体学者书
建立一个由消费者和企业、商户共建共享的新零售
生态系统
,在最低成本的原则下推动群体式创新,实现共同富裕,这是我们建设公共网络的初心。
徐金敏顺风_9082
·
2024-03-25 19:41
最前沿的趋势性财富机遇:原力元宇宙与未来财富的无限可能
在众多元宇宙项目中,原力元宇宙以其独特的运作机制和
生态系统
发展,正逐渐成为引领潮流的佼佼者。13分钟视频内容讲明白原力元宇宙创富项目,中国区运营服务对接微信:ForceZen元宇宙是一个虚拟与
口碑信息传播者
·
2024-03-25 15:08
Spark
面试整理-
Spark
是什么?
Apache
Spark
是一个开源的分布式计算系统,它提供了一个用于大规模数据处理的快速、通用、易于使用的平台。它最初是在加州大学伯克利分校的AMPLab开发的,并于2010年开源。
不务正业的猿
·
2024-03-24 13:02
面试
Spark
spark
大数据
分布式
Spark
Q&A
A:从
Spark
2.1开始,你可以通过启用
spark
.sql.files.ignoreCorruptFiles选项来忽略损毁的文件。
耐心的农夫2020
·
2024-03-19 00:12
linux安装单机版
spark
3.5.0
一、
spark
介绍是一种通用的大数据计算框架,正如传统大数据技术Hadoop的MapReduce、Hive引擎,以及Storm流式实时计算引擎等.
Spark
主要用于大数据的计算二、
spark
下载
spark
3.5.0
爱上雪茄
·
2024-03-17 18:57
大数据
JAVA知识
spark
大数据
分布式
springcloud五大组件:Eureka:注册中心、Zuul:服务网关、Ribbon:负载均衡、Feign:服务调用、Hystix:熔断器
你提到的这些组件都是SpringCloud
生态系统
中非常关键和常用的组件。
MarkHD
·
2024-03-17 16:54
springcloud
Vue3 使用Pinia 存入与取出数据
由于Pinia在
生态系统
中能够承担相同的职责且能做得更好,因此Vuex现在处于维护模式。它仍然可以工作,但不再接受新的功能。对于新的应用,建议使用Pinia。
海鸥两三
·
2024-03-16 12:47
vue.js
javascript
前端
前端框架
霸榜的 JavaScript,框架为什么越来越复杂?
JavaScript的霸榜地位在很大程度上源自其灵活性和强大的
生态系统
。随着Web技术的不断发展,JavaScript也在不断演进,从简单的页面交互脚本到复杂的前端框架和工具链。
Itmastergo
·
2024-03-16 09:12
javascript
开发语言
ecmascript
Spark
的数据结构——RDD
RDD的5个特征下面来说一下RDD这东西,它是ResilientDistributedDatasets的简写。咱们来看看RDD在源码的解释。Alistofpartitions:在大数据领域,大数据都是分割成若干个部分,放到多个服务器上,这样就能做到多线程的处理数据,这对处理大数据量是非常重要的。分区意味着,可以使用多个线程了处理。Afunctionforcomputingeachsplit:作用在
bluedraam_pp
·
2024-03-14 08:32
Spark
spark
数据结构
大数据
大数据开发(
Spark
面试真题-卷一)
大数据开发(
Spark
面试真题)1、什么是
Spark
Streaming?简要描述其工作原理。2、什么是
Spark
内存管理机制?请解释其中的主要概念,并说明其作用。
Key-Key
·
2024-03-13 07:58
大数据
spark
面试
基于HBase和
Spark
构建企业级数据处理平台
摘要:在中国HBase技术社区第十届Meetup杭州站上,阿里云数据库技术专家李伟为大家分享了如何基于当下流行的HBase和
Spark
体系构建企业级数据处理平台,并且针对于一些具体落地场景进行了介绍。
weixin_34071713
·
2024-03-12 22:44
大数据
数据库
爬虫
HDFS
(一)HDFS简介及其基本概念 HDFS(HadoopDistributedFileSystem)是hadoop
生态系统
的一个重要组成部分,是hadoop中的的存储组件,在整个Hadoop中的地位非同一般
weixin_51987187
·
2024-03-12 14:32
笔记
大数据
lightGBM专题4:py
spark
平台下lightgbm模型保存
之前的文章(py
spark
lightGBM1和py
spark
lightGBM2)介绍了py
spark
下lightGBM算法的实现,本文将重点介绍下如何保存训练好的模型,直接上代码:frompy
spark
.sqlimport
Spark
Sessionfrompy
spark
.ml.featureimportStringIndexer
I_belong_to_jesus
·
2024-03-12 12:30
大数据
大数据开发(
Spark
面试真题-卷六)
大数据开发(
Spark
面试真题)1、
Spark
HashPartitioner和RangePartitioner的实现?
Key-Key
·
2024-03-12 02:16
大数据
spark
面试
大数据开发(Hadoop面试真题-卷二)
6、
Spark
为什么比MapReduce更快?7、详细描述一
Key-Key
·
2024-03-12 02:15
大数据
hadoop
面试
Spark
从入门到精通29:
Spark
SQL:工作原理剖析以及性能优化
Spark
SQL工作原理剖析1.编写SQL语句只要是在数据库类型的技术里面,例如MySQL、Oracle等,包括现在大数据领域的数据仓库,例如Hive。
勇于自信
·
2024-03-11 00:20
PyTorch:深度学习的革命性框架
下面将从PyTorch的核心特性、应用场景、
生态系统
、与其他框架的比较以及未来发展等方面,对PyTorch进行详细介绍。一、核心特性动态计算图
奔强的程序
·
2024-03-10 17:16
学习
2022-09-27
鸡枞菌,在自然界是和白蚁共生的菌类,白蚁构筑蚁巢的同时培养了鸡㙡菌菌丝体,形成一个共同的
生态系统
,这种菌本来是在我国云南贵州等南方省市的森林中才有。鸡枞菌肉厚肥硕,质细丝白,味道鲜甜香脆。
銘靄
·
2024-03-10 02:41
大数据开发(Hadoop面试真题-卷九)
3、
Spark
mapjoin的实现原理?4、
Spark
的stage如何划分?在源码中是怎么判断属于ShuffleMapStage或ResultStage的?5、
Spark
reduceByKe
Key-Key
·
2024-03-09 10:06
大数据
hadoop
面试
砸钱开荒,四处举债,她在荒地设下“连环计”,赚来7000万
荻港村有1700多年的历史,村民在池塘里养鱼,在池塘周边种桑树,形成了“池埂种桑,桑叶养蚕,蚕沙喂鱼,塘泥肥桑”的生产循环,这种人工
生态系统
,被称为“桑基鱼塘”。
徐二新
·
2024-03-09 09:15
Spark
Streaming(二):DStream数据源
1、输入DStream和Receiver输入(Receiver)DStream代表了来自数据源的输入数据流,在之前的wordcount例子中,lines就是一个输入DStream(JavaReceiverInputDStream),代表了从netcat(nc)服务接收到的数据流。除了文件数据流之外,所有的输入DStream都会绑定一个Receiver对象,该对象是一个关键的组件,用来从数据源接收数
雪飘千里
·
2024-03-09 01:28
Spark
常见问题汇总
注意:如果Driver写好了代码,eclipse或者程序上传后,没有开始处理数据,或者快速结束任务,也没有在控制台中打印错误,那么请进入
spark
的web页面,查看一下你的任务,找到每个分区日志的stderr
midNightParis
·
2024-03-08 03:25
spark
spark
Spark
Shop开源可商用,匹配小程序H5和PC端带分销功能!
Spark
Shop(星火商城)B2C商城是基于thinkphp6+elementui的开源免费可商用的高性能商城系统;包含小程序商城、H5商城、公众号商城、PC商城、App,支持页面diy、秒杀、优惠券
行动之上
·
2024-03-05 15:09
源码免费下载
小程序
【Hadoop】在
spark
读取clickhouse中数据
clickhouse数据库数据importscala.collection.mutable.ArrayBufferimportjava.util.Propertiesimportorg.apache.
spark
.sql.SaveModeimportorg.apache.
spark
.sql.
Spark
SessiondefgetCKJdbcProperties
方大刚233
·
2024-03-03 06:54
Hadoop
Scala
hadoop
spark
clickhouse
Spark
-sql Adaptive Execution动态调整分区数量,调整输出文件数
有时间为了解决小文件问题,我们把
spark
.sql.shuffle.partitions这个参数调整的很小,但是随着时间的推移,数据量越来越大,当初设置的参数就不合适了,那有没有一个可以自我伸缩的参数呢
不想起的昵称
·
2024-03-02 15:03
hive
spark
hive
数据仓库
hive join中出现的数据暴增(数据重复)
我们来看一下案例:
spark
-sql>withtest1as>(select'10001'asuid,'xiaomi'asqid>unionall>select'10002'asuid,'huawei'asqid
不想起的昵称
·
2024-03-02 15:03
hive
大数据
hadoop
hive
hive四种常见的join
1.左连接leftjoin
spark
-sql>withtest1as(>select1asuser_id,'xiaoming'asname>unionall>select2asuser_id,'xiaolan'asname
不想起的昵称
·
2024-03-02 15:33
hive
大数据
hadoop
hdfs
hive
180812卢宝荣:生物学思维【二】演化思维
之前我们讨论了生命从何而来以及生命的基本特征,而且还讲到了个体,个体是怎么去进行演化的,所以说我想我们今天一起来分享,除了个体,在个体这个层次以上,比如群体和
生态系统
,还有
天悦刘洋
·
2024-03-02 06:56
蚓链数字化
生态系统
助力企业业务数字化转型
蚓链数字化
生态系统
致力于通过业务和技术的协同推动企业数字化转型,为企业提供了一套系统化的业务数字化解决方案。业务数字化的第一步是根据企业当前业务分布,划分业务板块,并将管理责任明确到业务部门。
开利网络
·
2024-03-01 05:13
大数据
云计算
【Java编程进阶之路 04】深入探索:Java类加载器与双亲委派 & 打破双亲委派桎梏
文章目录导言01双亲委派模型的基本概念02双亲委派模型的工作流程03双亲委派模型的优势04双亲委派模型在Java
生态系统
中的应用05如何打破双亲委派模型5.1线程上下文类加载器5.2类加载器的代理模式5.3
浅夏的猫
·
2024-03-01 04:42
Java专栏
java
双亲委派
自定义类加载器
Spark
整合hive(保姆级教程)
准备工作:1、需要安装配置好hive,如果不会安装可以跳转到Linux下编写脚本自动安装hive2、需要安装配置好
spark
,如果不会安装可以跳转到
Spark
安装与配置(单机版)3、需要安装配置好Hadoop
万家林
·
2024-02-29 09:47
spark
hive
spark
hadoop
以太坊 Sepolia 和 Holesky 测试网对比
以太坊
生态系统
在不断变化和改进中,包括测试网络。这些测试网络在塑造网络未来方面发挥着关键作用。因此,以太坊
生态系统
中的开发者和利益相关者必须理解这些测试网络的复杂性,以便成功部署项目。
·
2024-02-28 21:38
区块链智能合约以太坊
【Rust详细学习路线】讲解
Rust的一个详细学习路线,你可以根据个人学习进度做适当的调整:2.初学者阶段了解Rust的优势和用例性能:接近C/C++的性能安全性:所有权和生命周期系统保障内存安全并发:Rust的所有权模型减少数据竞争
生态系统
程序员不想敲代码啊
·
2024-02-27 11:51
rust
学习
开发语言
在
Spark
数据导入中的一些实践细节
best-practices-import-data-
spark
-nebula-graph本文由合合信息大数据团队柳佳浩撰写1.前言图谱业务随着时间的推移愈发的复杂化,逐渐体现出了性能上的瓶颈:单机不足以支持更大的图谱
NebulaGraph
·
2024-02-27 07:53
Spark
开发_简单DataFrame判空赋值逻辑
valtable1="实时转存数据"valtable2="历史存hdf数据"valdfin1=inputRDD(table1).asInstanceOf[org.apache.
spark
.sql.DataFrame
Matrix70
·
2024-02-26 22:06
Spark开发_工作
spark
大数据
分布式
Spring Boot 和 Spring Cloud: 区别与联系
Spring框架作为Java
生态系统
中最流行的开发框架之一,也不例外地推出了SpringBoot和SpringCloud这两个项目来满足这些需求。
琴剑飘零西复东
·
2024-02-26 20:34
spring
boot
spring
cloud
后端
Spark
SQL编程指南
Spark
SQL编程指南
Spark
SQL是用于结构化数据处理的一个模块。同
Spark
RDD不同地方在于
Spark
SQL的API可以给
Spark
计算引擎提供更多地信息,例如:数据结构、计算算子等。
<>=
·
2024-02-26 05:46
spark
上一页
2
3
4
5
6
7
8
9
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他