E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
深入理解Spark
CDH6.3.2 多
Spark
版本共存
一部署
Spark
客户端1.1部署
spark
3客户端tar-zxvf
spark
-3.3.1-bin-3.0.0-cdh6.3.2.tgz-C/opt/cloudera/parcels/CDH/libcd/
大数据AI
·
2024-02-05 09:56
大数据从入门到精通
spark
cdh
大数据-
Spark
调优(一)
大数据-
Spark
调优(一)分配更多的资源分配更多的资源是性能优化调优的王道,就是增加和分配更多的资源,这对于性能和速度上的提升是显而易见的,基本上,在一定范围之内,增加资源与性能的提升,是成正比的;写完了一个复杂的
海恋北斗星
·
2024-02-05 09:29
大数据
spark
大数据笔记--
Spark
(第五篇)
目录一、
Spark
的调优1、更改序列化为kryo2、配置多临时文件目录3、启动推测执行机制4、某些特定场景,用mapPartitions代替map5、避免使用collect二、
Spark
的共享变量1、广播变量
是小先生
·
2024-02-05 09:59
大数据08-Spark
spark
大数据 -
Spark
系列《三》- 加载各种数据源创建RDD
Spark
系列文章:大数据-
Spark
系列《一》-从Hadoop到
Spark
:大数据计算引擎的演进-CSDN博客大数据-
Spark
系列《二》-关于
Spark
在Idea中的一些常用配置-CSDN博客目录3.1
王哪跑nn
·
2024-02-05 09:28
spark
大数据
spark
分布式
大数据原理-
Spark
概述:基于内存计算三大分布式计算系统:Hadoop、
Spark
、Storm特点:采用有向无环图DAG作业调度运行速度快循环数据流容易使用:可以通过
Spark
Shell交互式编程用途:SQL查询、流式计算
monster++
·
2024-02-05 09:28
大数据原理
分布式
编程语言
分布式计算
hadoop
spark
大数据 -
Spark
系列《四》-
Spark
分布式运行原理
Spark
系列文章:大数据-
Spark
系列《一》-从Hadoop到
Spark
:大数据计算引擎的演进-CSDN博客大数据-
Spark
系列《二》-关于
Spark
在Idea中的一些常用配置-CSDN博客大数据
王哪跑nn
·
2024-02-05 08:54
spark
大数据
分布式
spark
深入理解
ext2文件系统
ext2文件系统需要考虑哪些因素:1.最重要的是保证数据的安全性。2.效率,方便文件的查找读写。3.文件在磁盘空间占用空间小。(1)树形目录结构EXT文件系统采用一个独立的顶级树形目录架构(即所有一切都从root根目录开始,延伸到子目录)来组织和管理全部文件。目录文件记录了本目录下所有文件和子目录的信息(文件名和索引节点号inode),并依次存放在数据块中,采用把文件名(放在目录文件中)与文件的其
Linux技术芯
·
2024-02-05 08:21
Linux文件系统
文件系统
【Linux】Ext2 文件系统
文件系统前言一、磁盘硬件1.磁盘的物理存储结构2.磁盘存储的逻辑抽象结构二、理解Ext2文件系统1.初步理解文件系统2.
深入理解
文件系统(1)inodeTable(2)Datablocks(3)inodeBitmap
YoungMLet
·
2024-02-05 08:16
Linux系统
linux
运维
服务器
centos
开发语言
数据库
k8s-
深入理解
Service(为Pod提供负载均衡和发现)
一、Service存在的意义二、Service的定义和创建Pod与Service的关系Service的定义和创建三、Service使用NodePort对外暴露应用四种类型,常用的三种:指定Service的NodePort端口在实际生产中,k8s的集群不会直接暴露在公网中,一般会在k8s集群前加一个负载均衡器,这个负载均衡器暴漏在公网。四、Service负载均衡实现之iptablesService代
milo.qu
·
2024-02-05 08:52
k8s
kubernetes
容器
云原生
kubernetes-
深入理解
Pod对象:调度
一、创建一个Pod的工作流程Pod创建流程:1、kubectl向APIServer发起一个Pod创建请求。2、APIServer接受到Pod创建请求后,不是直接创建Pod,而是将Pod的数据写入etcd中,待写入操作执行完成,APIServer将结果返回给kubectl,此时仅仅是在etcd中写入数据,Pod还没真正创建。3、Controller-Manager通过APIServer提供的watc
milo.qu
·
2024-02-05 08:21
k8s
kubernetes
容器
云原生
kubernetes-
深入理解
Pod对象:基本管理
一、Pod的基本概念二、Pod存在的意义三、Pod资源共享实现机制四、Pod常用管理命令将pod.yaml改名pod-net-test.yaml演示共享网络:-为方便演示这里直接创建Pod,正常情况下不会这么使用。同一Pod下,两个容器查看到相同的网络以及监听端口,容器"web"之所以没有对应的命令,是因为它是个nginx容器,如果有的话,如刚才所有应该保持一致。还有一种验证方式:进入容器“tes
milo.qu
·
2024-02-05 08:20
k8s
kubernetes
容器
云原生
Windows系统运行py
spark
报错:Py4JJavaError
运行py
spark
时出现以下错误---------------------------------------------------------------------------Py4JJavaErrorTraceback
赫桃
·
2024-02-05 07:25
windows
spark
scala
py
spark
报错TypeError: an integer is required (got type bytes)
安装配置py
spark
,计算时报错如下:Using
Spark
'sdefaultlog4jprofile:org/apache/
spark
/log4j-defaults.propertiesSettingdefaultloglevelto"WARN
helluy
·
2024-02-05 07:23
bug解决
bug
spark
python
py
spark
报错:ValueError: object of IntegerType out of range
背景:py
spark
任务中,调用了udf处理数据,并使用了链接:py
spark
并行调用udf函数的方式,报错如上。但是在python中很少遇到整型越界问题。
leap_ruo
·
2024-02-05 07:53
pyspark
spark
Python调用py
spark
报错整理
Pycharm配置了SSH服务器和Anaconda的python解释器,如果没有配置可参考大数据单机学习环境搭建(8)Linux单节点Anaconda安装和Pycharm连接Pycharm执行的脚本执行如下py
spark
_model.py
赫加青空
·
2024-02-05 07:52
Python
spark
大数据
python
开发语言
基于hadoop+
spark
的大规模日志的一种处理方案
而且CDN上的访问日志一般都非常大,需要用大数据处理架构来进行处理,本文描述了一种利用hadoop+
spark
来处理大量CDN日志的方法,当然本方
码农心语
·
2024-02-05 06:36
日志处理
大规模
大数据
hadoop
spark
cdn
Flink实时流计算入门系列——广播变量使用
Flink和
Spark
一样,都有支持广播变量这定义。广播变量,可以理解成为日常的广播,是一个公共的变量。广播变量创建后,它可以运行在集群中的任何function上,而不需要多次传递给集群节
晨冉1688
·
2024-02-05 06:19
庄|图44《高效能人士的七个习惯》再论由内而外造就自己
如果我们能够为了抽时间从事第二象限事务(即彼此深入交流)而重新审视自己的计划,改变行为模式和调整生活,就会收获宝贵的双赢关系、彼此的
深入理解
和精彩的统合综效。
爱画画的设计师庄媛惠
·
2024-02-05 06:05
深入理解
指针(5)
1.1sizeof在学习操作符的时候,我们学习了sizeof,sizeof计算变量所占内存内存空间⼤⼩的,单位是字节,如果操作数是类型的话,计算的是使⽤类型创建的变量所占内存空间的⼤⼩。sizeof只关注占⽤内存空间的⼤⼩,不在乎内存中存放什么数据。⽐如:#inculdeintmain(){inta=10;printf("%d\n",sizeof(a));printf("%d\n",sizeofa
2.5条悟T^T
·
2024-02-05 04:13
算法
学习
开发语言
c语言
经验分享
Linux进程信号处理:
深入理解
与应用(1)
慕斯主页:修仙—别有洞天♈️今日夜电波:it's6pmbutImissualready.—bbbluelee0:01━━━━━━️────────3:18◀️⏸▶️☰关注点赞收藏您的每一次鼓励都是对我莫大的支持目录Linux进程信号的概念引入进程信号信号的产生回顾进程的运行认识进程信号通过signal替换信号通过raise给自己发信号通过abort终止自己具体信号的产生(下一篇内容)Linux进程
慕斯( ˘▽˘)っ
·
2024-02-05 03:10
Linux练功
初阶功法
linux
信号处理
运维
服务器
网络
Linux进程信号处理:
深入理解
与应用(2)
慕斯主页:修仙—别有洞天♈️今日夜电波:it's6pmbutImissualready.—bbbluelee0:01━━━━━━️────────3:18◀️⏸▶️☰关注点赞收藏您的每一次鼓励都是对我莫大的支持目录前言进程信号的产生1、通过终端按键产生信号。OS怎么知道终端按键(即:键盘)有数据了呢?常见的通过按键产生的信号及其作用CoreDump2、调用系统函数向进程发信号。kill其他3、由软
慕斯( ˘▽˘)っ
·
2024-02-05 03:08
Linux练功
初阶功法
信号处理
linux
运维
服务器
网络
深入理解
javascript类数组对象
一、什么是类数组类数组的定义只存在一条,就是存在length属性。1、类数组形式letdivs=document.querySelectorAll("div")console.log(divs.length)//9console.log(divs[0])//1console.log(divs)//NodeList(9)[div,div,div,div,div,div,div,div,div]con
卖菜的小白
·
2024-02-05 02:23
js面试题
javascript
前端
html5
类数组
HIVE
--------hive数据仓库hive底层执行引擎有MapReduceTez
Spark
压缩GZIPLZOSnappyBZIP2等存储TextFileSequenceFileRCFileORCParquetUDF
Yagami_
·
2024-02-05 00:23
spark
-submit 任务提交过程分析
https://blog.csdn.net/u013332124/article/details/91456422一、
spark
-submit脚本分析
spark
-submit的脚本内容很简单:#如果没设置
疯狂的哈丘
·
2024-02-04 22:08
运行环境jre版本和jar包编译版本不一致导致:Unsupported major.minor version 52.0
问题我在本地使用IntellijIdea打包了一个
spark
的程序jar包,放到linux集群上运行,报错信息是:Unsupportedmajor.minorversion52.0环境本机系统->windows10
stone_zhu
·
2024-02-04 18:51
深入理解
Istio服务网格(一)数据平面Envoy
一、服务网格概述(servicemesh)在传统的微服务架构中,服务间的调用,业务代码需要考虑认证、熔断、服务发现等非业务能力,在某种程度上,表现出了一定的耦合性服务网格追求高级别的服务流量治理能力,认证、熔断、服务发现这些能力更多的是平台测的能力。将业务测和平台测能力解耦,开发人员只关心业务测的能力。每个服务实例都有一个代理,服务的入站流量、出站流量都先经过代理,代理不进行业务处理,只做流量转发
Sxm&
·
2024-02-04 17:02
云原生
istio
云原生
kubernetes
win10环境下通过anaconda安装py
spark
解决方法本来应该可以在anaconda上直接搜索安装,但是非常慢,而且还有错误,说python3.8无法和和py
spark
3.1.2兼容,需要安装python3.8之前的版本才行。
零下2度
·
2024-02-04 14:36
笔记
python
大数据
深入理解
网络通信和TCP/IP协议
目录计算机网络是什么?定义和分类计算机网络发展简史计算机网络体系结构OSI七层模型TCP/IP模型TCP/IP协议族TCP/IP网络传输中的数据地址和端口号MAC地址IP地址端口号为什么端口号有65535个?综述TCP特性TCP三次握手为什么TCP握手需要三次?TCP三次握手之洪泛攻击TCP四次挥手为什么TCP的挥手需要四次?计算机网络是什么?随着计算机技术发展,计算机的体积和价格都在下降,之前计
山鸟与鱼!
·
2024-02-04 12:17
分布式中间件
tcp/ip
网络
服务器
网络协议
大数据技术未来发展前景及趋势分析
Spark
:
Spark
是一个兼容Hadoop数据源的内存数据处理平台,运行速度相比于HadoopMapReduce更快。
丨程序之道丨
·
2024-02-04 12:54
大数据入门-大数据技术概述(二)
目录大数据入门系列文章1.大数据入门-大数据是什么2.大数据入门-大数据技术概述(一)一、简介二、技术详解1.分布式协调服务:Zookeeper2.分布式资源管理器:Yarn3.计算引擎:
Spark
4.
水坚石青
·
2024-02-04 11:11
大数据理论
大数据
spark
kafka
深入理解
动态链接
动态链接库又叫共享库(SharedLibrary),相信大部分做软件开发的人都很熟悉。简单地说,库是对一系列程序的封装,静态库是会在链接时与可执行程序合并的库,而动态库则在链接后仍然与可执行文件分离,直到运行时才动态加载。显然,动态库可以共享给多个可执行程序同时使用,更节约硬盘和内存空间。不管是Windows开发者,还是Linux开发者,或者是Android、iOS开发者,我们无时无刻都在生产或者
金戈大王
·
2024-02-04 08:17
【C语言】
深入理解
指针(4)回调函数
目录回调函数回调函数的应用i,简化代码逻辑ii,实现上下机之间的通讯回调函数回调函数就是⼀个通过函数指针调用的函数。如果你把函数的指针(地址)作为参数传递给另⼀个函数,当这个指针被用来调用其所指向的函数时,被调用的函数就是回调函数。回调函数不是由该函数的实现方直接调用,而是在特定的事件或条件发生时由另外的⼀方调用的,用于对该事件或条件进行响应。回调函数的应用i,简化代码逻辑//使⽤回调函数改造前#
水墨不写bug
·
2024-02-04 08:08
C进阶
c语言
开发语言
完结,从零开始学python(十八)想成为一名APP逆向工程师,需要掌握那些技术点?
我们来简单的回顾一下内容1.编程语法语法编程并发编程网络编程多线程/多进程/协程数据库编程MySQLRedisMongoDB2.机器学习3.全栈开发4.数据分析Numpy+pandas+MatplotlibHadoop
Spark
5
爬完虫变成龙
·
2024-02-04 07:52
python
python开发
APP逆向
python
开发语言
python爬虫
python开发
java
APP逆向
NDK
Vim工具使用全攻略:从入门到精通
本文将手把手教你如何从Vim的新手逐渐变为高手,
深入理解
Vim的操作模式,并掌握一些实用的技巧。
hqxnb666
·
2024-02-04 07:54
Linux专栏
网络安全-从0到1
vim
编辑器
linux
Fink CDC数据同步(三)Flink集成Hive
利用Flink来读写Hive的表Flink打通了与Hive的集成,如同使用
Spark
SQL或者Impala操作Hive中的数据一样,我们可以使用Flink直接读写Hive中的表。
苡~
·
2024-02-04 07:20
flink
hive
大数据
子雨大数据之
Spark
入门教程---
Spark
入门:RDD的设计与运行原理1.3
Spark
的核心是建立在统一的抽象RDD之上,使得
Spark
的各个组件可以无缝进行集成,在同一个应用程序中完成大数据计算任务。
千寻~
·
2024-02-04 06:38
spark
rdd
Spark
Exception: A master URL必须在配置中设置
问题描述当你遇到org.apache.
spark
.
Spark
Exception:AmasterURLmustbesetinyourconfiguration错误时,这意味着你的
Spark
应用程序尝试启动时没有找到有效的
小湘西
·
2024-02-04 06:07
Spark
spark
大数据
分布式
Spark
部署模式
目录部署模式概述1.LocalMode2.StandaloneMode3.YARNMode4.MesosMode5.KubernetesMode部署模式选择部署模式概述Apache
Spark
支持多种部署模式
小湘西
·
2024-02-04 06:02
Spark
spark
大数据
分布式
Spark
的Driver程序中定义的外部变量或连接为什么不能在各种算在中直接用,如果要要如何做?
在Driver程序中定义的外部变量或连接不能在算子中直接使用,因为它们不会被序列化并发送到各个Executor。如果需要在算子使用外部资源,应该在算子内部初始化这些资源。例如,将RDD数据写入数据库可以这样实现:rdd.foreach(record=>{//在这里初始化数据库连接valconnection=createNewConnection()//假设这是创建连接的函数connection.s
小湘西
·
2024-02-04 06:32
Spark
spark
大数据
分布式
大数据本地环境搭建03-
Spark
搭建
pwd=e20h提取码:e20h将
spark
-3.1.2-bin-hadoop3.2.tar.gz压缩包到node1下的/export/server目录1.2解压压缩包tar-zxvf/export
OnePandas
·
2024-02-04 06:31
Spark
大数据集群环境搭建
大数据
spark
分布式
深入理解
spring mvc启动过程与原理
springmvc的启动,是跟随着tomcat启动的,所以要
深入理解
springmvc的启动过程与原理,需要先了解下tomcat启动的一些关键过程。
程序猿java易
·
2024-02-04 06:25
java
编程
程序员
spring
mvc
servlet
spark
运维问题记录
环境:
spark
-2.1.0-bin-hadoop2.71.
Spark
启动警告:neither
spark
.yarn.jarsnot
spark
.yarn.archiveisset,fallingbacktouploadinglibrariesunder
SPARK
_HOME
lishengping_max
·
2024-02-04 05:11
Spark
spark
Spark
提交任务到yarn 报错提示虚拟内存不足解决办法
spark
context初始化失败ERROR
spark
.
Spark
Context:Errorinitializing
Spark
Context.java.lang.IllegalStateException
动若脱兔--
·
2024-02-04 05:11
Spark
spark
大数据
scala
解决“
Spark
context stopped while waiting for backend“ issue
在配置为4C16G的虚拟机上安装hadoop生态全家桶,在安装
Spark
2,使用了社区版2.3的版本。
江畔独步
·
2024-02-04 05:10
Spark
bigdata
Spark
context stopped while waiting for backend
目录报错信息解决办法解释报错信息
Spark
contextstoppedwhilewaitingforbackend翻译过来就是:
Spark
上下文在等待后端时停止解决办法通过在yarn-site.xml中添加如下配置项
十二点的泡面
·
2024-02-04 05:36
大数据报错信息的解决
spark
大数据
分布式
Spark
Streaming实战:窗口操作,每10秒,把过去30秒的数据取出来(读取端口号1235中的数据)
1.需求:窗口操作,每10秒,把过去30秒的数据取出来窗口长度:30秒滑动距离:10秒2.代码:(1)pom.xmlorg.apache.
spark
spark
-core_2.112.1.0org.apache.
spark
spark
-sql
Movle
·
2024-02-04 05:52
深入理解
指针(3)
⽬录1.字符指针变量2.数组指针变量3.⼆维数组传参的本质4.函数指针变量5.函数指针数组6.转移表1.字符指针变量在指针的类型中我们知道有⼀种指针类型为字符指针char*;⼀般使⽤:intmain(){charch='w';char*pc=&ch;*pc='w';return0;}还有⼀种使⽤⽅式如下:intmain(){constchar*pstr="hellobit.";//这⾥是把⼀个字符
2.5条悟T^T
·
2024-02-04 05:33
数据结构
c语言
算法
学习
经验分享
深入理解
指针(4)
⽬录1.回调函数是什么?2.qsort使⽤举例3.qsort函数的模拟实现1.回调函数是什么?回调函数就是⼀个通过函数指针调⽤的函数。如果你把函数的指针(地址)作为参数传递给另⼀个函数,当这个指针被⽤来调⽤其所指向的函数时,被调⽤的函数就是回调函数。回调函数不是由该函数的实现⽅直接调⽤,⽽是在特定的事件或条件发⽣时由另外的⼀⽅调⽤的,⽤于对该事件或条件进⾏响应。第13讲中我们写的计算机的实现的代码
2.5条悟T^T
·
2024-02-04 05:31
c语言
开发语言
数据结构
算法
经验分享
学习
Hadoop2.7.6+Mysql5.7+Hive2.3.2+zookeeper3.4.6+kafka2.11+Hbase1.4.9+Sqoop1.4.7+Kylin2.4单机伪分布式安装及官方案例测
####################################################################最新消息:关于
spark
和Hudi的安装部署文档,本人已经写完,连接
运维道上奔跑者
·
2024-02-04 05:43
分布式
hbase
zookeeper
hadoop
py
spark
_1_理论篇(RDD基础)
跟着Leo学习Py
Spark
chapter1——rdd的基础编程指南一、准备工作1.背景介绍
Spark
是用scala编程语言实现的,为了使
Spark
支持Python,Apache
Spark
社区发布了一个工具
NikolasNull
·
2024-02-04 04:50
上一页
14
15
16
17
18
19
20
21
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他