E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
Spark学习之路
(转)
Spark
DataFrame 开发指南
DataFrame是
Spark
在RDD之后新推出的一个数据集,从属于
Spark
SQL模块,适用于结构化数据。对于我们这些用惯了数据库表和散列/字典结构的人来说,尤为亲切。
达微
·
2023-11-27 06:40
大数据处理框架
Spark
:核心原理
大数据处理框架
Spark
:核心原理
Spark
是一个开源的大数据处理框架,它提供了高效的分布式数据处理和计算能力。本文将介绍
Spark
的核心原理,并提供相应的源代码示例。
雨中徜徉的思绪漫溢
·
2023-11-27 04:17
spark
ajax
大数据
Spark
SQL之catalyst
说到
Spark
SQL,我们不得不提到它的优化器(Catalyst),Catalyst是
Spark
sql的核心,它是针对于
Spark
SQL语句执行过程中的查询优化框架。
临界爵迹
·
2023-11-27 03:34
大数据
spark
利用
Spark
SQL Logical Plan Parse 打造大数据平台SQL诊断利器
利用我们的源码,打造一款SQL的扫描工具~~原理篇
Spark
被大家津津乐道的经典SQL解析流程Sql语句经过Antlr4解析,生成UnresolvedLog
敏叔V587
·
2023-11-27 03:34
Spark
大数据
工具分享
big
data
spark
Spark
SQL 源码解析
Spark
Planner
文章目录物理计划转换过程
Spark
Plan分类LeafExecNodeUnaryExecNodeBinaryExecNode其他类型的
Spark
Plan
Spark
PlannerPlanLaterplan
Spark
Strategy.applycollectPlaceholdersplaceholders
KD_
·
2023-11-27 03:03
Spark
Spark
入门之五:
Spark
SQL的原理以及架构
1、
Spark
SQL的发展历程1.1HiveandShark
Spark
SQL的前身是Shark,给熟悉RDBMS但又不理解MapReduce的技术人员提供快速上手的工具,Hive应运而生,它是当时唯一运行在
铁猴
·
2023-11-27 03:03
Spark
Spark入门简单学
Spark
SparkSQL
架构
Spark
SQL讲解
一
Spark
SQL是什么1.1
Spark
SQL的出现契机数据分析的方式数据分析的方式大致上可以划分为SQL和命令式两种:命令式在前面的RDD部分,非常明显可以感觉的到是命令式的,主要特征是通过一个算子,
北山璎珞
·
2023-11-27 03:32
Spark
SparkSQL
SparkSQL学习
spark
SQL1.1入门之二:
spark
SQL运行架构
在介绍
spark
SQL之前,我们首先来看看,传统的关系型数据库是怎么运行的。
chuozhi7142
·
2023-11-27 03:02
scala
数据库
大数据
spark
SQL1.1入门之二:
spark
SQL执行架构
在介绍
spark
SQL之前。我们首先来看看,传统的关系型数据库是怎么执行的。
aofan9566
·
2023-11-27 03:31
scala
数据库
大数据
Spark
SQL之Optimized LogicalPlan生成过程
经过Analyzer的处理,UnresolvedLogicalPlan已经解析成为AnalyzedLogicalPlan。AnalyzedLogicalPlan中自底向上节点分别对应Relation、Subquery、Filter和Project算子。 AnalyzedLogicalPlan基本上是根据UnresolvedLogicalPlan一对一转换过来的,对于SQL语句中的逻辑能够很好
RainTicking
·
2023-11-27 03:31
大数据
大数据
scala
Spark
:读取mysql数据作为DataFrame
{Calendar,Date}importcom.iptv.domain.DatePatternimportcom.iptv.job.JobBaseimportorg.apache.
spark
.sql.expressions.Windowimportorg.apa
利伊奥克儿
·
2023-11-27 02:57
【计算机网络
学习之路
】日志和守护进程
文章目录前言一.日志介绍二.简单日志1.左字符串2.右字符串三.守护进程1.ps-axj命令2.会话扩展命令3.创建守护进程结束语前言本系列文章是计算机网络学习的笔记,欢迎大佬们阅读,纠错,分享相关知识。希望可以与你共同进步。本篇博客介绍简单,较为基础的日志。日志和守护进程都是辅助服务器的,一个是服务器的运行信息,一个是服务器的运行方式一.日志介绍日志是记录事件,运行结果的工具日志文件是重要的系统
好想有猫猫
·
2023-11-27 00:53
计算机网络学习之路
计算机网络
学习
网络
c语言
c++
服务器
linux
window环境下安装
spark
spark
是大数据计算引擎,拥有
Spark
SQL、
Spark
Streaming、MLlib和GraphX四个模块。
FTDdata
·
2023-11-26 22:42
spark
spark
大数据
48期演讲训练营9.1复盘
今年的9.1我家老公开始了演讲
学习之路
,报名21天演讲训练营。今年9.1是演讲训练营48期开营日,也是我在星球浸泡的第三个月的第一天。48期演讲训练营开营,我收到了二个动,分别是感动,触动。
赵燕娜
·
2023-11-26 22:07
讯飞星火知识库文档问答Web API的使用(二)
上一篇提到过星火
spark
大模型,现在有更新到3.0:给ChuanhuChatGPT配上讯飞星火
spark
大模型V2.0(一)同时又看到有知识库问答的webapi,于是就测试了一下。
悟乙己
·
2023-11-26 21:54
LLM大模型
前端
服务器项目怎么连接数据库,项目使用服务器上的数据库连接
项目使用服务器上的数据库连接内容精选换一换该任务指导用户使用Loader将数据从关系型数据库导入到
Spark
。创建或获取该任务中创建Loader作业的业务用户和密码。
sched yield
·
2023-11-26 19:22
服务器项目怎么连接数据库
Mybatis源码
学习之路
三反射模块核心类Reflector类详解
前言:Reflector是Mybatis中反射模块的基础,每个Reflector对象都对应一个类,而Reflector中缓存了反射操作需要使用的类的原信息本片博客详解了下Reflector中各个方法是如何将属性中所需的信息进行填充的,代码中都写入的比较详细的注释Reflector类解析:类成员变量解析://对应的Class类型privatefinalClasstype;//可读属性的名称集合,可读
wuxiaohao1128
·
2023-11-26 19:55
mybatis
Mybaits源码
开启营销
学习之路
吧。
先从各种概念开始,开启营销
学习之路
吧。我是用思维导图整理了一些个人认为比较重要的点,放在mindmaster导图社区了。
2281882d3d0b
·
2023-11-26 19:48
一起走的
学习之路
(221)
今天早上还在和方同学一起讨论,离开了现在的工作岗位,我能干什么。确实不是一次这样问自己,有的时候我们觉得我们在单位上还挺重要的,很多工作,觉得只有我们做,才会做的很好。可事实上,这个社会绝对不是缺了谁就不能运转,而且相反的是,我们一旦脱离了这个体制的身份,那么做什么我想都会比现在要困难一些,因为对于现在的我而言,根本没有什么能够独立出去的能力。常常在给自己说要多学习学习一些本领,可是自己的事受众面
小米雨路
·
2023-11-26 19:18
大数据集群高可用组建搭建部署
大数据集群高可用安装部署包有:redis-3.2.10.tar.gz
spark
-2.2.0-bin-hadoop2.7.tgzhbase-1.2.1-bin.tar.gzhadoop-2.8.1.tar.gzapache-hive
Big-Hadoop
·
2023-11-26 19:18
笔记
hadoop
hdfs
kafka
mapreduce
spark
平台环境部署的相关大数据
本文利用云服务器对大数据平台进行环境部署,包含:服务器使用、环境准备、Hadoop集群完全分布式安装、Zookeeper集群完全分布式安装、HBase完全分布式安装、Hive、Scala、
Spark
、Sqoop
云建站架构师rain
·
2023-11-26 19:45
腾讯云
服务器
云计算
传统数仓和clickhouse对比
背景传统数仓一般都是Hive+
Spark
Sql作为代表,不过也包括Kylin等,而clickhouse是实时OLAP的代表,我们简单看下他们的对比传统数仓和clickhouse对比Hive+
Spark
SQL
lixia0417mul2
·
2023-11-26 19:06
clickhouse
clickhouse
Python基础
学习之路
(五) ------ 格式符% / format()
一.格式符%案例:print('我的幸运数字是%d'%8)#8以整数展示print('我的幸运数字是%s'%8)#8以字符串展示print(8)#整数8与字符串'8'打印出来的结果是一样的print('8')运行结果:我的幸运数字是8我的幸运数字是8882.format()format()函数用来占位的是大括号{},不用区分类型码(%+类型码)。具体的语法是:'str.format()',而不是课
千喜Ya
·
2023-11-26 18:59
Dr.Elephant入门
Dr.Elephant是一个Hadoop和
Spark
的性能监控和调优工具,由LinkedIn于2016年4月份开源。能自动化收集所有计算任务指标,进行数据分析,并以简单易用的方式进行呈现。
文贞武毅
·
2023-11-26 17:46
学习升维训练营Day1
听到了什么大早上就听到了我喜欢的主持人七喜和海鹏的声音,开启了我今天的
学习之路
。
水心_7902
·
2023-11-26 17:14
【开源组件】- 关于Jetcache的使用
关于Jetcache的使用生命不息,写作不止继续踏上
学习之路
,学之分享笔记总有一天我也能像各位大佬一样分享学习心得,欢迎指正,大家一起学习成长!
一个有梦有戏的人
·
2023-11-26 15:12
开源组件
Alibaba
jetcache
java
后端
【JVM系列】- 穿插·对象的实例化与直接内存
对象的实例化与直接内存生命不息,写作不止继续踏上
学习之路
,学之分享笔记总有一天我也能像各位大佬一样分享学习心得,欢迎指正,大家一起学习成长!
一个有梦有戏的人
·
2023-11-26 15:40
JVM
jvm
java
后端
“夜光”:使用域隐藏代替域前置
文章来源|MS08067内网安全知识星球本文作者:
Spark
(Ms08067内网小组成员)众所周知,谷歌云和亚马逊云于2018年宣布停止支持域前置技术。
Ms08067安全实验室
·
2023-11-26 14:19
java
http
https
linux
网络
2023年全国职业院校技能大赛-赛题第01套-GZ033 大数据应用开发
目录任务A:大数据平台搭建(容器环境)(15分)子任务一:Hadoop完全分布式安装配置子任务二:
Spark
onYarn安装配置子任务三:HBase分布式安装配置任务B:离线数据处理(25分)子任务一:
你可知这世上再难遇我
·
2023-11-26 13:48
各类赛项赛题比赛综合任务书
大数据
数据采集
数据挖掘
1.5.1.2
Spark
的部署与安装
总目录:https://www.jianshu.com/p/e406a9bc93a9Hadoop-子目录:https://www.jianshu.com/p/9428e443b7fd
Spark
的部署方式单机
寒暄_HX
·
2023-11-26 13:16
百度开源高性能 Python 分布式计算框架 Bigflow
Bigflow的设计中有许多思想借鉴自GoogleFlumeJava以及GoogleCloudDataflow,另有部分接口设计借鉴自Apache
Spark
。
妄心xyx
·
2023-11-26 12:25
【
Spark
】Ubuntu16.04
spark
集群安装 (standalone模式)
一、前言目前Apache
Spark
支持三种分布式部署方式,分别是:standalone
spark
onmesos
spark
onYARN其中,第一种类似于MapReduce1.0所采用的模式,内部实现了容错性和资源管理
w1992wishes
·
2023-11-26 11:50
DBT踩坑第二弹
总结下dbt-
spark
踩到的坑,连接方式采用的是thrift连接+Kerberos认证。
淡定一生2333
·
2023-11-26 10:02
DBT
数据库
一起走的
学习之路
(349)
如何理解领导的意思今天早上一早就发现微信建了一个新群,据了解是某个领导说之前我们那个跑步群人太多了,建议就我们这几个经常在一起聚着跑步的人建一个群就行了。其实观察了一下,之前那个群里面也就16个人,今天我们重新组建一个群,也就11个人,看起来差不了多少。当时自己就思考了一下,领导为什么要让重新建一个群,其实这些群对我们平时的工作生活来说并没有太大影响,只是大家在群里面分享一下自己的生活聊聊。我想那
小米雨路
·
2023-11-26 10:33
掌握
spark
3.0中的查询计划
本文翻译自MasteringQueryPlansin
Spark
3.0,能够很好的帮助学习
spark
sql理解
spark
UI的计划,决定翻译记录一下。
鸿乃江边鸟
·
2023-11-26 09:16
AIGC创作系统ChatGPT网站源码、支持最新GPT-4-Turbo模型、GPT-4图片对话能力+搭建部署教程
一、AI创作系统
Spark
Ai创作系统是基于ChatGPT进行开发的Ai智能问答系统和Midjourney绘画系统,支持OpenAI-GPT全模型+国内AI全模型。
白云如幻
·
2023-11-26 09:50
人工智能
ChatGPT
软件源码
chatgpt
AIGC
人工智能
(转载)
Spark
任务输出文件过程详解
一、
Spark
任务输出文件的总过程当一个Job开始执行后,输出文件的相关过程大概如下:1、Job启动时创建一个目录:${output.dir}/_temporary/${appAttemptId}作为本次运行的输出临时目录
淡定一生2333
·
2023-11-26 09:09
Spark学习
Spark
任务输出文件过程详解
文章目录一、
Spark
任务输出文件的总过程二、Commit细节分析1、commitTask介绍1.1、判断是否需要commit1.2、task的commit细节2、commitJob介绍三、V1和V2commiter
疯狂哈丘
·
2023-11-26 09:07
spark
大数据
spark输出文件
spark
spark任务性能优化
简略
Spark
输出
http://blog.jobbole.com/86232/
Spark
(和Py
Spark
)的执行可以特别详细,很多INFO日志消息都会打印到屏幕。
chenlongzhen_tech
·
2023-11-26 09:37
python
python
Spark
SQL输入输出
1、对于
Spark
SQL的输入需要使用
spark
Session.read方法1)、通用模式
spark
Session.read.format("json").load("path")支持类型:parquet
sinat_36710456
·
2023-11-26 09:37
大数据
Spark
SQL
输入
输出
spark
输出结果压缩(gz)
如果不想往下看,可以直接看结果:maxCallRdd.repartition(3).saveAsTextFile(path,GzipCodec.class);恩,没错。就只这么一行简单的代码实现了gz压缩,但是为什么网上一直没找到呢,这个我不太清楚,可能是他们没碰到吧。最近项目的需求,其实很简单,就是将输出结果以.gz的格式压缩,每个压缩包的大小不能超过100M,而且压缩包的名称也有要求,就是要以
fjr_huoniao
·
2023-11-26 09:00
spark
spark
gz压缩
【
spark
】控制日志输出的方法
目录一、控制日志输出方法二、代码测试一、控制日志输出方法1、使用
spark
默认的log4j配置文件设置日志输出级别Logger.getLogger("org.apache.
spark
").setLevel
郝少
·
2023-11-26 09:30
大数据
Spark技术经验
spark
日志
Spark
Streaming(四)——输出
输出操作如下:1)print():在运行流程序的驱动结点上打印DStream中每一批次数据的最开始10个元素。这用于开发和调试。2)saveAsTextFiles(prefix,[suffix]):以text文件形式存储这个DStream的内容。每一批次的存储文件名基于参数中的prefix和suffix。”prefix-Time_IN_MS[.suffix]”。3)saveAsObjectFile
爱喝水的绿萝
·
2023-11-26 09:29
spark
streaming
spark
大数据
big
data
Spark
导出
3
Spark
导出在使用
Spark
之前,先将编译好的classes导出为jar比较好,可以$sbt/sbtassembly将
Spark
及其依赖包导出为jar,放在core/target/
spark
-core-assembly
a2261504394
·
2023-11-26 09:59
Spark
多文件输出的两种形式
#所需环境版本jdk=1.8scala.version=2.11.0
spark
.version=2.3.2hadoop.verison=2.7.2importorg.apache.hadoop.io.
一只咸鱼va
·
2023-11-26 09:58
spark
spark
scala
大数据
使用
Spark
进行结构化流处理并将结果输出到终端或指定位置
使用
Spark
进行结构化流处理并将结果输出到终端或指定位置
Spark
是一个强大的大数据处理框架,提供了许多功能强大的组件,其中包括StructuredStreaming,它是
Spark
的流处理引擎。
心之所向,或千或百
·
2023-11-26 09:24
spark
linq
大数据
最初的喜欢
喜欢也许就来源于看你的第一眼,但那年的夏天我学会了成长也学会了对你的放手,那年我正步入高三,为了更好的
学习之路
我离开了家乡,到了一个远方,在车上的时候每每想起父母的关爱与小伙伴的笑脸,不知不觉眼泪已落下
十壹猫
·
2023-11-26 08:41
c++入门
个人名片:作者简介:一名乐于分享在学习道路上收获的大二在校生❄个人主页:GOTXX个人WeChat:ILXOXVJE本文由GOTXX原创,首发CSDN系列专栏:零基础学习C语言-----数据结构的
学习之路
每日一句
GOTXX
·
2023-11-26 08:35
c++的学习之路
c++
开发语言
C++类与对象(上)
个人名片:作者简介:一名乐于分享在学习道路上收获的大二在校生❄个人主页:GOTXX个人WeChat:ILXOXVJE本文由GOTXX原创,首发CSDN系列专栏:零基础学习C语言-----数据结构的
学习之路
每日一句
GOTXX
·
2023-11-26 08:35
c++的学习之路
c++
归并排序详解
个人名片:作者简介:一名乐于分享在学习道路上收获的大二在校生❄个人主页:GOTXX个人WeChat:ILXOXVJE本文由GOTXX原创,首发CSDN系列专栏:零基础学习C语言-----数据结构的
学习之路
每日一句
GOTXX
·
2023-11-26 08:05
数据结构的学习之路
排序算法
数据结构
算法
上一页
48
49
50
51
52
53
54
55
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他