E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
spark学习路线
2024.1.30
Spark
SQL的高级用法
目录1、如何快速生成多行的序列2、如何快速生成表数据3.开窗函数排序函数平分函数聚合函数向上向下窗口函数1、如何快速生成多行的序列--需求:请生成一列数据,内容为1,2,3,4,5仅使用select语句selectexplode(split('1,2,3,4,5',','))asnum;--需求:请生成一列数据,内容1~100python中有一个函数range(1,100)--SQL函数:http
白白的wj
·
2024-01-31 05:56
spark
sql
大数据
database
hive
数据仓库
数据库
python快速入门:基础语法精讲
需要更全面的学习可移步官方文档python学习资料推荐:阿里云社区-Python
学习路线
,菜鸟教程-Python基础教程01注释与引号pyhton中注释分为单行注释和多行
徐小潜
·
2024-01-31 05:58
python
python
学习方法
笔记
经验分享
开发语言
网络安全
想用verilog写一个npu 需要什么
学习路线
?
要用Verilog编写一个NPU(神经处理单元),你需要经过以下
学习路线
:数字电路基础:学习数字电路的基本概念,包括逻辑门、寄存器、时钟信号、信号传输等。
移知
·
2024-01-31 02:00
学习
fpga开发
Structured Streaming 基于 event-time 的窗口(Java语言)
在这种机制下,即不必考虑
Spark
陆续接收事件的顺序是否与事件发生的顺序一致,也不必考虑事件到达
Spark
的时间与事件发生时间的关系。因此,它在提高数据处理精度的同时,大大减少了开发者的工作量。
2301_79479951
·
2024-01-31 00:19
java
开发语言
spark
启动bin/
spark
-shell警告:WARN NativeCodeLoader: Unable to load native-hadoop library for your platform.
启动bin/
spark
-shell警告:WARNNativeCodeLoader:Unabletoloadnative-hadooplibraryforyourplatform...usingbuiltin-javaclasseswhereapplicable
2301_79479951
·
2024-01-31 00:18
spark
hadoop
大数据
知识点积累系列(九)开发规范篇【持续更新】
云原生
学习路线
导航页(持续更新中)本文是知识点积累系列文章的第九篇,记录日常学习中遇到的开发规范相关的知识点1.OpenAPI是什么,和swagger有什么区别OpenAPI:其实就是用于描述应用API
格桑阿sir
·
2024-01-30 21:13
云原生学习专栏
kubernetes
容器
云原生
golang
devops
代码规范
知识点积累系列(七)文件格式相关篇【持续更新】
云原生
学习路线
导航页(持续更新中)本文是知识点积累系列文章的第七篇,记录日常学习中遇到的文件格式相关的知识点1.toml格式是什么TOML旨在成为一个语义明显且易于阅读的最小化配置文件格式TOML可以无歧义地映射为哈希表官网
格桑阿sir
·
2024-01-30 21:43
云原生学习专栏
全文检索
xml
json
云原生
kubernetes
数据库
容器
知识点积累系列(八)各种IDE编辑器篇【持续更新】
云原生
学习路线
导航页(持续更新中)本文是知识点积累系列文章的第八篇,记录日常学习中遇到的各种IDE编辑器相关的知识点1.VSCode1.1.launch.json是干嘛的launch.json文件的主要作用是提供一个结构化的配置方式
格桑阿sir
·
2024-01-30 21:43
云原生学习专栏
编辑器
golang
vscode
go
java
idea
ide
知识点积累系列(六)操作系统(Linux+Windows+MacOS)篇【持续更新】
云原生
学习路线
导航页(持续更新中)本文是知识点积累系列文章的第六篇,记录日常学习中遇到的操作系统相关的知识点,包括Linux、Windows、MacOS等1.Linux相关1.1.shell脚本1.2.
格桑阿sir
·
2024-01-30 21:11
云原生学习专栏
linux
windows
macos
云计算
microsoft
003-90-16【
Spark
SQL&DF&DS】慈航寺庙山脚下八卦田旁油菜花海深处人家王二爷家女儿大红用GPT学习Rdd和Dataaset 以及DataFrame 的转换
003-90-16【
Spark
SQL&DF&DS】慈航寺庙山脚下八卦田旁油菜花海深处人家王二爷家女儿大红用GPT学习Rdd和Dataaset以及DataFrame的转换【
Spark
SQL&DF&DS】Dataset
一杯派蒙
·
2024-01-30 21:31
spark
gpt
学习
spark
大数据
分布式
Spark
SQL之函数解析
!!expr-Logicalnot.不的意思Examples:>SELECT!true;false>SELECT!false;true>SELECT!NULL;NULLSince:1.0.0!=expr1!=expr2-Returnstrueifexpr1isnotequaltoexpr2,orfalseotherwise.如果expr1不等于expr2则返回true,否则返回false。Argu
OnePandas
·
2024-01-30 21:00
Spark
spark
从术语到
Spark
,10篇必读大数据学习资源
本文给想进入大数据领域的朋友提供了一系列的资源,由浅入深,比如“需要了解的51条大数据术语”、“学习python的四个理由”、“十一个必须要参加的大数据会议”等有趣的话题。相信各种背景的朋友都会在这篇文章中有所收获。之前,我们已就数据可视化进行了深入探讨。这次,我们将从更基本的概念讲起,以便在涉足更复杂的数据科学和商业智能之前能够真正理解大数据。文中会引领大家阅读介绍大数据的相关文章,研究网络上流
大数据的时代
·
2024-01-30 20:34
Spark
Submit提交时,Json字符串作为参数
今天遇到一个把json作为参数传入
spark
程序中的问题原因如下,
Spark
源码中会对把}}和{{替换掉@VisibleForTestingpublicstaticStringexpandEnvironment
南修子
·
2024-01-30 19:21
IOS – OpenGL ES 桑原滤波/水粉画模糊效果 GPUImageKuwaharaFilter
目录一.简介二.效果演示三.源码下载四.猜你喜欢零基础OpenGL(ES)
学习路线
推荐:OpenGL(ES)学习目录>>OpenGLES基础零基础OpenGL(ES)
学习路线
推荐:OpenGL(ES)学习目录
猿说编程
·
2024-01-30 19:01
Spark
读取、写入时序数据库TDengine以及TDengine概述
一、TDengine是什么TDengine是一款高性能、分布式、支持SQL的时序数据库,其核心代码,包括集群功能全部开源(开源协议,AGPLv3.0)。TDengine能被广泛运用于物联网、工业互联网、车联网、IT运维、金融等领域。除核心的时序数据库功能外,TDengine还提供缓存、数据订阅、流式计算等大数据平台所需要的系列功能,最大程度减少研发和运维的复杂度。1.TDengine总结出了物联网
Alex_81D
·
2024-01-30 18:10
数据库
大数据基础
时序数据库
PDF如何提取页面
操作软件:旋风PDF编辑器下载地址:http://www.679
spark
le.com/pdfeditor1.下载旋风PDF编辑器安装完之后,点击右下角的打开文件按钮
六号_db7a
·
2024-01-30 18:24
Kubernetes operator(二)CRD篇
云原生
学习路线
导航页(持续更新中)本文是Kubernetesoperator学习系列第二篇,主要对CRD进行学习1.CRD介绍1.1.如何使用在K8S系统扩展点中,开发者可以通过CRD(CustomResourceDefinition
格桑阿sir
·
2024-01-30 17:32
云原生学习专栏
kubernetes
容器
云原生
devops
Kubernetes operator(三)code-generator 篇
云原生
学习路线
导航页(持续更新中)本文是Kubernetesoperator学习系列第三篇,主要对使用code-generator进行CRD自动代码生成进行学习Kubernetesoperator学习系列快捷链接
格桑阿sir
·
2024-01-30 17:32
云原生学习专栏
kubernetes
容器
云原生
golang
Kubernetes operator(四)controller-tools 篇
云原生
学习路线
导航页(持续更新中)本文是Kubernetesoperator学习系列第四篇,主要对使用controller-tools进行CRD自动代码生成进行学习Kubernetesoperator学习系列快捷链接
格桑阿sir
·
2024-01-30 17:32
云原生学习专栏
kubernetes
java
容器
云原生
go
docker
云原生
学习路线
导航页(持续更新中)
云原生
学习路线
导航页(持续更新中)本文作为云原生学习系列文章的导航页,内容实时更新,笔者会对其中列出的每一项,进行学习并整理成文章,敬请期待1、形成对云原生的基本认识2、golang学习2.1.golang
格桑阿sir
·
2024-01-30 17:02
云原生学习专栏
云原生
kubernetes
容器
go
后端
知识点积累系列(一)golang语言篇【持续更新】
云原生
学习路线
导航页(持续更新中)本文是知识点积累系列文章的第一篇,记录golang语言相关的知识点1.结构体的mapstructure是什么mapstructure:"default"mapstructure
格桑阿sir
·
2024-01-30 17:29
云原生学习专栏
golang
开发语言
后端
云原生
容器
docker
kubernetes
2024年Java
学习路线
【超详细超实用】
小伙伴们大家好,这里是动力节点,我们从2009年开始一直在从事Java培训到今年已经整15年了,虽然现在不缺培训机构,更不缺Java培训,但是像我们这么多年专注这一件事的应该也不多。我们只希望在“专业”两个字上面不断精进,给每一位想学Java的同学带来更好的资源和学习规划。我们深知,有很多同学对于培训费用、是否适合、怎么学等等有着各种各样的顾虑,在网上各大平台搜寻着学习方法资料等等,但是很难找到一
动力节点IT教育
·
2024-01-30 17:34
24年Java学习路线
java
学习
开发语言
如何接手一个大数据项目
以下是个人的一些思考总结:了解一个大数据系统,我认为需要从以下几个方面入手:宏观方面:1.了解系统的整体架构和技术栈:需要了解系统中使用的技术栈,包括各种大数据组件和工具,例如Hadoop、
Spark
、
Mmj666
·
2024-01-30 15:19
大数据
Spark
的核心RDD(Resilient Distributed Datasets弹性分布式数据集)
Spark
的核心RDD(ResilientDistributedDatasets弹性分布式数据集)铺垫在hadoop中一个独立的计算,例如在一个迭代过程中,除可复制的文件系统(HDFS)外没有提供其他存储的概念
fcyh
·
2024-01-30 15:46
Spark
Spark
RDD(弹性分布式数据集)
1.RDD1.1RDD是什么RDD(ResilientDistributedDataset):弹性分布式数据集,是
Spark
对数据集的抽象,代表一个只读、不可变、可分区、其中元素可进行并行计算的集合,并且是可跨越集群节点进行并行操作的有容错机制的集合
JOEL-T99
·
2024-01-30 15:15
BigData
spark
RDD
理解
Spark
中RDD(Resilient Distributed Dataset)
文章目录1RDD基础1.1分区1.2不可变1.3并行执行2RDD结构2.1
Spark
Context、
Spark
Conf2.2Partitioner2.3Dependencies2.4Checkpoint
小何才露尖尖角
·
2024-01-30 15:45
Spark
spark
RDD
弹性分布式数据集
依赖关系
RDD结构
Spark
RDD基础实战(弹性分布式数据集)
http://
spark
.apache.org/docs/latest/sql-data-sources-json.htmlhttp://jsonlines.org/examples/官网的准备的数据集合启动
蜗牛杨哥
·
2024-01-30 15:14
Spark
RDD编程实战指南
大数据
Spark
弹性分布式数据集(Resilient Distributed Dataset)
1.弹性分布式数据集RDD1.1.RDD概述1.1.1.什么是RDDRDD(ResilientDistributedDataset)叫做分布式数据集,是
Spark
中最基本的数据抽象,它代表一个不可变、可分区
你狗
·
2024-01-30 15:14
大数据
scala
Spark
——(RDD(弹性分布式数据集),RDD的创建和操作,Transformation 算子)
文章目录RDD(弹性分布式数据集)RDD的创建和操作常见的Transformation算子RDD(弹性分布式数据集)RDD(ResilientDistributedDataset)是
Spark
中的核心概念
想做CTO的任同学...
·
2024-01-30 15:12
Spark
spark
大数据
后端
开发语言
java
spark
学习笔记:弹性分布式数据集RDD(Resilient Distributed Dataset)
弹性分布式数据集RDD1.RDD概述1.1什么是RDDRDD(ResilientDistributedDataset)叫做弹性分布式数据集,是
Spark
中最基本的数据抽象,它代表一个不可变、可分区、里面的元素可并行计算的集合
黄道婆
·
2024-01-30 15:39
bigdata
【
Spark
】之 RDD(Resilient Distributed Dataset)
文章目录RDD编程模型一、RDD之间的依赖关系(Dependency)如何生成RDD?二、RDD计算(1)RDD获得数据(2)RDD计算任务(3)RDD操作算子三、RDD容错(1)`Lineage`(2)`checkpoint`机制RDD编程模型需求:需要在多个并行操作之间重用工作数据集。典型场景:机器学习和图应用中常用的迭代算法(每一步对数据执行相似的函数)数据重用隐藏在系统实现背后,没有将重用
fanfan4569
·
2024-01-30 15:39
【Spark】
Spark
RDD
Spark
Core之RDD---弹性分布式数据集
不可变3.依赖关系4.缓存(cache)5.检测点(CheckPoint)四、RDD的创建1.通过并行化的方式创建RDD2.读取文件生成RDD3.通过其他RDD转换五、RDD运行过程RDD的设计与运行原理
Spark
孤独の√ 3
·
2024-01-30 15:09
大数据
#
spark
分布式
【
Spark
】RDD(Resilient Distributed Dataset)究竟是什么?
目录基本概念官方文档概述含义RDD出现的原因五大属性以单词统计为例,一张图熟悉RDD当中的五大属性解构图RDD弹性RDD特点分区只读依赖缓存checkpoint基本概念官方文档介绍RDD的官方说明:http://
spark
.apache.org
关于我转生变成程序猿这档事
·
2024-01-30 15:08
Spark
大数据
spark
RDD
弹性分布式数据集
大数据自学
横扫
Spark
之 - RDD(Resilient Distributed Dataset)弹性分布式数据集
概念二、理解1.弹性2.分布式3.数据集三、5个主要特性1.一个分区列表2.作用在每个分区上的计算函数3.一个和其他RDD的依赖列表4.一个分区器(可选)5.计算的最佳位置(可选)一、概念 RDD就是
Spark
阿年、嗯啊
·
2024-01-30 15:07
Spark
分布式
spark
大数据
RDD
RDD的5个主要特性
当你要做数仓汇报时,应该怎么讲故事?
欢迎关注公众号:语数本期精选问题提问背景:了解高效的学习方向和针对性的
学习路线
,利用业余时间修炼自己,希望2年后收入和职级能有所提高。当下应制定怎样的
学习路线
?有哪些模块应深入学习或者考证?
语兴数据
·
2024-01-30 15:01
大数据
面试
职场和发展
以数仓视角切入
学习路线
,大数据真正需要学习的内容有哪些?
语数精选简介语数精选来源于语数社区星球球友提问,主要沉淀一些大家工作和学习过程中存在的一些共性问题,希望能够更好的帮助到球友和粉丝。本期精选问题作为数仓开发,需要学习哪些大数据基础知识?当整个数据链路过长时,如何进行模型优化?站在数仓开发角度,大数据技术需要学哪些语兴回答语言层面(必学):java学习Java的基础,多线程,反射,juc,锁,内部类,代码块那些,都要好好掌握,还有几个类String
语兴数据
·
2024-01-30 15:30
java
数据库
大数据
面试
数仓建设
学习路线
(四)-指标体系建设
指标体系建设目的与下游(风控/bi)达成合作,保障指标建设时口径的统一,完成指标覆盖,提升复用性,通过可视化方式提升查询效率指标中心图指标体系建设难点能否与下游达成共识(沟通)指标能否做到数仓收口需要与其他部门配合(数据平台/前端),进度难把控,容易烂尾如何推广给下游开发变更/下线规范难保障指标标准来源表信息保持一致做到尽可能从“核心表”复用字段口径统一(多数在dws层)业务口径(偏文字
语兴数据
·
2024-01-30 15:00
数仓建设-学习路线
学习
大数据
数据仓库
hive
数仓建设
学习路线
(五)-数据质量保障
什么是数据质量?数据质量,意如其名,就是数据的准确性,他是数据仓库的基石,控制好数据质量,是做数据仓库基本要求,也使得下游业务方对数据用的放心数据质量的痛点有哪些数据问题该如何上报修复,缺少流程化数据链路缺少卡点保障数据不能及时产出影响到下游用数用户无感知,除了发现的数据问题,隐藏的数据问题仍存在很多人会有一种想法,做了这么久的数仓为什么还存在质量问题?数据质量保障措施模型上线设计模型-
语兴数据
·
2024-01-30 15:00
程序人生
数仓建设
学习路线
(三)元数据管理
什么是元数据?简单来说就是描述数据的数据,更直白来说就是描述表名、表制作者、表字段、表生命周期、表存粗等信息的数据元数据该如何管理工具化开源:可通过atlas获取表依赖及信息做二次开发,或者完成可视化界面平台化:数据血缘数据血缘功能清晰知道表/任务上下游,方便排查问题,知道下游哪个模块在使用,提升开发效率及后期管理维护数据血缘类型活跃血缘:指离线开发线上调度产出的血缘,且调度持续生效静默血缘:指离
语兴数据
·
2024-01-30 15:59
数仓建设-学习路线
大数据
数据仓库
hive
数据治理实践 | 小文件治理
背景小文件是如何产生的:日常任务及动态分区插入数据(使用的
Spark
2MapReduce引擎),产生大量的小文件,从而导致
语兴数据
·
2024-01-30 15:29
大数据
数据治理
小文件治理
数据仓库
最新AI系统ChatGPT网站系统源码,支持Midjourney绘画V6 ALPHA绘画模型,GPT语音对话+ChatFile文档对话总结+DALL-E3文生图
一、前言
Spark
Ai创作系统是基于ChatGPT进行开发的Ai智能问答系统和Midjourney绘画系统,支持OpenAI-GPT全模型+国内AI全模型。
白云如幻
·
2024-01-30 14:49
人工智能
ChatGPT
软件源码
人工智能
chatgpt
语音识别
midjourney
gpt
ColorPicker的操作会影响Button按钮的样式,需注意~~~
ColorPicker的操作会将Button的样式修改,具体看下面的例子..例如:@namespaces"library://ns.adobe.com/flex/
spark
";@namespacemx"library
郎岳樟
·
2024-01-30 14:42
flex
button
library
application
function
import
c
spark
写hive的ORC表,count(*)没数据
使用
spark
向hive中插入数据,hive表是ORC表
spark
.sql("insertoverwritetableods.ods_aaapartition(pt,id)\n"+"select\n"+
青云游子
·
2024-01-30 09:49
Spark
spark
hive
大数据
Spark
快速入门(4) 核心概念和抽象:Actions
之前我们讲过,
Spark
中的transformations,只有在真正需要的时候才会执行计算,这里计算的触发器被称作actions。Driver&Executors我们先来介绍一些相关概念。
MeazZa
·
2024-01-30 09:55
详细分析Spring中的@Around注解(附Demo)
Demo2.1不带参数2.2带参数前言此知识点都来源于项目实战,对此进行科普总结,使得之后项目游刃有余对于Spring的基本知识,推荐阅读:Spring框架从入门到学精(全)java框架零基础从入门到精通的
学习路线
附开源项目面经等
码农研究僧
·
2024-01-30 08:26
java
spring
java
后端
8.hive安装 和 Hive环境准备 (hive on
Spark
、Yarn队列配置)
1Hive安装部署1)把apache-hive-3.1.2-bin.tar.gz上传到linux目录下2)解压apache-hive-3.1.2-bin.tar.gz到/opt/module/目录下面[root@node0906_hive]#tar-zxvfapache-hive-3.1.2-bin.tar.gz-C/opt/module/3)修改apache-hive-3.1.2-bin.tar
shenjianyu_rex
·
2024-01-30 08:23
Apache集群搭建
spark
大数据
hive
apache
Spark
为何使用Netty通信框架替代Akka
解决方案:一直以来,基于Akka实现的RPC通信框架是
Spark
引以为豪的主要特性,也是与Hadoop等分布式计算框架对比过程中一大亮点,但是时代和技术都在演化,从
Spark
1.3.1版本开始,为了解决大块数据
yyoc97
·
2024-01-30 07:56
网络
Spark
大数据
spark
通信
netty
akka
spark
window源码探索
核心类:1.WindowExec物理执行逻辑入口,主要doExecute()和父类WindowExecBase2.WindowFunctionFrame窗框执行抽象,其子类对应sql语句的不同窗框其中又抽象出BoundOrdering类,用于判断一行是否在界限内(Bound),分为RowBoundOrdering和RangeBoundOrdering我们的UDAF在何时已什么顺序接受数据,何时会被
orange大数据技术探索者
·
2024-01-30 07:19
#
源码探索文章迁移
spark
大数据
窗口函数
源码
Scala入门01
Spark
入门1.入门
spark
采用Scala语言开发
Spark
是用来计算的Scala掌握:特性,基本操作,集合操作,函数,模式匹配,trait,样例类,actor等内容。
chde2Wang
·
2024-01-30 07:48
scala
开发语言
后端
【
Spark
系列4】Task的执行
一、Task的执行流程1.1、Task执行流程DAGScheduler将Stage生成TaskSet之后,会将Task交给TaskScheduler进行处理,TaskScheduler负责将Task提交到集群中运行,并负责失败重试,为DAGScheduler返回事件信息等,整体如流程如下:当任务提交到TaskScheduler时,TaskScheduler会通知SchedulerBackend分配
周润发的弟弟
·
2024-01-30 07:15
从零开始搞大数据
java
服务器
开发语言
上一页
13
14
15
16
17
18
19
20
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他