E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
spark经验总结
Hbase BulkLoad用法
要导入大量数据,Hbase的BulkLoad是必不可少的,在导入历史数据的时候,我们一般会选择使用BulkLoad方式,我们还可以借助
Spark
的计算能力将数据快速地导入。
kikiki2
·
2024-01-31 19:00
Spark
Exchange节点和Partitioning
Exchange在explain时,常看到Exchange节点,这个节点其实就是发生了数据交换此图片来自于网络截取BroadcastExchangeExec主要是用来广播的ShuffleExchangeExec里面决定了数据分布的方式和采用哪种shuffle在这里可以看到好几种不同的分区器shufleManager创建不同的shuffle方式Distribution与PartitioningDis
orange大数据技术探索者
·
2024-01-31 19:34
#
源码探索文章迁移
大数据
spark源码
shuffle
阿里java开发手册最新版-嵩山版(md版)
阿里java开发手册最新版-嵩山版(md版)前言《Java开发手册》是阿里巴巴集团技术团队的集体智慧结晶和
经验总结
,经历了多次大规模一线实战的检验及不断完善,公开到业界后,众多社区开发者踊跃参与,共同打磨完善
不会打字314
·
2024-01-31 19:02
javaSE
工具库
java
阿里开发手册 嵩山版-编程规约 (十) 前后端规约
历史版本前言《Java开发手册》是阿里巴巴集团技术团队的集体智慧结晶和
经验总结
,经历了多次大规模一线实战的检验及不断完善,公开到业界后,众多社区开发者踊跃参与,共同打磨完善,系统化地整理成册,当前的版本是嵩山版
软工菜鸡
·
2024-01-31 19:01
阿里巴巴编程开发手册
java
开发语言
服务器
spring
spring
boot
阿里云
设计规范
阿里开发手册 嵩山版-编程规约 (十一) 其它
历史版本前言《Java开发手册》是阿里巴巴集团技术团队的集体智慧结晶和
经验总结
,经历了多次大规模一线实战的检验及不断完善,公开到业界后,众多社区开发者踊跃参与,共同打磨完善,系统化地整理成册,当前的版本是嵩山版
软工菜鸡
·
2024-01-31 19:31
阿里巴巴编程开发手册
java
服务器
spring
spring
boot
阿里云
设计规范
代码规范
阿里开发手册 嵩山版-编程规约 (五)日期时间的规范
历史版本前言《Java开发手册》是阿里巴巴集团技术团队的集体智慧结晶和
经验总结
,经历了多次大规模一线实战的检验及不断完善,公开到业界后,众多社区开发者踊跃参与,共同打磨完善,系统化地整理成册,当前的版本是嵩山版
软工菜鸡
·
2024-01-31 19:30
阿里巴巴编程开发手册
服务器
java
阿里云
代码规范
设计规范
阿里开发手册 嵩山版-编程规约 (九) 注释规约
历史版本前言《Java开发手册》是阿里巴巴集团技术团队的集体智慧结晶和
经验总结
,经历了多次大规模一线实战的检验及不断完善,公开到业界后,众多社区开发者踊跃参与,共同打磨完善,系统化地整理成册,当前的版本是嵩山版
软工菜鸡
·
2024-01-31 19:30
阿里巴巴编程开发手册
java
数据库
面经
注释规范
阿里云
设计规范
编码规范
阿里开发手册 嵩山版-编程规约 (一)命名规范
历史版本前言《Java开发手册》是阿里巴巴集团技术团队的集体智慧结晶和
经验总结
,经历了多次大规模一线实战的检验及不断完善,公开到业界后,众多社区开发者踊跃参与,共同打磨完善,系统化地整理成册,当前的版本是嵩山版
软工菜鸡
·
2024-01-31 19:00
阿里巴巴编程开发手册
java
阿里巴巴
阿里云
服务器
设计规范
代码规范
阿里开发手册 嵩山版-编程规约 (四)OOP规约-Java程序员必看知识点!!!
历史版本前言《Java开发手册》是阿里巴巴集团技术团队的集体智慧结晶和
经验总结
,经历了多次大规模一线实战的检验及不断完善,公开到业界后,众多社区开发者踊跃参与,共同打磨完善,系统化地整理成册,当前的版本是嵩山版
软工菜鸡
·
2024-01-31 19:00
阿里巴巴编程开发手册
服务器
java
阿里云
代码规范
设计规范
面向对象
阿里开发手册 嵩山版-编程规约 (三)代码格式
历史版本前言《Java开发手册》是阿里巴巴集团技术团队的集体智慧结晶和
经验总结
,经历了多次大规模一线实战的检验及不断完善,公开到业界后,众多社区开发者踊跃参与,共同打磨完善,系统化地整理成册,当前的版本是嵩山版
软工菜鸡
·
2024-01-31 19:59
阿里巴巴编程开发手册
java
阿里云
代码规范
编程规范
设计规范
服务器
spring
阿里开发手册 嵩山版-编程规约 (二)常量定义
历史版本前言《Java开发手册》是阿里巴巴集团技术团队的集体智慧结晶和
经验总结
,经历了多次大规模一线实战的检验及不断完善,公开到业界后,众多社区开发者踊跃参与,共同打磨完善,系统化地整理成册,当前的版本是嵩山版
软工菜鸡
·
2024-01-31 19:59
阿里巴巴编程开发手册
java
开发语言
阿里云
编程规范
阿里开发手册 嵩山版-编程规约 (六)集合处理
历史版本前言《Java开发手册》是阿里巴巴集团技术团队的集体智慧结晶和
经验总结
,经历了多次大规模一线实战的检验及不断完善,公开到业界后,众多社区开发者踊跃参与,共同打磨完善,系统化地整理成册,当前的版本是嵩山版
软工菜鸡
·
2024-01-31 19:28
阿里巴巴编程开发手册
java
算法
设计规范
阿里云
spring
java-ee
集合
window环境下安装
spark
spark
是大数据计算引擎,拥有
Spark
SQL、
Spark
Streaming、MLlib和GraphX四个模块。
FTDdata
·
2024-01-31 17:06
IBM SPSS统计课 第一课
变量类型和度量标准编程窗口SPSS数据文件格式构建
经验总结
作业
沈住氣
·
2024-01-31 17:11
蓝妖:蓝雪花黄叶是什么原因?这3点尤为重要,处理不好继续黄
蓝妖根据自己的养护
经验总结
,出现这种现象,多数是因为以下这3个原因。1、追肥不及时蓝雪花本身非常耐热,所以在夏季会一直处于生长旺盛期,不断地长新枝、开花。很多花友看着蓝雪花
蓝妖花园
·
2024-01-31 16:01
二十四节气之“雨水”:春风化雨燕归来
二十四节气是我国古代劳动人命根据长期的劳动
经验总结
编制的,用于辅助指导农事的一种历法。包括了二十四个时节和相应的气候特征。它很好的反映了太阳的运行周期,对于古代的农耕经济有着很重要的指导意义。
星尘梦羽
·
2024-01-31 16:43
大厂 5 年实时数据开发
经验总结
,Flink SQL 看这篇就够了!
本文摘编于《FlinkSQL与DataStream入门、进阶与实战》(500页、70万字)作者羊艺超,目前就职于快手,国内最早一批FlinkSQL使用者拥有从0到1使用FlinkSQL建设、保障及治理实时数仓的丰富经验京东机械工业出版社旗舰店限时5折使用SQL实现流处理的核心技术在了解了Table\SQLAPI的使用方法以及作业运行机制之后,接下来分析SQL实现流处理的核心技术。为什么要分析这个问
zhisheng_blog
·
2024-01-31 15:29
flink
sql
数据库
oracle
大数据
Scala核心编程 第一章—Scala语言概述
一、Scala语言解释1.什么是Scala语言
Spark
—新一代内存级大数据计算框架,是大数据的重要内容。
Spark
就是使用Scala编写的。因此为了更好的学习
Spark
,需要掌握Scala这门语言。
我是星星我会发光i
·
2024-01-31 15:47
Scala核心编程
第一章
Scala语言概述
题解 | #统计每个学校的答过题的用户的平均答题数#
(附交流群)前端快手实习一面满帮前端一面快手前端一面美的前端字节前端一面offer选择秋招投递华子你需要知道的十件事2023届春招的一点
经验总结
分享这种公司是真恶心啊,没钱招人就别招[发火][发火][发火
Buoluochuixue
·
2024-01-31 14:27
java
flink sql运用入门
Job)#步骤4:停止集群#三、SQL客户端#1、准备sql涉及的lib包2、编写sql脚本3、webui查看总结前言目前我司项目中有实时大屏的需求,涉及实时计算部分的选型(以开源为基础),目前主流选择有
spark
yc_zlj
·
2024-01-31 11:21
大数据
flink
大数据
Apache Flink -任意文件写入漏洞复现(CVE-2020-17518)
1、产品简介ApacheFlink是高效和分布式的通用数据处理平台,由Apache软件基金会开发的开源流处理框架,其核心是用Java和Scala编写的分布式流数据流引擎(简单来说,就是跟
spark
类似)
OidBoy_G
·
2024-01-31 10:52
漏洞复现
apache
flink
安全
web安全
网络安全
[
Spark
] 如何设置
Spark
资源
转自1.公众号[
Spark
学习技巧]如何设置
Spark
资源2.
Spark
性能优化篇一:资源调优
Spark
和YARN管理的两个主要资源:CPU和内存应用程序中每个
Spark
Executor都具有相同的固定数量的核心和相同的固定堆大小
LZhan
·
2024-01-31 10:07
java进阶
大数据史上最全Flink面试题,高薪必备,大数据面试宝典史上最全Hadoop面试题:尼恩大数据面试宝典专题1史上最全HBase面试题,高薪必备,架构必备史上最全Hive面试题,高薪必备,架构必备绝密100个
Spark
don't_know
·
2024-01-31 09:44
java
py
spark
学习-
spark
.sql.functions 聚合函数
https://
spark
.apache.org/docs/3.4.1/api/python/reference/py
spark
.sql/functions.html1.approx_count_distinct
heiqizero
·
2024-01-31 08:02
spark
spark
【
Spark
系列6】如何做SQL查询优化和执行计划分析
Apache
Spark
SQL使用Catalyst优化器来生成逻辑执行计划和物理执行计划。逻辑执行计划描述了逻辑上如何执行查询,而物理执行计划则是
Spark
实际执行的步骤。
周润发的弟弟
·
2024-01-31 08:01
spark
sql
大数据
【
Spark
系列5】Dataframe下常用算子API
Apache
Spark
DataFrameAPI提供了丰富的方法来处理分布式数据集。以下是一些常见的DataFrameAPI类别和方法,但这不是一个完整的列表,因为API非常广泛。
周润发的弟弟
·
2024-01-31 08:31
从零开始搞大数据
spark
大数据
分布式
(一)Py
Spark
3:安装教程及RDD编程(非常详细)
目录一、py
spark
介绍二、Py
Spark
安装三、RDD编程1、创建RDD2、常用Action操作①collect②take③takeSample④first⑤count⑥reduce⑦foreach⑧countByKey⑨saveAsTextFile3
唯余木叶下弦声
·
2024-01-31 08:57
大数据
python
python
spark
spark-ml
pyspark
Spark
性能调优
Spark
性能调优executor内存不足用`UNIONALL`代替`UNION`persist与耗时监控executor内存不足问题表现1:Containerxxisrunningbeyondphysicalmemorylimits.Currentusage
HanhahnaH
·
2024-01-31 08:26
Spark
spark
大数据
分布式
2022-07-25
无领导小组模拟面试
经验总结
:1.自己的表现中规中矩,对面试试题进行了思考,表达了自己的观点,与同伴分享了也听取了他们的想法,最后达成了一致。2.自己的感受整场面试下来感觉其乐融融的。
zwk_qaq
·
2024-01-31 08:02
Spark
如何用累加器Accumulator收集日志
Spark
如何用累加器Accumulator收集日志Accumulator如何使用Accumulator收集日志
Spark
任务的实际运算是交由众多executor来执行的,如果再执行算子内部打印日志,是需要到对应的
HanhahnaH
·
2024-01-31 08:03
Spark
spark
大数据
分布式
分布式虚拟文件系统,如何实现多种存储系统的融合
随着大数据技术和人工智能技术的发展,各种框架应运而生,比如大数据领域中的MapReduce和
Spark
,人工智能领域中的TensorFlow和PyTorch等。
数据存储张
·
2024-01-31 07:20
分布式
大数据-
Spark
-关于Json数据格式的数据的处理与练习
上一篇:大数据-MapReduce-关于Json数据格式的数据的处理与练习-CSDN博客16.7Json在
Spark
中的引用依旧利用上篇的数据去获取每部电影的平均分{"mid":1,"rate":6,"
王哪跑nn
·
2024-01-31 06:50
大数据
spark
大数据
spark
json
大数据开发:hadoop系统搭建以及
spark
编程
csdn这个坑先留着…传送门:https://github.com/louxinyao/Hadoop-
spark
墨染枫
·
2024-01-31 06:47
大数据开发
大数据
分布式
hadoop
spark
2024.1.25 Object_basic 用户画像标签开发过程 面向对象定义基类
/usr/bin/envpython#@desc:__coding__="utf-8"__author__="bytedance"frompy
spark
.sqlimport
Spark
Session,DataFramefrompy
spark
.sql.typesimportStringTypefr
白白的wj
·
2024-01-31 06:03
python
大数据
spark
database
elasticsearch
2024.1.20 用户画像标签开发,面向过程方法
/usr/bin/envpython#@desc:__coding__="utf-8"__author__="bytedance"frompy
spark
.sqlimport
Spark
Session,DataFramefrompy
spark
.sql.typesimportStringTypefromcom.bytedance.tag.base.parse_ruleimportEsMetaimpo
白白的wj
·
2024-01-31 06:32
python
大数据
hadoop
elasticsearch
spark
大数据存储与处理技术之
Spark
1、
Spark
简介•
Spark
最初由美国加州伯克利大学(UCBerkeley)的AMP实验室于2009年开发,是基于内存计算的大数据并行计算框架,可用于构建大型的、低延迟的数据分析应用程序•2013年
Spark
小嘤嘤怪学
·
2024-01-31 05:28
spark
hadoop
考研
经验总结
——英语篇
文章目录一、前言二、刷题情况三、关于背诵四、建议五、大作文模板作文词汇一、图画类作文1.1para.1description远景+近景(倒装+分词结构)1.2para.2interpretation(两正一反或一正一反)1.3para.3comment二、柱线饼表2.1linechart双柱对比图====线状图para.1descriptionpara.2interpretationpara.3c
周末不下雨
·
2024-01-31 05:56
#
24考研
考研
2024.1.30
Spark
SQL的高级用法
目录1、如何快速生成多行的序列2、如何快速生成表数据3.开窗函数排序函数平分函数聚合函数向上向下窗口函数1、如何快速生成多行的序列--需求:请生成一列数据,内容为1,2,3,4,5仅使用select语句selectexplode(split('1,2,3,4,5',','))asnum;--需求:请生成一列数据,内容1~100python中有一个函数range(1,100)--SQL函数:http
白白的wj
·
2024-01-31 05:56
spark
sql
大数据
database
hive
数据仓库
数据库
2021-02-17《梁衡的21堂作文课》感悟15
最后两个章节知识性的内容比较多,是作者
经验总结
。在谈文章标题的章节,作者说“未成文时题为梁,文成之后题为眼。”作者认为拟标题可以分为两类“一是直写,讲求准确、直白;二是曲写,讲求含蓄、美感。”
浅浅慢慢
·
2024-01-31 05:47
Structured Streaming 基于 event-time 的窗口(Java语言)
在这种机制下,即不必考虑
Spark
陆续接收事件的顺序是否与事件发生的顺序一致,也不必考虑事件到达
Spark
的时间与事件发生时间的关系。因此,它在提高数据处理精度的同时,大大减少了开发者的工作量。
2301_79479951
·
2024-01-31 00:19
java
开发语言
spark
启动bin/
spark
-shell警告:WARN NativeCodeLoader: Unable to load native-hadoop library for your platform.
启动bin/
spark
-shell警告:WARNNativeCodeLoader:Unabletoloadnative-hadooplibraryforyourplatform...usingbuiltin-javaclasseswhereapplicable
2301_79479951
·
2024-01-31 00:18
spark
hadoop
大数据
003-90-16【
Spark
SQL&DF&DS】慈航寺庙山脚下八卦田旁油菜花海深处人家王二爷家女儿大红用GPT学习Rdd和Dataaset 以及DataFrame 的转换
003-90-16【
Spark
SQL&DF&DS】慈航寺庙山脚下八卦田旁油菜花海深处人家王二爷家女儿大红用GPT学习Rdd和Dataaset以及DataFrame的转换【
Spark
SQL&DF&DS】Dataset
一杯派蒙
·
2024-01-30 21:31
spark
gpt
学习
spark
大数据
分布式
Spark
SQL之函数解析
!!expr-Logicalnot.不的意思Examples:>SELECT!true;false>SELECT!false;true>SELECT!NULL;NULLSince:1.0.0!=expr1!=expr2-Returnstrueifexpr1isnotequaltoexpr2,orfalseotherwise.如果expr1不等于expr2则返回true,否则返回false。Argu
OnePandas
·
2024-01-30 21:00
Spark
spark
从术语到
Spark
,10篇必读大数据学习资源
本文给想进入大数据领域的朋友提供了一系列的资源,由浅入深,比如“需要了解的51条大数据术语”、“学习python的四个理由”、“十一个必须要参加的大数据会议”等有趣的话题。相信各种背景的朋友都会在这篇文章中有所收获。之前,我们已就数据可视化进行了深入探讨。这次,我们将从更基本的概念讲起,以便在涉足更复杂的数据科学和商业智能之前能够真正理解大数据。文中会引领大家阅读介绍大数据的相关文章,研究网络上流
大数据的时代
·
2024-01-30 20:34
Spark
Submit提交时,Json字符串作为参数
今天遇到一个把json作为参数传入
spark
程序中的问题原因如下,
Spark
源码中会对把}}和{{替换掉@VisibleForTestingpublicstaticStringexpandEnvironment
南修子
·
2024-01-30 19:21
Spark
读取、写入时序数据库TDengine以及TDengine概述
一、TDengine是什么TDengine是一款高性能、分布式、支持SQL的时序数据库,其核心代码,包括集群功能全部开源(开源协议,AGPLv3.0)。TDengine能被广泛运用于物联网、工业互联网、车联网、IT运维、金融等领域。除核心的时序数据库功能外,TDengine还提供缓存、数据订阅、流式计算等大数据平台所需要的系列功能,最大程度减少研发和运维的复杂度。1.TDengine总结出了物联网
Alex_81D
·
2024-01-30 18:10
数据库
大数据基础
时序数据库
PDF如何提取页面
操作软件:旋风PDF编辑器下载地址:http://www.679
spark
le.com/pdfeditor1.下载旋风PDF编辑器安装完之后,点击右下角的打开文件按钮
六号_db7a
·
2024-01-30 18:24
如何接手一个大数据项目
以下是个人的一些思考总结:了解一个大数据系统,我认为需要从以下几个方面入手:宏观方面:1.了解系统的整体架构和技术栈:需要了解系统中使用的技术栈,包括各种大数据组件和工具,例如Hadoop、
Spark
、
Mmj666
·
2024-01-30 15:19
大数据
Spark
的核心RDD(Resilient Distributed Datasets弹性分布式数据集)
Spark
的核心RDD(ResilientDistributedDatasets弹性分布式数据集)铺垫在hadoop中一个独立的计算,例如在一个迭代过程中,除可复制的文件系统(HDFS)外没有提供其他存储的概念
fcyh
·
2024-01-30 15:46
Spark
Spark
RDD(弹性分布式数据集)
1.RDD1.1RDD是什么RDD(ResilientDistributedDataset):弹性分布式数据集,是
Spark
对数据集的抽象,代表一个只读、不可变、可分区、其中元素可进行并行计算的集合,并且是可跨越集群节点进行并行操作的有容错机制的集合
JOEL-T99
·
2024-01-30 15:15
BigData
spark
RDD
上一页
9
10
11
12
13
14
15
16
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他