E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
实时处理spark安装部署
1、KVM
安装部署
(1)yuminstallvirt-installqemu-kvmqemu-imglibvirtlibvirt-python.x86_64virt-managerpython-virtualenvlibvirt-client(2)yumgroupinstall-y"虚拟化主机|VirtualizationHost"yuminstall-yvirt-managerssh-Xip:port#带x11图
小短腿电工
·
2024-02-01 06:59
Spark
SQL的高级用法
一.快速生成多行的序列需求:请生成一列数据,内容为1,2,3,4,5--快速生成多行的序列--方式一selectexplode(split("1,2,3,4,5",","));--方式二/*序列函数sequence(start,stop,step):生成指定返回的列表数据[start,stop]必须传入,step步长可传可不传,默认为1,也可以传入负数,传入负数的时候,大数要在前,小数*/sele
Yan_bigdata
·
2024-02-01 06:42
spark
sql
大数据
行列表生成
开窗函数
横向迭代和纵向迭代
基于SpringBoot整合RocketMQ异步发送短信功能
引入依赖1.2编写配置1.3需求描述1.4Producer代码1.5Consumer代码二、阿里云短信服务2.1申请短信模板2.2短信配置2.3短信业务层代码前言上一篇文章记录了RocketMQ整体架构、
安装部署
南波塞文
·
2024-02-01 02:27
RocketMQ
消息中间件
SpringBoot
框架
java-rocketmq
spring
boot
rocketmq
8. 如何快速地把 Hive 中的数据导入 ClickHouse
文章目录HivetoClickHouseHiveSchemaClickHouseSchemaSeatunnelwithClickHouseSeatunnelSeatunnelPipeline
Spark
InputFilterOutputRunningSeatunnelConclusionHivetoClickHouse
helloooi
·
2024-02-01 00:29
#
Hive
hive
clickhouse
hadoop
ubuntu 20.04.4+uWSGI+Nginx
安装部署
Django+Vue的web前后端全过程记录(1-Django)
文章目录基本命令行安装虚拟环境及配置路径虚拟环境基本命令Xftp和FileZilla连接本地虚拟机查看虚拟机本地地址在使用sftp连接时,filezilla与虚拟机之间是通过ssh连接,所以需在虚拟机上安装ssh-server。连接成功,开始传输文件部署Django连接数据库有可能没有打开文件的权限到这里还没结束开启Mysql远程连接的权限一些可能发生的报错端口占用远程连接迁移本地数据库到虚拟机(
荻风溪畔
·
2024-02-01 00:25
Django
web笔记
笔记
ubuntu
nginx
vue
django
mysql
中国氢气泄漏检测传感器行业市场供需与战略研究报告
氢气泄漏检测传感器市场的企业竞争态势该报告涉及的主要国际市场参与者有NGK
Spark
PlugCOLTD、ShenzhenSafegasTechnologyCo、Limited、FlukeCorp、NeoxidGroup
贝哲斯研究中心
·
2024-01-31 23:39
其他
spark
从入门到放弃三十九:
Spark
Sql(12)
Spark
Sql工作原理以及性能优化
文章地址:http://www.haha174.top/article/details/2570731工作原理1.大家都知道,只要在数据库类型的技术里面,比如,最传统的mysql,Oracle包括现在大数据领域的数据仓库如Hive,他的基本Sql执行的模型,都是类似的,首先生成一条SQL语句的执行计划。例如Selectnamefromnames=>解析成从哪里去查询(names表在那个文件里面,从
意浅离殇
·
2024-01-31 20:42
Hbase BulkLoad用法
要导入大量数据,Hbase的BulkLoad是必不可少的,在导入历史数据的时候,我们一般会选择使用BulkLoad方式,我们还可以借助
Spark
的计算能力将数据快速地导入。
kikiki2
·
2024-01-31 19:00
Spark
Exchange节点和Partitioning
Exchange在explain时,常看到Exchange节点,这个节点其实就是发生了数据交换此图片来自于网络截取BroadcastExchangeExec主要是用来广播的ShuffleExchangeExec里面决定了数据分布的方式和采用哪种shuffle在这里可以看到好几种不同的分区器shufleManager创建不同的shuffle方式Distribution与PartitioningDis
orange大数据技术探索者
·
2024-01-31 19:34
#
源码探索文章迁移
大数据
spark源码
shuffle
window环境下安装
spark
spark
是大数据计算引擎,拥有
Spark
SQL、
Spark
Streaming、MLlib和GraphX四个模块。
FTDdata
·
2024-01-31 17:06
RabbitMQ入门概念
1.2应用场景1.3AMQP协议与RabbitMQ工作流程1.4Docker
安装部署
RabbitMQ二、SpringBoot连接MQ配置2.1示例12.1示例2——发送实体一、RabbitMQ入门1.1rabbitmq
云村小威
·
2024-01-31 17:52
RabbitMQ
+
Redis
rabbitmq
分布式
java
docker
spring
boot
Scala核心编程 第一章—Scala语言概述
一、Scala语言解释1.什么是Scala语言
Spark
—新一代内存级大数据计算框架,是大数据的重要内容。
Spark
就是使用Scala编写的。因此为了更好的学习
Spark
,需要掌握Scala这门语言。
我是星星我会发光i
·
2024-01-31 15:47
Scala核心编程
第一章
Scala语言概述
Prometheus详解(三)——Prometheus
安装部署
今天继续给大家介绍Linux运维相关知识,本文主要内容是Prometheus
安装部署
。在本文中,我们直接将Prometheus安装在了Kubernetes集群上,并没有在物理设备上部署。
永远是少年啊
·
2024-01-31 13:37
虚拟化运维
运维
linux
Prometheus
云原生
云计算
Docker离线
安装部署
RabbitMQ
一、首先确保系统环境有dockerdocker-version查看如果没有可以看我的另一篇离线安装docker的文章离线安装docker二、在有外网的地方下载好docker镜像1、拉取docker镜像dockerpullrabbitmq:management2、查看下载好的镜像dockerimages3、开始创建rabbitmq容器dockerrun-d-p5672:5672-p15672:156
易小染
·
2024-01-31 11:06
docker
docker
rabbitmq
linux
flink sql运用入门
Job)#步骤4:停止集群#三、SQL客户端#1、准备sql涉及的lib包2、编写sql脚本3、webui查看总结前言目前我司项目中有实时大屏的需求,涉及实时计算部分的选型(以开源为基础),目前主流选择有
spark
yc_zlj
·
2024-01-31 11:21
大数据
flink
大数据
Apache Flink -任意文件写入漏洞复现(CVE-2020-17518)
1、产品简介ApacheFlink是高效和分布式的通用数据处理平台,由Apache软件基金会开发的开源流处理框架,其核心是用Java和Scala编写的分布式流数据流引擎(简单来说,就是跟
spark
类似)
OidBoy_G
·
2024-01-31 10:52
漏洞复现
apache
flink
安全
web安全
网络安全
[
Spark
] 如何设置
Spark
资源
转自1.公众号[
Spark
学习技巧]如何设置
Spark
资源2.
Spark
性能优化篇一:资源调优
Spark
和YARN管理的两个主要资源:CPU和内存应用程序中每个
Spark
Executor都具有相同的固定数量的核心和相同的固定堆大小
LZhan
·
2024-01-31 10:07
【数据库】starrocks
安装部署
集群版
之前写过一篇427.【数据库】starrocks安装踩坑,今天把详细的安装步骤记录下来:一、环境准备starrocks安装包jdk8centos7服务器3台二、服务器互信任在三台服务器之间建立互信任,使得ssh连接时,无需输入密码,可参考170.【Linux】ssh-keyscan解决“离线环境”多节点互信任问题,里面的脚本可直接使用。互信任完成之后,就可以使用sync_scripts.sh脚本了
七镜
·
2024-01-31 10:26
java进阶
大数据史上最全Flink面试题,高薪必备,大数据面试宝典史上最全Hadoop面试题:尼恩大数据面试宝典专题1史上最全HBase面试题,高薪必备,架构必备史上最全Hive面试题,高薪必备,架构必备绝密100个
Spark
don't_know
·
2024-01-31 09:44
java
py
spark
学习-
spark
.sql.functions 聚合函数
https://
spark
.apache.org/docs/3.4.1/api/python/reference/py
spark
.sql/functions.html1.approx_count_distinct
heiqizero
·
2024-01-31 08:02
spark
spark
【
Spark
系列6】如何做SQL查询优化和执行计划分析
Apache
Spark
SQL使用Catalyst优化器来生成逻辑执行计划和物理执行计划。逻辑执行计划描述了逻辑上如何执行查询,而物理执行计划则是
Spark
实际执行的步骤。
周润发的弟弟
·
2024-01-31 08:01
spark
sql
大数据
【
Spark
系列5】Dataframe下常用算子API
Apache
Spark
DataFrameAPI提供了丰富的方法来处理分布式数据集。以下是一些常见的DataFrameAPI类别和方法,但这不是一个完整的列表,因为API非常广泛。
周润发的弟弟
·
2024-01-31 08:31
从零开始搞大数据
spark
大数据
分布式
中间件系列 - Kafka3.x从入门到精通
,深入全面)本内容仅用于个人学习笔记,如有侵扰,联系删除1Kafka概述1.1定义Kafka传统定义:Kafka是一个分布式的基于发布/订阅模式的消息队列(MessageQueue),主要应用于大数据
实时处理
领域
代码的知行者
·
2024-01-31 08:58
中间件
中间件
(一)Py
Spark
3:安装教程及RDD编程(非常详细)
目录一、py
spark
介绍二、Py
Spark
安装三、RDD编程1、创建RDD2、常用Action操作①collect②take③takeSample④first⑤count⑥reduce⑦foreach⑧countByKey⑨saveAsTextFile3
唯余木叶下弦声
·
2024-01-31 08:57
大数据
python
python
spark
spark-ml
pyspark
Spark
性能调优
Spark
性能调优executor内存不足用`UNIONALL`代替`UNION`persist与耗时监控executor内存不足问题表现1:Containerxxisrunningbeyondphysicalmemorylimits.Currentusage
HanhahnaH
·
2024-01-31 08:26
Spark
spark
大数据
分布式
Spark
如何用累加器Accumulator收集日志
Spark
如何用累加器Accumulator收集日志Accumulator如何使用Accumulator收集日志
Spark
任务的实际运算是交由众多executor来执行的,如果再执行算子内部打印日志,是需要到对应的
HanhahnaH
·
2024-01-31 08:03
Spark
spark
大数据
分布式
Hive安装配置及基本操作
Hive/GettingStarted下载地址http://archive.apache.org/dist/hive/github地址https://github.com/apache/hive2Hive
安装部署
_Unique_楠楠
·
2024-01-31 07:49
【新课】
安装部署
系列Ⅲ—Oracle 19c Data Guard部署之两节点RAC部署实战
本课程由云贝教育-刘峰老师出品,感谢关注课程介绍OracleRealApplicationClusters(RAC)是一种跨多个节点分布数据库的企业级解决方案。它使组织能够通过实现容错和负载平衡来提高可用性和可扩展性,同时提高性能。本课程基于当前主流版本Oracle19c+OEL7.9解析如何搭建2节点RAC对1节点单机的DATAGUARD搭建,让学员快速掌握安装流程。适合人群IT开发,运维、架构
云贝教育-郑老师
·
2024-01-31 07:56
oracle
数据库
dba
大数据
分布式虚拟文件系统,如何实现多种存储系统的融合
随着大数据技术和人工智能技术的发展,各种框架应运而生,比如大数据领域中的MapReduce和
Spark
,人工智能领域中的TensorFlow和PyTorch等。
数据存储张
·
2024-01-31 07:20
分布式
国内外FPGA主要厂商和其主要芯片
前言随着人工智能的普及,在落地过程中由于需要
实时处理
大批量的图片和视频数据,在硬件设计过程中,fpga都会作为硬件架构中的周转,所以近年来fpga工程师的需求越来越大,本文旨在归纳一下目前市场主流的fpga
程老师讲FPGA
·
2024-01-31 07:13
fpga开发
大数据-
Spark
-关于Json数据格式的数据的处理与练习
上一篇:大数据-MapReduce-关于Json数据格式的数据的处理与练习-CSDN博客16.7Json在
Spark
中的引用依旧利用上篇的数据去获取每部电影的平均分{"mid":1,"rate":6,"
王哪跑nn
·
2024-01-31 06:50
大数据
spark
大数据
spark
json
大数据开发:hadoop系统搭建以及
spark
编程
csdn这个坑先留着…传送门:https://github.com/louxinyao/Hadoop-
spark
墨染枫
·
2024-01-31 06:47
大数据开发
大数据
分布式
hadoop
spark
2024.1.25 Object_basic 用户画像标签开发过程 面向对象定义基类
/usr/bin/envpython#@desc:__coding__="utf-8"__author__="bytedance"frompy
spark
.sqlimport
Spark
Session,DataFramefrompy
spark
.sql.typesimportStringTypefr
白白的wj
·
2024-01-31 06:03
python
大数据
spark
database
elasticsearch
2024.1.20 用户画像标签开发,面向过程方法
/usr/bin/envpython#@desc:__coding__="utf-8"__author__="bytedance"frompy
spark
.sqlimport
Spark
Session,DataFramefrompy
spark
.sql.typesimportStringTypefromcom.bytedance.tag.base.parse_ruleimportEsMetaimpo
白白的wj
·
2024-01-31 06:32
python
大数据
hadoop
elasticsearch
spark
大数据存储与处理技术之
Spark
1、
Spark
简介•
Spark
最初由美国加州伯克利大学(UCBerkeley)的AMP实验室于2009年开发,是基于内存计算的大数据并行计算框架,可用于构建大型的、低延迟的数据分析应用程序•2013年
Spark
小嘤嘤怪学
·
2024-01-31 05:28
spark
hadoop
2024.1.30
Spark
SQL的高级用法
目录1、如何快速生成多行的序列2、如何快速生成表数据3.开窗函数排序函数平分函数聚合函数向上向下窗口函数1、如何快速生成多行的序列--需求:请生成一列数据,内容为1,2,3,4,5仅使用select语句selectexplode(split('1,2,3,4,5',','))asnum;--需求:请生成一列数据,内容1~100python中有一个函数range(1,100)--SQL函数:http
白白的wj
·
2024-01-31 05:56
spark
sql
大数据
database
hive
数据仓库
数据库
如何使用Python+Flask搭建本地Web站点并结合内网穿透公网访问?
文章目录前言1.
安装部署
Flask并制作SayHello问答界面2.安装Cpolar内网穿透3.配置Flask的问答界面公网访问地址4.公网远程访问Flask的问答界面前言Flask是一个Python编写的
程思扬
·
2024-01-31 04:00
python
flask
前端
网络
安全
远程工作
Structured Streaming 基于 event-time 的窗口(Java语言)
在这种机制下,即不必考虑
Spark
陆续接收事件的顺序是否与事件发生的顺序一致,也不必考虑事件到达
Spark
的时间与事件发生时间的关系。因此,它在提高数据处理精度的同时,大大减少了开发者的工作量。
2301_79479951
·
2024-01-31 00:19
java
开发语言
spark
启动bin/
spark
-shell警告:WARN NativeCodeLoader: Unable to load native-hadoop library for your platform.
启动bin/
spark
-shell警告:WARNNativeCodeLoader:Unabletoloadnative-hadooplibraryforyourplatform...usingbuiltin-javaclasseswhereapplicable
2301_79479951
·
2024-01-31 00:18
spark
hadoop
大数据
第18章 使用MariaDB数据库管理系统
一、初始化mariaDB服务
安装部署
MariaDB数据库主程序及服务端程yuminstallmariadbmariadb-server对数据库程序进行初始化操作:1、设置root管理员在数据库中的密码
weixin_33912453
·
2024-01-30 23:56
安装部署
halo博客
Docker安装文档:https://docs.docker.com/engine/install/DockerCompose安装文档:https://docs.docker.com/compose/install/mkdir~/halo&&cd~/halotouch~/halo/docker-compose.yamlvimapplication.yamlapplication.yamlversi
FanZheGOGOGO
·
2024-01-30 22:40
java
DAB01 构建MySQL服务器、 数据库基本管理 、 MySQL 数据类型
下载:mysql-5.7.17.tar重新克隆新的虚拟机:eth0网卡:192.168.4.50-192.168.4.57/8台虚拟机主机名称:mysql50-mysql57一:
安装部署
MySQL准备工作
mid的博客
·
2024-01-30 22:26
MySQL数据库知识集
构建MySQL服务器
数据库基本管理
MySQL数据类型
Kafka常见问题
1.Kafka介绍Kafka是一个分布式的基于发布/订阅模式的消息队列(MessageQueue),主要应用于大数据
实时处理
领域。
头未秃
·
2024-01-30 21:48
笔记
kafka
003-90-16【
Spark
SQL&DF&DS】慈航寺庙山脚下八卦田旁油菜花海深处人家王二爷家女儿大红用GPT学习Rdd和Dataaset 以及DataFrame 的转换
003-90-16【
Spark
SQL&DF&DS】慈航寺庙山脚下八卦田旁油菜花海深处人家王二爷家女儿大红用GPT学习Rdd和Dataaset以及DataFrame的转换【
Spark
SQL&DF&DS】Dataset
一杯派蒙
·
2024-01-30 21:31
spark
gpt
学习
spark
大数据
分布式
Spark
SQL之函数解析
!!expr-Logicalnot.不的意思Examples:>SELECT!true;false>SELECT!false;true>SELECT!NULL;NULLSince:1.0.0!=expr1!=expr2-Returnstrueifexpr1isnotequaltoexpr2,orfalseotherwise.如果expr1不等于expr2则返回true,否则返回false。Argu
OnePandas
·
2024-01-30 21:00
Spark
spark
从术语到
Spark
,10篇必读大数据学习资源
本文给想进入大数据领域的朋友提供了一系列的资源,由浅入深,比如“需要了解的51条大数据术语”、“学习python的四个理由”、“十一个必须要参加的大数据会议”等有趣的话题。相信各种背景的朋友都会在这篇文章中有所收获。之前,我们已就数据可视化进行了深入探讨。这次,我们将从更基本的概念讲起,以便在涉足更复杂的数据科学和商业智能之前能够真正理解大数据。文中会引领大家阅读介绍大数据的相关文章,研究网络上流
大数据的时代
·
2024-01-30 20:34
Spark
Submit提交时,Json字符串作为参数
今天遇到一个把json作为参数传入
spark
程序中的问题原因如下,
Spark
源码中会对把}}和{{替换掉@VisibleForTestingpublicstaticStringexpandEnvironment
南修子
·
2024-01-30 19:21
Spark
读取、写入时序数据库TDengine以及TDengine概述
一、TDengine是什么TDengine是一款高性能、分布式、支持SQL的时序数据库,其核心代码,包括集群功能全部开源(开源协议,AGPLv3.0)。TDengine能被广泛运用于物联网、工业互联网、车联网、IT运维、金融等领域。除核心的时序数据库功能外,TDengine还提供缓存、数据订阅、流式计算等大数据平台所需要的系列功能,最大程度减少研发和运维的复杂度。1.TDengine总结出了物联网
Alex_81D
·
2024-01-30 18:10
数据库
大数据基础
时序数据库
PDF如何提取页面
操作软件:旋风PDF编辑器下载地址:http://www.679
spark
le.com/pdfeditor1.下载旋风PDF编辑器安装完之后,点击右下角的打开文件按钮
六号_db7a
·
2024-01-30 18:24
ELK集群搭建(基础教程)
ELK集群搭建(基础教程)目录:机器准备集群内各台机器安装Elasticsearch
安装部署
Kafka(注:每个节点都配置,注意ip不同)安装logstash工具安装filebeatELK收集Nginx
lqcbj_IT老混混
·
2024-01-30 16:41
ELK集群
elk
上一页
12
13
14
15
16
17
18
19
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他