E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
spark集群部署yarn
史上最全OLAP对比
目录1.什么是OLAP2.OLAP引擎的常见操作3.OLAP分类MOLAP的优点和缺点ROLAP的优点和缺点4.并发能力与查询延迟对比5.执行模型对比5.OLAP引擎的主要特点5.2
Spark
SQL、FlinkSQL5.3Clickhouse5.4Elasticsearch5.5Presto5.6Impala5.7Doris5.8Druid5.9Kylin
只会写demo的程序猿
·
2024-02-08 11:04
数仓
spark
hadoop
数据仓库
Spark
:基于莱文斯坦(Levenshtein)距离计算字符串相似度
以下程序代码基于
spark
,使用scala语言,测试时间:2018-08-03str1和str2相似度=1-Levenshtein距离/max(length(str1),length(str2))valdf
xuejianbest
·
2024-02-08 11:25
大数据
算法
编程语言/Scala
大数据/spark
Levenshtein
字符串相似
莱文斯坦距离
spark
scala
react-native-vector-icons的使用
1.安装三方包
yarn
addreact-native-vector-icons或npminstallreact-native-vector-icons--save2.自动linkreact-nativelinkreact-native-vector-iconsios
marlti7
·
2024-02-08 10:42
MML
Spark
+
Spark
:py
spark
+lightGBM应用实践
MML
Spark
,即MicrosoftMachineLearningforApache
Spark
,是微软开源的一个针对Apache
Spark
的深度学习和数据可视化的库。
bensonrachel
·
2024-02-08 10:38
spark
sql 数据类型转换_
spark
sql时间类型转换以及其他
1.
spark
sql的日期转换一般使用两种形式第一种使用to_timestamp(REACHTIME1,"yyyy-MM-ddHH24:mi:ss")//它将字符串时间转换为日期类型例如2018-10-
weixin_39535527
·
2024-02-08 10:02
spark
sql
数据类型转换
Spark
streaming写入delta数据湖问题
但项目上线到生产环境,检查
spark
streaming的job,发现数据在merge写入到数据湖时,往往超过1小时。
kk_io
·
2024-02-08 10:01
疑难杂症
spark
大数据
分布式
Spark
streaming batch运行时间过长问题02
排查
Spark
streaming数据写入时间过长问题,一方面是因为程序写数据湖小文件问题。在解决了小文件问题后,还是不能达到预期的1分钟一个batch。
kk_io
·
2024-02-08 10:01
疑难杂症
spark
batch
大数据
企业
Spark
案例--酒店数据分析实战提交
第1关:数据清洗--过滤字段长度不足的且将出生日期转:packagecom.yyimportorg.apache.
spark
.rdd.RDDimportorg.apache.
spark
.sql.
cz学java
·
2024-02-08 10:30
spark
数据分析
大数据
Spark
的timestamp 数据时间问题
使用
Spark
来处理国际业务数据,涉及到数据时区转换,在实际项目中出现时区转换问题。
kk_io
·
2024-02-08 10:29
疑难杂症
spark
大数据
分布式
大数据毕业设计Py
Spark
+PyFlink航班预测系统 飞机票航班数据分析可视化大屏 机票预测 机票爬虫 飞机票推荐系统 大数据毕业设计 计算机毕业设计
博主介绍:✌全网粉丝100W+,前互联网大厂软件研发、集结硕博英豪成立工作室。专注于计算机相关专业毕业设计项目实战6年之久,选择我们就是选择放心、选择安心毕业✌由于篇幅限制,想要获取完整文章或者源码,或者代做,可以给我留言或者找我聊天。感兴趣的可以先收藏起来,还有大家在毕设选题,项目以及论文编写等相关问题都可以给我留言咨询,希望帮助更多的人。1.DrissionPage自动化Python爬虫工具采
B站计算机毕业设计超人
·
2024-02-08 09:17
大数据毕业设计
大数据
数据分析
hadoop
数据挖掘
爬虫
spark
flink
【项目实战】Flink+InfluxDB+Grafana实现对
YARN
集群队列资源进行画像
一、Flink实时计算第一章:Flink快速入门1.Flink架构2.Flink应用场景3.FlinkVS
Spark
4.实时计算技术选型第二章:Flink项目构建与测试1.快速构建Flink项目2.第一个
大数据研习社
·
2024-02-08 08:56
Flink
flink
Flink实时计算
可视化监控
InfluxDB
生成域名ssl证书
使用命令shcreate_self-cert.sh--ssl-domain=
yarn
-test.comcreate_self-cert.sh#!
不会吐丝的蜘蛛侠。
·
2024-02-08 08:30
ssl
https
服务器
大数据问题:Hadoop的web页面无法访问logs
报错如下:HTTPERROR403Problemaccessing/logs/.Reason:User
yarn
isunauthorizedtoaccessthispage.PoweredbyJetty:
不会吐丝的蜘蛛侠。
·
2024-02-08 08:28
Hadoop
hadoop
spark
运行失败The directory item limit of /
spark
_dir/
spark
_eventLogs is exceeded: limit=1048576 items=104
org.apache.hadoop.hdfs.protocol.FSLimitException$MaxDirectoryItemsExceededException):Thedirectoryitemlimitof/
spark
_dir
不会吐丝的蜘蛛侠。
·
2024-02-08 08:58
Hadoop
spark
hadoop
hdfs
mac下控制台可以搜索到命令但是vscode显示zsh: command not found:
在控制台全局安装了
yarn
,控制台可以
yarn
-v命令,但是vscode报错zsh:commandnotfound:。怀疑是环境变量的问题吧。
sasaraku.
·
2024-02-08 07:25
开发问题记录
macos
vscode
ide
Flink on
Yarn
的两种模式
Flinkon
Yarn
模式部署始末:Flink的Standalone和on
Yarn
模式都属于集群运行模式,但是有很大的不同,在实际环境中,使用Flinkon
Yarn
模式者居多。
GOD_WAR
·
2024-02-08 07:22
Flink
flink
yarn
flink
on
yarn
flink on
yarn
文章目录使用flinksqlclienton
yarn
session模式Per-JobCluster模式flinkrunflinkrunapplication-t
yarn
-application配置任务退出时保留
枪枪枪
·
2024-02-08 07:46
flink
大数据
hadoop
【大数据】Flink on
YARN
,如何确定 TaskManager 数
Flinkon
YARN
,如何确定TaskManager数1.问题2.并行度(Parallelism)3.任务槽(TaskSlot)4.确定TaskManager数1.问题在Flink1.5ReleaseNotes
G皮T
·
2024-02-08 07:43
#
Flink
大数据
flink
TaskManager
Task
Slot
任务槽
并行度
SubTask
Rancher 2.4正式发布!打造业界规模最大的云边协同集群
Rancher2.4全新特性一览:边缘
集群部署
场景的延展性、零宕机升级集群、安全性增强以及全新的托管选项,为用户提供从数据中心到云端到边缘的海量Kubernetes集群一站式管理体验2020年4月1日,
RancherLabs
·
2024-02-08 07:27
Flink流式数据倾斜
1.流式数据倾斜流式处理的数据倾斜和
Spark
的离线或者微批处理都是某一个SubTask数据过多这种数据不均匀导致的,但是因为流式处理的特性其中又有些许不同2.如何解决2.1窗口有界流倾斜窗口操作类似
Spark
orange大数据技术探索者
·
2024-02-08 07:58
#
flink迁移
flink
大数据
数据倾斜
【深入浅出
Yarn
架构与实现】6-4 Container 生命周期源码分析
本文将深入探讨AM向RM申请并获得Container资源后,在NM节点上如何启动和清理Container。将详细分析整个过程的源码实现。一、Container生命周期介绍Container的启动由ApplicationMaster通过调用RPC函数ContainerManagementProtocol#startContainers()发起请求,NM中的ContainerManagerImpl组件
大数据王小皮
·
2024-02-08 07:27
深入浅出Yarn架构与实现
架构
java
大数据
vue项目:集成富文本编辑器 - 百度ueditor(vue-ueditor-wrap)
集成步骤3.1、下载富文本编辑器GitHub-fex-team/ueditor:richtext富文本编辑器3.2、下载后放在static目录下3.3、vue项目安装插件vue-ueditor-wrap
yarn
addvue-ueditor-wrap3.4
snowball_li
·
2024-02-08 06:38
前端
vue.js
前端
富文本
大数据系列—数据迁移(Sqoop,Flume,DataX)对比学习(stage3)
个人大数据技术栈:DataX,Sqoop,Hadoop,Hive,
Spark
,Flink,Hbase,Kafka,Kettle,Azkaban,Airflow,Tableau…个人在学习领域:Python
道-闇影
·
2024-02-08 06:07
big
data
大数据
sqoop
flume
npm_config_xxx
console.log(`process.env['${key}']`,process.env[key]);}logProcessEnv('npm_config_foo');问题:`npmrunlog`和`
yarn
log
Shellphon
·
2024-02-08 06:01
npm
前端
node.js
create-react-app的两种跨域解决方式
我们可以在node-modules/react-scripts/webpack-dev-server.js文件直接配置proxy选项但是后续如果继续安装其他模块的话
yarn
内部会检测有没有文件被改动若有改动恢复原样两种解决方式弹射配置文件使用
栗子daisy
·
2024-02-08 05:14
Spark
安装(
Yarn
模式)
一、解压链接:https://pan.baidu.com/s/1O8u1SEuLOQv2Yietea_Uxg提取码:mb4htar-zxvf/opt/software/
spark
-3.0.3-bin-hadoop3.2
莫噶
·
2024-02-08 04:44
搭建
spark
大数据
分布式
图解大数据 | 大数据分析挖掘-
Spark
初步
图解大数据|大数据分析挖掘-
Spark
初步作者:韩信子@ShowMeAI教程地址:www.showmeai.tech/tutorials/8…本文地址:www.showmeai.tech/article-det
Dashesand
·
2024-02-08 03:22
大数据
数据分析
spark
docker数据科学与
spark
镜像源与使用常见问题疑难解答
以下是一些与数据挖掘和数据科学相关的Docker镜像源:jupyter/all-
spark
-notebook:此镜像包含JupyterNotebook和
Spark
的完整环境,用于
Spark
开发和学习。
DreamNotOver
·
2024-02-08 01:16
eureka
java
spring
cloud
用docker 配置scala
spark
环境
要使用Docker配置Scala和
Spark
环境,您可以按照以下步骤进行操作。以下是一个基本的示例,您可能需要根据您的具体需求进行调整。安装Docker:在您的系统上安装Docker。
DreamNotOver
·
2024-02-08 01:14
python
数据挖掘
docker
docker
scala
spark
容器
Spark
Standalone 集群配置
前言平时工作中主要用
YARN
模式,最近进行TPC测试用到了Standalone模式,便记录总结一下Standalone集群相关的配置。
董可伦
·
2024-02-07 23:01
Spark
spark
大数据
分布式
RDD vs DataFrame vs Dataset
RDD是
Spark
最基础的数据结构。RDD允许开发者使用容错的形式在集群中使用内存计算,这样可以提高计算速度。1.2DataFrameDataFrame是使用数据组成命名
一生逍遥一生
·
2024-02-07 22:20
Hadoop系统应用之Zookeeper分布式
集群部署
一、Zoopkeeper安装包下载安装【Zookeeper版本型号为3.4.10】1.下载Zookeeper安装包(地址)https://archive.apache.org/dist/zookeeper/zookeeper-3.4.10/2.上传安装包(SecureCRT&FX)通过软件FX将安装包上传到linux系统的/export/software/目录下3.解压Zookeeper安装包执行
-牧心-
·
2024-02-07 22:31
分布式
hadoop
java-zookeeper
RabbitMQ之七生产
集群部署
个人专题目录1.RabbitMQ集群搭建实际生产应用中都会采用消息队列的集群方案,出于MQ中间件本身的可靠性、并发性、吞吐量和消息堆积能力等问题的考虑,在生产环境上一般都会考虑使用RabbitMQ的集群方案。1.1集群方案的原理RabbitMQ这款消息队列中间件产品本身是基于Erlang编写,Erlang语言天生具备分布式特性(通过同步Erlang集群各节点的magiccookie来实现)。因此,
Java及SpringBoot
·
2024-02-07 21:21
vue 中使用 vue-router-tab 插件实现页面顶部路由标签功能 ?
安装依赖(官方推荐
yarn
)npmivue-router-tab-S//或者cnpmivue-router-tab-S//或者
yarn
addvue-router-tabmain
『九离~空白』
·
2024-02-07 20:22
vue2.x
vue_cli
Plug-ins
and
class
libraries
路由标签
vue-router-tab
如何在Vue应用程序中使用Vue-Router来实现路由嵌套动画效果
在Vue项目中,可以使用npm或
yarn
来安装Vue-Router:npminstall
忧郁的蛋~
·
2024-02-07 20:19
前端技术
vue.js
前端
javascript
优化h5的滚动功能:在vue和react中使用better-sroll插件的踩坑笔记
使用经验安装(推荐安装core版本按需引入插件)
yarn
add@better-scroll/core在vue中的使用封装一个滚动组件Scroll.vueimportBScrollfrom"bett
故居风
·
2024-02-07 19:41
javascript
vue.js
react.js
前端
vue 走马灯无缝滚动轮播图 vue-seamless-scroll
效果图GIF软件有点问题出现抖动(献丑了QAQ)1.安装vue-seamless-scrollnpminstallvue-seamless-scroll--save//或
yarn
addvue-seamless-scroll2
Nicole.oO
·
2024-02-07 19:10
vue
vue.js
javascript
html5
react
jquery
黑猴子的家:
Spark
SQL 的性能
1、内存列存储(In-MemoryColumnarStorage)内存列存储来说,将所有原生数据类型的列采用原生数组来存储,将Hive支持的复杂数据类型(如array、map等)先序列化后拼接成一个字节数组来存储。这样,每个列创建一个JVM对象,从而导致可以快速的GC和紧凑的数据存储。额外的,还可以用低廉CPU开销的高效压缩方法来降低内存开销。更有趣的是,对于分析查询中频繁使用的聚合特定列,性能会
黑猴子的家
·
2024-02-07 18:48
简单使用
Spark
、Scala完成对天气数据的指标统计
目录一、前言&什么是
Spark
?
db_lcz_2014
·
2024-02-07 18:33
spark
scala
大数据
《向量数据库指南》——Milvus Cloud 「部署」:简化部署一直在路上
“大家MilvusCloud
集群部署
有没有实践过比较好的方案?”作为一个开源数据库,是否能够进行快速部署,是所有工作的前提。在简化部署的道路上,社区从来没有停止过脚步。
LCHub低代码社区
·
2024-02-07 17:54
《向量数据库指南》
数据库
milvus
向量数据库
Milvus
Cloud
Milvus
ModaHub
React+TypeScript项目创建
可采取两个工具来创建:create-react-app(React官方提供)、vite(不仅仅是创建React项目,Vue等也可用)每种工具都列出npm和
yarn
两种使用方式一,create-react-app1
Leo_DLi
·
2024-02-07 17:00
Web前端
React
react
yarn
typescript
npm
yarn
安装报错error Error: certificate has expired
先报错errorError:connectETIMEDOUT104.16.24.34:443然后把下载源设置成淘宝的先把node-sass镜像源进行设置成国内的
yarn
configsetsass-binary-sitehttp
前端小菜鸟也有人起
·
2024-02-07 16:28
yarn
前端
javascript
应用集群(1)-节点间的文件同步策略
首先我们在研发7代产品时,已经兼顾了
集群部署
,但总还有一些遗漏的地方。趁着这个机会梳理出来,并附上解决方案。今天先谈下集群中应用文件的同步问题。应用文件指的是保存在应用节点下的文件。
成勐
·
2024-02-07 14:42
集群
redis
消息队列
【Iceberg学习一】什么是Iceberg?
Iceberg为包括
Spark
、Trino、PrestoDB、Flink、Hive和Impala在内的计算引擎增加了表格功能,使用一种高性能的表格格式,其工作方式就像一个SQL表一样。
周润发的弟弟
·
2024-02-07 10:56
Iceberg
学习
RDD任务切分之Stage任务划分(图解和源码)
RDD任务切分中间分为:Application、Job、Stage和Task(1)Application:初始化一个
Spark
Context即生成一个Application;(2)Job:一个Action
大数据左右手
·
2024-02-07 09:34
大数据
大数据
spark
stage切分
任务划分
kyuubi 接入starrocks | doris
kyuubi接入starrocks一、环境Hadoop集群组件版本Hadoop3.1.1
spark
3.Xzookeeper3.XHive3.Xkyuubi版本1.7.1starrocks2.X 已将kyuubi
甜甜的巧克力阿
·
2024-02-07 09:48
大数据相关
大数据
kyuubi
starrocks
doris
Hive Sql优化记录
日常检查ETLjob时发现一段sql采用hiveonmr执行比hiveon
spark
要快70%,与正常的认知正好相反,所以对该sql进行了详细分析。
风筝flying
·
2024-02-07 07:40
Spark
JDBC读写数据库实战
默认的操作代码valdf=
spark
.read.format("jdbc").option("url","jdbc:postgresql://localhost:5432/testdb").option
SunnyRivers
·
2024-02-07 07:41
Spark最佳实战与性能优化
spark
jdbc
数据库
IDEA 本地运行
Spark
IDEA本地运行
Spark
1、背景2、环境准备3、具体流程3.1IDEA创建maven项目3.2pom.xml配置3.3Demo程序示例3.4结果输出4、总结改进1、背景主要用于本地阅读
Spark
源码,
fir_dameng
·
2024-02-07 06:41
大数据开发
spark
Spark
Scala大数据编程实例
一、Scala1.1、Scala简介Scala是一门现代的多范式编程语言,平滑地集成了面向对象和函数式语言的特性,旨在以简练、优雅的方式来表达常用编程模式。Scala的设计吸收借鉴了许多种编程语言的思想,只有很少量特点是Scala自己独有的。Scala语言的名称来自于“可伸展的语言”,从写个小脚本到建立个大系统的编程任务均可胜任。Scala运行于Java平台(JVM,Java虚拟机)上,并兼容现有
一直de不完的bug
·
2024-02-07 06:38
Hadoop
spark
大数据
hadoop
上一页
7
8
9
10
11
12
13
14
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他