E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
spark本地连接hive
Hadoop 基础原理
NameNode持久化机制MapReduce底层原理示例Hadoop是一个由Apache基金会开发的分布式系统基础架构,主要解决海量数据的存储和计算问题,广义上Hadoop指的是Hadoop生态圈,包含HDFS、
Hive
disgare
·
2025-02-26 11:38
数据库
hadoop
大数据
分布式
nodejs npm run build 打包压缩zip文件
步骤1:安装npminstallarc
hive
r-D步骤2:根目录下新建zip.js,内容如下constfs=require('fs')constarc
hive
r=require('arc
hive
r')
xiaoxiao_0721
·
2025-02-26 10:36
vue
本地Oracle数据库复制数据到Apache
Hive
的Linux服务器集群的分步流程
我们已经有安装Apache
Hive
的Linux服务器集群,它可以连接到一个OracleRDS数据库,需要在该Linux服务器上安装配置sqoop,然后将OracleRDS数据库中所有的表数据复制到
Hive
weixin_30777913
·
2025-02-26 10:34
数据库
大数据
hive
深入探索
Spark
MLlib:大数据时代的机器学习利器
Apache
Spark
作为大数据处理的利器,其内置的机器学习库MLlib(MachineLearningLibrary)提供了一套高效、易用的工具,用于处理和分析海量数据。
concisedistinct
·
2025-02-26 10:59
人工智能
mllib
spark-ml
Spark
MLlib
大数据
机器学习
preview_220624,Day08_DM层建设实战,
抛弃DM.使用DataGrip在
Hive
中创建dm层注意,对于建库建表操作,需直接使用Hiv
啊六六六
·
2025-02-26 04:51
Python
大数据
数据挖掘
数据仓库
Spark
Streaming 容错机制详解
Spark
Streaming是
Spark
生态系统中用于处理实时数据流的模块。它通过微批处理(micro-batch)的方式将实时流数据进行分片处理,每个批次的计算本质上是
Spark
的批处理作业。
goTsHgo
·
2025-02-26 04:20
spark-streaming
大数据
分布式
spark-streaming
大数据
分布式
Spark
提交任务
1、
Spark
提交任务到Yarn1.1、DwKuduApp
spark
-submit--classcom.io.etl.dwkudu.DwKuduApp\--files/etl/etl-dwkudu/conf
docsz
·
2025-02-26 04:50
spark
spark
大数据
如何使用GraphX在
Spark
中进行图计算
GraphX是Apache
Spark
的一个图计算框架,它允许开发者在分布式环境中进行大规模的图数据处理和分析。
python资深爱好者
·
2025-02-26 04:19
spark
大数据
分布式
在
Spark
中如何配置Executor内存以优化性能
在
Spark
中,配置Executor内存以优化性能是一个关键步骤。
python资深爱好者
·
2025-02-26 04:19
spark
java
大数据
什么容错性以及
Spark
Streaming如何保证容错性
二、
Spark
Streaming保证容错性的方法
Spark
Streaming为了保证数据的准确性和系统的可靠性,实现了多种容错机制,主要包括以下几个方面:元数据的容错性:Spar
python资深爱好者
·
2025-02-26 04:48
spark
大数据
分布式
Spark
集群架构
文章目录
Spark
架构
Spark
执行任务流程
Spark
运行环境
Spark
onYARN
Spark
Standalone
Spark
架构
Spark
可以运行在YARN上也可以运行Mesos上,无论运行在哪个集群管理架构上
情深不仅李义山
·
2025-02-25 20:25
spark
spark
大数据
四、
spark
集群架构
spark
集群架构官方文档:http://
spark
.apache.org/docs/latest/cluster-overview.html集群架构我们先看这张图这张图把
spark
架构拆分成了两块内容
weixin_34411563
·
2025-02-25 20:54
大数据
开发工具
Spark
集群架构介绍
Spark
之YARN介绍一、导语二、
Spark
及其特性三、
Spark
架构总览一、导语Apache
Spark
(后续简称为
Spark
)是一款正在点燃大数据世界的开源集群计算框架。
olifchou
·
2025-02-25 20:23
Spark
spark
apache
spark
大数据
分布式
Spark
Standalone集群架构
北风网
spark
学习笔记
Spark
Standalone集群架构
Spark
Standalone集群集群管理器,clustermanager:Master进程,工作节点:Worker进程搭建了一套Hadoop
htfenght
·
2025-02-25 20:22
spark
spark
Spark
----
Spark
在不同集群中的架构
Spark
注重建立良好的生态系统,它不仅支持多种外部文件存储系统,提供了多种多样的集群运行模式。
XiaodunLP
·
2025-02-25 20:22
Spark
MySQL 8 公用表表达式(CTE)—— WITH关键字深入用法
更多介绍请查看官网:https://dev.mysql.com/blog-arc
hive
/mysql-8-0-labs-recursive-common-table-expressions-in-mysql-cte
gmHappy
·
2025-02-25 19:45
大数据学习
java
web
Java
mysql
数据库
with递归
spark
1.x和
spark
2.x的区别
spark
2.x版本相对于1.x版本,有挺多地方的修改,1
Spark
2Apache
Spark
作为编译器:增加新的引擎Tungsten执行引擎,比
Spark
1快10倍2ml做了很大的改进,支持协同过滤http
xuxu1116
·
2025-02-25 16:56
spark
spark1.x与2.x的区别
spark
程序提交到集群上_
Spark
集群模式&
Spark
程序提交
Spark
集群模式&
Spark
程序提交1.集群管理器
Spark
当前支持三种集群管理方式Standalone—
Spark
自带的一种集群管理方式,易于构建集群。
毫无特色
·
2025-02-25 16:25
spark程序提交到集群上
基于docker-compose安装
spark
1+3及
Spark
On Yarn模式集群
基于docker-compose安装
spark
1+3及
Spark
OnYarn模式集群1、`docker-compose.yml`:2、`
spark
.env`:此处的样例是参考别人的,之后自己整合一套可以使用的
dh12313012
·
2025-02-25 15:20
docker-compose
spark
docker
spark
vi基本使用
打开文件与创建文件是Linux的内置命令,以命令的方式来运行。命令格式:vi/路径/文件名注意以下两种情况:1.如果这个文件不存在,此时就是新建文件,编辑器的左下角会提示:newfile2.如果文件已存在,此时就打开这个文件,进入命令模式。把文本内容添加到一个全新的文件的快捷方式:echo1>>1.txt三种模式vi编辑器有三种工作模式,分别为:命令模式,输入模式,底线模式。命令模式:所敲按键编辑
Freedom℡
·
2025-02-25 15:47
spark
Spark
(1)
阶段性:一、单机时代特点:1.硬件资源有限:单机系统的计算能力、存储容量和内存空间都受限于单台计算机的硬件配置。例如早期的个人电脑,通常只有几百兆的内存和几GB的硬盘空间。2.数据处理能力有限:主要处理本地产生的小规模数据,数据量一般在MB级别到GB级别之间。如单机版的财务软件,只处理一个小型企业内部的少量财务数据。3.应用场景简单:主要用于个人办公、简单的游戏娱乐或小型企业的基本业务处理,如文字
Freedom℡
·
2025-02-25 15:45
spark
jar、war、pom
1.jar定义与用途用途:默认打包类型,生成JAR文件(JavaArc
hive
),适用于普通Java应用或库。场景:开发工具类库(如commons-lang.jar)。
JIU_WW
·
2025-02-25 13:33
jar
java
架构师论文《论湖仓一体架构及其应用》
本项目采用Iceberg+
Spark
架构实现湖仓一
pccai-vip
·
2025-02-25 12:28
架构
软考论文
【大数据分析】基于
Spark
哔哩哔哩数据分析舆情推荐系统 b站(完整系统源码+数据库+开发笔记+详细部署教程+虚拟机分布式启动教程)
文章目录【大数据分析】基于
Spark
哔哩哔哩数据分析舆情推荐系统b站(完整系统源码+数据库+开发笔记+详细部署教程+虚拟机分布式启动教程)?
m0_74823471
·
2025-02-25 11:46
面试
学习路线
阿里巴巴
分布式
数据分析
spark
电脑不管用没用一段时间后网络会自动断开需要重新拔插
1.在
本地连接
——属性——配置——电源管理——把允许计算机关闭此设备节约前面的√去掉——保存。
weixin_30815427
·
2025-02-25 09:10
Spark
性能调优方法总结
1、资源分配优化
Spark
的分配资源主要就是executor、cpuperexecutor、memoryperexecutor、drivermemory等的调节,我们在生产环境中,提交
spark
作业时
Cynthiaaaaalxy
·
2025-02-25 08:32
spark
大数据
分布式
MAC电脑 初始化 开发环境(Java + Node)
1.后端1.1Java下载地址https://www.oracle.com/cn/java/technologies/javase/javase8-arc
hive
-downloads.html1.2Maven
Kevin_K2
·
2025-02-25 08:57
macos
java
开发语言
centOS 7.9 安装JDK MYSQL
jdk:JavaArc
hive
Downloads-JavaSE17.0.12andearlierCentOS安装JDK17教程(完整版)-秦胜飞-博客园sudoyumupdatewgethttps://
he25819
·
2025-02-25 07:23
centos
java
mysql
显卡3050ti等安培架构的GPU安装paddlepaddle
官网原话如果您使用的是安培架构的GPU,推荐使用CUDA11.2如果您使用的是非安培架构的GPU,推荐使用CUDA10.2,性能更优其他配套确定软件版本后,到官网下载对应版本的软件CUDA:CUDAToolkitArc
hive
社会闲散人员中的代码爱好者
·
2025-02-24 14:49
python
环境搭建
python
人工智能
深度学习
Oracle 19C DataGuard GAP 修复过程(RECOVER STANDBY DATABASE FROM SERVICE)
DGGAP主要分为以下两类情况:主库归档日志存在,可以通过配置FetchArc
hive
Log(FAL)参数,自动解决归档GAP;主库归档日志丢失,需要人工干预来修复;不同Oracle版本的GAP修复方式也不尽相同
莳花微语
·
2025-02-24 13:17
Oracle
oracle
数据库
ADG
jmeter 与大数据生态圈中的服务进行集成
以下为你详细介绍JMeter与大数据生态圈中几种常见服务(HadoopHDFS、
Spark
、Kafka、Elasticsearch)集成的方法:与HadoopHDFS集成实现思路HDFS是Hadoop的分布式文件系统
小赖同学啊
·
2025-02-24 13:40
jmeter专栏
jmeter
大数据
利用Python imaplib和email模块 读取邮件文本内容及附件内容
python使用imap接收邮件的过程探索https://www.cnblogs.com/yhlx/arc
hive
/2013/03/22/2975817.html#!
aobian2884
·
2025-02-24 12:06
python
hive
运维
hive
锁相关showlocks;查看锁unlocktable表名;释放锁发现释放不了锁,执行下面set
hive
.support.concurrency=false;set
hive
.txn.manager
花泽啸
·
2025-02-23 23:04
Hive
hive
【003
hive
基础】
hive
的数据类型
文章目录一.数据类型1.基础数据类型2.复杂数据类型二.显式转换与隐式转换三.
hive
的读时模式一.数据类型1.基础数据类型2.复杂数据类型array:有序相同数据类型的集合。
roman_日积跬步-终至千里
·
2025-02-23 22:29
#
hive
hive
大数据
hadoop
【
Hive
】学习路线:架构、运维、Hsql实战、源码分析
文章目录一.
Hive
基础学习1.基础知识2.安装与配置3.数据存储与表结构二.
hive
运维三.
Hive
实战1.
Hive
SQL基础2.高级查询与数据分析3.数据存储优化4.性能调优四.
Hive
源码分析一.
roman_日积跬步-终至千里
·
2025-02-23 22:25
#
hive
hive
学习
架构
Spark
on Yarn 多机集群部署
Spark
onYarn多机集群部署1.规划机器角色服务器IP地址角色Master192.168.1.100NameNode+ResourceManager+
Spark
MasterWorker1192.168.1.101DataNode
晓夜残歌
·
2025-02-23 17:20
spark
大数据
分布式
Python+
Spark
地铁客流数据分析与预测系统 地铁大数据 地铁流量预测
本系统基于大数据设计并实现成都地铁客流量分析系统,使用网络爬虫爬取并收集成都地铁客流量数据,运用机器学习和时间序列分析等方法,对客流量数据进行预处理和特征选择,构建客流量预测模型,利用历史数据对模型进行训练和优化,实现客流量预测模型的部署和应用,通过系统界面展示预测结果。对预测模型进行评估和验证,并提出改进方案。设计步骤使用Python语言编写爬虫程序采集数据,并对原始数据集进行预处理;使用Pyt
qq_79856539
·
2025-02-23 16:16
javaweb
大数据
python
spark
pg使用 arc
hive
_cleanup_command 自动清理归档日志
清理归档日志的方式1.使用arc
hive
_cleanup_command自动清理归档日志PostgreSQL提供了arc
hive
_cleanup_command参数,用于自动清理归档日志。
eaglesstone
·
2025-02-23 14:29
postgresql数据库
数据库
postgresql
LINUX 安装mysql5.6.50 RPM
,记录一下安装过程的碰见的各种问题1.下载安装包抖店云上的系统是CentOS7.964位,因此下载Redhat7系统下面的安装包下载地址:https://downloads.mysql.com/arc
hive
s
a21768541
·
2025-02-23 10:06
数据库
mysql
搭建
Spark
On YARN集群
一、
Spark
OnYARN架构二、搭建
Spark
OnYARN集群(一)搭建
Spark
Standalone集群(二)修改
Spark
环境配置文件
Spark
OnYARN模式的搭建比较简单,仅需要在YARN集群的一个节点上安装
snow323H
·
2025-02-23 07:05
spark
big
data
hadoop
Hive
排序函数源码解密:字节跳动面试官的底层三连问
Hive
排序函数源码解密:字节跳动面试官的底层三连问作为数据工程师,理解
Hive
排序函数的源码就像掌握汽车的发动机原理。本文通过字节跳动内部技术文档,为你揭示三大排序函数的源码级实现差异。
数据大包哥
·
2025-02-23 06:31
#
Hive
#
大厂SQL面试指南
hive
hadoop
数据仓库
如何配置 PostgreSQL 允许远程连接 - 以 Odoo 数据库为例
然而,PostgreSQL默认只允许
本地连接
,需要进行适当的配置才能实现远程访问。本文将详细介绍如何配置PostgreSQL以允许远程连接。
m0_74823842
·
2025-02-23 05:56
面试
学习路线
阿里巴巴
数据库
postgresql
笔记-Ubuntu本地镜像源配置
操作1、先在外网拿到安装包cd/var/cache/apt/arc
hive
s2、复制至内网将所有deb复制至内网根目录下mkdir/ak/downloadchmod777-R/ak/download/3
丶花落谁家
·
2025-02-23 02:03
笔记
ubuntu
apt
对应chd5.14的
spark
_carbonData使用文档(基于CDH 的
spark
-yarn模式)
一、部署(基于CDH的
spark
-yarn模式)下载源码编译(目前官网已经提供编译好的jar包了)【https://dist.apache.org/repos/dist/release/carbondata
颜语一声
·
2025-02-22 22:22
对应chd5.14的spark
yarn模式运行
spark
作业所有属性详解
摘要:
Spark
参数调优,可以大大提高工作中程序的运行效率。
weixin_34248487
·
2025-02-22 22:22
大数据
Spark
on YARN的重要参数
Spark
属性或者去源码找Class类
Spark
SubmitArguments,最全了属性名称默认含义
spark
.yarn.am.memory512m用于客户端模式下的YARNApplicationMaster
大米饭精灵
·
2025-02-22 21:50
Spark
Yarn
Spark
Yarn
大数据-257 离线数仓 - 数据质量监控 监控方法 Griffin架构
目前已经更新到了:Hadoop(已更完)HDFS(已更完)MapReduce(已更完)
Hive
(已更完)Flume(已更完)Sqoop(已更完)Zookeeper(已更完)HBase(已更完)Redis
m0_74823705
·
2025-02-22 21:50
面试
学习路线
阿里巴巴
大数据
架构
spark
sql随记
1、
spark
sql访问
hive
将
hive
-site.xml放入到${
SPARK
_HOME}/conf下如果是
spark
onyarn的cluster模式,由于driver是运行于哪个executor未知
cxy1991xm
·
2025-02-22 21:18
spark
apk文件放到Linux服务器 nginx不支持apk ipa文件下载设置
修改/usr/local/nginx/conf目录下的mime.types增加如下配置,重启nginx生效application/vnd.android.package-arc
hive
apk;//安卓application
云上上云
·
2025-02-22 11:00
服务器
linux
nginx
计算机毕业设计吊炸天Python+
Spark
地铁客流数据分析与预测系统 地铁大数据 地铁流量预测
开发技术
Spark
HadoopPython爬虫Vue.jsSpringBoot机器学习/深度学习人工智能创新点
Spark
大屏可视化爬虫预测算法功能1、登录注册界面,用户登录注册,修改信息2、管理员用户:
qq_80213251
·
2025-02-22 08:35
java
javaweb
大数据
课程设计
python
上一页
1
2
3
4
5
6
7
8
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他