E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
spark编程入门
Oracle PL/SQL
编程入门
:第二十五章 附PL/SQL格式手册
欢迎来到OraclePL/SQL
编程入门
的第二十五章!在这一章中,我们将学习如何编写格式良好的PL/SQL代码。良好的代码格式不仅能提高代码的可读性,还能帮助你和你的团队更容易地维护和扩展代码。
caifox菜狐狸
·
2025-02-06 09:00
Oracle
PL/SQL
编程入门
oracle
sql
数据库
关键字
变量
注释
内置函数
初识
spark
本文通过介绍的是大数据领域优秀框架
spark
,打开分布式实时计算的大门1.spar
wlyang666
·
2025-02-06 08:20
大数据之spark
spark
大数据
分布式
一次
spark
streaming 性能抖动问题解决和分析
问题现象业务通过
spark
stream处理10000+上数据大致需要30s时间,但偶发出现超过30s的情况问题分析
spark
stream是内存密集型的应用,一般出现延迟通常是因为以下两个原因:内存分配过程出现延迟
spring208208
·
2025-02-06 04:18
spark
大数据组件线上问题分析
spark
大数据
分布式
一次线程数超限导致的hive写入hbase作业失败分析
每次报错的任务不是同一个,hivesql任务分为2个阶段:第1个阶段是hive自处理阶段,底层是
spark
计算引擎。出现oom,无法开启新的
spring208208
·
2025-02-06 04:46
大数据组件线上问题分析
大数据
hive
hbase
盘点大数据生态圈,那些繁花似锦的开源项目
盘点大数据生态圈,那些繁花似锦的开源项目发表于12小时前|2466次阅读|来源CSDN|6条评论|作者仲浩大数据开源Hadoop
Spark
width="22"height="16"src="http
AI周红伟
·
2025-02-05 17:30
大数据
深度学习
开源项目推荐:基于Lambda架构的大数据管道
开源项目推荐:基于Lambda架构的大数据管道big-data-pipeline-lambda-archAfullbigdatapipeline(LambdaArchitecture)with
Spark
柳旖岭
·
2025-02-05 16:53
python必读书单
文章目录{
编程入门
}{编程进阶}{算法基础}{Web开发}{网络编程}{爬虫}{安全}{数据分析}{数据科学}{数据挖掘}{机器学习}{深度学习}{其他方向}{
编程入门
}父与子的编程之旅:与小卡特一起学
Vin0sen
·
2025-02-05 02:08
python
开发语言
《AI赋能行业实战:揭秘企业数字化转型最佳实践,落地案例深度解析!》 ---- 总目录
文章大纲金融行业落地实践浅析基于Py
Spark
进行信用卡评分--实战案例迁移学习小样本金融风控生物信息识别大健康行业落地实践浅析传统行业深度融合升级如何深度参与创业?
shiter
·
2025-02-04 20:58
人工智能系统解决方案与技术架构
人工智能
大数据
AI
Oracle PL/SQL
编程入门
:第二十二章 存储代码
欢迎来到OraclePL/SQL
编程入门
的第二十二章!在这一章中,我们将探讨如何从数据字典获取存储代码信息、如何重载模块(包括IN和OUT参数的使用)以及相关的注意事项。
caifox菜狐狸
·
2025-02-04 10:38
Oracle
PL/SQL
编程入门
oracle
sql
数据库
存储过程
pl
sql
Stores
数据字典
Spark
3.1.2单机安装部署
spark
3.1.2单机安装部署概述
Spark
是一个性能优异的集群计算框架,广泛应用于大数据领域。
花菜回锅肉
·
2025-02-04 07:43
大数据
spark
大数据
hadoop
Spark
基本概念
Spark
核心组件Driver将用户程序转化为作业(job)在Executor之间调度任务(task)跟踪Executor的执行情况通过UI展示查询运行情况Executor
Spark
Executor是集群中工作节点
javafanwk
·
2025-02-04 00:18
Spark
大数据
spark
架构
大数据
Spark
基本概念
#官网部分解释ClusterModeOverview-
Spark
3.3.0DocumentationApplication:指的是用户编写的
Spark
应用程序/代码,一个完整的main方法程序,包含了Driver
Buutoorr
·
2025-02-04 00:17
spark
大数据
分布式
scala
Spark
基础【RDD依赖关系--源码解析】
文章目录一RDD依赖关系1RDD血缘关系2RDD依赖关系3RDD阶段划分4RDD任务划分一RDD依赖关系1RDD血缘关系相邻两个RDD之间的关系,称之为依赖关系,多个连续的依赖关系称之为血缘关系RDD只支持粗粒度转换,即在大量记录上执行的单个操作。将创建RDD的一系列Lineage(血统)记录下来,以便恢复丢失的分区。RDD的Lineage会记录RDD的元数据信息和转换行为,当该RDD的部分分区数
OneTenTwo76
·
2025-02-03 21:52
Spark
spark
scala
大数据
Hive重点面试题
数据倾斜原因与解决方法6.HiveMapReduce的底层实现与优化方式7.Hive窗口函数的使用场景8.Hive分区与分桶的区别9.Hive的存储格式10.Hive计算引擎(MapReduce,Tez,
Spark
Major Tom _
·
2025-02-03 20:43
hive
hadoop
数据仓库
linux的apache安装,Apache Kylin | 安装指南
软件要求Hadoop:2.7+,3.1+(sincev2.5)Hive:0.13-1.2.1+HBase:1.1+,2.0(sincev2.5)
Spark
(可选)2.3.0+Kafka(可选)1.0.0
姜白的树洞
·
2025-02-03 07:26
linux的apache安装
kylin linux 安装教程,Apache Kylin | 安装指南
软件要求Hadoop:2.7+Hive:0.13-1.2.1+HBase:1.1+
Spark
2.1.1+JDK:1.7+OS:Linuxonly,CentOS6.5+orUbuntu16.0.4+用HortonworksHDP2.2
社本
·
2025-02-03 07:26
kylin
linux
安装教程
Oracle PL/SQL
编程入门
:第十八章 批处理 SQL
欢迎来到OraclePL/SQL
编程入门
的第十八章!在这一章中,我们将深入探讨批处理SQL。通过学习FORALL语句、批处理集合以及如何在SQL中绑定集合,你将能够编写更加高效和强大的数据库操作代码。
caifox菜狐狸
·
2025-02-02 09:41
Oracle
PL/SQL
编程入门
oracle
sql
数据库
批处理
FORALL
FETCH
Loop
Java 大视界 -- Java 与
Spark
SQL:结构化数据处理与查询优化(五)
亲爱的朋友们,热烈欢迎你们来到青云交的博客!能与你们在此邂逅,我满心欢喜,深感无比荣幸。在这个瞬息万变的时代,我们每个人都在苦苦追寻一处能让心灵安然栖息的港湾。而我的博客,正是这样一个温暖美好的所在。在这里,你们不仅能够收获既富有趣味又极为实用的内容知识,还可以毫无拘束地畅所欲言,尽情分享自己独特的见解。我真诚地期待着你们的到来,愿我们能在这片小小的天地里共同成长,共同进步。本博客的精华专栏:大数
青云交
·
2025-02-02 05:39
大数据新视界
Java
大视界
Spark
SQL
结构化数据
查询优化
数据分区
缓存策略
日志分析
电商数据分析
java
Hive 整合
Spark
全教程 (Hive on
Spark
)
hadoop.proxyuser.luanhao.groups*hadoop.proxyuser.luanhao.groups*2)HDFS配置文件配置hdfs-site.xmldfs.namenode.http-addressBigdata00:9870dfs.namenode.secondary.http-addressBigdata00:9868dfs.replication13)YARN配
字节全栈_rJF
·
2025-02-02 02:56
hive
spark
hadoop
如何使用
Spark
Streaming
一、什么叫
Spark
Streaming基于
Spark
Core,大规模、高吞吐量、容错的实时数据流的处理二、
Spark
Streaming依赖org.apache.
spark
spark
-streaming_
会探索的小学生
·
2025-02-02 00:46
spark
大数据
分布式
Spark
任务与
Spark
Streaming 任务的差异详解
Spark
任务与
Spark
Streaming任务的主要差异源自于两者的应用场景不同:
Spark
主要处理静态的大数据集,而
Spark
Streaming处理的是实时流数据。
goTsHgo
·
2025-02-02 00:14
spark-streaming
分布式
大数据
spark
streaming
大数据
分布式
4
Spark
Streaming
4
Spark
Streaming一级目录1.整体流程2.数据抽象3.DStream相关操作4.
Spark
Streaming完成实时需求1)WordCount2)updateStateByKey3)reduceByKeyAndWindow
TTXS123456789ABC
·
2025-02-01 23:43
#
Spark
spark
ajax
大数据
spark
和python的区别_
Spark
入门(Python)
Spark
是第一个脱胎于该转变的快速、通用分布式计算范式,并且很快流行起来。
weixin_39934257
·
2025-02-01 23:42
spark和python的区别
spark
python入门_python py
spark
入门篇
一.环境介绍:1.安装jdk7以上2.python2.7.113.IDEpycharm4.package:
spark
-1.6.0-bin-hadoop2.6.tar.gz二.Setup1.解压
spark
weixin_39686634
·
2025-02-01 23:12
spark
python入门
spark
streaming python_
Spark
入门:
Spark
Streaming简介(Python版)
Spark
Streaming是构建在
Spark
上的实时计算框架,它扩展了
Spark
处理大规模流式数据的能力。
weixin_39531582
·
2025-02-01 23:12
spark
streaming
python
Spark
学习-1 (python)
Spark
官方文档快速入门指南
Spark
架构-
Spark
教程1.基本概念RDD(resilientdistributeddataset)弹性分布式数据集,对分布式数据和计算的基本抽象。
一二三四0123
·
2025-02-01 23:40
spark
学习
python
Python大数据之Py
Spark
(三)使用Python语言开发
Spark
程序代码_windows
spark
python
算子:rdd的api的操作,就是算子,flatMap扁平化算子,map转换算子Transformation算子Action算子步骤:1-首先创建
Spark
Context上下文环境2-从外部文件数据源读取数据
2401_84181704
·
2025-02-01 23:09
程序员
大数据
python
spark
Spark
入门(Python)
目录一、安装
Spark
二、
Spark
基本操作一、安装
Spark
pip3installpy
spark
二、
Spark
基本操作#导入
spark
的
Spark
Context,
Spark
Conf模块frompy
spark
import
Spark
Context
nfenghklibra
·
2025-02-01 23:39
python
spark
Oracle PL/SQL
编程入门
:第十六章 记录类型 Records
欢迎来到OraclePL/SQL
编程入门
的第十六章!在这一章中,我们将深入探讨记录类型(Records)。
caifox菜狐狸
·
2025-02-01 09:14
Oracle
PL/SQL
编程入门
oracle
sql
数据库
PL/SQL
Record
Records
记录
hive表指定分区字段搜索_Hive学习-Hive基本操作(建库、建表、分区表、写数据)...
Hive是类SQL语法的数据查询、计算、分析工具,执行引擎默认的是MapReduce,可以设置为
Spark
、Tez。Hive分内部表和外部表,外部表在建表的同时指定一个
weixin_39710660
·
2025-02-01 04:00
hive表指定分区字段搜索
PyDeequ库在AWS EMR启动集群中数据质量检查功能的配置方法和实现代码
PyDeequ是一个基于Apache
Spark
的PythonAPI,专门用于定义和执行“数据单元测试”,从而在大规模数据集中测量数据质量。
weixin_30777913
·
2025-02-01 04:59
python
spark
大数据
云计算
aws
spark
算子例子_
Spark
性能调优方法
公众号后台回复关键词:py
spark
,获取本项目github地址。
Spark
程序可以快如闪电⚡️,也可以慢如蜗牛?。它的性能取决于用户使用它的方式。
不让爱你的人失望
·
2025-01-31 16:28
spark
算子例子
Spark
性能调优
1、前言在大数据计算领域,
Spark
已经成为了越来越流行、越来越受欢迎的计算平台之一。
大数据侠客
·
2025-01-31 16:58
spark相关问题汇总及解决
spark
性能调优
在AWS上使用KMS客户端密钥加密S3文件,同时支持Py
Spark
读写和Snowflake导入
现有AWSEMR集群上运行Py
Spark
代码,可以读写S3上的数据文件,Snowflake数据仓库也需要导入S3上的文件到表。
weixin_30777913
·
2025-01-31 16:27
python
spark
大数据
云计算
数据仓库
11
Spark
面试真题
11
Spark
大厂面试真题1.通常来说,
Spark
与MapReduce相比,
Spark
运行效率更高。请说明效率更高来源于
Spark
内置的哪些机制?2.hadoop和
spark
使用场景?
TTXS123456789ABC
·
2025-01-31 16:26
#
Spark
spark
面试
大数据
21. Ubuntu 交叉编译工具链安装
交叉编译器安装ARM裸机、Uboot移植、Linux移植这些都需要在Ubuntu下进行编译,编译就需要编译器,我们在第三章“LinuxC
编程入门
”里面已经讲解了如何在Liux进行C语言开发,里面使用GCC
lljss2020
·
2025-01-31 14:11
Linux
OLAP引擎比较
一,
spark
sql与doris
spark
虽然是一个计算引擎,但
spark
sql也支持符合通用语法的sql查询,延迟为分钟级。doris是一个OLAP数据库,支持对大数据的复杂查询,延迟为秒级。
小手追梦
·
2025-01-31 10:30
hadoop
rpc
java
C、C++、Java到Python,
编程入门
学习什么语言好?
最近,TIOBE更新了7月的编程语言榜单,常年霸榜的C、Java和Python依然蝉联前三位。万万没想到的是,R语言居然冲到了第八位,创下了史上最佳记录。而且后续随着业内对数据统计和挖掘需求的上涨,R语言热度颇有些势不可挡的架势。然而作为程序员吃饭的工具,编程语言之间也形成了某种鄙视链,各大论坛里弥漫着剑拔弩张的气氛,众口难调。也难怪有很多初学者会有疑惑,为什么会有这么多编程语言,我到底应该学什么
明天会比今天更好
·
2025-01-30 22:53
C/C++
编程入门
编程语言
程序员
大数据毕业设计hadoop+
spark
+hive豆瓣图书数据分析可视化大屏 豆瓣图书爬虫 图书推荐系统
系统总体目标基于
Spark
的个性化书籍推荐系统是一种基于大数据技术的智能推荐系统,它可以根据用户的历史行为和偏好,为用户提供个性化的书籍推荐。
qq_79856539
·
2025-01-30 20:03
javaweb
java
大数据
hadoop
课程设计
【
spark
床头书系列】
Spark
Streaming 编程权威使用指南
Spark
Streaming编程权威使用指南文章目录
Spark
Streaming编程权威使用指南概述快速示例基本概念链接初始化StreamingContext离散化流(DStreams)输入DStreams
BigDataMLApplication
·
2025-01-30 14:14
spark
大数据
流数据处理#大数据
spark
大数据
分布式
Spark
Streaming的背压机制的原理与实现代码及分析
Spark
Streaming的背压机制是一种根据JobScheduler反馈的作业执行信息来动态调整Receiver数据接收率的机制。
weixin_30777913
·
2025-01-30 14:07
spark
大数据
python
1-structedStreaming-基本流程(2.3.1)
基本流程--
spark
2.3.1新定义接口--中间使用了一些过度接口为了兼容老版本如:BaseStreamingSourceDataSource为一个类,定义了可插拔的数据源,对应一些列旧的数据源DataSourceV2
spark
2.3.1
github_28583061
·
2025-01-30 09:30
java
spark
大数据
mysql
hadoop
1-structedStreaming-基本流程(2.2.1)
基本流程
spark
2.2.1StructuredNetworkWordCount统计来自socket的wordcount创建stream,指定数据源DataStreamReader--从外部存储加载流数据的接口
github_28583061
·
2025-01-30 09:30
java
spark
大数据
hadoop
hive
python 分布式集群_Python搭建
Spark
分布式集群环境
前言Apache
Spark
是一个新兴的大数据处理通用引擎,提供了分布式的内存抽象。
Spark
最大的特点就是快,可比HadoopMapReduce的处理速度快100倍。
小国阁下
·
2025-01-30 05:32
python
分布式集群
性能优化案例:通过合理设置
spark
.shuffle.memoryFraction参数的值来优化Py
Spark
程序的性能
在Py
Spark
中,合理调整
spark
.shuffle.memoryFraction参数可以有效优化Shuffle阶段的性能,尤其是在存在大量磁盘溢出的场景下。
weixin_30777913
·
2025-01-30 05:01
python
spark
大数据
spark
集群完全分布式搭建
1.
spark
的运行架构(主从模式)主节点:master-----资源管理调度和任务的分配---------类似yarn从节点:worker-----执行具体的计算任务整体运行架构:编写
spark
运行程序用户将应用程序提交给
。 。,。,。
·
2025-01-30 05:59
分布式
spark
大数据
基于Python+
Spark
的气象天气分析大屏可视化系统设计与实现毕设源码
博主介绍:✌专注于VUE,小程序,安卓,Java,python,物联网专业,有17年开发经验,长年从事毕业指导,项目实战✌选取一个适合的毕业设计题目很重要。✌关注✌私信我✌具体的问题,我会尽力帮助你。研究的背景:随着我国气象事业的发展,气象数据的实时分析和可视化成为越来越重要的任务。然而,目前气象数据的分析与展示手段仍然较为传统,缺乏交互性,不能满足现代气象业务的需求。因此,研究一种基于Pytho
sj52abcd
·
2025-01-30 02:10
python
spark
课程设计
毕业设计
Python
编程入门
指南:从基础到高级
如果你正在学习Python,那么你需要的话可以,点击这里Python重磅福利:入门&进阶全套学习资料、电子书、软件包、项目源码等等免费分享!一、引言1.1Python编程语言简介Python是一种高级编程语言,它具有简单易学、代码简洁、易维护等特点,因此被广泛应用于科学计算、数据分析、人工智能等领域。Python的语法简洁,代码易于阅读和编写,因此它被广大开发者所喜爱。同时,Python还拥有庞大
编程咕咕gu-
·
2025-01-30 02:38
python
零基础学习
开发语言
学习
零基础入门
基于
Spark
的实时计算服务的流程架构
基于
Spark
的实时计算服务的流程架构通常涉及多个组件和步骤,从数据采集到数据处理,再到结果输出和监控。
小小搬运工40
·
2025-01-30 02:08
spark
大数据
Oracle PL/SQL
编程入门
:第九章 异常 高级主题
欢迎来到OraclePL/SQL
编程入门
的第九章!在这一章中,我们将深入探讨PL/SQL中的异常处理高级主题。
caifox菜狐狸
·
2025-01-29 14:00
Oracle
PL/SQL
编程入门
oracle
sql
数据库
异常
异常高级
自定义异常
Exceptions
上一页
2
3
4
5
6
7
8
9
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他