E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
spark编程入门
yarn模式运行
spark
作业所有属性详解
摘要:
Spark
参数调优,可以大大提高工作中程序的运行效率。
weixin_34248487
·
2025-02-22 22:22
大数据
Spark
on YARN的重要参数
Spark
属性或者去源码找Class类
Spark
SubmitArguments,最全了属性名称默认含义
spark
.yarn.am.memory512m用于客户端模式下的YARNApplicationMaster
大米饭精灵
·
2025-02-22 21:50
Spark
Yarn
Spark
Yarn
大数据-257 离线数仓 - 数据质量监控 监控方法 Griffin架构
已更完)HDFS(已更完)MapReduce(已更完)Hive(已更完)Flume(已更完)Sqoop(已更完)Zookeeper(已更完)HBase(已更完)Redis(已更完)Kafka(已更完)
Spark
m0_74823705
·
2025-02-22 21:50
面试
学习路线
阿里巴巴
大数据
架构
spark
sql随记
1、
spark
sql访问hive将hive-site.xml放入到${
SPARK
_HOME}/conf下如果是
spark
onyarn的cluster模式,由于driver是运行于哪个executor未知
cxy1991xm
·
2025-02-22 21:18
spark
计算机毕业设计吊炸天Python+
Spark
地铁客流数据分析与预测系统 地铁大数据 地铁流量预测
开发技术
Spark
HadoopPython爬虫Vue.jsSpringBoot机器学习/深度学习人工智能创新点
Spark
大屏可视化爬虫预测算法功能1、登录注册界面,用户登录注册,修改信息2、管理员用户:
qq_80213251
·
2025-02-22 08:35
java
javaweb
大数据
课程设计
python
【Python编程 】从入门到实践(入门)
Python
编程入门
1.变量和数据类型1.1变量命名1.2变量1.3字符串1.3.1修改字符串大小写1.3.2字符串中使用变量1.3.3使用制表符或换行符来添加空白1.3.4删除空白1.4数1.4.1整数
Jasper.w
·
2025-02-22 05:10
Python
python
开发语言
Python 的 WebSocket 实现详解
大数据技术:涵盖Hadoop(HDFS)、Hive、
Spark
、Fli
王子良.
·
2025-02-22 03:23
经验分享
python
websocket
网络协议
网络
Spark
MLlib中的机器学习算法及其应用场景
Spark
MLlib是Apache
Spark
框架中的一个机器学习库,提供了丰富的机器学习算法和工具,用于处理和分析大规模数据。
Java资深爱好者
·
2025-02-21 20:47
深度学习
推荐算法
Spark
源码分析
Spark
源码分析
Spark
onYarnclientCluster本质区别,driver位置不同1)有哪些不同得进程?2)分别有什么作用?
陈同学�
·
2025-02-21 15:07
spark
big
data
scala
Spark
源码分析 – Shuffle
参考详细探究
Spark
的shuffle实现,写的很清楚,当前设计的来龙去脉HadoopHadoop的思路是,在mapper端每次当memorybuffer中的数据快满的时候,先将memory中的数据,按
weixin_34292924
·
2025-02-21 15:06
大数据
【大数据分析】
Spark
SQL查询:使用SQL命令
在
Spark
SQL编写SQL命令时,它们将被转换为DataFrame上的操作。通过连接到
Spark
的Thrift服务器,它们可以通过标准的JDBC或ODBC协议从应用服务器连接到
Spark
。
sword_csdn
·
2025-02-21 02:58
Spark
spark
数据分析
sql
如何使用
Spark
SQL进行复杂的数据查询和分析
使用
Spark
SQL进行复杂的数据查询和分析是一个涉及多个步骤和技术的过程。
Java资深爱好者
·
2025-02-21 01:22
spark
sql
大数据
Java并发
编程入门
,看这一篇就够了
Java并发编程一直是Java程序员必须懂但又是很难懂的技术内容。这里不仅仅是指使用简单的多线程编程,或者使用juc的某个类。当然这些都是并发编程的基本知识,除了使用这些工具以外,Java并发编程中涉及到的技术原理十分丰富。于是乎,就诞生了想写点东西记录下,以提升理解和对并发编程的认知。为什么需要用到并发?凡事总有好坏两面,之间的trade-off是什么,也就是说并发编程具有哪些挑战?以及在进行并
weixin_30555753
·
2025-02-21 01:48
java
数据库
人工智能
如果MLlib 中没有所需要的模型,如何使用
Spark
进行分布式训练?
如果MLlib中没有你所需要的模型,并且不打算结合更强大的框架(如TensorFlowOn
Spark
或Horovod),仍然可以使用
Spark
进行分布式训练,但需要手动处理训练任务的分配、数据准备、模型训练
是纯一呀
·
2025-02-20 08:57
WSL
Docker
AI
spark
分布式
mllib
《从编程小白到人工智能大神:大学新生Python入门攻略》
希望本文能帮助作为大学新生的你们在
编程入门
的过程中少走弯路,提供一条清晰有效的学习路径。一、编程语言选择作为编程新手,选择一门适合自己的编程语言至关重要。对于希望进入人工智能领
千帆过尽.
·
2025-02-20 06:10
python
人工智能
使用 Docker 部署 Apache
Spark
集群教程
简介Apache
Spark
是一个强大的统一分析引擎,用于大规模数据处理。
努力的小T
·
2025-02-19 20:48
docker
docker
spark
linux
运维
服务器
云计算
容器
笔记:DataSphere Studio安装部署流程
一、标准版部署标准版:有一定的安装难度,体现在Hadoop、Hive和
Spark
版本不同时,可能需要重新编译,可能会出现包冲突问题。适合于试用和生产使用,2~3小时即可部署起来。
右边com
·
2025-02-19 13:15
Java
大数据
HIVE-
SPARK
日常记录备忘Hive修改字段类型之后(varchar->string)Hive可以查到数据,Presto查询报错;分区字段数据类型和表结构字段类型不一样;
spark
-sql分区表和非分区表兼容问题,不能关联可以建临时表把分区数据导入
流川枫_
·
2025-02-19 13:14
20210706
hdfs
hive
spark
spark
为什么比mapreduce快?
作者:京东零售吴化斌
spark
为什么比mapreduce快?
·
2025-02-19 11:55
程序员
spark
为什么比mapreduce快?
作者:京东零售吴化斌
spark
为什么比mapreduce快?
·
2025-02-19 11:22
程序员
Spark
中Dataset方法详解
一、数据清洗核心方法1.处理缺失值方法说明示例代码na().drop()删除包含空值的行Datasetcleaned=dataset.na().drop();na().fill(value)用指定值填充所有空值Datasetfilled=dataset.na().fill(0);na().fill(Map)按列填充不同值Mapfills=newHashMapunique=dataset.dropD
小巫程序Demo日记
·
2025-02-19 10:53
Spark+Hadoop学习
spark
ajax
java
分布式
cuda
编程入门
——并行归约(五)
CUDA
编程入门
—并行归约(数组求和为例)在并行计算中,归约(Reduction)是一种将多个数据通过特定操作(如求和、求最大值等)合并为单一结果的并行算法。
我不会打代码啊啊
·
2025-02-19 07:02
cuda编程
算法
c++
gpu算力
cuda
编程入门
——并行性与异构性概念
CUDA
编程入门
一基于cuda的异构并行计算并行性一、并行性的概念与分类概念并行性旨在通过同时处理多个任务或数据元素来提高计算速度和效率。
我不会打代码啊啊
·
2025-02-19 07:32
cuda编程
gpu算力
c++
探索大数据处理:利用 Apache
Spark
解锁数据价值
探索大数据处理:利用Apache
Spark
解锁数据价值大家好,我是你们熟悉的大数据领域自媒体创作者Echo_Wish。今天,我们来聊聊如何利用Apache
Spark
进行大规模数据处理。
Echo_Wish
·
2025-02-19 07:59
实战高阶大数据
apache
spark
大数据
最新Apache Hudi 1.0.1源码编译详细教程以及常见问题处理
1.最新ApacheHudi1.0.1源码编译2.Flink、
Spark
、Hive集成Hudi1.0.13.flinkstreaming写入hudi目录1.版本介绍2.安装maven2.1.下载maven2.2
Toroidals
·
2025-02-19 06:51
大数据组件安装部署教程
hudi1.0.1
源码编译
教程
最新
使用Docker安装
Spark
集群(带有HDFS)
本实验在CentOS7中完成第一部分:安装Docker这一部分是安装Docker,如果机器中已经安装过Docker,可以直接跳过[root@VM-48-22-centos~]#systemctlstopfirewalld[root@VM-48-22-centos~]#systemctldisablefirewalld[root@VM-48-22-centos~]#systemctlstatusfi
Sicilly_琬姗
·
2025-02-18 10:52
云计算
大数据
docker
spark
hdfs
使用Docker部署
Spark
集群
使用Docker部署
Spark
集群克隆包含启动脚本的git仓库启动
Spark
0.8.0集群并切换至
Spark
Shell环境不带参数运行部署脚本*运行一些小的例子终止集群克隆包含启动脚本的git仓库*gitclone-bblogpostgit
小孩真笨
·
2025-02-18 10:17
工程开发技术
Cloud
Data
Docker
Spark
从0开始使用Docker搭建
Spark
集群
utm_campaign=maleskine&utm_content=note&utm_medium=seo_notes&utm_source=recommendation最近在学习大数据技术,朋友叫我直接学习
Spark
吃鱼的羊
·
2025-02-18 10:16
SPARK
Hadoop
Hbase深入浅出
大家熟知的
Spark
、以及Hadoop的MapReduce,可以理解为一种计算框架。而HDFS,我们可以认为是为计算框架服务的存
天才之上
·
2025-02-18 03:13
数据存储
Hbase
大数据存储
深入浅出了解HBase及RDD编程
HBase为什么能存储海量数据创建一个HBase表配置
Spark
编写程序读取HBase数据编写程序向HBase写入数据关于搭建HBase高可用集群的图文教程,可参考我的另一篇博文——安装并配置HBase
山海王子
·
2025-02-18 03:11
大数据
hbase
Spark
性能优化(四):Cache
在
Spark
中,缓存是一种将计算结果存储在内存中的方式,目的是加速后续操作。当你执行迭代算法或查询时,如果多次重复使用相同的数据集,缓存可以避免每次都重新计算相同的转换操作。
LevenBigData
·
2025-02-17 00:04
spark
性能调优
spark
性能优化
大数据
使用Docker搭建Flink集群
我们知道,像
spark
、flink这些计算框架都有多种运行模式:在本地使用多线程模拟集群真正的分布式集群如果直接在IDE(Intellj)里面编译和运行写好的程序,实际上是用的前一种运行模式;如果想尝试真正的生产环境中任务的提交和管
O_1CxH
·
2025-02-16 20:34
Flink大数据
Kafka大数据
docker
flink
容器
python
编程入门
学习(3)——自用笔记
目录第五章:if语句一个简单的示例条件测试if语句使用if语句处理列表第六章:字典一个简单的字典使用字典遍历字典嵌套在列表中存储字典在字典中存储列表在字典中存储字典第五章:if语句一个简单的示例#if语句示例cars=['bmw','audi','toyota','subaru']forcarincars:ifcar=='bmw':print(car.upper())else:print(car.
徐少19
·
2025-02-16 19:52
python入门
python
Spark
和 Flink
Spark
和Flink都是目前流行的大数据处理引擎,但它们在架构设计、应用场景、性能和生态方面有较大区别。
信徒_
·
2025-02-16 12:04
spark
flink
大数据
spark
任务运行
运行环境在这里插入代码片[root@hadoop000conf]#java-versionjavaversion"1.8.0_144"Java(TM)SERuntimeEnvironment(build1.8.0_144-b01)[root@hadoop000conf]#echo$JAVA_HOME/home/hadoop/app/jdk1.8.0_144[root@hadoop000conf]#
冰火同学
·
2025-02-16 11:56
Spark
spark
大数据
分布式
【Redis】golang操作Redis基础入门
【Redis】golang操作Redis基础入门大家好我是寸铁总结了一篇【Redis】golang操作Redis基础入门
spark
les:喜欢的小伙伴可以点点关注Redis的作用Redis(RemoteDictionaryServer
寸 铁
·
2025-02-16 07:24
go
数据库
Redis
redis
golang
数据库
CRUD
基本操作
分布式
键值对
hive
spark
读取hive hbase外表报错分析和解决
问题现象使用
Spark
shell操作hive关联Hbase的外表导致报错;hive使用tez引擎操作关联Hbase的外表时报错。
spring208208
·
2025-02-16 07:21
hive
hive
spark
hbase
spark
-广播变量
当本地数据极大的时候,可以使用广播变量,使得减少内存。本地集合对象和分布式集合对象(RDD)进行关联的时候,需要将本地集合对象广播变量。本地的数据传输到集群上,会发到每一个线程,每一个分区。每一个进程executor,有多个线程分区,进程内的线程数据共享因此,给每一个线程发送数据会导致数据占用,浪费资源。所有,出现了广播变量,使得只发送给进程代码使用:broadcast=sc.broadcast(
哈哈哈哈q
·
2025-02-16 05:12
+spark
hdfs
hadoop
大数据
spark
探索数据云的无缝桥梁:Apache
Spark
与 Snowflake 的完美结合
探索数据云的无缝桥梁:Apache
Spark
与Snowflake的完美结合
spark
-snowflakeSnowflakeDataSourceforApache
Spark
.项目地址:https://gitcode.com
窦育培
·
2025-02-15 12:32
maven插件学习(maven-shade-plugin和maven-antrun-plugin插件)
整合
spark
3.3.x和hive2.1.1-cdh6.3.2碰到个问题,就是
spark
官方支持的hive是2.3.x,但是cdh中的hive确是2.1.x的,项目中又计划用
spark
-thrift-server
catcher92
·
2025-02-15 08:00
java
maven
maven
学习
大数据
使用
Spark
LLM实现智能聊天:技术原理与实战演示
在本篇文章中,我们将探讨如何使用iFlyTek的
Spark
LLM模型来实现智能聊天功能。我们将详细介绍
Spark
LLM的技术背景、核心原理,并通过实际代码展示如何进行实现。
shuoac
·
2025-02-15 06:41
java
Spark
性能优化 (三):RBO 与 CBO
1.RBO的核心概念在Apache
Spark
的查询优化过程中,规则优化(Rule-BasedOptimization,RBO)是Catalyst优化器的一个关键组成部分。
LevenBigData
·
2025-02-15 02:09
spark
性能调优
spark
性能优化
ajax
HarmonyOS鸿蒙最全【PHP】PHP入门指南:从基础到进阶_php网络
编程入门
与进阶,2024年最新鸿蒙基础面试题及答案
网上学习资料一大堆,但如果学到的知识不成体系,遇到问题时只是浅尝辄止,不再深入研究,那么很难做到真正的技术提升。需要这份系统化的资料的朋友,可以戳这里获取一个人可以走的很快,但一群人才能走的更远!不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人,都欢迎加入我们的的圈子(技术交流、学习资源、职场吐槽、大厂内推、面试辅导),让我们一起学习成长!PHP标记:了解PHP的起始和结束标记,以及如何嵌入
2401_84872585
·
2025-02-14 23:18
鸿蒙
面试
学习
ACM训练系统 1003 [
编程入门
]密码破译 C
代码思路:利用srcii对每个字符进行加四处理一使用四个变量和getchar();对每个字符加密;。//baizhen#includeintmain(void){chara,b,c,d,e;a=getchar();b=getchar();c=getchar();d=getchar();e=getchar();printf("%c%c%c%c%c",a+4,b+4,c+4,d+4,e+4);//字符
眉间白
·
2025-02-14 23:16
ACM
c语言
蓝桥杯
c++
蓝桥杯——Python初级入门
目录一、运算符练习二、分支练习一、运算符练习题目1003:[
编程入门
]密码破译要将"China"译成密码,译码规律是:用原来字母后面的第4个字母代替原来的字母.例如,字母"A"后面第4个字母是"E"."
YAmlei
·
2025-02-14 22:13
蓝桥杯——Python
蓝桥杯
python
1003: [
编程入门
]密码破译(A用%d输出为ASCII码值)
1.字母以整形%d输出:ASCII码值printf("%d",'A');2.判断字母为大写/小写'A'==65,'Z'==90,'a'==97,'z'==122可以用ASCII码值比较,或者字母比较if(ch>=65&&ch='A'&&chintmain(){chars[11];//定义一个长度为10的字符串(注意有结尾符)gets(s);//输入字符串for(inti=0;s[i]!='\0';
XU0826csdn
·
2025-02-14 22:12
C语言刷题
蓝桥杯
C语言蓝桥杯1003: [
编程入门
]密码破译
要将"China"译成密码,译码规律是:用原来字母后面的第4个字母代替原来的字母.例如,字母"A"后面第4个字母是"E"."E"代替"A"。因此,"China"应译为"Glmre"。请编一程序,用赋初值的方法使cl、c2、c3、c4、c5五个变量的值分别为,’C’、’h’、’i’、’n’、’a’,经过运算,使c1、c2、c3、c4、c5分别变为’G’、’l’、’m’、’r’、’e’,并输出。变量初
年*D-清仁
·
2025-02-14 22:11
c语言
蓝桥杯
开发语言
python 并行框架_基于python的高性能实时并行机器学习框架之Ray介绍
这种框架名为Ray,看起来有望取代
Spark
,业界认为
Spark
对于一些现实的人工智能应用而言速度太慢了;过不了一年,Ray应该会准备好用于生产环境。目前ray已经发布了0.3.0
weixin_39778582
·
2025-02-14 20:54
python
并行框架
java获取hive表所有字段,Hive Sql从表中动态获取空列计数
我正在使用datastax
spark
集成和
spark
SQLthrift服务器,它为我提供了一个HiveSQL接口来查询Cassandra中的表.我的数据库中的表是动态创建的,我想要做的是仅根据表名在表的每列中获取空值的计数
拾亿年
·
2025-02-14 16:23
java获取hive表所有字段
Py
Spark
查询Dataframe中包含乱码的数据记录的方法
首先,用Py
Spark
获取Dataframe中所有非ASCII字符,找到其中的非乱码字符。
weixin_30777913
·
2025-02-14 16:23
python
大数据
spark
上一页
1
2
3
4
5
6
7
8
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他