E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
Spark基础学习
Java零基础入门笔记:(3)程序控制
【狂神说Java】Java零
基础学习
视频通俗易懂_哔哩哔哩_bilibiliScanner对象之前我们学的基本语法中我们并没有实现程序和人的交互,但是Java给我们提供了这样一个工具类,我们可以获取用户的输入
Sherlock Ma
·
2025-02-20 04:26
Java
Java入门
java
笔记
开发语言
程序人生
学习方法
改行学it
跳槽
Java零基础入门笔记:(4)方法
【狂神说Java】Java零
基础学习
视频通俗易懂_哔哩哔哩_bilibili第1-2章:Java零基础入门笔记:(1-2)入门(简介、基础知识)-CSDN博客第3章:Java零基础入门笔记:(3)程序控制
Sherlock Ma
·
2025-02-20 04:26
Java
Java入门
java
笔记
开发语言
学习方法
改行学it
跳槽
程序人生
使用 Docker 部署 Apache
Spark
集群教程
简介Apache
Spark
是一个强大的统一分析引擎,用于大规模数据处理。
努力的小T
·
2025-02-19 20:48
docker
docker
spark
linux
运维
服务器
云计算
容器
笔记:DataSphere Studio安装部署流程
一、标准版部署标准版:有一定的安装难度,体现在Hadoop、Hive和
Spark
版本不同时,可能需要重新编译,可能会出现包冲突问题。适合于试用和生产使用,2~3小时即可部署起来。
右边com
·
2025-02-19 13:15
Java
大数据
HIVE-
SPARK
日常记录备忘Hive修改字段类型之后(varchar->string)Hive可以查到数据,Presto查询报错;分区字段数据类型和表结构字段类型不一样;
spark
-sql分区表和非分区表兼容问题,不能关联可以建临时表把分区数据导入
流川枫_
·
2025-02-19 13:14
20210706
hdfs
hive
spark
spark
为什么比mapreduce快?
作者:京东零售吴化斌
spark
为什么比mapreduce快?
·
2025-02-19 11:55
程序员
spark
为什么比mapreduce快?
作者:京东零售吴化斌
spark
为什么比mapreduce快?
·
2025-02-19 11:22
程序员
Spark
中Dataset方法详解
一、数据清洗核心方法1.处理缺失值方法说明示例代码na().drop()删除包含空值的行Datasetcleaned=dataset.na().drop();na().fill(value)用指定值填充所有空值Datasetfilled=dataset.na().fill(0);na().fill(Map)按列填充不同值Mapfills=newHashMapunique=dataset.dropD
小巫程序Demo日记
·
2025-02-19 10:53
Spark+Hadoop学习
spark
ajax
java
分布式
探索大数据处理:利用 Apache
Spark
解锁数据价值
探索大数据处理:利用Apache
Spark
解锁数据价值大家好,我是你们熟悉的大数据领域自媒体创作者Echo_Wish。今天,我们来聊聊如何利用Apache
Spark
进行大规模数据处理。
Echo_Wish
·
2025-02-19 07:59
实战高阶大数据
apache
spark
大数据
最新Apache Hudi 1.0.1源码编译详细教程以及常见问题处理
1.最新ApacheHudi1.0.1源码编译2.Flink、
Spark
、Hive集成Hudi1.0.13.flinkstreaming写入hudi目录1.版本介绍2.安装maven2.1.下载maven2.2
Toroidals
·
2025-02-19 06:51
大数据组件安装部署教程
hudi1.0.1
源码编译
教程
最新
使用Docker安装
Spark
集群(带有HDFS)
本实验在CentOS7中完成第一部分:安装Docker这一部分是安装Docker,如果机器中已经安装过Docker,可以直接跳过[root@VM-48-22-centos~]#systemctlstopfirewalld[root@VM-48-22-centos~]#systemctldisablefirewalld[root@VM-48-22-centos~]#systemctlstatusfi
Sicilly_琬姗
·
2025-02-18 10:52
云计算
大数据
docker
spark
hdfs
使用Docker部署
Spark
集群
使用Docker部署
Spark
集群克隆包含启动脚本的git仓库启动
Spark
0.8.0集群并切换至
Spark
Shell环境不带参数运行部署脚本*运行一些小的例子终止集群克隆包含启动脚本的git仓库*gitclone-bblogpostgit
小孩真笨
·
2025-02-18 10:17
工程开发技术
Cloud
Data
Docker
Spark
从0开始使用Docker搭建
Spark
集群
utm_campaign=maleskine&utm_content=note&utm_medium=seo_notes&utm_source=recommendation最近在学习大数据技术,朋友叫我直接学习
Spark
吃鱼的羊
·
2025-02-18 10:16
SPARK
Hadoop
Hbase深入浅出
大家熟知的
Spark
、以及Hadoop的MapReduce,可以理解为一种计算框架。而HDFS,我们可以认为是为计算框架服务的存
天才之上
·
2025-02-18 03:13
数据存储
Hbase
大数据存储
深入浅出了解HBase及RDD编程
HBase为什么能存储海量数据创建一个HBase表配置
Spark
编写程序读取HBase数据编写程序向HBase写入数据关于搭建HBase高可用集群的图文教程,可参考我的另一篇博文——安装并配置HBase
山海王子
·
2025-02-18 03:11
大数据
hbase
Ajax
基础学习
AJAX浏览器本身就具备网络通信的能力,但在早期浏览器并没有把这个能力开放给JS最早是微软在IE浏览器中把这一能力向JS开放,让JS可以在代码中实现发送请求,这项技术在2005年被正式命名为AJAX(AsynchronousJavascriptAndXML)这套API主要依靠一个构造函数完成;该构造函数的名称为XMLHttpRequest,简称为XHR由于XHRAPI有着诸多缺陷,在HTML5和E
喜欢代码的新之助
·
2025-02-17 22:12
ajax
学习
okhttp
Spark
性能优化(四):Cache
在
Spark
中,缓存是一种将计算结果存储在内存中的方式,目的是加速后续操作。当你执行迭代算法或查询时,如果多次重复使用相同的数据集,缓存可以避免每次都重新计算相同的转换操作。
LevenBigData
·
2025-02-17 00:04
spark
性能调优
spark
性能优化
大数据
使用Docker搭建Flink集群
我们知道,像
spark
、flink这些计算框架都有多种运行模式:在本地使用多线程模拟集群真正的分布式集群如果直接在IDE(Intellj)里面编译和运行写好的程序,实际上是用的前一种运行模式;如果想尝试真正的生产环境中任务的提交和管
O_1CxH
·
2025-02-16 20:34
Flink大数据
Kafka大数据
docker
flink
容器
Spark
和 Flink
Spark
和Flink都是目前流行的大数据处理引擎,但它们在架构设计、应用场景、性能和生态方面有较大区别。
信徒_
·
2025-02-16 12:04
spark
flink
大数据
spark
任务运行
运行环境在这里插入代码片[root@hadoop000conf]#java-versionjavaversion"1.8.0_144"Java(TM)SERuntimeEnvironment(build1.8.0_144-b01)[root@hadoop000conf]#echo$JAVA_HOME/home/hadoop/app/jdk1.8.0_144[root@hadoop000conf]#
冰火同学
·
2025-02-16 11:56
Spark
spark
大数据
分布式
【Redis】golang操作Redis基础入门
【Redis】golang操作Redis基础入门大家好我是寸铁总结了一篇【Redis】golang操作Redis基础入门
spark
les:喜欢的小伙伴可以点点关注Redis的作用Redis(RemoteDictionaryServer
寸 铁
·
2025-02-16 07:24
go
数据库
Redis
redis
golang
数据库
CRUD
基本操作
分布式
键值对
hive
spark
读取hive hbase外表报错分析和解决
问题现象使用
Spark
shell操作hive关联Hbase的外表导致报错;hive使用tez引擎操作关联Hbase的外表时报错。
spring208208
·
2025-02-16 07:21
hive
hive
spark
hbase
spark
-广播变量
当本地数据极大的时候,可以使用广播变量,使得减少内存。本地集合对象和分布式集合对象(RDD)进行关联的时候,需要将本地集合对象广播变量。本地的数据传输到集群上,会发到每一个线程,每一个分区。每一个进程executor,有多个线程分区,进程内的线程数据共享因此,给每一个线程发送数据会导致数据占用,浪费资源。所有,出现了广播变量,使得只发送给进程代码使用:broadcast=sc.broadcast(
哈哈哈哈q
·
2025-02-16 05:12
+spark
hdfs
hadoop
大数据
spark
Go
基础学习
-数组与切片
数组固定长度同一种数据类型元素的集合//数组声明:vara[2]int//var数组名[长度]存放的类型//数组初始化://1,使用初始化列表来设置数组元素的值vara[3]int//数组会初始化为int类型的零值varb=[3]int{1,2}//使用指定的初始值完成初始化//2,使用指定索引值的方式来初始化数组c:=[2]int{1:1,3:5}//3,根据设置的数组元素来自行确定数组长度va
wzbwzt
·
2025-02-15 14:18
GO语言
golang
探索数据云的无缝桥梁:Apache
Spark
与 Snowflake 的完美结合
探索数据云的无缝桥梁:Apache
Spark
与Snowflake的完美结合
spark
-snowflakeSnowflakeDataSourceforApache
Spark
.项目地址:https://gitcode.com
窦育培
·
2025-02-15 12:32
【CANoe之CAPL
基础学习
_函数用法3】
【CANoe之CAPL
基础学习
_函数用法3】1、监视总线的情况,这一般会用在查看一段时间内,总线上有没有出现通讯异常的情况。
车端域控测试工程师
·
2025-02-15 11:24
笔记
经验分享
学习方法
c语言
maven插件学习(maven-shade-plugin和maven-antrun-plugin插件)
整合
spark
3.3.x和hive2.1.1-cdh6.3.2碰到个问题,就是
spark
官方支持的hive是2.3.x,但是cdh中的hive确是2.1.x的,项目中又计划用
spark
-thrift-server
catcher92
·
2025-02-15 08:00
java
maven
maven
学习
大数据
使用
Spark
LLM实现智能聊天:技术原理与实战演示
在本篇文章中,我们将探讨如何使用iFlyTek的
Spark
LLM模型来实现智能聊天功能。我们将详细介绍
Spark
LLM的技术背景、核心原理,并通过实际代码展示如何进行实现。
shuoac
·
2025-02-15 06:41
java
Spark
性能优化 (三):RBO 与 CBO
1.RBO的核心概念在Apache
Spark
的查询优化过程中,规则优化(Rule-BasedOptimization,RBO)是Catalyst优化器的一个关键组成部分。
LevenBigData
·
2025-02-15 02:09
spark
性能调优
spark
性能优化
ajax
2024年Python最新Python爬虫淘宝母婴销售数据可视化和商品推荐系统 开题报告(2),2024年最新高级开发面试题及答案大全
二、Python必备开发工具三、Python视频合集观看零
基础学习
视频,看视频学习是最快捷也是最有效果的方式,跟着视频中老师的思路,从基础到深入,还是很容易入门的。
2401_84140628
·
2025-02-14 22:11
程序员
python
爬虫
信息可视化
python 并行框架_基于python的高性能实时并行机器学习框架之Ray介绍
这种框架名为Ray,看起来有望取代
Spark
,业界认为
Spark
对于一些现实的人工智能应用而言速度太慢了;过不了一年,Ray应该会准备好用于生产环境。目前ray已经发布了0.3.0
weixin_39778582
·
2025-02-14 20:54
python
并行框架
Python Flask 入门开发
Python
基础学习
:Pyhton语法基础Python变量Python控制流Python函数与类PythonException处理Python文件操作Python日期与时间PythonSocket的使用
胖蔡
·
2025-02-14 18:05
Python
编程之道
python
flask
开发语言
java获取hive表所有字段,Hive Sql从表中动态获取空列计数
我正在使用datastax
spark
集成和
spark
SQLthrift服务器,它为我提供了一个HiveSQL接口来查询Cassandra中的表.我的数据库中的表是动态创建的,我想要做的是仅根据表名在表的每列中获取空值的计数
拾亿年
·
2025-02-14 16:23
java获取hive表所有字段
Py
Spark
查询Dataframe中包含乱码的数据记录的方法
首先,用Py
Spark
获取Dataframe中所有非ASCII字符,找到其中的非乱码字符。
weixin_30777913
·
2025-02-14 16:23
python
大数据
spark
spark
streaming基础操作
spark
streaming基础操作一、什么是
spark
streaming
Spark
Streaming用于流式数据的处理。
天选之子123
·
2025-02-14 09:33
大数据
spark
大数据
分布式
python票务系统_python
基础学习
:模拟火车订票系统
2020-12-20str1=["车次","出发站-到达站","出发时间","到达时间","历时"]train_numbers=["T40","T298","Z158"]train_place=["长春-北京","哈尔滨-北京","青岛-北京"]train_outTime=["00:12","00:06","12:48"]train_arriveTime=["12:20","10:50","21:
一愫
·
2025-02-14 03:27
python票务系统
真正通俗易懂的Langchain入门学习(一)
以下是针对初学者的LangChain
基础学习
提纲,从理论到实践逐步深入,帮助你系统掌握核心概念与应用:一、基础认知(1-2天)什么是LangChain?定义:基于语言模型(LLM)构建应用程序的框架。
caridle
·
2025-02-14 00:42
智能体
langchain
学习
数据库
Linux
基础学习
——指令
文章目录Linux的特点Linux的基础指令文件命令1.文件系统导航命令2.文件资源管理命令3.文件权限管理命令4.文件压缩和归档命令软件安装与卸载1.离线安装:dpkg2.在线安装:apt用户相关命令添加与删除用户进程管理命令显示进程状态Linux的特点开源,免费内核可裁剪Linux一切皆文件支持多用户,多任务安全稳定广泛的硬件支持模块化程度高Linux的基础指令文件命令1.文件系统导航命令pw
是妳流的泪
·
2025-02-13 17:56
学习
linux
小白零
基础学习
深度学习之张量
1.张量PyTorch中的张量(Tensor)就是一种用来存储数据的“盒子”,这个盒子可以有不同的形状和大小,里面可以装各种数字。张量是PyTorch中最基本的东西,就像乐高积木一样,你可以用它来搭建各种复杂的模型。2.张量的用途存储数据:你可以把张量当作一个容器,用来存储各种数据。比如,一张图片可以用一个三维张量来表示,其中第一维是颜色通道(红、绿、蓝),第二维和第三维是图片的宽度和高度。进行计
爱理科的小王子
·
2025-02-13 17:53
学习
深度学习
人工智能
flink实时集成利器 - apache seatunnel - 核心架构详解
它支持多种数据源和数据目标,并可以与ApacheFlink、
Spark
等计算引擎集成。
24k小善
·
2025-02-12 23:38
flink
apache
架构
DS缩写乱争:当小海豚撞上AI顶流,技术圈也逃不过“撞名”修罗场
这个2019年诞生的分布式任务调度系统,凭借可视化DAG界面、多租户支持和对Hadoop/
Spark
生态的深度集成,一度是大数据工程师的“梦中情工”。
·
2025-02-12 18:58
数据库
2024年Python最新使用Python读取mongoDB写入csv文件_python 连接mongodb 写入csv,面试开发人员都 问哪些问题
二、Python必备开发工具三、Python视频合集观看零
基础学习
视频,看视频学习是最快捷也是最有效果的方式,跟着视频中老师的思路,从基础到深入,还是很容易入门的。
m0_60707660
·
2025-02-12 11:10
程序员
python
mongodb
面试
Rust
基础学习
-标准库
栈和堆是我们Rust代码在运行时可以使用的内存部分。Rust是一种内存安全的编程语言。为了确保Rust是内存安全的,它引入了所有权、引用和借用等概念。要理解这些概念,我们必须首先了解如何在栈和堆中分配和释放内存。栈栈可以被看作一堆书。当我们添加更多书时,我们把它们放在堆叠的顶部。当我们需要一本书时,我们从顶部拿一本。栈按顺序插入值。它获取它们并以相反的顺序移除值。添加数据称为入栈,移除数据称为出栈
Xayla
·
2025-02-12 07:15
无畏并发Rust
rust
学习
人工智能
如何在Java中实现高效的分布式计算框架:从Hadoop到
Spark
如何在Java中实现高效的分布式计算框架:从Hadoop到
Spark
大家好,我是微赚淘客系统3.0的小编,是个冬天不穿秋裤,天冷也要风度的程序猿!
省赚客app开发者
·
2025-02-12 07:12
java
hadoop
spark
Spark
源码分析
过程描述:1.通过Shell脚本启动Master,Master类继承Actor类,通过ActorySystem创建并启动。2.通过Shell脚本启动Worker,Worker类继承Actor类,通过ActorySystem创建并启动。3.Worker通过Akka或者Netty发送消息向Master注册并汇报自己的资源信息(内存以及CPU核数等),以后就是定时汇报,保持心跳。4.Master接受消息
数据年轮
·
2025-02-11 22:11
Spark
spark源码
spark
大数据
源码分析
Spark
源码 | 脚本分析总结
前言最初是想学习一下
Spark
提交流程的源码,比如
Spark
OnYarn、Standalone。
董可伦
·
2025-02-11 21:31
spark
源码
脚本
Java
基础学习
笔记-继承
继承是面向对象的三大特性之一,继承可以解决编程中代码冗余的问题,是实现代码重用的重要手段之一。Java中只支持单继承,即每个类只能有一个直接父类。继承的语法格式如下。[访问修饰符]classextends{}>在Java中。继承通过extends关键字实现,其中SubClass称为子类,SuperClass称为父类或基类。>访问修饰符如果是public,那么该类在整个项目中可见。>若不写访问修饰符
蝴蝶不愿意
·
2025-02-11 02:39
Java基础学习笔记
python
开发语言
Spark
性能调优-----常规性能调优(一)最优资源配置
1.1.1常规性能调优一:最优资源配置
Spark
性能调优的第一步,就是为任务分配更多的资源,在一定范围内,增加资源的分配与性能的提升是成正比的,实现了最优的资源配置后,在此基础上再考虑进行后面论述的性能调优策略
weidajiangjiang
·
2025-02-11 01:01
spark
性能调优
常规资源配置
Spark
性能调优系列:
Spark
资源模型以及调优
Spark
资源模型
Spark
内存模型
Spark
在一个Executor中的内存分为三块,execution内存、storage内存、other内存。
Mr Cao
·
2025-02-11 01:29
大数据
spark
Spark性能调优
spark
性能调优 (一):执行计划
在
Spark
中,explain函数用于提供数据框(DataFrame)或SQL查询的逻辑计划和物理执行计划的详细解释。
LevenBigData
·
2025-02-11 01:26
spark
性能调优
spark
大数据
上一页
1
2
3
4
5
6
7
8
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他