E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
Spark编程基础
【
Spark
】
Spark
Join类型及Join实现方式
Spark
Join类型1.InnerJoin(内连接)示例:valresult=df1.join(df2,df1("id")===df2("id"),"inner")执行逻辑:只返回那些在两个表中都有匹配的行
DataCrafter
·
2025-01-24 13:33
Spark
大数据
计算框架
spark
大数据
分布式
Spark
运行模式及
Spark
on Yarn两种运行模式的区别
Spark
运行模式1.Standalone模式描述:Standalone模式是
Spark
的独立集群模式,
Spark
自己管理资源和调度任务。适合小型集群或个人开发环境。特点:简单易用,适合开发和测试。
DataCrafter
·
2025-01-24 13:03
Spark
大数据
计算框架
spark
大数据
TiDB架构特性
文章目录TiDB整体架构TiDBServerPDServerTiKVServerTi
Spark
TiDBOperatorTiDB核心特性水平扩展高可用TiDB存储和计算能力存储能力-TiKV-LSM计算能力
·
2025-01-24 05:24
#
TiDB
TiDB
大数据学习(七)Python3操作livy(使用pylivy模块)
Livy是一个用于与
Spark
交互的开源REST接口。pylivy是Livy的Python客户端,可以在
Spark
集群上轻松实现远程代码执行。
猪笨是念来过倒
·
2025-01-24 04:46
大数据
大数据
python
SpringBoot
编程基础
教程:Spring Boot Test
作者:禅与计算机程序设计艺术1.背景介绍SpringBootTest简介测试是一个软件开发过程中的重要环节,它可以帮助我们检测出软件代码中存在的问题、错误或漏洞,提高软件质量,确保软件的可靠性和可用性。在Java开发领域,Java自带的单元测试框架(JUnit)已经成为事实上的标准,但是随着项目越来越复杂,系统越来越庞大,单元测试用例的数量也越来越多,执行时间也越来vron长。此时,我们就需要自动
AI天才研究院
·
2025-01-23 19:48
AI大模型企业级应用开发实战
大数据
人工智能
语言模型
Java
Python
架构设计
【Redis】golang操作Redis基础入门
总结了一篇【Redis】golang操作Redis基础入门
spark
les:喜欢的小伙伴可以点点关注??
m0_74825360
·
2025-01-23 19:14
面试
学习路线
阿里巴巴
redis
golang
数据库
搭建单机伪分布式Hadoop+
spark
+scala
目录一、准备环境包:二、创建centos7虚拟机并配置ip三、链接Xshell并上环境包四、安装JDK1.解压jdk2.设置JAVA环境变量3.执行source使设置生效:4.检查JAVA是否可用。五、免密登陆1.创建ssh秘钥,输入如下命令,生成公私密钥2.将master公钥id_dsa复制到master进行公钥认证,实现本机免密登陆,测试完exit退出六、安装Hadoop软件1.解压hadoo
啥也不会0-0
·
2025-01-23 16:21
分布式
hadoop
spark
CDP中的Hive3之Apache Hive3特性
ApacheHive3架构概述CDP中采用的是ApacheHive3版本,相比Hive1/2,该版本在事务和安全性等方面有重大改进,了解这些版本之间的主要差异对于SQL用户至关重要,包括使用Apache
Spark
对许
·
2025-01-23 16:51
#
Hive
#
Spark
hive
cdp
Hadoop 与
Spark
:大数据处理的比较
大数据技术:涵盖Hadoop(HDFS)、Hive、
Spark
、Fli
王子良.
·
2025-01-23 16:50
大数据
经验分享
hadoop
spark
大数据
虚拟机VMware Workstation Pro安装集群+hadoop+
spark
+scala
参考资料:参考视频教程链接:大数据实验虚拟机安装Hadoop和
Spark
_哔哩哔哩_bilibiliup主:孤独时代的硕硕namenode安装选择镜像、路径、磁盘(最好不要c盘)、内存和处理器编辑名称与位置可点击此处自定义硬盘进行设置
落枫兮
·
2025-01-23 15:16
hadoop
spark
scala
大数据手写面试题Scala语言实现大全(持续更新)
目录1.冒泡排序2.二分查找3.快速排序4.归并排序5.手写
Spark
-WordCount6.手写
Spark
程序求平
大模型大数据攻城狮
·
2025-01-23 15:44
大数据
数据结构
算法
面试题
面试宝典
使用iFlyTek
Spark
LLM进行实时聊天应用开发
iFlyTek的
Spark
LLM为开发者提供了强大的聊天模型API,支持灵活的集成和扩展。本文将介绍如何使用
Spark
LLM搭建一个简单的聊天应用,包括基本的API初始化和调用,以及如何实现流式输出。
dagGAIYD
·
2025-01-23 04:53
前端
javascript
java
python
有了TiDB,是否还需要“散装”大数据组件?
最近和同事们讨论一个问题:在大数据应用日益增多的今天,如果使用了TiDB这样的一体化数据库,还需要使用那些传统的大数据组件(比如Hadoop、
Spark
等)吗?
狮歌~资深攻城狮
·
2025-01-22 15:02
tidb
数据仓库
数据分析
数据库
分布式
Spark
GraphX原理与代码实例讲解
Spark
GraphX原理与代码实例讲解作者:禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming1.背景介绍1.1问题的由来随着互联网和大数据技术的迅猛发展,社交网络
AI大模型应用之禅
·
2025-01-22 07:34
AI大模型与大数据
计算科学
神经计算
深度学习
神经网络
大数据
人工智能
大型语言模型
AI
AGI
LLM
Java
Python
架构设计
Agent
RPA
深入探秘 Java 网络编程:从基础到多线程服务器的全方位指南
1.Java网络
编程基础
Java网络编
2的n次方_
·
2025-01-22 04:09
java
网络
服务器
spark
电影数据分析系统 Springboot协同过滤-余弦函数推荐系统 爬虫2万+数据 大屏数据展示 + [手把手视频教程 和 开发文档]
spark
电影数据分析系统Springboot协同过滤-余弦函数推荐系统爬虫2万+数据大屏数据展示+[手把手视频教程和开发文档【功能介绍】1.java爬取【豆瓣电影】网站中电影数据,保存为data.csv
QQ-1305637939
·
2025-01-21 22:58
毕业设计
大数据毕设
计算机毕业设计
spark
spring
boot
爬虫
大数据
电影推荐
电影分析
玩转至轻云大数据平台-docker部署篇
产品介绍至轻云是一款超轻量级、企业级大数据计算平台,基于
Spark
生态打造。一键部署,开箱即用。
fanciNate454
·
2025-01-21 16:34
大数据
docker
C语言的网络编程
网络
编程基础
1.网络协议在进行网络编程之前,了解网络协议是非常重要的。网络协议
AI向前看
·
2025-01-21 12:53
包罗万象
golang
开发语言
后端
【从零开始入门unity游戏开发之——C#篇46】C#补充知识点——命名参数和可选参数
【C#篇】:主要讲解C#的基础语法,包括变量、数据类型、运算符、流程控制、面向对象等,适合没有
编程基础
的同学入门。
向宇it
·
2025-01-21 05:24
unity
c#
游戏引擎
编辑器
开发语言
hadoop常用命令
Yarn查看提交到资源调度器的任务(任何用yarn资源的都可以看,比如
spark
、tez、mapreduce)看正在运行的yarn任务yarnapplication-list杀死对应的yarn任务yarnapplication-kill
我要用代码向我喜欢的女孩表白
·
2025-01-21 05:54
hadoop
npm
大数据
厦门租房信息分析展示(pycharm+python爬虫+py
spark
+pyecharts)(踩坑记录)
厦门租房信息分析展示(pycharm+python爬虫+py
spark
+pyecharts)(踩坑记录)项目地址http://dblab.xmu.edu.cn/blog/2307/踩坑:
Spark
分析文件
吃西红柿的鸡蛋
·
2025-01-20 18:03
大数据
hadoop
spark
python
AI大模型学习路线
阶段1Python
编程基础
主要内容掌握的核心能力·Python基础语法·Python数据处理·函数·文件读写·异常处理·模块和包1、掌握Python开发环境基本配置;2、掌握运算符、表达式、流程控制语句
liuhenghui5201
·
2025-01-20 16:15
AI
python
AI
大模型
Android应用开发入门:从Android Studio环境设置到Java
编程基础
目录介绍步骤一:设置AndroidStudio环境步骤二:了解AndroidStudio界面步骤三:学习Java
编程基础
变量和数据类型数组和集合控制流类和方法结论介绍Android应用开发是一个令人兴奋和有趣的领域
Python爬虫项目
·
2025-01-20 11:22
移动开发精通教程
android
android
studio
java
gitee
ide
Hadoop 和
Spark
的内存管理机制分析
大数据技术:涵盖Hadoop(HDFS)、Hive、
Spark
、Fli
王子良.
·
2025-01-20 03:27
经验分享
hadoop
spark
大数据
大数据学习(五):如何使用 Livy提交
spark
批量任务--转载
Livy是一个开源的REST接口,用于与
Spark
进行交互,它同时支持提交执行代码段和完整的程序。Livy封装了
spark
-submit并支持远端执行。启动服务器执行以下命令,启动livy服务器。.
zuoseve01
·
2025-01-19 22:15
livy
Spark
Livy 指南及livy部署访问实践
背景:Apache
Spark
是一个比较流行的大数据框架、广泛运用于数据处理、数据分析、机器学习中,它提供了两种方式进行数据处理,一是交互式处理:比如用户使用
spark
-shell,编写交互式代码编译成
spark
house.zhang
·
2025-01-19 22:40
大数据-Spark
大数据
大数据学习(四):Livy的安装配置及py
spark
的会话执行
一个基于
Spark
的开源REST服务,它能够通过REST的方式将代码片段或是序列化的二进制代码提交到
Spark
集群中去执行。
猪笨是念来过倒
·
2025-01-19 21:08
大数据
pyspark
探索数据科学新边界:Apache Livy 开源项目详解
探索数据科学新边界:ApacheLivy开源项目详解incubator-livyApacheLivyisanopensourceRESTinterfaceforinteractingwithApache
Spark
fromanywhere
毕艾琳
·
2025-01-19 21:37
大数据公司 Databricks 详解
Databricks是一家在大数据和人工智能领域具有重要影响力的美国企业软件公司,以下是关于它的详细技术解析:1.起源与背景:Databricks成立于2013年,由来自加州大学伯克利分校AMP实验室的
Spark
Bj陈默
·
2025-01-19 10:00
大数据
全面解读 Databricks:从架构、引擎到优化策略
导语:Databricks是一家由Apache
Spark
创始团队成员创立的公司,同时也是一个统一分析平台,帮助企业构建数据湖与数据仓库一体化(Lakehouse)的架构。
克里斯蒂亚诺罗纳尔多阿维罗
·
2025-01-19 09:27
架构
spark
大数据
使用 Hadoop 实现大数据的高效存储与查询
大数据技术:涵盖Hadoop(HDFS)、Hive、
Spark
、Fli
王子良.
·
2025-01-18 23:24
经验分享
大数据
hadoop
分布式
Spark
源码分析(一)
Spark
Rpc中序列化与反序列化Serializer的抽象类解读 (正在更新中~)别人能写出来的,你也能行!多学习别人的思路,形成自己的思路,高薪工作奔你而来!
Java序列化实现类JavaSerializer(1)JavaSerializationStream类代码实际例子1:序列化(2)JavaDeserializationStream代码实际例子2:反序列化
Spark
小白的大数据历程
·
2025-01-18 22:07
Spark源码解析
开发语言
spark
大数据
分布式
scala
Spark
源码分析(一)
Spark
Rpc中序列化与反序列化Serializer的抽象类解读 (java序列化部分完结,正在更新RpcEnv部分~)
目录(3)JavaSerializerInstance定义了一个Java序列化实例(1)构造方法参数(2)方法1:serializeStream(3)方法2:deserializeStreamdefaultClassLoader(4)方法3:deserializeStreamloader(5)方法4:serialize(6)方法5:deserializeloader(7)方法6:deseriali
小白的大数据历程
·
2025-01-18 22:37
Spark源码解析
spark
java
python
R语言的并发编程
一、并发
编程基础
并发编
技术的探险家
·
2025-01-18 21:31
包罗万象
golang
开发语言
后端
大数据-257 离线数仓 - 数据质量监控 监控方法 Griffin架构
已更完)HDFS(已更完)MapReduce(已更完)Hive(已更完)Flume(已更完)Sqoop(已更完)Zookeeper(已更完)HBase(已更完)Redis(已更完)Kafka(已更完)
Spark
武子康
·
2025-01-18 10:29
大数据
离线数仓
大数据
数据仓库
java
后端
hadoop
hive
py
spark
中删除hdfs的文件夹
在py
spark
中保存rdd的内存到文件的时候,会遇到文件夹已经存在而失败,所以如果文件夹已经存在,需要先删除。搜索了下资料,发现py
spark
并没有提供直接管理hdfs文件系统的功能。
TDengine (老段)
·
2025-01-18 09:21
大数据
spark
hadoop
hdfs
mapreduce
【零基础入门unity游戏开发——unity通用篇36】向量(Vector3)的基本操作和运算(基于unity6开发介绍)
【C#篇】:主要讲解C#的基础语法,包括变量、数据类型、运算符、流程控制、面向对象等,适合没有
编程基础
的同学入门。
向宇it
·
2025-01-18 09:49
unity
游戏引擎
3d
c#
开发语言
Python 爬虫:获取网页数据的 5 种方法
大数据技术:涵盖Hadoop(HDFS)、Hive、
Spark
、Fli
王子良.
·
2025-01-18 07:35
经验分享
python
python
开发语言
爬虫
python捕获异常
try:name="aaa"id="aaa"exceptExceptionase:print("任务报错")print(str(e))print(str(traceback.print_exc()))
spark
.sql
青云游子
·
2025-01-18 02:58
python
Spark
任务提交流程
当包含在applicationmaster中的
spark
-driver启动后,会与资源调度平台交互获取其他执行器资源,并通过反向注册通知对应的node节点启动执行容器。
尘世壹俗人
·
2025-01-18 01:21
大数据Spark技术
大数据
spark
读取、写入Clickhouse以及遇到的问题
最近需要处理Clickhouse里面的数据,经过上网查找总结一下
spark
读写Clickhouse的工具类已经遇到的问题点。具体Clickhouse的讲解本篇不做讲解,后面专门讲解这个。
Alex_81D
·
2025-01-18 01:18
大数据基础
大数据从入门到精通
clickhouse
spark
2024年最新Python:Page Object设计模式_python page object,BTAJ大厂最新面试题汇集
知识体系:含编程语言、算法、大数据生态圈组件(Mysql、Hive、
Spark
、Flink)、数据仓库、Python、前端等等。网上学习资料一大堆,但如果学到的知识不成体系,遇到问题时只是
m0_60707708
·
2025-01-17 20:36
程序员
python
设计模式
开发语言
2024年总结:大转向
职业转向今年我在职业上尝试做了一个转向,具体的结果可能需要比较长的时间来检验我选择是否正确,所以转向的细节我就不全部展开了,可以确定是我依然会专注在Infra和BigData,比如今年我发布了
Spark
SQL
·
2025-01-17 20:11
年度总结
Java爬虫——使用
Spark
进行数据清晰
1.依赖引入 org.apache.
spark
spark
-core_2.13 3.5.3 org.apache.
spark
spark
-sql_2.13 3.5.32.数据加载从MySQL数据库中加载
Future_yzx
·
2025-01-17 20:59
java
爬虫
spark
万字详解数仓分层设计架构 ODS-DWD-DWS-ADS
把复杂问题简单化5、屏蔽原始数据的(影响),屏蔽业务的影响ETL操作1、数据抽取2、数据清洗3、数据转换4、数据加载数据中台包含的内容很多,对应到具体工作中的话,它可以包含下面的这些内容:系统架构:以Hadoop、
Spark
_Jordan
·
2025-01-17 16:56
自己写的
数据仓库
Java 大视界 -- Java 开发
Spark
应用:RDD 操作与数据转换
Apache
Spark
是一个强大的分布式计算框架,提供了高效的数据处理能力,广泛应用于大数据分析与机器学习。
Spark
提供了多种高级API,支持批处理和流处理。
一只蜗牛儿
·
2025-01-17 12:26
java
spark
开发语言
Spring Boot 和微服务:快速入门指南
大数据技术:涵盖Hadoop(HDFS)、Hive、
Spark
、Fli
王子良.
·
2025-01-17 09:56
Java
经验分享
spring
boot
微服务
后端
Shell 函数深入解析与实践
本教程旨在为刚入门的新手提供明晰的指南,同时也为有一定
编程基础
的开发者提供深入理解shell函数的机会。我们将通过实际代码示例,逐步展开讨论,以确保概念的清晰传达和理解。
·
2025-01-17 04:25
shell
CDP中的Hive3之Hive Metastore(HMS)
Impala、
Spark
、Hive和其他服务共享元存储。与HMS的连接包括HiveServe
对许
·
2025-01-17 02:31
#
Hive
#
Spark
hive
cdp
ARM架构与嵌入式系统开发全流程教程
同时,涵盖ARM
编程基础
知识,包括汇编语言、C/C++编程和软件开发工具链,以及嵌入式系统中的应用和入门级教程,帮助初学者逐步掌握ARM处理器的工作原理和嵌入式系
夏勇兴
·
2025-01-17 02:27
上一页
5
6
7
8
9
10
11
12
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他