E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
Spark基础学习
Scala简介
hadoop生态圈—>java
spark
生态圈—>scala1.scala是面向对象的、面向函数的基于静态类型的编程语言。
醉游江湖
·
2025-01-26 18:21
scala
spark
官方配置参数详解
以下是整理的
Spark
中的一些配置参数,官方文档请参考
Spark
Configuration。
我丶怀念的
·
2025-01-26 18:21
spark
scala
d
s
【
spark
床头书系列】如何在YARN上启动
Spark
官网权威详解说明
【
spark
床头书系列】如何在YARN上启动
Spark
官网权威详解说明点击这里看全文文章目录添加其他JAR文件准备工作配置调试应用程序
Spark
属性重要说明KerberosYARN特定的Kerberos
BigDataMLApplication
·
2025-01-26 18:20
spark
spark
大数据
分布式
xgboost在
spark
集群使用指南
简介XGBoost是一个优化的分布式梯度增强库,具有高效、灵活和可移植性。在梯度增强框架下实现了机器学习算法。XGBoost提供了一种并行树增强(也称为GBDT、GBM),可以快速、准确地解决许多数据科学问题。相同的代码在主要的分布式环境(Hadoop、SGE、MPI)上运行,可以解决数十亿个示例的训练问题。xgb相对于gbt所做的改进:1.2.3.XGBoost可以使用R、python、java
一颗小草333
·
2025-01-26 17:49
算法
mapreduce
spark
数据挖掘
MySQL
基础学习
(2): INSERT 操作
在这篇文章中,我们将专注于MySQL中的INSERT操作,深入了解如何高效地向表中插入数据,并探索插入操作中的一些常见错误与解决方案。一、基础INSERT语法在MySQL中,INSERT操作用于向表中插入新记录,基本语法如下:INSERTINTO表名VALUES(值1,值2,...);例如:INSERTINTOstudentVALUES(1,'zhangsan');这条语句会向student表中插
Purified_Soda
·
2025-01-26 14:19
MySQL数据库
数据库
mysql
学习
性能优化案例:通过合理设置
spark
.default.parallelism参数的值来优化Py
Spark
程序的性能
在Py
Spark
中,
spark
.default.parallelism是一个关键参数,直接影响作业的并行度和资源利用率。
weixin_30777913
·
2025-01-26 06:52
大数据
spark
python
性能优化案例:通过合理设置
spark
.storage.memoryFraction参数的值来优化Py
Spark
程序的性能
优化Py
Spark
程序的性能时,合理设置
spark
.storage.memoryFraction(或相关内存参数)是关键。
weixin_30777913
·
2025-01-26 05:14
python
大数据
spark
转:
Spark
RDD算子练习题
版权声明:本文为博主原创文章,遵循CC4.0BY-SA版权协议,转载请附上原文出处链接和本声明。本文链接:https://blog.csdn.net/qq_40825218/article/details/83720732给定数据如下:12张三25男chinese5012张三25男math6012张三25男english7012李四20男chinese5012李四20男math5012李四20男e
爱萨萨
·
2025-01-26 05:42
技术-大数据
spark
RDD
练习
spark
sql的练习题
1、使用StructuredStreaming读取Socket数据,把单词和单词的反转组成json格式写入到当前目录中的file文件夹中2、请使用StructuredStreaming读取student_info文件夹写的csv文件,2.1、统计出文件中的男女生各有多少人2.2、统计出姓“王”男生和女生的各有多少人3、请使用StructuredStreaming读取department_info文
a大数据yyds
·
2025-01-26 05:39
spark
spark
Spark
>sql练习题
练习题-------------------------------以下使用StructuredStreaming:-------------------------------1、请使用StructuredStreaming读取Socket数据,统计出每个单词的个数2、请使用StructuredStreaming读取student_info文件夹写的csv文件,2.1、统计出文件中的男女生各有多
BigMoM1573
·
2025-01-26 05:38
Spark
spark
《
Spark
大数据分析与内存计算》——第三章
(单选题)并不是所有企业都能自己产生数据,从而用于决策辅助,而更多的互联网企业如电商等大部分是要靠什么来抓取互联网数据进行分析A.HadoopB.pythonC.
Spark
D.网路爬虫正确答案:D:网路爬虫
阿万古
·
2025-01-26 05:07
课程作业
spark
数据分析
大数据
Py
Spark
之金融数据分析(
Spark
RDD、SQL练习题)
目录一、数据来源二、Py
Spark
RDD编程1、查询特定日期的资金流入和流出情况2、活跃用户分析三、Py
Spark
SQL编程1、按城市统计2014年3月1日的平均余额2、统计每个城市总流量前3高的用户四
唯余木叶下弦声
·
2025-01-26 04:02
大数据
大数据
spark
pyspark
python
数据分析
sql
用 Docker 搭建
Spark
集群
简介
Spark
是Berkeley开发的分布式计算的框架,相对于Hadoop来说,
Spark
可以缓存中间结果到内存而提高某些需要迭代的计算场景的效率,目前收到广泛关注。
yeasy
·
2025-01-26 00:22
Bigdata
Docker
spark
Docker
云计算
集群
分布式计算
Apache Flink 替换
Spark
Stream的架构与实践( bilibili 案例解读)_stream
spark
flink加载udf
3.基于ApacheFlink的流式计算平台为解决上述问题,bilibili希望根据以下三点要求构建基于ApacheFlink的流式计算平台。第一点,需要提供SQL化编程。bilibili对SQL进行了扩展,称为BSQL。BSQL扩展了Flink底层SQL的上层,即SQL语法层。**第二点,**DAG拖拽编程,一方面用户可以通过画板来构建自己的Pipeline,另一方面用户也可以使用原生Jar方式
2501_90243308
·
2025-01-25 16:58
apache
flink
spark
免费AI大模型API汇总(非常详细),零基础入门到精通,看这一篇就够了
前言一、免费大模型API一览大模型免费版本免费限制控制台(api_key等)讯飞星火大模型
spark
-litetokens:总量无限;QPS:2;(每秒发送的请求数)有效期:不限访问链接百度千帆大模型平台
大模型扬叔
·
2025-01-25 06:08
人工智能
免费AI大模型API汇总
大模型
python3+TensorFlow 2.x
基础学习
(一)
目录TensorFlow2.x基础1、安装TensorFlow2.x2、TensorFlow2.x基础概念2、1EagerExecution2、2TensorFlow张量(Tensor)3、使用Keras构建神经网络模型3、1构建Sequential模型3、2编译模型1、Optimizer(优化器)2、Loss(损失函数)3、Metrics(评估指标)3、3训练模型3、4评估模型3、5预测4、使用
刀客123
·
2025-01-25 03:23
python学习
tensorflow
学习
人工智能
用 Java 的思路快速学习 Scala
引言Scala是一种结合了面向对象和函数式编程的现代编程语言,广泛应用于大数据处理框架如Apache
Spark
和ApacheFlink。对于熟悉Java的开发者来说,Scala的学习曲线相对平缓。
进朱者赤
·
2025-01-24 23:50
其他
大数据
scala
Scala
scala
基础学习
(数据类型)-集合
文章目录集合创建集合isEmpty获取数据添加元素删除元素常见方法交集&差集diff--并集++uniontostringtolisttoArraytoMap其余常用方法集合ScalaSet(集合)是没有重复的对象集合,所有的元素都是唯一的。Scala集合分为可变的和不可变的集合。默认情况下,Scala使用的是不可变集合,如果你想使用可变集合,需要引用scala.collection.mutabl
百流
·
2025-01-24 19:55
scala
scala
学习
开发语言
【
Spark
】
Spark
Join类型及Join实现方式
Spark
Join类型1.InnerJoin(内连接)示例:valresult=df1.join(df2,df1("id")===df2("id"),"inner")执行逻辑:只返回那些在两个表中都有匹配的行
DataCrafter
·
2025-01-24 13:33
Spark
大数据
计算框架
spark
大数据
分布式
Spark
运行模式及
Spark
on Yarn两种运行模式的区别
Spark
运行模式1.Standalone模式描述:Standalone模式是
Spark
的独立集群模式,
Spark
自己管理资源和调度任务。适合小型集群或个人开发环境。特点:简单易用,适合开发和测试。
DataCrafter
·
2025-01-24 13:03
Spark
大数据
计算框架
spark
大数据
TiDB架构特性
文章目录TiDB整体架构TiDBServerPDServerTiKVServerTi
Spark
TiDBOperatorTiDB核心特性水平扩展高可用TiDB存储和计算能力存储能力-TiKV-LSM计算能力
·
2025-01-24 05:24
#
TiDB
TiDB
大数据学习(七)Python3操作livy(使用pylivy模块)
Livy是一个用于与
Spark
交互的开源REST接口。pylivy是Livy的Python客户端,可以在
Spark
集群上轻松实现远程代码执行。
猪笨是念来过倒
·
2025-01-24 04:46
大数据
大数据
python
【Redis】golang操作Redis基础入门
总结了一篇【Redis】golang操作Redis基础入门
spark
les:喜欢的小伙伴可以点点关注??
m0_74825360
·
2025-01-23 19:14
面试
学习路线
阿里巴巴
redis
golang
数据库
搭建单机伪分布式Hadoop+
spark
+scala
目录一、准备环境包:二、创建centos7虚拟机并配置ip三、链接Xshell并上环境包四、安装JDK1.解压jdk2.设置JAVA环境变量3.执行source使设置生效:4.检查JAVA是否可用。五、免密登陆1.创建ssh秘钥,输入如下命令,生成公私密钥2.将master公钥id_dsa复制到master进行公钥认证,实现本机免密登陆,测试完exit退出六、安装Hadoop软件1.解压hadoo
啥也不会0-0
·
2025-01-23 16:21
分布式
hadoop
spark
CDP中的Hive3之Apache Hive3特性
ApacheHive3架构概述CDP中采用的是ApacheHive3版本,相比Hive1/2,该版本在事务和安全性等方面有重大改进,了解这些版本之间的主要差异对于SQL用户至关重要,包括使用Apache
Spark
对许
·
2025-01-23 16:51
#
Hive
#
Spark
hive
cdp
Hadoop 与
Spark
:大数据处理的比较
大数据技术:涵盖Hadoop(HDFS)、Hive、
Spark
、Fli
王子良.
·
2025-01-23 16:50
大数据
经验分享
hadoop
spark
大数据
虚拟机VMware Workstation Pro安装集群+hadoop+
spark
+scala
参考资料:参考视频教程链接:大数据实验虚拟机安装Hadoop和
Spark
_哔哩哔哩_bilibiliup主:孤独时代的硕硕namenode安装选择镜像、路径、磁盘(最好不要c盘)、内存和处理器编辑名称与位置可点击此处自定义硬盘进行设置
落枫兮
·
2025-01-23 15:16
hadoop
spark
scala
大数据手写面试题Scala语言实现大全(持续更新)
目录1.冒泡排序2.二分查找3.快速排序4.归并排序5.手写
Spark
-WordCount6.手写
Spark
程序求平
大模型大数据攻城狮
·
2025-01-23 15:44
大数据
数据结构
算法
面试题
面试宝典
使用iFlyTek
Spark
LLM进行实时聊天应用开发
iFlyTek的
Spark
LLM为开发者提供了强大的聊天模型API,支持灵活的集成和扩展。本文将介绍如何使用
Spark
LLM搭建一个简单的聊天应用,包括基本的API初始化和调用,以及如何实现流式输出。
dagGAIYD
·
2025-01-23 04:53
前端
javascript
java
python
有了TiDB,是否还需要“散装”大数据组件?
最近和同事们讨论一个问题:在大数据应用日益增多的今天,如果使用了TiDB这样的一体化数据库,还需要使用那些传统的大数据组件(比如Hadoop、
Spark
等)吗?
狮歌~资深攻城狮
·
2025-01-22 15:02
tidb
数据仓库
数据分析
数据库
分布式
Spark
GraphX原理与代码实例讲解
Spark
GraphX原理与代码实例讲解作者:禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming1.背景介绍1.1问题的由来随着互联网和大数据技术的迅猛发展,社交网络
AI大模型应用之禅
·
2025-01-22 07:34
AI大模型与大数据
计算科学
神经计算
深度学习
神经网络
大数据
人工智能
大型语言模型
AI
AGI
LLM
Java
Python
架构设计
Agent
RPA
java微服务中消息队列处理中间件基础语法学习,零
基础学习
在Java微服务中,消息队列处理中间件可以帮助实现服务之间的异步通信、解耦和负载均衡。常用的Java消息队列工具包括RabbitMQ、ApacheKafka和ActiveMQ。下面我将详细介绍这些消息队列工具在Java中的基础语法和使用方法。1.RabbitMQRabbitMQ是一个广泛使用的开源消息代理软件,支持多种协议(AMQP、MQTT、STOMP等)。我们可以使用SpringAMQP来简化
慧香一格
·
2025-01-22 05:52
学习
消息队列
java
java
中间件
消息队列处理
spark
电影数据分析系统 Springboot协同过滤-余弦函数推荐系统 爬虫2万+数据 大屏数据展示 + [手把手视频教程 和 开发文档]
spark
电影数据分析系统Springboot协同过滤-余弦函数推荐系统爬虫2万+数据大屏数据展示+[手把手视频教程和开发文档【功能介绍】1.java爬取【豆瓣电影】网站中电影数据,保存为data.csv
QQ-1305637939
·
2025-01-21 22:58
毕业设计
大数据毕设
计算机毕业设计
spark
spring
boot
爬虫
大数据
电影推荐
电影分析
玩转至轻云大数据平台-docker部署篇
产品介绍至轻云是一款超轻量级、企业级大数据计算平台,基于
Spark
生态打造。一键部署,开箱即用。
fanciNate454
·
2025-01-21 16:34
大数据
docker
hadoop常用命令
Yarn查看提交到资源调度器的任务(任何用yarn资源的都可以看,比如
spark
、tez、mapreduce)看正在运行的yarn任务yarnapplication-list杀死对应的yarn任务yarnapplication-kill
我要用代码向我喜欢的女孩表白
·
2025-01-21 05:54
hadoop
npm
大数据
厦门租房信息分析展示(pycharm+python爬虫+py
spark
+pyecharts)(踩坑记录)
厦门租房信息分析展示(pycharm+python爬虫+py
spark
+pyecharts)(踩坑记录)项目地址http://dblab.xmu.edu.cn/blog/2307/踩坑:
Spark
分析文件
吃西红柿的鸡蛋
·
2025-01-20 18:03
大数据
hadoop
spark
python
Hadoop 和
Spark
的内存管理机制分析
大数据技术:涵盖Hadoop(HDFS)、Hive、
Spark
、Fli
王子良.
·
2025-01-20 03:27
经验分享
hadoop
spark
大数据
大数据学习(五):如何使用 Livy提交
spark
批量任务--转载
Livy是一个开源的REST接口,用于与
Spark
进行交互,它同时支持提交执行代码段和完整的程序。Livy封装了
spark
-submit并支持远端执行。启动服务器执行以下命令,启动livy服务器。.
zuoseve01
·
2025-01-19 22:15
livy
Spark
Livy 指南及livy部署访问实践
背景:Apache
Spark
是一个比较流行的大数据框架、广泛运用于数据处理、数据分析、机器学习中,它提供了两种方式进行数据处理,一是交互式处理:比如用户使用
spark
-shell,编写交互式代码编译成
spark
house.zhang
·
2025-01-19 22:40
大数据-Spark
大数据
大数据学习(四):Livy的安装配置及py
spark
的会话执行
一个基于
Spark
的开源REST服务,它能够通过REST的方式将代码片段或是序列化的二进制代码提交到
Spark
集群中去执行。
猪笨是念来过倒
·
2025-01-19 21:08
大数据
pyspark
探索数据科学新边界:Apache Livy 开源项目详解
探索数据科学新边界:ApacheLivy开源项目详解incubator-livyApacheLivyisanopensourceRESTinterfaceforinteractingwithApache
Spark
fromanywhere
毕艾琳
·
2025-01-19 21:37
大数据公司 Databricks 详解
Databricks是一家在大数据和人工智能领域具有重要影响力的美国企业软件公司,以下是关于它的详细技术解析:1.起源与背景:Databricks成立于2013年,由来自加州大学伯克利分校AMP实验室的
Spark
Bj陈默
·
2025-01-19 10:00
大数据
全面解读 Databricks:从架构、引擎到优化策略
导语:Databricks是一家由Apache
Spark
创始团队成员创立的公司,同时也是一个统一分析平台,帮助企业构建数据湖与数据仓库一体化(Lakehouse)的架构。
克里斯蒂亚诺罗纳尔多阿维罗
·
2025-01-19 09:27
架构
spark
大数据
使用 Hadoop 实现大数据的高效存储与查询
大数据技术:涵盖Hadoop(HDFS)、Hive、
Spark
、Fli
王子良.
·
2025-01-18 23:24
经验分享
大数据
hadoop
分布式
正则表达式
基础学习
目录1.基础1.1正则表达式的模式1.2正则表达式元字符和特性2.语法2.1普通字符2.2非打印字符2.3特殊字符2.4限定符2.5定位符2.6选择2.7反向引用3.修饰符(标记)4.元字符5.运算符优先级6.匹配规则6.1基本模式匹配6.2字符簇6.3确定重复的出现1.基础正则表达式(RegularExpression)是一种文本模式,包括普通字符(例如,a到z之间的字母)和特殊字符(称为"元字
RrEeSsEeTt
·
2025-01-18 23:22
正则表达式
正则表达式
正则
Spark
源码分析(一)
Spark
Rpc中序列化与反序列化Serializer的抽象类解读 (正在更新中~)别人能写出来的,你也能行!多学习别人的思路,形成自己的思路,高薪工作奔你而来!
Java序列化实现类JavaSerializer(1)JavaSerializationStream类代码实际例子1:序列化(2)JavaDeserializationStream代码实际例子2:反序列化
Spark
小白的大数据历程
·
2025-01-18 22:07
Spark源码解析
开发语言
spark
大数据
分布式
scala
Spark
源码分析(一)
Spark
Rpc中序列化与反序列化Serializer的抽象类解读 (java序列化部分完结,正在更新RpcEnv部分~)
目录(3)JavaSerializerInstance定义了一个Java序列化实例(1)构造方法参数(2)方法1:serializeStream(3)方法2:deserializeStreamdefaultClassLoader(4)方法3:deserializeStreamloader(5)方法4:serialize(6)方法5:deserializeloader(7)方法6:deseriali
小白的大数据历程
·
2025-01-18 22:37
Spark源码解析
spark
java
python
OpenCV
基础学习
5.1开运算完整代码:importcv2importnumpyasnpdefcir():try:image=cv2.imread("./image/xingtai/cirrec.jpg")kernel=cv2.getStructuringElement(cv2.MORPH_ELLIPSE,(11,11))src=cv2.morphologyEx(image,cv2.MORPH_OPEN,kerne
yzx991013
·
2025-01-18 13:48
OpenCV基础全集
学习
opencv图像
基础学习
2.3图像的加密解密源码如下:importcv2importnumpyasnpimportmatplotlib.pyplotaspltdefpassImg():img=cv2.imread('./image/cat.jpg',0)h,w=img.shape#生成一个密码,加密key_img=np.random.randint(0,256,size=(h,w),dtype=np.uint8)img_
yzx991013
·
2025-01-18 13:17
OpenCV基础全集
opencv
人工智能
计算机视觉
大数据-257 离线数仓 - 数据质量监控 监控方法 Griffin架构
已更完)HDFS(已更完)MapReduce(已更完)Hive(已更完)Flume(已更完)Sqoop(已更完)Zookeeper(已更完)HBase(已更完)Redis(已更完)Kafka(已更完)
Spark
武子康
·
2025-01-18 10:29
大数据
离线数仓
大数据
数据仓库
java
后端
hadoop
hive
上一页
1
2
3
4
5
6
7
8
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他