E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
——Spark
Spark
SQL 每年的1月1日算当年的第一个自然周, 给出日期,计算是本年的第几周
一、问题按每年的1月1日算当年的第一个自然周(遇到跨年也不管,如果1月1日是周三,那么到1月5号(周日)算是本年的第一个自然周,如果按周一是一周的第一天)计算是本年的第几周,那么
spark
sql如何写?
_lizhiqiang
·
2023-11-14 06:02
spark
sql
spark
调优案例分享
做了一个
Spark
调优案例的分享最近在整理了
Spark
相关的调优案例,并做了以下分享:
spark
调优案例,注意是MacKeynote
鸿乃江边鸟
·
2023-11-14 06:01
spark
分布式
spark
大数据
分布式
Spark
3.0中的AOE、DPP和Hint增强
1
Spark
3.0AQE
Spark
在3.0版本推出了AQE(AdaptiveQueryExecution),即自适应查询执行。
shangjg3
·
2023-11-14 06:32
Spark
大数据
spark
分布式
Spark
数据倾斜优化
1数据倾斜现象1、现象绝大多数task任务运行速度很快,但是就是有那么几个task任务运行极其缓慢,慢慢的可能就接着报内存溢出的问题。2、原因数据倾斜一般是发生在shuffle类的算子,比如distinct、groupByKey、reduceByKey、aggregateByKey、join、cogroup等,涉及到数据重分区,如果其中某一个key数量特别大,就发生了数据倾斜。2数据倾斜大key定
shangjg3
·
2023-11-14 06:30
Spark
大数据
spark
分布式
基于C#+WPF编写的调用讯飞星火大模型工具
工具源码:https://github.com/lishuangquan1987/XFYun.
Spark
Chat工具效果截图:支持流式输出:其中ApiKey/ApiSecret/AppId需要自己到讯飞星火大模型官网去注册账号申请
lishuangquan1987
·
2023-11-14 04:45
c#
开发语言
星火大模型
Spark
SQL之Analyzed LogicalPlan生成过程
经过AstBuilder的处理,得到了UnresolvedLogicalPlan。该逻辑算子树中未被解析的有UnresolvedRelation和UnresolvedAttribute两种对象。Analyzer所起到的主要作用就是将这两种节点或表达式解析成有类型的(Typed)对象。在此过程中,需要用到Catalog的相关信息。 因为继承自RuleExecutor类,所以Analyzer执行
RainTicking
·
2023-11-14 01:48
大数据
大数据
scala
Advanced Materials_Ben Cloward
Episode2——
Spark
lingSnowShader这一集来制作一个闪闪发光的雪的材质用到的材质是这个下载的是4K的,但是为了性能考虑需要优化一下这个纹理,把法线分为主要的和细节法线,主N为1024
嘟嘟小魔王_
·
2023-11-13 23:14
Unity
Shader学习
unity
1024程序员节
Spark
Worker 启动流程及源码详解
环境:
spark
2.3.3scala2.11.8Java1.8.0_141可以参考【
Spark
Master启动流程及源码详解】${
SPARK
_HOME}/sbin/start-slaves.sh#Launchtheslaves
ustbxyls
·
2023-11-13 17:59
大数据
Spark
Spark源码
大数据
Spark
Sql创建临时表并查询数据
importorg.apache.
spark
.sql.{DataFrame,
Spark
Session}importorg.apache.
spark
.sql.types.
Vincer_DB
·
2023-11-13 16:04
大数据
Scala
大数据
SparkSQL
Dataset 的一些 Java api 操作
文章目录一、使用JavaAPI和JavaRDD在
Spark
SQL中向数据帧添加新列二、foreachPartition遍历Dataset三、Dataset自定义Partitioner四、Dataset重分区并且获取分区数五
小强签名设计
·
2023-11-13 12:29
spark
Dataset
Spark
SQL
spark
sql读取hive数据直接写入doris,离线批量导入
一,
spark
sql读取hive表这里通过catalog查询表的字段信息,然后查询出来的字段colStr要给下面的doris使用。注意:我这里是直接拿取的hive表所有的字段。
黄瓜炖啤酒鸭
·
2023-11-13 12:36
apache
doris
sparkSql写入doris
spark
写入
doris
doris
spark
doris
Doris:读取Doris数据的N种方法
目录1.MySQLClient2.JDBC3.查询计划4.
Spark
DorisConnector5.FlinkDorisConnector1.MySQLClientDoris采用MySQL协议,高度兼容
m0_37559973
·
2023-11-13 12:59
Doris
doris
Spark
资源调优
1资源规划1.1资源设定考虑1、总体原则以单台服务器128G内存,32线程为例。先设定单个Executor核数,根据Yarn配置得出每个节点最多的Executor数量,每个节点的yarn内存/每个节点数量=单个节点的数量总的executor数=单节点数量*节点数。2、具体提交参数1)executor-cores每个executor的最大核数。根据经验实践,设定在3~6之间比较合理。2)num-ex
shangjg3
·
2023-11-13 08:41
Spark
大数据
spark
Spark
Job优化
1Map端优化1.1Map端聚合map-side预聚合,就是在每个节点本地对相同的key进行一次聚合操作,类似于MapReduce中的本地combiner。map-side预聚合之后,每个节点本地就只会有一条相同的key,因为多条相同的key都被聚合起来了。其他节点在拉取所有节点上的相同key时,就会大大减少需要拉取的数据数量,从而也就减少了磁盘IO以及网络传输开销。RDD的话建议使用reduce
shangjg3
·
2023-11-13 08:03
Spark
spark
大数据
分布式
基于
Spark
的电商用户行为实时分析可视化系统(Flask-SocketIO)
基于
Spark
的电商用户行为实时分析可视化系统(Flask-SocketIO)项目简介该项目已上线蓝桥课程,有需要的可凭邀请码(UB5mdLbl)学习哦,有优惠!
Mise_V
·
2023-11-13 04:14
Spark
spark
kafka
redis
python
flask
进阶SQL——数据表中多列按照指定格式拼接,并将多行内容合并为map拼接
示例:str_to_map(concat_ws(',',collect_set(concat_ws(':',modelname,score))))asscore_map,这条语句是一个
Spark
SQL的语句
JingjingyiyiGuo
·
2023-11-12 22:25
MySQL
sql
数据库
hive和
spark
-sql中 日期和时间相关函数 测试对比
测试版本:hive2.3.4
spark
3.1.1hadoop2.7.71、增加月份add_months(timestampdate,intmonths)add_months(timestampdate,
Data_IT_Farmer
·
2023-11-12 21:26
hive
hive
数据仓库
日期函数
时间函数
软件开发学习资料大全
进入大数据
Spark
SQL的世界链接:https://pan.baidu.com/s/1_AINgCN8KaQEbnJRkWnKdw提取码:7j85Java深入微服务原理改造房产销售平台链接:https
时光如水_岁月如哥
·
2023-11-12 17:09
others
开发
Hive的表操作2
Hive系列注:大家觉得博客好的话,别忘了点赞收藏呀,本人每周都会更新关于人工智能和大数据相关的内容,内容多为原创,PythonJavaScalaSQL代码,CVNLP推荐系统等,
Spark
FlinkKafkaHbaseHiveFlume
陈万君Allen
·
2023-11-12 16:00
Java和大数据
hive
大数据
hadoop
spark
插入动态分区代码报错
现象
Spark
Sessionsession=
Spark
Session.builder().config(
spark
Conf).config("hive.exec.dynamic.partition.mode
cclovezbf
·
2023-11-12 16:17
spark
spark
hive
大数据
Cannot initialize Cluster. Please check your configuration for mapreduce.framework .name and the cor
我知道问题点肯定在
spark
2.3.1集成hive3.1.0的版本问题上,因为hive3.1.0新增了很多功能,如事务等,发布时间没有长时间的积累,出问题很容易不受控制。
汐朔
·
2023-11-12 16:47
hadoop
Spark
spark
大数据
hadoop
hive
hive3.0
Spark
SQL之Catelog体系
在
Spark
SQL系统中,Catalog主要用于各种函数资源信息和元数据信息(数据库、数据表、数据视图、数据分区与函数等)的统一管理。
Spark
SQL的Catalog体系涉及多个方面,不同
RainTicking
·
2023-11-12 12:07
大数据
大数据
scala
Spark
SQL之Rule体系
在UnresolvedLogicalPlan逻辑算子树的操作(如绑定、解析、优化等)中,主要方法都是基于规则(Rule)的,通过Scala语言模式匹配机制(Pattern-match)进行树结构的转换或节点改写。Rule是一个抽象类,子类需要复写apply(plan:TreeType)方法来制定特定的处理逻辑,基本定义如下。abstractclassRule[TreeTypevalbatchSta
RainTicking
·
2023-11-12 12:05
大数据
大数据
scala
Spark
简介
1.什么是
Spark
官网:http://
spark
.apache.org
Spark
是一个快速、通用、可扩展的大数据分析引擎。
Six Gods
·
2023-11-12 10:47
大数据
Spark
简介
AI系统ChatGPT源码+详细搭建部署教程+AI绘画系统+支持GPT4.0+Midjourney绘画+已支持OpenAI GPT全模型+国内AI全模型
一、AI创作系统
Spark
Ai创作系统是基于OpenAI很火的ChatGPT进行开发的Ai智能问答系统和Midjourney绘画系统,支持OpenAI-GPT全模型+国内AI全模型。
白云如幻
·
2023-11-12 09:58
人工智能
ChatGPT
软件源码
人工智能
chatgpt
AI作画
midjourney
AI写作
Apache Doris 入门教程10:数据导入之Broker Load
因为Doris表里的数据是有序的,所以Brokerload在导入数据的时是要利用doris集群资源对数据进行排序,相对于
Spark
load来完成海量历史数据迁移,对Doris的集群资源占用要比较大,这种方式是在用户没有
sunjian286
·
2023-11-12 09:57
apache
数据库
大数据
数据仓库
Apache Doris 入门教程12:数据导入之
Spark
Load
Spark
Load通过外部的
Spark
资源实现对导入数据的预处理,提高Doris大数据量的导入性能并且节省Doris集群的计算资源。主要用于初次迁移,大数据量导入Doris的场景。
sunjian286
·
2023-11-12 09:57
spark
大数据
数据库
数据仓库
database
apache
Spark
Ai创作系统ChatGPT网站源码+详细搭建部署教程+AI绘画系统+支持GPT4.0+Midjourney绘画
一、AI创作系统
Spark
Ai创作系统是基于OpenAI很火的ChatGPT进行开发的Ai智能问答系统和Midjourney绘画系统,支持OpenAI-GPT全模型+国内AI全模型。
只恨天高
·
2023-11-12 05:48
人工智能
程序源码
chatgpt
chatgpt
AI作画
midjourney
人工智能
Spark
的转换算子和操作算子
1Transformation转换算子1.1Value类型1)创建包名:com.shangjack.value1.1.1map()映射参数f是一个函数可以写作匿名子类,它可以接收一个参数。当某个RDD执行map方法时,会遍历该RDD中的每一个数据项,并依次应用f函数,从而产生一个新的RDD。即,这个新RDD中的每一个元素都是原来RDD中每一个元素依次应用f函数而得到的。1)具体实现packagec
shangjg3
·
2023-11-12 05:11
Spark
spark
大数据
数据仓库
Spark
SQL语法优化
Spark
SQL在整个执行计划处理的过程中,使用了Catalyst优化器。
shangjg3
·
2023-11-12 05:22
Spark
大数据
spark
分布式
Spark
的执行计划
Spark
3.0大版本发布,
Spark
SQL的优化占比将近50%。
shangjg3
·
2023-11-12 05:52
Spark
spark
大数据
分布式
资料免费领取-Flink/
Spark
/Java/Python/Redis/Kafka/CK/ZK/ES/Flume
首先这是一篇资源福利篇,相信会有很多读者和笔者一样,学习一门技术,至少会有20%的时候来寻找好的学习文章或者书籍。之前在后台提供了相关技术的书籍和视频,但经常有读者后台私信反馈链接失效的问题。由于笔者所有的资源均在某网盘中存放,迁移成本较大,所有这里对获取方式进行了改变,流程可能会有所繁琐,但尽可能节省大家的时间,如还是遇到失效问题,请后台私信进行处理解决。这里先给大家汇总下相关资料,如感兴趣,请
进击吧大数据
·
2023-11-12 04:13
Flink
Spark
Flume
java
kafka
spark
zookeeper
python
大数据-玩转数据-Flume
Flume、Kafka用来实时进行数据收集,
Spark
、Flink用来实时处理数据,impala用来实时查询。
人猿宇宙
·
2023-11-12 02:41
大数据
flume
大数据博文列表
文章目录说明分享大数据简述搭建hadoop平台单机版集群版安装优化组件hadoophdfsyarnflinkHbaseElasticsearchkafka
spark
hiveoozie其他vmwaredocker
羽落风起
·
2023-11-12 01:05
大数据
kafka
flink
hadoop
centos /dev/mapper/cl-root 100% 解决方法
解决方法本来是要在虚拟机上安装grpc进行测试的,结果发现gradle不能使用,然后去安装gradle,安装gradle之前要先安装sdkman,而官网sdkman的安装半天没反应,于是就想着yum试试,结果之前跑
spark
写回
·
2023-11-12 00:23
centos7
空间
centos7
空间不足
Spark
Streaming发布到Yarn
各位小伙伴周末好,之前写了文章介绍了怎么启动一个简单的
Spark
Streaming,此文开始介绍Yarn的原理,后续将一步步介绍
Spark
Streaming与SpringKarfka的项目整合。
cong_han
·
2023-11-11 23:50
Spark
大数据
spark
java
yarn
如何将Py
Spark
应用到日常的数据科学工作?
Spark
数据处理引擎是一个强大的分析工具,它可以将原始数据转化为有价值的洞察。Py
Spark
是基于Python的API,封装了
Spark
的核心引擎。
清图
·
2023-11-11 20:09
python
spark
python_python
spark
环境配置
放在D盘添加
SPARK
_HOME=D:\
spark
-2.3.0-bin-hadoop2.7。并将%
SPARK
_HOME%/bin添加至环境变量PATH。然后进入命令行,输入py
spark
命令。
weixin_39979948
·
2023-11-11 20:17
spark
python
本地运行py
spark
踩坑
步骤1安装py
spark
pip3installpy
spark
步骤2创建
spark
session对象
Spark
Session.builder.master("local").config("
spark
.driver.host
轶阳
·
2023-11-11 20:16
java
javascript
前端
Py
Spark
实战(二)——
Spark
环境配置
#下载
spark
安装包cd/export/softwarewgethttps://dlcdn.apache.org/
spark
/
spark
-3.3.2/
spark
-3.3.2-bin-hadoop3.tgz
狻猊来当程序媛
·
2023-11-11 20:15
PySpark
Hadoop
spark
大数据
分布式
Spark
类库----Py
Spark
(本地开发环境配置&&远程SSH解释器配置)
我们前面使用过bin/py
spark
程序,要注意,这个只是一个应用程序,提供一个Python解释器执行环境来运行
Spark
任务。
北海怪兽Monster
·
2023-11-11 20:13
大数据
spark
ssh
python
Py
spark
,Python下安装
Spark
,无需安装Hadoop
又是装环境斗志斗勇的一天,苦笑之前一直不想搭虚拟机/Hadoop/
spark
这些环境,后来python三千万行数据实在跑不动了,知道有py
spark
这等好东西,以为condainstallpy
spark
Lemon_ZL
·
2023-11-11 20:40
Py
Spark
环境配置
首先,要知道Py
Spark
是
Spark
为Python提供的API库,因此使用`pipinstallpy
spark
`下载py
spark
不等于下载了
spark
。
Maxi_0902
·
2023-11-11 20:40
大数据
spark
大数据
分布式
如何在虚拟机上安装和配置
Spark
开发环境
如何文章目录如何在虚拟机上安装和配置
Spark
开发环境下载解压安装包配置环境变量:修改
Spark
配置文件校验在虚拟机上安装和配置
Spark
开发环境背景:Apache
Spark
是专为大规模数据处理而设计的快速通用的计算引擎
Deng872347348
·
2023-11-11 19:39
Spark
spark
python—
spark
本地安装及环境变量配置
Spark
介绍
Spark
是一种快速、通用、可扩展的大数据分析引擎,2009年诞生于加州大学伯克利分校AMPLab,2010年开源,2013年6月成为Apache孵化项目,2014年2月成为Apache顶级项目
Sun_shine99
·
2023-11-11 19:38
spark
python
大数据
2021-06-10
RDD编程实践RDD编程实践1、需求描述
Spark
的核心是建立在统一的抽象弹性分布式数据集(ResilienntDistributedDatasets,RDD)之上的,这使得
Spark
的各个组件可以无缝地进行集成
weixin_43368981
·
2023-11-11 19:00
spark
大数据毕业设计选题推荐-生产大数据平台-Hadoop-
Spark
-Hive
✨作者主页:IT毕设梦工厂✨个人简介:曾从事计算机专业培训教学,擅长Java、Python、微信小程序、Golang、安卓Android等项目实战。接项目定制开发、代码讲解、答辩教学、文档编写、降重等。☑文末获取源码☑精彩专栏推荐⬇⬇⬇Java项目Python项目安卓项目微信小程序项目文章目录一、前言二、开发环境三、系统界面展示四、部分代码设计五、论文参考六、系统视频结语一、前言随着工业化进程的加
IT毕设梦工厂
·
2023-11-11 18:15
大数据项目
大数据
hadoop
spark
hive
毕业设计
VM虚拟机
解决Py
Spark
导入Python的问题
通过在“CMD”命令提示符程序内,输入:pipinstallpy
spark
安装Py
Spark
时,遇到了导入Py
Spark
包时无法找到
Spark
Conf和
Spark
Context的问题。
不吃花椒的兔酱
·
2023-11-11 17:26
黑马程序员Python课程
python
spark
基于Docker快速安装
Spark
及基础使用
基于Docker快速安装
Spark
及基础使用实战环境信息docker编排工具docker-compose安装使用官网指导方式安装(不推荐)使用国内镜像源安装(推荐)安装docker的
spark
镜像结果通过
小小马里奥ぅ
·
2023-11-11 14:36
大数据
spark
scala
docker
大数据
CSDN超级实习生 | 寒假之前,收藏好这份大厂2022年实习生招聘计划
对技术有热情,对于大数据处理,并发系统,性能优化等有强烈的兴趣;4、熟悉软件工程领域相关知识;5、熟悉大数据领域相关知识,Hadoop、
Spark
、Kafka等。后
实训001
·
2023-11-11 10:16
超级实习生
java
架构
面试
上一页
47
48
49
50
51
52
53
54
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他