E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
Spark入门教程
【
Spark
系列1】
Spark
作业执行原理
本文字数在7800字左右,预计时间在15分钟一、整体流程每个Aciton操作会创建一个JOB,JOB会提交给DAGScheduler,DAGScheduler根据RDD依赖的关系划分为多个Stage,每个Stage又会创建多个TaskSet,每个TaskSet包含多个Task,这个Task就是每个分区的并行计算的任务。DAGScheduler将TaskSet按照顺序提交给TaskScheduler
周润发的弟弟
·
2024-01-28 23:40
从零开始搞大数据
servlet
Pillow(PIL Fork) Image模块
加载图像创建图像新图像从矩阵中创建生成图像方法显示保存格式转换复制裁剪draft图像缩放图像旋转图像翻转对象属性图像模式图像生命周期Pillow(PILFork)Image模块RelatedLinksPillow(PIL)
入门教程
syugyou
·
2024-01-28 23:30
pillow
python
数仓治理-小文件治理
:数据治理实践|小文件治理本文中将介绍Hive中小文件治理的方法和技巧,希望对大家有所帮助https://mp.weixin.qq.com/s/HDxAGhGIPvXF38wPiXZ7xg[离线计算-
Spark
爱吃辣条byte
·
2024-01-28 23:40
数据治理
大数据
数据仓库
PyQt6中文手册
PyQt6中文手册一、PyQt6简介最后更新于2021.04.22本教程是PyQt6的
入门教程
。本教程的目的是让您开始使用PyQt6库。
bugtraq2021
·
2024-01-28 21:37
qt
python
pyqt
ui
Maven 详细
入门教程
文章目录什么是Maven作用项目构建依赖管理目录结构核心概念POMMaven仓库本地仓库远程仓库中央仓库私服坐标依赖依赖传递依赖冲突路径最短者优先路径相同先声明优先统一管理依赖的版本依赖范围可选依赖排除依赖聚合概念实现继承概念实现Maven安装与配置下载/解压配置环境变量配置文件配置本地仓库位置配置阿里云镜像Maven工程的默认jdkMaven常用操作手动安装Maven依赖命令行实例部署jar包到
我觉得海星_98
·
2024-01-28 19:09
开发工具
maven
java
jar
微软又搞了一个开源入门课程,这次是物联网
《微软开源的机器学习课程》《微软开源的Web开发课程》简介IoT-For-Beginners是微软开源的物联网
入门教程
,总共有24节课,时间周期为12周,每一节课都包括课前与课后测验、完成课程的书面说明
开源前哨
·
2024-01-28 19:28
spark
内核源码剖析七:Work工作原理
driverDesc)=>{logInfo(s"Askedtolaunchdriver$driverId")valdriver=newDriverRunner(conf,driverId,workDir,
spark
Home
雪飘千里
·
2024-01-28 18:08
极简py
spark
Py
Spark
简要介绍Py
Spark
是一个基于
Spark
的Python接口,它允许你在Python中使用
Spark
的强大功能,如大数据处理、实时数据处理等。
吉小雨
·
2024-01-28 18:13
python
史上最口语化Arduino
入门教程
——1.2数字I/O口
那么操作IO口的电平有什么作用呢?其实模块的控制十分的简单,大多数都是用高低电平来控制它们,IO口就充当着一个开关的角色。一般来说控制模块先要看看介绍,看它可以接收和输出的是数字信号还是模拟信号,所谓数字信号就是说它只有两个量0和1,一般led模块、人体热电感应模块等都是采用的数字信号,而模拟信号它所输出的是一个电压值,通过板子的数模转换将它转化为可读的数值,然后使用公式换算成具体的量。常见的有温
鼾声鼾语
·
2024-01-28 16:48
Antlr v4
入门教程
和实践
一.ANTRL是什么当我们实现一种语言时,我们需要构建读取句子(sentence)的应用,并对输入中的元素做出反应。如果应用计算或执行句子,我们就叫它解释器(interpreter),包括计算器、配置文件读取器、Python解释器都属于解释器。如果我们将句子转换成另一种语言,我们就叫它翻译器(translator),像Java到C#的翻译器和编译器都属于翻译器。不管是解释器还是翻译器,应用首先都要
yixianshijie
·
2024-01-28 16:41
antlr
py
spark
在windows下java.net.SocketException: Connection reset by peer 错误
py
spark
在windows加载数据集训练模型出现以下错误java.net.SocketException:Connectionresetbypeer:socketwriteerroratjava.net.SocketOutputStream.socketWrite0
walk walk
·
2024-01-28 15:49
数据挖掘
python
spark
java
java
大数据
python
spark
-streaming与kafka的整合
1.概述在2.x中,
spark
有两个用来与kafka整合的代码,版本代号为0.8和0.10,由于在0.8,kafka有两套消费者api,根据高级api得到了Receiver-basedApproach,
王大为学习笔记
·
2024-01-28 14:47
[
Spark
SQL] Rdd转化DataFrame 通过StructType为字段添加Schema
1、开发环境
spark
-2.1.0-bin-hadoop2.62、Rdd转换成DataFrame,为字段添加列信息参数nullable说明:Indicatesifvaluesofthisfieldcanbenullvaluesvalschema
林沐之森
·
2024-01-28 13:51
[AIGC大数据基础]
Spark
入门
其中,
Spark
作为一个快速、通用的大数据处理引擎备受关注。本文将从“是什么、怎么用、为什么用”三个角度来介绍
Spark
。
程序员三木
·
2024-01-28 12:32
大后端
大数据
AIGC
spark
Impala-shell卡顿分析——记一次曲折的Debug经历
Impala-shell卡顿分析——记一次曲折的Debug经历问题发现最近准备在Impala中增加对UTF-8的支持,以修正跟Hive、
Spark
等基于Java的系统在UTF-8字符串上的不兼容表现(如
stiga-huang
·
2024-01-28 12:06
Impala
大数据
impala
debug
Impala元数据简介
Impala元数据简介背景Impala是一个高性能的OLAP查询引擎,与其它SQL-on-Hadoop的ROLAP解决方案如Presto、
Spark
SQL等不同的是,Impala对元数据(Metadata
stiga-huang
·
2024-01-28 12:05
Impala
Spark
:Task Locality参考
Datalocalitycanhaveamajorimpactontheperformanceof
Spark
jobs.Ifdataandthecodethatoperatesonitaretogetherthencomputationtendstobefast.Butifcodeanddataareseparated
liuzx32
·
2024-01-28 12:38
Spark
的宽依赖和窄依赖
Apache
Spark
中的依赖关系指的是转换操作(transformations)之间的依赖类型。这些依赖关系决定了任务是如何在集群上分布执行的。
小湘西
·
2024-01-28 08:52
Spark
spark
大数据
分布式
Spark
——
Spark
SQL逻辑计划(Logical Plan)、物理计划(Physical Plan)和Catalyst优化器(Catalyst Optimizer)
文章目录TreesRules
Spark
SQL中使用CatalystAnalysis逻辑优化(LogicalOptimizations)物理计划(PhysicalPlanning)代码生成(CodeGeneration
Southwest-
·
2024-01-28 08:18
Spark
Spark
Spark
——
Spark
覆盖分区表中指定的分区
问题描述
Spark
中向分区表写数据的时候,如果写入模式为“overwrite”,那会将整个表覆盖掉;如果写入模式为“ap
Southwest-
·
2024-01-28 08:18
Spark
Spark
Spark
——
Spark
OOM Error问题汇总分析
.广播了大变量Executor端OOMError1.低效的查询2.不合适的Driver端和Executor端内存3.不合适的YARNContainer内存4.内存中缓存大量数据5.不合适任务并行度参考
Spark
Southwest-
·
2024-01-28 08:17
Spark
Spark
Spark
——
Spark
写MySQL太慢、很慢、非常慢的原因分析及优化方法
文章目录问题背景原因分析解决方法参考问题背景有这样一个业务场景:需要将通过
Spark
处理之后的数据写入MySQL,并在在网页端进行可视化输出。
Southwest-
·
2024-01-28 08:17
Spark
Spark
MySQL
Spark
——
Spark
/Hive向量化查询执行原理分析(Vectorization Query Execution)
文章目录什么是向量化查询执行列式存储
Spark
向量化查询执行Hive向量化查询执行参考什么是向量化查询执行在标准的查询执行系统中,每次只处理一行数据,每次处理都要走过较长的代码路径和元数据解释,从而导致
Southwest-
·
2024-01-28 08:47
Spark
Spark
Hive
向量化
Spark
——
Spark
缓存临时视图(View)
文章目录RDD/Dataset缓存复用纯SQL结果缓存复用RDD/Dataset缓存复用我们知道在使用RDD和DatasetAPI开发
Spark
应用程序的时候,如果要缓存某个RDD或Dataset来进行复用
Southwest-
·
2024-01-28 08:47
Spark
Spark
Spark
——
Spark
DataFrame导出为Excel文件
文章目录问题背景实现1.Maven依赖2.代码实现3.参数详解1.'sheet_name'!B3:C35。2.sheet_name[#All]参考问题背景有时候我们在进行一些表的计算之后,会生成一些指标,需要导出来给其它同事用,虽说可以将DataFrame直接写成表,然后通过工具(比如Hue)导出为Excel,但是步骤就多了,而且如果要导出的表比较多的话,就更浪费时间了,那么这时候调用第三方插件就
Southwest-
·
2024-01-28 08:17
Spark
spark
Spark
—— JSON对象/数组转成
Spark
Dataset/DataFrame
JSON转DataFrame在日常使用
Spark
处理数据时,半结构化的JSON数据(JSONObject,JSONArray)可能是最常见的一种数据结构,那么能熟练并快速地处理JSON格式数据应该是数据开发人员的必备技能
Southwest-
·
2024-01-28 08:16
Spark
spark
json
Spark
——
Spark
读写MongoDB
文章目录
Spark
直连MongoDB1.通过
Spark
Conf2.通过ReadConfig3.通过DataFrameReaderHive中创建映射表mongoexport导出文件参考如果我们要想通过
Spark
Southwest-
·
2024-01-28 08:46
Spark
Spark
MongoDB
Spark
——
Spark
读写Greenplum/Greenplum-
Spark
Connector高速写Greenplum
文章目录问题背景解决方式代码实现
Spark
写Greenplum
Spark
读Greenplum参考问题背景通过数据平台上的DataX把Hive表数据同步至Greenplum(因为DataX原生不支持GreenplumWriter
Southwest-
·
2024-01-28 08:42
Spark
spark
大数据
分布式
Hive之set参数大全-18
指定在执行
Spark
上的动态分区裁剪时,用于评估分区数据大小的最大限制在Hive中,hive.
spark
.dynamic.partition.pruning.max.data.size是一个配置参数,用于指定在执行
OnePandas
·
2024-01-28 07:33
Hive
hive
数据仓库
hive面试题
本质上是将SQL转换为MapReduce或者
spark
来进行计算,数据是存储在hdfs上,简单理解来说hive就是MapReduce的一个客户端工具。补充1:你可以说一下HQL转换为MR的任务流程吗?
韩顺平的小迷弟
·
2024-01-28 07:29
大数据面试题
hive
hadoop
数据仓库
NVIDIA Isaac ROS -
入门教程
(一)
系列文章目录前言欢迎访问IsaacROS,这是一套硬件加速、高性能、低延迟的ROS2软件包,用于制造自主机器人,充分利用Jetson和其他英伟达平台的强大功能。查看入门指南,开始使用IsaacROS。设置IsaacROSBuildfarm,在英伟达™(NVIDIA®)Jetson上构建ROS2软件包访问资源库和软件包,了解特定软件包。熟悉IsaacROS的基本概念。比较软件包在不同平台上的性能。阅
kuan_li_lyg
·
2024-01-28 07:08
ROS
&
ROS2
机器人
自动驾驶
人工智能
ROS
机器人导航
SLAM
深度相机
大数据——Flink 知识点整理
目录1.Flink的特点2.Flink和
Spark
Streaming的对比3.Flink和Blink、Alink之间的关系4.JobManager和TaskManager的职责5.Flink集群部署有哪些模式
Vicky_Tang
·
2024-01-28 06:17
Flink
flink
面试
big
data
大数据
HTML新手教程
HTML
入门教程
:【狂神说Java】HTML5完整教学通俗易懂_哔哩哔哩_bilibili一.初识HTMLHyperTextMarkupLanguage(超文本标记语言)超文本包括:文字、图片、音频、视频
_阿伟_
·
2024-01-28 05:38
前端
html
前端
从壹开始微服务 [ DDD ] 之十一 ║ 基于源码分析,命令分发的过程(二)
缘起哈喽小伙伴周三好,老张又来啦,DDD领域驱动设计的第二个D也快说完了,下一个系列我也在考虑之中,是Id4还是Dockers还没有想好,甚至昨天我还想,下一步是不是可以写一个简单的Angular
入门教程
SAYLINING
·
2024-01-28 01:10
Apache
Spark
架构与特点
1.背景介绍Apache
Spark
是一个开源的大数据处理框架,由AMLLabs公司开发,后被Apache软件基金会所支持。
OpenChat
·
2024-01-27 23:35
apache
spark
架构
大数据
分布式
基于DDD的现代ASP.NET开发框架--ABP系列之2、ABP
入门教程
基于DDD的现代ASP.NET开发框架--ABP系列之2、ABP
入门教程
ABP是“ASP.NETBoilerplateProject(ASP.NET样板项目)”的简称。
zzm_
·
2024-01-27 23:16
数据库
测试
javascript
ViewUI
Spark
-core
什么是
Spark
Spark
是基于内存的快速,通用,可扩展的大数据分析引擎
Spark
的内置模块
Spark
Core是
Spark
可以离线处理的部分,实现了
spark
的基本功能,包含任务调度,错误恢复,与存储系统交互等模块
luckboy0000
·
2024-01-27 23:12
学习笔记
python模块包教学_11_模块和包 — 黑马程序员《Python
入门教程
完整版》笔记
模块和包—黑马程序员《Python
入门教程
完整版》笔记目标模块包发布模块01.模块1.1模块的概念模块是Python程序架构的一个核心概念每一个以扩展名py结尾的Python源代码文件都是一个模块模块名同样也是一个标识符
勉强解惑强行胡诌
·
2024-01-27 20:37
python模块包教学
萝卜大杂烩 | 万字长文,Numpy
入门教程
!
原文链接:万字长文,Numpy
入门教程
!本文给大家整理了一份绝佳的Numpy入门学习资料,文章略长,建议收藏!可以当文档使用,在需要的时候查看!
双木的木
·
2024-01-27 20:05
python拓展学习
numpy
python
机器学习
人工智能
数据分析
独家解读 | 滴滴机器学习平台架构演进之路
所谓大同是指大家所要处理的问题都相似,技术架构和选型也差不太多,比如都会使用GPU集群、采用
Spark
或K8s平台等。
csdn产品小助手
·
2024-01-27 19:18
人工智能
运维
大数据
携程Apollo简单
入门教程
这一篇就够了
1.Apollo背景对程序配置的期望值也越来越高:配置修改后实时生效,灰度发布,分环境、分集群管理配置,完善的权限、审核机制……废话不多说,参考官方文档如果不想看文档,也没关系,跟着我一步步走.2.安装Apollo服务端因为是简单案例,所以就用官方的QuickStart2.1环境要求以下是采用Linux环境配置Apollo服务启动包2.1.1CentOS7,不懂linux的,可以不要继续往下看了.
公子小白123
·
2024-01-27 18:23
apache 前30个开源项目
高性能Web服务器提供HTTP服务支持非常活跃2ApacheTomcatJava应用服务器部署JavaWeb应用程序非常活跃3ApacheHadoop分布式存储和计算框架大数据处理非常活跃4Apache
Spark
临水逸
·
2024-01-27 17:35
apache
开源
海淘返利新人入门 海淘返利
入门教程
:轻松上手,全球网购返
何为返利?如果你曾通过国内一些返利网到京东商城、苏宁等购物拿返利,那么恭喜,你可以不用看本攻略了!返利是将合作购物网站给的导购佣金,返还给会员。海淘返利不仅提供京东商城、苏宁易购、网易等国内返利,还提供许多国外购物网站的返利!【高省】是一个自用省钱佣金高,分享推广赚钱多的平台,百度有几百万篇报道,也期待你的加入。高省APP,是2021年推出的平台,0投资,0风险、高省APP佣金更高,模式更好,终端
高省APP珊珊
·
2024-01-27 16:30
如何使用irsa将火花提交给亚马逊eks集群
Inpreviousarticle,Ihaveintroducedhowwesubmita
Spark
jobtoanEKScluster.Aslongaswe’reusingotherAWScomponentsforourpipelinestointeract
weixin_26755331
·
2024-01-27 15:26
java
Py
spark
分类--LogisticRegression
LogisticRegression:逻辑回归分类classpy
spark
.ml.classification.LogisticRegression(featuresCol=‘features’,labelCol
Gadaite
·
2024-01-27 14:53
ML基础
分类
机器学习
人工智能
搭建大数据平台常用的端口号
journalnode默认的端口号9000:非高可用访问数rpc端口8020:高可用访问数据rpc8088:yarn的webUI的端口号8080:master的webUI,Tomcat的端口号7077:
spark
修勾勾L
·
2024-01-27 13:51
Linux
大数据
Spark
连接Hive的两种方式
一、使用hive-site.xml第一步:将集群中的hive-site.xml的内容复制出来,并放在idea项目的resources下,要求文件命名为:hive-site.xmldatanucleus.schema.autoCreateAlltruejavax.jdo.option.ConnectionURLjdbc:mysql://192.168.38.160:3306/hive_db?crea
修勾勾L
·
2024-01-27 13:50
Spark
Hive
hive
spark
mysql
项目中常用的utils
importcryptofrom'crypto'import
Spark
MD5from'
spark
-md5'importCryptoJsfrom'crypto-js'importJSEncryptfrom'jsencrypt'importstoragefrom
乐夫天命兮
·
2024-01-27 13:05
javascript
前端
开发语言
Python 进程 Process 与线程 threading 区别 - Python零基础
入门教程
目录一.Python线程threading创建二.Python进程Process创建三.Python进程Process和线程threading区别四.Python进程Process并行五.Python线程threading并发六.猜你喜欢一.Python线程threading创建对于Python线程相关的函数本文不再做详细讲解,如果想学习线程threading内容请参考:Python线程创建和参数
猿说编程
·
2024-01-27 12:14
flume+kafka+
Spark
Streaming+mysql+ssm+高德地图热力图项目
第一步、编写python脚本,产生模拟数据#coding=UTF-8importrandomimporttimephone=["13869555210","18542360152","15422556663","18852487210","13993584664","18754366522","15222436542","13369568452","13893556666","1536669855
printf200
·
2024-01-27 12:24
上一页
16
17
18
19
20
21
22
23
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他