E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
Spark技术研究
py
spark
_1_理论篇(RDD基础)
跟着Leo学习Py
Spark
chapter1——rdd的基础编程指南一、准备工作1.背景介绍
Spark
是用scala编程语言实现的,为了使
Spark
支持Python,Apache
Spark
社区发布了一个工具
NikolasNull
·
2024-02-04 04:50
Kubernetes operator 如何根据自定义类型生成响应的代码的?
分享这篇文章的主要目的,是如何利用kubernetes来自定义类型,如
Spark
Application,从而使用脚本,生成响应的代码的这些代码是专门为自定义的类型
Spark
Application对象服务的
weixin_34109408
·
2024-02-04 00:09
Java Scala 混合编程导致 编译失败 ,【找不到符号】问题解决
Failedtoexecutegoalorg.apache.maven.plugins:maven-compiler-plugin:3.1:compile(default-compile)onproject
spark
-auth
0X码上链
·
2024-02-03 23:20
大数据
分布式技术
java
scala
开发语言
hadoop、
spark
、flink集群修改默认ssh端口号
大数据集群在实际搭建过程中,其默认ssh端口不一定都是22,这时需要根据各自的配置文件进行适配。ssh端口号默认为22,以centos7.x为例,可以在/etc/ssh/sshd_config中进行修改,如下示例将22改为22222:#IfyouwanttochangetheportonaSELinuxsystem,youhavetotell#SELinuxaboutthischange.#sem
0X码上链
·
2024-02-03 21:12
大数据
分布式技术
ssh
hadoop
spark
flink
Spark
程序执行逻辑迷你版
再把Task发出去DAGScheduler的功能,将rdd转换逻辑切分stage,生成taskset然后模拟taskScheduler的功能,将这些task发到Executor上去执行(真正的发送逻辑
spark
submit
{BOOLEAN}
·
2024-02-03 21:21
Spark
spark
大数据
java
2019-10-08 大数据开发进阶之路
市场需要的水平熟练掌握Linux、SQL与HiveSQL掌握Hadoop生态主流技术,如HDFS/MapRedunce/Yarn/HBase/Flume等掌握
Spark
生态核心技术,如
Spark
架构/RDD
红瓦李
·
2024-02-03 20:39
Spark
常用Transformations算子(二)
joincogroupcartesianpiperepartitionAndSortWithinPartitionsglomrandomSplitzipzipWithIndexzipWithUniqueId(2)joinobjectJoinTest{defmain(args:Array[String]):Unit={valconf=new
Spark
Con
数据萌新
·
2024-02-03 20:03
大数据环境搭建(一)-Hive
1hive介绍由Facebook开源的,用于解决海量结构化日志的数据统计的项目本质上是将HQL转化为MapReduce、Tez、
Spark
等程序Hive表的数据是HDFS上的目录和文件Hive元数据metastore
xfchn多多学习学习
·
2024-02-03 20:42
大数据
大数据
hive
hadoop
【
Spark
】
Spark
作业执行原理--提交任务
本篇结构:创建Task创建TaskSetManager并向DriverEndpoint发送消息分配资源发送消息告诉Executor去执行Task一、创建Task当调度阶段运行后,在DAGScheduler的submitMissingTasks方法中会根据调度阶段Partition数量拆分对应个数任务。对于ResultStage,生成ResultTask,对于ShuffleMapStage生成Shu
w1992wishes
·
2024-02-03 19:17
spark
WordCount
Spark
WC.scalapackageday06importorg.apache.
spark
.rdd.RDDimportorg.apache.
spark
.
lehuai
·
2024-02-03 16:27
阿里云服务器2核16G、4核32G、8核64G配置最新收费标准及活动价格
2核16G、8核64G、4核32G配置的云服务器处理器与内存比为1:8,这种配比的云服务器一般适用于数据分析与挖掘,Hadoop、
Spark
集群和数据库,缓存等内存密集型场景,因此,多为企业级用户选择,
阿里云最新优惠和活动汇总
·
2024-02-03 15:07
89.网游逆向分析与插件开发-物品使用-实现物品使用策略的功能
内容参考于:易道云信息
技术研究
院VIP课上一个内容:物品使用策略管理UI的设计-CSDN博客码云地址(ui显示角色数据分支):https://gitee.com/dye_your_fingers/sro
染指1110
·
2024-02-03 15:24
网游逆向
游戏
c++
大数据组件笔记 --
Spark
入门
文章目录一、简介二、
Spark
运行模式2.1本地模式2.2集群角色2.3Standalone模式2.4Yarn模式2.5总结三、WordCount开发案例实操一、简介
Spark
是一种基于内存的快速、通用
L小Ray想有腮
·
2024-02-03 15:53
BigData
Spark
大数据分与实践笔记(Scala语言基础-1)
目录1.1Scala概述1.1.1Scala的下载安装1.1.2在IDEA开发工具中下载安装Scala插件1.1.3开发第一个Scala程序
Spark
是专为大规模数据处理而设计的快速通用的计算引擎,它是由
妉妉师姐
·
2024-02-03 15:49
大数据-linux-spark
scala
spark
java
大数据
SpringBoot或Jeecg 配置SSL实现https,http和https端口都要,http转发到https
如果没有阿里云腾讯云只是本地测试,可以参考https://www.cnblogs.com/
Spark
More/p/14067340.html有阿里云购买域名域名备案购买服务器宽带收费和流量收费都可以域名绑定服务器
天海华兮
·
2024-02-03 12:05
Java
EE
http
spring
boot
ssl
https
初识Apache Paimon
第0章前言0.1主流数据湖工具Delta:由
Spark
背后商业公司Databricks出品,因此很多功能强兼容
Spark
,对其他计算引擎不是很友好。
Racin_01
·
2024-02-03 12:30
apache
最新AI系统ChatGPT网站H5系统源码,支持Midjourney绘画局部编辑重绘,GPT语音对话+ChatFile文档对话总结+DALL-E3文生图
一、前言
Spark
Ai创作系统是基于ChatGPT进行开发的Ai智能问答系统和Midjourney绘画系统,支持OpenAI-GPT全模型+国内AI全模型。
白云如幻
·
2024-02-03 12:28
人工智能
软件源码
ChatGPT
人工智能
chatgpt
语音识别
midjourney
AI作画
最近宣布的NIST后量子密码学标准的3个关键要点
美国国家标准与
技术研究
院(NIST)最近公布了他们的标准初稿支持向量子安全加密未来
SafePloy安策
·
2024-02-03 11:17
量子计算
人工智能
Docker容器中的Docker-compose的学习安装
本来今天想写下实战的教程的,但是下载
spark
的内容太慢了。
胖琪的升级之路
·
2024-02-03 10:42
Py
Spark
笔记(三):DataFrame
DataFrame是在
Spark
1.3中正式引入的一种以RDD为基础的不可变的分布式数据集,类似于传统数据库的二维表格,数据在其中以列的形式被组织存储。
Daisy丶
·
2024-02-03 10:31
Hbase - 自定义Rowkey规则
中我们有时候需要分析数据1点到2点的范围,可是经过Region又比较慢,这时候我们就可以定制TableInputFormat来实现我们的需求了,我们还可以采用Flink的DataSet的方式读取,另外下面还有
Spark
kikiki2
·
2024-02-03 10:05
AI+数据库——梳理Snowflake 和 Databricks 在峰会上的重要发布,快来看市值数百亿美金的数据巨头的贴身肉搏!
他们原本定位略有不同,Databricks是一个用于数据工程、数据科学和分析的集成环境,它构建在Apache
Spark
之上,提供实
小猿姐
·
2024-02-03 10:51
人工智能
数据库
【机器学习】3万字长文,Py
Spark
入门级学习教程,框架思维
为什么要学习
Spark
?
风度78
·
2024-02-03 08:00
大数据
entity
opencl
spark
hadoop
【数据开发】py
spark
入门与RDD编程
【数据开发】py
spark
入门与RDD编程文章目录1、py
spark
介绍2、RDD与基础概念3、RDD编程3.1Transformation/Action3.2数据开发流程与环节1、py
spark
介绍py
spark
小哈里
·
2024-02-03 08:58
#
后端开发
python
spark
pyspark
后端
大数据
Spark
如何用repartition来提升执行效率
Spark
如何用repartition来提升执行效率repartition是
Spark
中的一个转换操作,它可以用来增加或减少分区的数量。
HanhahnaH
·
2024-02-03 08:28
Spark
spark
ajax
大数据
scala
基于机器学习的无损缺陷检测
技术研究
进展
基于机器学习的无损缺陷检测技术是当前研究的热点之一,其应用广泛,可以有效检测各种材料表面的缺陷。近年来,随着机器学习技术的不断发展,越来越多的研究人员开始探索如何利用机器学习算法来进行无损缺陷检测。机器学习算法在无损缺陷检测中具有很多优势。首先,机器学习算法可以通过学习大量的已知样本,自动提取缺陷的特征,避免了手工特征提取的繁琐和主观性。其次,机器学习算法可以对各种不同的缺陷进行分类和识别,提高了
matlabgoodboy
·
2024-02-03 07:51
机器学习
人工智能
Python和Java的自动化测试
技术研究
及应用探索
随着软件开发的复杂性不断增加,传统的手动测试方法已经无法满足对软件质量和交付速度的要求。自动化测试作为一种高效的测试方法,通过使用自动化工具和脚本来执行测试任务,可以提高测试效率、降低人力成本,并确保软件的稳定性和质量。Python和Java作为两种广泛使用的编程语言,都具备丰富的自动化测试工具和框架,因此对它们在自动化测试领域的比较和研究具有重要意义。本研究的目的是比较和分析基于Python和J
测试萌萌
·
2024-02-03 04:29
程序人生
程序员
软件测试
面试
单元测试
自动化测试
职场和发展
软件测试
2019-03-16
Spark
基本架构及运行原理
Spark
Core:包含
Spark
的基本功能,包含任务调度,内存管理,容错机制等,内部定义了RDDs(弹性分布式数据集),提供了很多APIs来创建和操作这些RDDs。为其他组件提供底层的服务。
做一只乐观的小猴子
·
2024-02-03 02:04
嵌入式人工智能/深度学习/神经网络导论
加我微信hezkz17进入嵌入式人工智能
技术研究
开发交流答疑群1嵌入式人工智能,嵌入式深度学习含义?
周南音频科技教育学院(AI湖湘学派)
·
2024-02-03 01:05
AI深度学习理论与实践研究
人工智能
算法
神经网络
基于stm32F4卷积神经网络手写数字识别项目
加我微信hezkz17可以申请加入嵌入式人工智能
技术研究
开发交流答疑群,赠送企业嵌入式AI图像理解/音/视频项目核心开发资料1采用CNNBP反向传播算法更新权重系数2原理解析3实现策略训练与识别分离,先在电脑上训练好
周南音频科技教育学院(AI湖湘学派)
·
2024-02-03 01:35
AI深度学习理论与实践研究
神经网络
音频
人工智能
算法
力扣刷题策略
作为一个计算机科学
技术研究
者,编程能力一定要过硬才行,因为在实际学习工作中难免要进行大量地编程敲代码,而力扣题提供了一个非常好的编程环境锻炼自身的编程能力,尤其是数据结构与算法。
不落.
·
2024-02-02 23:46
力扣编程题研究
leetcode
算法
数据结构
2020年中国人工智能发展前景预测
人工智能行业基础条件已具备【嵌牛鼻子】:大数据人工智能【嵌牛提问】:2020年中国人工智能发展前景预测【嵌牛正文】:中国人工智能研究处于爆发期,人工智能行业基础条件已具备中国人工智能产业起步相对较晚,但产业布局、
技术研究
等基础设施正处于进步期
我会飞james
·
2024-02-02 23:00
87.网游逆向分析与插件开发-物品使用-物品交换的逆向分析与C++封装
内容参考于:易道云信息
技术研究
院VIP课上一个内容:物品丢弃的逆向分析与C++代码的封装-CSDN博客码云地址(ui显示角色数据分支):https://gitee.com/dye_your_fingers
染指1110
·
2024-02-02 19:04
网游逆向
游戏
c++
88.网游逆向分析与插件开发-物品使用-物品使用策略管理UI的设计
内容参考于:易道云信息
技术研究
院VIP课上一个内容:物品交换的逆向分析与C++封装-CSDN博客码云地址(ui显示角色数据分支):https://gitee.com/dye_your_fingers/sro
染指1110
·
2024-02-02 19:04
c++
网游逆向
逆向
84.网游逆向分析与插件开发-物品使用-项目需求与需求拆解
内容参考于:易道云信息
技术研究
院VIP课上一个内容:自动化助手显示装备数据-CSDN博客项目需求:通过自动化助手指定物品的使用策略,比如当HP小于百分之二十,使用加血药物,当MP小于百分之二十时,使用加蓝药物
染指1110
·
2024-02-02 19:34
网游逆向
游戏
85.网游逆向分析与插件开发-物品使用-物品使用的逆向分析与C++代码的封装
内容参考于:易道云信息
技术研究
院VIP课上一个内容:项目需求与需求拆解-CSDN博客码云地址(ui显示角色数据分支):https://gitee.com/dye_your_fingers/sro_-ex.git
染指1110
·
2024-02-02 19:03
网游逆向
游戏
c++
深度学习的开源分布式框架Deeplearning4j
该框架基本上是由Hadoop和
Spark
集成的分布式深度学习库组成的。在Hadoop和
Spark
的帮助下,我们可以轻松地分发模型和大数据集,并运行
weixin_43106248
·
2024-02-02 19:13
深度学习
Hadoop
深度学习开源分布式框架
deeplearning4j
golang实现简单的流式处理
实现一个最简单的类似
spark
的流式处理流程包含map和filter数据typeStreamstruct{data[]int}map函数func(sStream)Map(ffunc(int)int)Stream
nil_ddea
·
2024-02-02 18:24
图谱实战 | 深度应用驱动的医学知识图谱构建
分享嘉宾:徐美兰浙江数字医疗卫生
技术研究
院数字医学知识中心主任编辑整理:李杰京东出品平台:DataFunTalk导读:数研院这些年在知识图谱建设上取得了丰硕成果,今天我们将图谱构建过程中的经验、心得分享给大家
开放知识图谱
·
2024-02-02 18:44
新型内窥镜成像
技术研究
一、变焦光学变焦光学是指可以调整焦距以改变视野大小的光学系统。变焦镜头常见于摄影、摄像和望远镜等设备中,允许用户在不改变其位置的情况下,调整图像的大小和观察的范围。了解变焦光学的基础知识,可以从以下几个方面入手:焦距:焦距是镜头前端到焦点(成像点)的距离。在变焦镜头中,焦距可以调整,从而改变视场大小和图像的放大率。变焦机制:变焦镜头通过改变镜片组之间的相对位置来调整焦距。这通常通过机械装置实现,如
六个核桃Lu
·
2024-02-02 15:30
智能医疗
健康医疗
图像处理
人工智能
计算机视觉
史上最全的
spark
面试题
1.
spark
中的RDD是什么,有哪些特性?
@毛毛
·
2024-02-02 13:12
面试题
spark
livy使用样例_livy提交
spark
应用
spark
-submit的使用shell时时灵活性较低,livy作为
spark
提交的一种工具,是使用接口或者java客户端的方式提交,可以集成到web应用中1.客户端提交的方式核心代码LivyClientclient
阿里聚安全
·
2024-02-02 13:11
livy使用样例
Py
Spark
(一)
Spark
原理介绍、Py
Spark
初体验及原理
Spark
简介Apache
Spark
是用于大规模数据(large-scaladata)处理的统一(unified)分析引擎,其特点就是对任意类型的数据进行自定义计算。
独憩
·
2024-02-02 13:11
PySpark
python
分布式
大数据
spark
生产环境_
Spark
找出两DataFrame之间的差集(技巧)
在生产作业中,经常在工作流中遇到前后两DataFrame的数据缺失,比如df1为410条,下一个节点的df2就变成409条了,用眼睛看很费劲,因此不得不做一个差集。代码:/假设df1和df2是你的两个DataFramevaldf1=xxxvaldf2=ccc//使用except操作找出df1中存在但df2中不存在的数据valonlyInDf1=df1.except(df2)//使用except操作
Matrix70
·
2024-02-02 13:10
轨迹大数据智能处理
Spark开发_工作
spark
大数据
分布式
浅谈
Spark
Livy
Spark
Livy什么是LivyLivy的特点Livy的运作流程阐述Livy的安装、启动、访问Livy的使用1.什么是Livylivy是cloudera开发的通过REST来连接、管理
spark
的解决方案
浅汐yt
·
2024-02-02 13:40
spark
大数据
spark
大数据
【
Spark
实践6】特征转换FeatureTransformers实践Scala版--补充算子
本节介绍了用于处理特征的算法,大致可以分为以下几组:提取(Extraction):从“原始”数据中提取特征。转换(Transformation):缩放、转换或修改特征。选择(Selection):从更大的特征集中选择一个子集。局部敏感哈希(LocalitySensitiveHashing,LSH):这类算法结合了特征转换的方面与其他算法。FeatureTransformersIndexToStri
周润发的弟弟
·
2024-02-02 13:39
Spark机器学习
spark
scala
大数据
spark
相关面试题总结
1.
spark
中的RDD是什么,有哪些特性?
专注于大数据技术栈
·
2024-02-02 13:39
spark
[Scala学习笔记]
Spark
开发小笔记
Spark
开发小笔记:从0开始的
Spark
建图生活持续更新中……0.开发平台Zeppelin支持多种语言,默认是scala(背后是
spark
shell),
Spark
SQL,Markdown和Shell。
Rinnki
·
2024-02-02 13:39
Scala笔记
学习笔记
Scala
Spark
图
Scala 与
spark
7.23
例如:@transientval
spark
Context:
Spark
Context,Scala多行字符串之stripMargin方法https://www.jianshu.com/
qq_34872215
·
2024-02-02 13:09
spark
生产环境踩坑系列::Hive on
Spark
的connection timeout 问题
起因7/16凌晨,钉钉突然收到了一条告警,一个公司所有业务部门的组织架构表的ETL过程中,数据推送到DIM层的过程中出现异常,导致任务失败。因为这个数据会影响到第二天所有大数据组对外的应用服务中组织架构基础数据,当然,我们的Pla-nB也不是吃素的,一旦出现错误,后面的权限管理模块与网关会自动配合切换前一天的最后一次成功处理到DIM中的组织架构数据,只会影响到在前一天做过组织架构变化的同事在系统上
dclar_
·
2024-02-02 13:08
Spark
Hive
spark
hive
上一页
6
7
8
9
10
11
12
13
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他