E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
spark核心技术
2024.2.19 阿里云Flink
一、Flink基本介绍
Spark
底层是微批处理,Flink底层则是实时流计算流式计算特点:数据是源源不断产生,两大问题,乱序和延迟Stateful:有状态Flink的三个部分Source:Transactions
白白的wj
·
2024-02-20 07:05
flink
大数据
Flink Catalog 解读与同步 Hudi 表元数据的最佳实践
在当前的大数据格局中,
Spark
/Hive/Flink是最为主流的ETL或Strea
Laurence
·
2024-02-20 06:28
大数据专题
flink
catalog
hudi
metastore
hive
共用表
元数据
【高效开发工具系列】PyCharm使用
推荐:kwan的首页,持续学习,不断总结,共同进步,活到老学到老导航檀越剑指大厂系列:全面总结java
核心技术
点,如集合,jvm,并发编程redis,kafka,Spring,微服务,Netty等常用开发工具系列
檀越剑指大厂
·
2024-02-20 06:09
s0
常用工具
pycharm
ide
python
面试系列之《
Spark
》(持续更新...)
stage:一个job任务中从后往前划分,分区间每产生了shuffle也就是宽依赖则划分为一个stage,stage这体现了
spark
的pipeline思想,即数据在内存中尽可能的往后多计算,最后落盘,
atwdy
·
2024-02-20 06:07
Spark
面试
spark
以内存为核心的开源分布式存储系统
Tachyon为不同的大数据计算框架(如Apache
Spark
,HadoopMapReduce,ApacheFlink等)提供可靠的内存级的数据共享服务。
这次靠你了
·
2024-02-20 05:26
大数据
Tachyon
hdfs
大数据
集群应用与实战
一组通过高速网络互联的计算组,并以单一系统的模式加以管理—将很多服务器集中起来,提供同一中服务,在客户端看来就像是只有一个服务器—可以在付出较低成本的情况下获得在性能,可靠性,灵活性方面的相对较高的收益—任务调度是集群中的
核心技术
集群目的
weixin_33800593
·
2024-02-20 03:43
网络
操作系统
数据结构与算法
手机远程控制树莓派-BLINKER应用(物联网基础)
由于我买了坚果云这个软件服务,所以我对云储存并无太大的兴趣,只是有时候要远程回家翻翻服务器上的东西,或者挂着下载个东西,跑个py
spark
之类的。
crossni
·
2024-02-20 00:15
硬件
无依赖单机尝鲜 Nebula Exchange 的 SST 导入
无依赖单机尝鲜NebulaExchange的SST导入本文尝试分享下以最小方式(单机、容器化
Spark
、Hadoop、NebulaGraph),快速趟一下NebulaExchange中SST写入方式的步骤
NebulaGraph
·
2024-02-19 23:51
唐艺宸个人简历
徒手整形师日式整骨师主要经历:心相易骨创始人上海中医药大学医学院针灸专业上海中医药大学医学院保健推拿专业全国职业技能形象设计大赛评定员全国科技人才培养工程高级徒手整形师全球脊诊学术研究学会理事长亚太整脊医学会认证日式小颜矫正
核心技术
持有人新加坡抗老美容学术研究会会员大阪井上中央
唐艺宸徒手整形培训
·
2024-02-19 23:53
Linux下
Spark
offline安装graphframes包
文章目录背景安装步骤背景GraphX是
Spark
中用于图计算的模块.
Spark
安装包中内置Scala语言的GraphX库,但是对于Python语言的安装包,需要额外进行安装.对于内网服务器,不能访问外网
ithiker
·
2024-02-19 22:45
spark
linux
spark
Flink 2.0 状态存算分离改造实践
本文整理自阿里云智能Flink存储引擎团队兰兆千在FFA2023
核心技术
(一)中的分享,内容关于Flink2.0状态存算分离改造实践的研究,主要分为以下四部分:Flink大状态管理痛点阿里云自研状态存储后端
·
2024-02-19 20:28
后端flink大数据
OpenAI视频生成模型Sora背后的技术及其深远的影响
其
核心技术
包括使用视觉块编码将不同格式的视频统一编码成Transformer可训练的嵌入向量,以及类似于扩散过程的UNet方法进行降维和升维的加噪与去噪操作。
知来者逆
·
2024-02-19 16:45
Sora
Sora
文字生成视频
视频生成
OpenAI
AWS Serverless Py
Spark
指定 Python 版本(qbit)
的最新版本是6.15,自带的Python版本是3.7,尝试上传使用Python3.11Python环境打包技术栈Ubuntu22.04(x86)Linuxversion5.15Python3.11.5py
spark
3.4.1conda23.10.0conda-pack0.7.1
·
2024-02-19 16:05
Docker
核心技术
Docker
核心技术
容器容器(Container):容器是一种轻量级、可移植、并将应用程序进行的打包的技术,使应用程序可以在几乎任何地方以相同的方式运行。
小森( ﹡ˆoˆ﹡ )
·
2024-02-19 16:09
Docker
docker
容器
运维
深入解析 Flink 细粒度资源管理
▼关注「ApacheFlink」,获取更多技术干货▼摘要:本文整理自阿里巴巴高级开发工程师郭旸泽(天凌)在FlinkForwardAsia2021
核心技术
专场的演讲。
Apache Flink
·
2024-02-19 14:15
大数据
python
java
编程语言
数据库
Quick introduction to Apache
Spark
什么是
Spark
Apache
Spark
是一种快速通用的集群计算系统。它提供Java,Scala,Python和R中的高级API,以及支持通用执行图的优化引擎。
Liam_ml
·
2024-02-19 13:29
Spark
中多分区写文件前可以不排序么
背景
Spark
3.5.0目前
Spark
中的实现中,对于多分区的写入默认会先排序,这是没必要的。
鸿乃江边鸟
·
2024-02-19 13:10
分布式
spark
大数据
spark
大数据
分布式
Flink 细粒度滑动窗口性能优化
大数据技术AIFlink/
Spark
/Hadoop/数仓,数据分析、面试,源码解读等干货学习资料118篇原创内容公众号1、概述1.1细粒度滑动的影响当使用细粒度的滑动窗口(窗口长度远远大于滑动步长)时,
hyunbar
·
2024-02-19 13:39
Flink
大数据
flink
java
数据库
【大数据面试题】006介绍一下Parquet存储格式的优势
同时一般查询使用时不会使用所有列,而是只用到几列,所以查询速度会更快压缩比例高因为是列式存储,所以可以对同一类型的一段做压缩,压缩比例高支持的平台和框架多在Hadoop,
Spark
,Presto,Python
Jiweilai1
·
2024-02-19 13:34
一天一道面试题
大数据
spark
hadoop
七天爆肝flink笔记
一.flink整体介绍及wordcount案例代码1.1整体介绍从上到下包含有界无界流支持状态特点与
spark
对比应用场景架构分层1.2示例代码了解了后就整个demo吧数据源准备这里直接用的文本文件gradle
我才是真的封不觉
·
2024-02-19 13:01
flink
笔记
大数据
CDN缓存有什么作用?
CDN缓存是内容分发网络的
核心技术
之一,它的作用在于通过将内容缓存在边缘服务器上,提高内容的访问速度和可用性。
恒创HengHost
·
2024-02-19 13:32
缓存
Java学习资源 | Java编程好书分享,必读!
Java资源合集(书籍版)入门进阶高级样样俱全书籍《JAVA
核心技术
卷1》有一些编程基础的同学推荐阅读,可以学习一段时间回头再看看《JAVA编程思想》Java圣经,值得仔细品读,作者的功力十分深厚,即使很多内容还无法理解
Java烂笔头
·
2024-02-19 13:43
单细胞转录组基础分析六:伪时间分析
Monocle进行伪时间分析的
核心技术
是一种机器学习算法——反向图形嵌入(ReversedGraphEmbedding)。
Seurat_Satija
·
2024-02-19 12:25
福利「Flink Forward Asia 2023 」PPT 阅读合集!
来自阿里云智能、蚂蚁金服、字节跳动、芒果TV、快手、美团、华为、美的、Shopee、米哈游、腾讯、同程旅行、汽车之家、网易等全球30+各行业一线厂商的嘉宾,围绕
核心技术
、行业实践、生产实践、平台建设、流式湖仓
·
2024-02-19 11:20
后端flink大数据实时计算
(15)Hive调优——数据倾斜的解决指南
目录前言一、什么是数据倾斜二、发生数据倾斜的表现2.1MapReduce任务2.2
Spark
任务三、如何定位发生数据倾斜的代码四、发生数据倾斜的原因3.1key分布不均匀3.1.1某些key存在大量相同值
爱吃辣条byte
·
2024-02-19 11:50
#
Hive
大数据
hive
智慧城市与数字孪生:实现城市可持续发展的关键
而数字孪生作为智慧城市的
核心技术
,为实现城市的可持续发展提供了有力支持。本文将深入探讨智慧城市与数字孪生如何共同推动城市的可持续发展。二、智慧城市:可持续发展的技术支撑智慧城市通过运用物联网、云计算、
方案365
·
2024-02-19 10:11
数字孪生
智慧城市
人工智能
智慧城市
人工智能
数字孪生
2021-08-24
论文的题目是概括你这一篇论文的核心内容以及
核心技术
的一个简称。一般不超过30个字,尽量不使用不常见的缩写词、符号、代号、字符和公式等,我们看到题目就比较简单明了知道这一篇论文的
二分之一_9206
·
2024-02-15 10:51
Hive on
Spark
配置
前提条件1、安装好Hive,参考:Hive安装部署-CSDN博客2、下载好
Spark
安装包,链接:https://pan.baidu.com/s/1plIBKPUAv79WJxBSbdPODw?
在下区区俗物
·
2024-02-15 10:51
hive
spark
hadoop
配置hive on
spark
配置hiveon
spark
1、上传
Spark
纯净版jar包到HDFS:hdfsdfs-mkdir/
spark
-jarshdfsdfs-put/opt/
spark
/jars/*/
spark
-jars2、修改
空白格2519
·
2024-02-15 10:51
数据采集
big
data
hive
spark
hadoop
hive on
spark
配置经验
常规配置配置完,开启hadoop,开启
spark
(如果在hdfs上上传了纯净版的
spark
则不需要开启),开启hive注:当前节点一定要是namenode的active节点,因为hadoop长时间不用namenode
小五冲冲冲
·
2024-02-15 10:21
Spark
hive
spark
hadoop
《整本书阅读的六项
核心技术
》读书笔记(一)
今天我阅读了《整本书阅读的六项
核心技术
》的第一章——
核心技术
一:构建阅读战略。一、整本书阅读:何以必要?邓彤老师说,大多数老师在教学中习惯于“垂直型”思维方式。
野草r
·
2024-02-15 09:17
Hbase - 自定义Rowkey规则
中我们有时候需要分析数据1点到2点的范围,可是经过Region又比较慢,这时候我们就可以定制TableInputFormat来实现我们的需求了,我们还可以采用Flink的DataSet的方式读取,另外下面还有
Spark
kikiki2
·
2024-02-15 06:39
首个云原生、分布式、全栈国产化银行核心业务系统投产上线丨TiDB × 杭州银行
新核心系统是业内首个实际投产的云原生、分布式、全栈国产化的银行核心系统,是金融科技领域突破关键
核心技术
应用的重大实践。
·
2024-02-15 03:57
tidb银行卡云原生分布式全栈
打入是中盘
核心技术
——铁船长评棋(四)
今天来讲一盘小选手的对局,黑棋是小选手棋谱1(1—28)错失大场的布局黑9应当夹攻,具体变化看链接小林流(二)高挂和二间高挂黑11的打入明显坏棋,现在是布局阶段,不要计较一城一地的得失,最重要的是局部先手定型,然后抢占大场。如变化图1先手—大场黑27拆边坏棋,明显应该28位挂角。现在白棋守角之后站到了最后一个大场,按照布局理论白棋胜利。现在复习一下船长的布局理论:1先手—大场。局部不吃亏就好,尽量
A铁船长围棋B
·
2024-02-15 02:55
HTML
HTML和CSS、JavaScript被称为前端开发中最重要的三个
核心技术
。HTML用于制作网站的结构,CSS用于网站的表现形式,JS用于网站的行为模式。
王帅康_2022公益强化班
·
2024-02-15 01:45
(免费领源码)python+mysql+
spark
手机销售数据的可视化分析系统44127-计算机毕业设计项目选题推荐
摘要信息化社会内需要与之针对性的信息获取途径,但是途径的扩展基本上为人们所努力的方向,由于站在的角度存在偏差,人们经常能够获得不同类型信息,这也是技术最为难以攻克的课题。针对手机销售数据管理等问题,对手机销售数据管理进行研究分析,然后开发设计出手机销售数据可视化系统以解决问题。手机销售数据可视化系统主要功能模块包括系统首页、轮播图、公告信息、资源管理(新闻资讯、新闻分类)交流管理(交流论坛、论坛分
2301_3224142804
·
2024-02-15 00:40
python
mysql
spark
java
spring
boot
php
c#
基于Kafka的实时计算引擎如何选择?
以Flink和
Spark
为首的实时计算引擎,成为实时计算场景的重点考虑对象。那么,今天就来聊一聊基于Kafka的实时计算引擎如何选择?Flinkor
Spark
?2.为何需要实时计算?
java菜
·
2024-02-14 19:37
调用讯飞火星AI大模型WebAPI
getWebsocketUrl(){returnnewPromise((resolve,reject)=>{varapiKey=API_KEYvarapiSecret=API_SECRETvarurl='ws://
spark
-api
雲墨知秋
·
2024-02-14 18:54
javascript
开发语言
ecmascript
Spark
通过jdbc性能调优--采用分区的方式从oracle读数据
spark
通过jdbc读取Oracle,当数据量很大的时候会出现两个问题:读取数据异常缓慢,甚至卡死大表中进行操作也会出现OOM的问题调优常规的读取数据库的方式如下ods_bdz=
spark
.read.format
korry24
·
2024-02-14 18:08
oracle
spark
mysql
GiantPandaCV | 一文弄懂 Diffusion Model
原文链接:一文弄懂DiffusionModel0前言最近AI绘图非常的火,其背后用到的
核心技术
之一就是DiffusionModel(扩散模型),虽然想要完全弄懂DiffusionModel和其中复杂的公式推导需要掌握比较多的前置数学知识
双木的木
·
2024-02-14 15:07
深度学习拓展阅读
深度学习
人工智能
python
计算机视觉
图像处理
stable
diffusion
Py
Spark
介绍及其安装教程
一、Py
Spark
是什么PythonPy
Spark
是
Spark
官方提供的一个Python类库,其中内置了完全的
Spark
API,使得Python用户在导入这个类库后,可以使用自己熟悉的Python语言来编写
文景大大
·
2024-02-14 14:58
Spark
(四十二)数据倾斜解决方案之使用随机数以及扩容表进行join
一、背景当采用随机数和扩容表进行join解决数据倾斜的时候,就代表着,你的之前的数据倾斜的解决方案,都没法使用。这个方案是没办法彻底解决数据倾斜的,更多的,是一种对数据倾斜的缓解。原理,其实在上一讲,已经带出来了。扩容表(RDD)步骤:1、选择一个RDD,要用flatMap,进行扩容,将每条数据,映射为多条数据,每个映射出来的数据,都带了一个n以内的随机数,通常来说,会选择10。2、将另外一个RD
文子轩
·
2024-02-14 14:36
Spark
编程实验六:
Spark
机器学习库MLlib编程
目录一、目的与要求二、实验内容三、实验步骤1、数据导入2、进行主成分分析(PCA)3、训练分类模型并预测居民收入4、超参数调优四、结果分析与实验体会一、目的与要求1、通过实验掌握基本的MLLib编程方法;2、掌握用MLLib解决一些常见的数据分析问题,包括数据导入、成分分析和分类和预测等。二、实验内容1.数据导入从文件中导入数据,并转化为DataFrame。2、进行主成分分析(PCA)对6个连续型
Francek Chen
·
2024-02-14 14:48
Spark编程基础
spark
mllib
大数据
机器学习
算法
海量数据处理商用短链接生成器平台 - 4
第六章架构
核心技术
-池化思想-异步结合性能优化最佳实践第1集RestTemplate里面的存在的问题你知道多少-Brokenpipe错误项目就更新到第六章了,剩下的内容放百度网盘里面了,需要的来取。
从零开始学习人工智能
·
2024-02-14 13:14
java
spring
boot
Spring--视图内容协商(二)
本文是学习了小马哥在慕课网的课程的《SpringBoot2.0深度实践之
核心技术
篇》的内容结合自己的需要和理解做的笔记。
NealLemon
·
2024-02-14 13:28
ShuffleManager 原理
在
Spark
的源码中,负责shuffle过程的执行、计算、处理的组件主要是ShuffleManager。在
Spark
1.2以前,默认的shuffle计算引擎是HashShuffleManager。
stone_zhu
·
2024-02-14 10:03
网络安全产品之认识蜜罐
文章目录一、什么是蜜罐二、蜜罐的主要类型三、蜜罐的主要功能四、蜜罐的主要组成及
核心技术
五、蜜罐的优缺点六、蜜罐如何与其他安全工具协同工作?七、什么是“蜜网”?与蜜罐的联系和区别是什么?
xiejava1018
·
2024-02-14 10:37
网络信息安全
web安全
安全
网络安全
Python解析头条视频真实播放地址并自动下载
Python是未来的发展方向,正在挑战我们的分析能力及对世界的认知方式,因此,我们与时俱进,迎接变化,并不断的成长,掌握Python
核心技术
,才是掌握真正的价值所在。显然这样的地址是无法直接下
嗨学编程
·
2024-02-14 09:28
Hadoop+
Spark
+MongoDB+MySQL+C#大数据开发项目最佳实践
一、前言随着IT技术的飞速发展,各行各业都已在广泛尝试使用大数据技术提供更稳健和优质的服务。目前,医疗IT系统收集了大量极具价值的数据,但这些历史医疗数据并没有发挥出其应有的价值。为此,本文拟利用医院现有的历史数据,挖掘出有价值的基于统计学的医学规则、知识,并基于这些信息构建专业的临床知识库,提供诊断、处方、用药推荐功能,基于强大的关联推荐能力,极大地提高医疗服务质量,减轻医疗人员的工作强度。二、
yiyidsj
·
2024-02-14 07:08
大数据
人工智能
互联网
spark
Hadoop
MySQL
大数据开发
大数据学习
基于 C# 的 ETL 大数据并行编程
Apache
Spark
是一个用于Extract(提取),
dotNET跨平台
·
2024-02-14 07:07
c#
数据库
编程语言
java
大数据
上一页
1
2
3
4
5
6
7
8
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他