E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
Spark源码解析
Quick introduction to Apache
Spark
什么是
Spark
Apache
Spark
是一种快速通用的集群计算系统。它提供Java,Scala,Python和R中的高级API,以及支持通用执行图的优化引擎。
Liam_ml
·
2024-02-19 13:29
Spark
中多分区写文件前可以不排序么
背景
Spark
3.5.0目前
Spark
中的实现中,对于多分区的写入默认会先排序,这是没必要的。
鸿乃江边鸟
·
2024-02-19 13:10
分布式
spark
大数据
spark
大数据
分布式
Flink 细粒度滑动窗口性能优化
大数据技术AIFlink/
Spark
/Hadoop/数仓,数据分析、面试,源码解读等干货学习资料118篇原创内容公众号1、概述1.1细粒度滑动的影响当使用细粒度的滑动窗口(窗口长度远远大于滑动步长)时,
hyunbar
·
2024-02-19 13:39
Flink
大数据
flink
java
数据库
【大数据面试题】006介绍一下Parquet存储格式的优势
同时一般查询使用时不会使用所有列,而是只用到几列,所以查询速度会更快压缩比例高因为是列式存储,所以可以对同一类型的一段做压缩,压缩比例高支持的平台和框架多在Hadoop,
Spark
,Presto,Python
Jiweilai1
·
2024-02-19 13:34
一天一道面试题
大数据
spark
hadoop
七天爆肝flink笔记
一.flink整体介绍及wordcount案例代码1.1整体介绍从上到下包含有界无界流支持状态特点与
spark
对比应用场景架构分层1.2示例代码了解了后就整个demo吧数据源准备这里直接用的文本文件gradle
我才是真的封不觉
·
2024-02-19 13:01
flink
笔记
大数据
(15)Hive调优——数据倾斜的解决指南
目录前言一、什么是数据倾斜二、发生数据倾斜的表现2.1MapReduce任务2.2
Spark
任务三、如何定位发生数据倾斜的代码四、发生数据倾斜的原因3.1key分布不均匀3.1.1某些key存在大量相同值
爱吃辣条byte
·
2024-02-19 11:50
#
Hive
大数据
hive
Java集合篇之深入解析LinkedList
源码解析
看过build哥文章的同学应该都知道,俺喜欢通过源码去学习和
液态不合群
·
2024-02-19 10:54
java
开发语言
Hive on
Spark
配置
前提条件1、安装好Hive,参考:Hive安装部署-CSDN博客2、下载好
Spark
安装包,链接:https://pan.baidu.com/s/1plIBKPUAv79WJxBSbdPODw?
在下区区俗物
·
2024-02-15 10:51
hive
spark
hadoop
配置hive on
spark
配置hiveon
spark
1、上传
Spark
纯净版jar包到HDFS:hdfsdfs-mkdir/
spark
-jarshdfsdfs-put/opt/
spark
/jars/*/
spark
-jars2、修改
空白格2519
·
2024-02-15 10:51
数据采集
big
data
hive
spark
hadoop
hive on
spark
配置经验
常规配置配置完,开启hadoop,开启
spark
(如果在hdfs上上传了纯净版的
spark
则不需要开启),开启hive注:当前节点一定要是namenode的active节点,因为hadoop长时间不用namenode
小五冲冲冲
·
2024-02-15 10:21
Spark
hive
spark
hadoop
Glide
源码解析
之 关键类简介
Glide关键类介绍Glide单例,负责全局配置/***Asingletontopresentasimplestaticinterfaceforbuildingrequestswith*{@linkRequestBuilder}andmaintainingan{@linkEngine},{@linkBitmapPool},*{@linkcom.bumptech.glide.load.engine.
詹徐照
·
2024-02-15 09:29
Hbase - 自定义Rowkey规则
中我们有时候需要分析数据1点到2点的范围,可是经过Region又比较慢,这时候我们就可以定制TableInputFormat来实现我们的需求了,我们还可以采用Flink的DataSet的方式读取,另外下面还有
Spark
kikiki2
·
2024-02-15 06:39
(免费领源码)python+mysql+
spark
手机销售数据的可视化分析系统44127-计算机毕业设计项目选题推荐
摘要信息化社会内需要与之针对性的信息获取途径,但是途径的扩展基本上为人们所努力的方向,由于站在的角度存在偏差,人们经常能够获得不同类型信息,这也是技术最为难以攻克的课题。针对手机销售数据管理等问题,对手机销售数据管理进行研究分析,然后开发设计出手机销售数据可视化系统以解决问题。手机销售数据可视化系统主要功能模块包括系统首页、轮播图、公告信息、资源管理(新闻资讯、新闻分类)交流管理(交流论坛、论坛分
2301_3224142804
·
2024-02-15 00:40
python
mysql
spark
java
spring
boot
php
c#
类加载机制(2)类加载器
源码解析
目录一、类加载器1、BootstrapClassLoader启动类加载器2、ExtensionClassLoader扩展类加载器3、ApplicationClassLoader应用类加载器4、CustomClassLoader自定义类加载器5、线程上下文类加载器二、java虚拟机入口应用:sun.misc.Launcher1、sun.misc.Launcher主入口2、内部类ExtClassLoa
飞奔的口罩
·
2024-02-14 22:22
基于Kafka的实时计算引擎如何选择?
以Flink和
Spark
为首的实时计算引擎,成为实时计算场景的重点考虑对象。那么,今天就来聊一聊基于Kafka的实时计算引擎如何选择?Flinkor
Spark
?2.为何需要实时计算?
java菜
·
2024-02-14 19:37
调用讯飞火星AI大模型WebAPI
getWebsocketUrl(){returnnewPromise((resolve,reject)=>{varapiKey=API_KEYvarapiSecret=API_SECRETvarurl='ws://
spark
-api
雲墨知秋
·
2024-02-14 18:54
javascript
开发语言
ecmascript
Spark
通过jdbc性能调优--采用分区的方式从oracle读数据
spark
通过jdbc读取Oracle,当数据量很大的时候会出现两个问题:读取数据异常缓慢,甚至卡死大表中进行操作也会出现OOM的问题调优常规的读取数据库的方式如下ods_bdz=
spark
.read.format
korry24
·
2024-02-14 18:08
oracle
spark
mysql
小游戏和GUI编程(7) | SimpleNN 界面
源码解析
小游戏和GUI编程(7)|SimpleNN界面
源码解析
0.简介SimpleNN是AdamYuan在高中一年级时用1天时间写出来的简易CNN,使用SFML做UI,用于交互式输入手写数字,这个数字被训练好的
baiyu33
·
2024-02-14 15:48
SFML
GUI
CNN
MNIST
LeNet
手写数字识别
Py
Spark
介绍及其安装教程
一、Py
Spark
是什么PythonPy
Spark
是
Spark
官方提供的一个Python类库,其中内置了完全的
Spark
API,使得Python用户在导入这个类库后,可以使用自己熟悉的Python语言来编写
文景大大
·
2024-02-14 14:58
Spark
(四十二)数据倾斜解决方案之使用随机数以及扩容表进行join
一、背景当采用随机数和扩容表进行join解决数据倾斜的时候,就代表着,你的之前的数据倾斜的解决方案,都没法使用。这个方案是没办法彻底解决数据倾斜的,更多的,是一种对数据倾斜的缓解。原理,其实在上一讲,已经带出来了。扩容表(RDD)步骤:1、选择一个RDD,要用flatMap,进行扩容,将每条数据,映射为多条数据,每个映射出来的数据,都带了一个n以内的随机数,通常来说,会选择10。2、将另外一个RD
文子轩
·
2024-02-14 14:36
Spark
编程实验六:
Spark
机器学习库MLlib编程
目录一、目的与要求二、实验内容三、实验步骤1、数据导入2、进行主成分分析(PCA)3、训练分类模型并预测居民收入4、超参数调优四、结果分析与实验体会一、目的与要求1、通过实验掌握基本的MLLib编程方法;2、掌握用MLLib解决一些常见的数据分析问题,包括数据导入、成分分析和分类和预测等。二、实验内容1.数据导入从文件中导入数据,并转化为DataFrame。2、进行主成分分析(PCA)对6个连续型
Francek Chen
·
2024-02-14 14:48
Spark编程基础
spark
mllib
大数据
机器学习
算法
ShuffleManager 原理
在
Spark
的源码中,负责shuffle过程的执行、计算、处理的组件主要是ShuffleManager。在
Spark
1.2以前,默认的shuffle计算引擎是HashShuffleManager。
stone_zhu
·
2024-02-14 10:03
Spring AOP
源码解析
(二)
前言 上一篇中我们扒拉了一下spring-aop的底裤,详细解读了spring-aop中的各种抽象概念,本篇开始我们一起研究研究spring-aop的织入过程(基于5.2.6.RELEASE)。建议各位同学本地打开一份源码对照食用,效果更佳。 前方高能!!!本篇重度依赖于上一篇解读的抽象概念,不熟悉的同学请速速撤离,以免误伤。 正式开始之前,各位同学还请思考一下,在拥有了关于AOP的全局视角
anyoptional
·
2024-02-14 07:24
Hadoop+
Spark
+MongoDB+MySQL+C#大数据开发项目最佳实践
一、前言随着IT技术的飞速发展,各行各业都已在广泛尝试使用大数据技术提供更稳健和优质的服务。目前,医疗IT系统收集了大量极具价值的数据,但这些历史医疗数据并没有发挥出其应有的价值。为此,本文拟利用医院现有的历史数据,挖掘出有价值的基于统计学的医学规则、知识,并基于这些信息构建专业的临床知识库,提供诊断、处方、用药推荐功能,基于强大的关联推荐能力,极大地提高医疗服务质量,减轻医疗人员的工作强度。二、
yiyidsj
·
2024-02-14 07:08
大数据
人工智能
互联网
spark
Hadoop
MySQL
大数据开发
大数据学习
基于 C# 的 ETL 大数据并行编程
Apache
Spark
是一个用于Extract(提取),
dotNET跨平台
·
2024-02-14 07:07
c#
数据库
编程语言
java
大数据
Spark
- 动态注册UDF
昨天有位大哥问小弟一个
Spark
问题,他们想在不停
Spark
程序的情况下动态更新UDF的逻辑,他一问我这个问题的时候,本猪心里一惊,
Spark
**还能这么玩?
kikiki2
·
2024-02-14 06:33
Netty Review - ServerBootstrap
源码解析
文章目录概述源码分析小结概述ServerBootstrapbootstrap=newServerBootstrap();bootstrap.group(bossGroup,workerGroup).channel(NioServerSocketChannel.class).option(ChannelOption.SO_BACKLOG,1024).childHandler(newChannelIn
小小工匠
·
2024-02-14 04:39
【Netty】
ServerBootstrap
Netty
我给 Netty 提交了一个 bug
本系列Netty
源码解析
文章基于4.1.56.Final版本写在前面.....本文是笔者肉眼盯Bug系列的第三弹,前两弹分别是:抓到Netty一个Bug,顺带来透彻地聊一下Netty是如何高效接收网络连接的
公众号:码海
·
2024-02-14 02:41
内核
unix
epoll
hashtable
uefi
11.我为 Netty 贡献源码 | 且看 Netty 如何应对 TCP 连接的正常关闭,异常关闭,半关闭场景
我为Netty贡献源码|且看Netty如何应对TCP连接的正常关闭,异常关闭,半关闭场景本系列Netty
源码解析
文章基于4.1.56.Final版本写在前面.....本文是笔者肉眼盯Bug系列的第三弹,
磊哥 低调
·
2024-02-14 02:40
java
JDK源码阅读 0826 - 抽象集合
我们经常在代码中使用到List、Set、Map,也粗略看过一些实现类的
源码解析
。现在去看下抽象类集合中的方法与具体实现类有哪些不同。
学习吧朱小宁
·
2024-02-14 01:28
spring
源码解析
流程,一步一步在源码加注释带你了解bean的加载过程
spring前述:spring源码环境搭建以及源码下载在文章后方有链接,可自行参考搭建,这里只是对加载过程做一个解析,spring全家桶远不止这些东东,感兴趣的小伙伴可以去官网看一下,本文将以源码加注释的方式进行过程解析,带你了解spring中bean到底是如何一步步加载完成了解重点:bean的生命周期、加载过程最终目的:学习spring源码短期内不对对你的技术有太大提升,可能只是了解到漂亮的代码
笨蛋CXJ
·
2024-02-13 20:46
spring
spring
java
Spark
Authorizer支持最新版本
Spark
2.3.0
今天
Spark
社区为大家带来了最新的
Spark
2.3.0
Spark
Release2.3.0Apache
Spark
2.3.0isthefourthreleaseinthe2.xline.ThisreleaseaddssupportforContinuousProcessinginStructuredStreamingalongwithabrandnewKubernetesSchedulerbacke
Kent_Yao
·
2024-02-13 20:52
京东平台研发:领域驱动设计(DDD)实践总结
每天8:55更新文章,每天掉亿点点头发...源码精品专栏原创|Java2020超神之路,很肝~中文详细注释的开源项目RPC框架Dubbo
源码解析
网络应用框架Netty
源码解析
消息中间件RocketMQ
源码解析
数据库中间件
公众号-芋道源码
·
2024-02-13 18:26
tdd
控制器
360
dbcp
分布式
ReentrantLock
源码解析
1-公平锁和非公平锁
1简言ReentrantLock:重入锁,是指一个线程获取锁之后再尝试获取锁时会自动获取锁。ReentrantLock实现了Lock接口,Lock接口定义的方法://获取锁voidlock();//获取锁(可中断)voidlockInterruptibly()throwsInterruptedException;//尝试获取锁,如果没获取到锁,就返回falsebooleantryLock();//
LZhan
·
2024-02-13 18:32
大数据处理为何选择
Spark
,而不是Hadoop
一.基础知识1.
Spark
Spark
是一个用来实现快速而通用的集群计算的平台。在速度方面,
Spark
扩展了广泛使用的MapReduce计算模型,而且高效地支持更多计算模式,包括交互式查询和流处理。
嘿嘿海海
·
2024-02-13 14:00
LayoutInflater
源码解析
及常见相关报错分析
在日常Android开发中,最经常使用的RecyclerView控件是大家都绕不开的,而编写其Adapter时更离不开LayoutInflater的调用。当然,如果你做这一行有些时日了,相信你对其使用一定是炉火纯青了。即使如此,我觉得LayoutInflater仍旧有值得分析的地方,相信你看完之后有更多的认识。Android系统中有许多包括ActivityManagerService在内的系统级服
左大星
·
2024-02-13 13:48
Android进阶
android
androidx
Contractfuzzer 复现(2)
本文实现Contractfuzzer
源码解析
,在本地复现运行Contractfuzzer一、前期准备下载Contractfuzzer的源代码二、代码修改和部署Contractfuzzer的源代码分为三个部分
区区小块
·
2024-02-13 11:45
区块链
测试工具
Netty Review - NioEventLoopGroup
源码解析
文章目录概述类继承关系源码分析小结概述EventLoopGroupbossGroup=newNioEventLoopGroup(1);EventLoopGroupworkerGroup=newNioEventLoopGroup();这段代码是在使用Netty框架时常见的用法,用于创建两个不同的EventLoopGroup实例,一个用于处理连接请求(通常称为bossGroup),另一个用于处理连接后
小小工匠
·
2024-02-13 07:03
【Netty】
nioeventloop
eventloopgroup
Spark
编程实验五:
Spark
Structured Streaming编程
目录一、目的与要求二、实验内容三、实验步骤1、Syslog介绍2、通过Socket传送Syslog到
Spark
3、Syslog日志拆分为DateFrame4、对Syslog进行查询四、结果分析与实验体会一
Francek Chen
·
2024-02-13 05:49
Spark编程基础
spark
大数据
分布式
syslog
Spark
(三十五)troubleshooting之错误的持久化方式以及checkpoint的使用
一、背景错误的持久化使用方式:usersRDD,想要对这个RDD做一个cache,希望能够在后面多次使用这个RDD的时候,不用反复重新计算RDD;可以直接使用通过各个节点上的executor的BlockManager管理的内存/磁盘上的数据,避免重新反复计算RDD。usersRDD.cache()usersRDD.count()usersRDD.take()上面这种方式,不要说会不会生效了,实际上
文子轩
·
2024-02-13 02:26
Java从入门到精通
掌握Java语言本身、Java核心开发技术以及Java标准库的使用;2、如果继续学习JavaEE,那么Spring框架、数据库开发、分布式架构就是需要学习的;3、如果要学习大数据开发,那么Hadoop、
Spark
nightluo
·
2024-02-13 01:52
基础学习
java
开发语言
计算机哈希表相关知识
基础知识Java的HashMap
源码解析
(中高级Java工程师面试必备)Java8HashMap函数tableSizeFor详解JavaHashMap表的大小为什么必须是2的幂次Java8HashMap
雁阵惊寒_zhn
·
2024-02-12 23:15
babe从入门到精通
前言前面我们写了几篇很长的文章去介绍babel源码、preset-env、runtime,babel
源码解析
一babel
源码解析
之(@babel/preset-env)babel
源码解析
之(@babel
vv_小虫虫
·
2024-02-12 23:26
数据清洗
importorg.apache.
spark
.sql.
Spark
SessionobjectDataCleaning{defmain(args:Array[String]):Unit={val
spark
=
扣篮的左手
·
2024-02-12 23:46
【解决方案】py
spark
初次连接mongo 时报错Class not found exception:com.mongodb.
spark
.sql.DefaultSource
部分报错如下:Traceback(mostrecentcalllast): File"/home/cisco/
spark
-mongo-test.py",line7,in df=
spark
.read.format
能白话的程序员♫
·
2024-02-12 19:33
Spark
spark
Spark
- 动态注册UDF
>昨天有位大哥问小弟一个
Spark
问题,他们想在不停
Spark
程序的情况下动态更新UDF的逻辑,他一问我这个问题的时候,本猪心里一惊,
Spark
**还能这么玩?
kikiki5
·
2024-02-12 19:01
性价比满满的大显存甜点卡,
Spark
le(撼与科技)Intel Arc A770 TIT
●前言一直以来,2000元左右价位的独立显卡总是被玩家们称为“甜点级”显卡,因为这个价位段的显卡有着不俗的性能,游戏和生产力都能兼顾,而且不算太贵的定价也是能够让大众所接受,整体算下来还是很有性价比的。然而,在众多的甜点级显卡当中,除了N、A两家的甜点级显卡之外,前些年入局独显的英特尔也是有对应的产品可选,比如A770以及A750就有着优于同价位竞品的性能以及更低的售价,性价比尤为突出。作为英特尔
焦点易讯
·
2024-02-12 18:08
业界资讯
28、
Spark
核心编程之高级编程之二次排序
需求按照文件中的第一列排序。如果第一列相同,则按照第二列排序。文件内容2536241315Java实现自定义的二次排序key/***自定义的二次排序key*/publicclassSecondarySortKeyimplementsOrdered,Serializable{//首先在自定义key里面,定义需要进行排序的列privateintfirst;privateintsecond;public
ZFH__ZJ
·
2024-02-12 17:33
大数据视频教程百度网盘下载
同时,人们又试图用深度学习这样新的思路去解决过去MapReduce和
Spark
已经解决的问题,这也意味着大数据技术开始进入3.0时代。在这个全新阶段,可以看到整个市场上已经可以提
QFdongdong
·
2024-02-12 16:42
Hbase - 自定义Rowkey规则
中我们有时候需要分析数据1点到2点的范围,可是经过Region又比较慢,这时候我们就可以定制TableInputFormat来实现我们的需求了,我们还可以采用Flink的DataSet的方式读取,另外下面还有
Spark
大猪大猪
·
2024-02-12 15:45
上一页
2
3
4
5
6
7
8
9
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他