E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
Spark大数据平台源码分析
新人数据技术如何快速提升
对于数据平台和工具而言,一般情况下都是在Hadoop生态下做开发,但对于一些有特殊要求的团队,
Spark
和Flink已经得
晓阳的数据小站
·
2024-02-09 23:46
数据开发
数据
毕业设计:基于python的反爬虫系统
目录前言设计思路一、课题背景与意义二、算法理论技术2.1
spark
技术2.2反爬虫设计2.3黑名单设计三、检测的实现3.1数据集3.2实验环境最后前言大四是整个大学期间最忙碌的时光,一边要忙着备考或实习为毕业后面临的就业升学做准备
Krin_IT
·
2024-02-09 22:54
毕业设计
毕设
python
网络爬虫
ClickHouse-简谈OLAP与ClickHouse
在第一届易观OLAP大赛中,在用户行为分析转化漏斗场景里,ClickHouse比
Spark
快了近10倍。在随后几年的
adson1987
·
2024-02-09 18:00
Database
ClickHouse
OLAP
海量数据分析
数据中台 pdf_数据中台到底怎么建设,有人把他说清楚了
本人断断续续从事数据仓库约有五六年经验,在移动公司前三年是负责数据仓库项目实施,后四年开发搞
大数据平台
,见证了从传统数据仓库转型到
大数据平台
的全历程,见证了
大数据平台
从0到1的全部过程,包括第一个MPP
weixin_39699121
·
2024-02-09 18:59
数据中台
pdf
某企业多Scrum团队解决方案题文章
●背景●业务快速发展,开发下一代云原生
大数据平台
●产研测-多Scrum团队多sprint并行开发●公司需要,建立PMO体系,结合实际建立流程体系●问题描述●关键字:跨团队、多scrum、沟通、大版本、技术能力
叶建波_8de4
·
2024-02-09 16:57
spring启动
源码分析
一、示例代码整体代码工程目录如下image.png首先我们新建一个类ManpublicclassMan{publicvoidsay(Stringcontent){System.out.println("say:"+content);}}然后我们新建一个main方法类,通过new一个ClassPathXmlApplicationContext,来加载ManpublicclassApp{publics
摆渡时光
·
2024-02-09 16:43
【数据库篇】MySQL
源码分析
之row_search_mvcc详细分析(Page加载及索引分析)
从上一篇文章了解到Innodb的查询最终都是通过row_search_mvcc执行的,接下来就来略详细的分析下row_search_mvcc的执行流程。本文主要分析查询逻辑忽略了部分细节,比如行锁表锁等处理,数据库事务的快照查询等。由于本人是Java开发并不擅长C++,只是看代码并没有进行调试,分析细节不对的地方还请指正哈~一、先理清楚row_search_mvcc的主要流程1.1、基本参数定义d
苒翼
·
2024-02-09 14:59
数据库
mysql
数据库
sql
MVCC原理探究及MySQL源码实现分析
董红禹目录预览数据库多版本读场景MVCC实现原理1、通过DB_ROLL_PT回溯查找数据历史版本2、通过readview判断行记录是否可见MVCC解决了什么问题MySQL代码分析1、InnoDB隐藏字段
源码分析
老叶茶馆_
·
2024-02-09 14:28
初识kafka
目前越来越多的开源分布式处理系统如Cloudera、Storm、
Spark
、Flink等都支持与Kafka集成。
tracy_668
·
2024-02-09 14:07
69.Kudu、
Spark
2、Kafka安装—CDH
69.1演示环境介绍CDH集群运行正常操作系统版本为:CentOS6.5CM和CDH版本为:5.12.1CM管理员为:admin用户操作系统用户为:root用户69.2操作演示Kudu安装Kudu的Parcel部署下载Kudu的Parcel包:http://archive.cloudera.com/kudu/parcels/5.12.1/KUDU-1.4.0-1.cdh5.12.1.p0.10-e
大勇任卷舒
·
2024-02-09 14:55
spark
开发中的Zip算子灵活使用
本人开发中,需要聚合的文段举个栗子:RDD中有如下元素kv((a,b),List(7,8,9))((a,b),List(1,2,3))((a,b),List(4,5,6))((c,d),List(4,5,6))。。。。。。reducebyke后要对v操作原理将v中的list前后zip再map每个元素进行逐个元组元素(口,口)的累加。a代表v的前一个元素,b代表v的后一个元素如vala=List(7
Hero.Lin
·
2024-02-09 13:35
spark
scala
开发
spark-core
OpenSceneGraph
源码分析
:osg模块
osg库是OpenSceneGraph最为重要的一个模块,提供了内存管理、场景管理、图形绘制、状态管理等功能。Ref.fromOpenSceneGraphQuickStartGuide======================================TheosglibraryistheheartofOpenSceneGraph.Itdefinesthecorenodesthatmakeu
JiNan.YouQuan.Soft
·
2024-02-09 10:43
OSG
其他
Spark
是什么?与MapReduce的对比
Spark
是一个基于内存的集群计算系统,是一个分布式的计算框架。
Spark
可以将计算任务分发到多个机器并行计算。
Tim在路上
·
2024-02-09 10:27
spark
资源动态释放
通过
spark
-submit会固定占用一占的资源,有什么办法,在任务不运作的时候将资源释放,让其它任务使用呢,yarn新版本默认已经支持了,我们使用的是HDP。
kikiki2
·
2024-02-09 09:54
macos安装local模式
spark
文章目录配置说明安装hadoop安装
Spark
测试安装成功配置说明Scala-3.18+
Spark
-3.5.0Hadoop-3.3.6安装hadoop从这里下载相应版本的hadoop下载后解压,配置系统环境变量
SparklingTheo
·
2024-02-09 08:52
大数据-linux
macos
spark
大数据
详细分析python中的from waitress import serve(附Demo)
目录前言1.基本知识2.serve
源码分析
3.基本操作前言以前玩python开发的时候写过一些见解,推荐阅读:uwsgi启动django以及uwsgi.ini的配置参数详解Django框架零基础入门部署服务器除了
码农研究僧
·
2024-02-09 08:41
python
python
serve
flask
Telegram-iOS
源码分析
:第一部分
版权声明本文内容均为搬运,目的只为更方便的学习Telegram编码思维。如需查阅原作者文章,附赠原文章机票part-1-cover.pngTelegram是市面上最受欢迎的即时通讯之一。截至今年4月,其MAU(月活跃用户人数)已超过4亿。考虑到某些国家/地区不提供该服务,这显然是一个了不起的成就。大多数Telegram客户端应用程序源码都是开源的,足以证明其安全性。Telegram官方还启用了一个
灰原丶逗
·
2024-02-09 08:37
SQL条件判断语句嵌套window子句的应用【易错点】--HiveSql面试题25
目录0需求分析1数据准备3数据分析4小结0需求分析需求:表如下user_idgood_namegoods_typerk1hadoop1011hive1221sqoop2631hbase1041
spark
1351flink2661kafka1471oozie108
莫叫石榴姐
·
2024-02-09 06:00
SQLBOY1000题
sql
HiveSql面试题
sql
HiveSQL——条件判断语句嵌套windows子句的应用
0需求分析需求:表如下user_idgood_namegoods_typerk1hadoop1011hive1221sqoop2631hbase1041
spark
1351flink2661kafka1471oozie108
爱吃辣条byte
·
2024-02-09 06:58
#
HIve
SQL
大数据
数据仓库
Spark
SQL(十一):与
Spark
Core整合
每日top3热点搜索词统计Demo1、数据格式:日期用户搜索词城市平台版本2、需求:1、筛选出符合查询条件(城市、平台、版本)的数据2、统计出每天搜索uv排名前3的搜索词3、按照每天的top3搜索词的uv搜索总次数,倒序排序4、将数据保存到hive表中3、实现思路:1、针对原始数据(HDFS文件),获取输入的RDD2、使用filter算子,去针对输入RDD中的数据,进行数据过滤,过滤出符合查询条件
雪飘千里
·
2024-02-09 06:34
大数据 -
Spark
系列《五》-
Spark
常用算子
Spark
系列文章:大数据-
Spark
系列《一》-从Hadoop到
Spark
:大数据计算引擎的演进-CSDN博客大数据-
Spark
系列《二》-关于
Spark
在Idea中的一些常用配置-CSDN博客大数据
王哪跑nn
·
2024-02-09 05:25
spark
大数据
spark
分布式
SQL、Hive中的SQL和
Spark
中的SQL三者联系与区别
SQL、Hive中的SQL和
Spark
中的SQL(即
Spark
SQL)都是用于处理和分析数据的查询语言,但它们在实现、性能、应用场景等方面存在一些明显的区别和联系。
大数据SQLboy
·
2024-02-09 05:20
数据库
Spark
Hive
数据库
py
spark
操作示例
前置pipinstallpy
spark
为了支持py4j的使用,需要进行如下设置,并修改了java_gateway.py中的env['_PY
SPARK
_DRIVER_CALLBACK_HOST']='127.0.0.1
佛系小懒
·
2024-02-09 05:15
spark
从入门到放弃二十八:
Spark
Sql (1)Data Set
文章地址:http://www.haha174.top/article/details/257834项目源码:https://github.com/haha174/
spark
.git1.简介
Spark
Sql
意浅离殇
·
2024-02-09 03:17
再聊阴影裁剪与高性能视锥剔除
【U
Spark
le专栏】如果你深怀绝技,爱“搞点研究”,乐于分享也博采众长,我们期待你的加入,让智慧的火花碰撞交织,让知识的传递生生不息!
UWA
·
2024-02-09 03:24
厚积薄发
Unity优化
阴影
unity
spark
原理总体介绍
拿到系统后,部署系统是第一件事,那么系统部署成功以后,各个节点都启动了哪些服务?部署图image.png从部署图中可以看到整个集群分为Master节点和Worker节点,相当于Hadoop的Master和Slave节点。Master节点上常驻Master守护进程,负责管理全部的Worker节点。Worker节点上常驻Worker守护进程,负责与Master节点通信并管理executors。Driv
tracy_668
·
2024-02-09 03:48
Spring Developer Tools
源码分析
:二、类路径监控
在SpringDeveloperTools
源码分析
一中介绍了devtools提供的文件监控实现,在第二部分中,我们将会使用第一部分提供的目录监控功能,实现对开发环境中classpath的监控。
Java架构_师
·
2024-02-09 03:02
消息中间件之RocketMQ
源码分析
(八)
RocketMQ中的消息过滤RocketMQ设计了消息过滤,来解决大量无意义流量的传输:即对于客户端不需要的消息,Broker就不会传输给客户端,以免浪费宽带,RocketMQ4.2.0支持Tag过滤、SQL92过滤、FilterServer过滤Tag过滤第一步:用户发送一个带Tag的消息第二步:用户订阅一个Topic的Tag,RocketMQBroker会保存订阅关系第三步:在Broker端做T
coffee_babe
·
2024-02-09 02:36
消息中间件
rocketmq
java
PDF如何页面插入
操作软件:旋风PDF编辑器下载地址:http://www.679
spark
le.com/pdfeditor1.运行旋风PDF编辑器,打开你想要编辑的文件。
六号_db7a
·
2024-02-09 00:18
DataX
源码分析
TaskGroupContainer
系列文章目录一、DataX详解和架构介绍二、DataX
源码分析
JobContainer三、DataX
源码分析
TaskGroupContainer四、DataX
源码分析
TaskExecutor五、DataX
shandongwill
·
2024-02-08 23:25
大数据
DataX
ETL
大数据
Flink状态编程
Spark
Streaming在状态管理这块做的不好,很多时候需要借助于外部存储(例如Redis)来手动管理状态,增加了编程的难度.访问redis需要通过网络访问,增大处理时间状态一致性问题,可能会造成数据的不一致
万事万物
·
2024-02-08 22:41
比特币
源码分析
系列3---区块block数据结构
bitcoin版本:0.16.2区块结构分析区块是组成区块链的基本单位,可以通过bitcoin-cli命令查看一个区块的基本信息区块block的数据结构如下图(存储方式为小端):block数据结构整体结构数据项大小(Byte)描述BlockSize4区块大小BlockHeader80区块头信息大小Transactionsm*n(n>=250)所有交易的列表TransactionsCounter1-
JC86
·
2024-02-08 20:54
从
源码分析
Hystrix工作机制
一、Hystrix解决了什么问题?在复杂的分布式应用中有着许多的依赖,各个依赖都有难免在某个时刻失败,如果应用不隔离各个依赖,降低外部的风险,那容易拖垮整个应用。举个电商场景中常见的例子,比如订单服务调用了库存服务、商品服务、积分服务、支付服务,系统均正常情况下,订单模块正常运行。image但是当积分服务发生异常时且会阻塞30s时,订单服务就有有部分请求失败,且工作线程阻塞在调用积分服务上。ima
vivo互联网技术
·
2024-02-08 19:07
7.0 MapReduce编程实例教程
MapReduce主要是依靠开发者通过
Spark
来实现功能的,开发者可以通过实现Map和Reduce相关的方法来进行数据处理。为了简单的展示这个过程,我们将手工编写一个字数统计程序。
二当家的素材网
·
2024-02-08 18:11
Hadoop
教程
mapreduce
eclipse
大数据
(十七)springboot实战——spring securtity的授权流程源码解析
前言本节内容是关于springsecurity安全框架授权流程的
源码分析
,springsecurity的授权流程主要是在FilterSecurityInterceptor过滤器中实现的。
厉害哥哥吖
·
2024-02-08 17:19
#
springboot
spring
boot
(十六)springboot实战——spring securtity的认证流程源码解析
前言本节内容是关于springsecurity安全框架认证流程的
源码分析
,springsecurity的认证流程主要是在UsernamePasswordAuthenticationFilter过滤器中实现的
厉害哥哥吖
·
2024-02-08 17:47
#
springboot
spring
boot
深度解析ScheduledThreadPoolExecutor源码之ScheduledFutureTask
文章目录引言一、RunnableScheduledFuture定义周期性接口二、ScheduledFutureTask
源码分析
2.1ScheduledFutureTask参数解析2.2ScheduledFutureTask
对酒当歌丶人生几何
·
2024-02-08 17:45
java
开发语言
算法
Spark
经典案例之非结构数据处理
需求:根据tomcat日志计算url访问了情况,具体的url如下,要求:区别统计GET和POSTURL访问量结果为:访问方式、URL、访问量测试数据集:在CODE上查看代码片派生到我的代码片196.168.2.1--[03/Jul/2014:23:36:38+0800]“GET/course/detail/3.htmHTTP/1.0”200384350.038182.131.89.195--[03
张明洋_4b13
·
2024-02-08 15:57
深入理解
Spark
的前世今生
文章来源:https://blog.csdn.net/qq_42107047/article/details/80239094感谢大神分享~~~~~一:大数据的概述1.1
Spark
是什么?
闲云野鹤~~~
·
2024-02-08 14:01
Spark
【
Spark
重点难点】你以为的Shuffle和真正的Shuffle
我们的【
Spark
重点难点】系列继续更新。以往的系列:我们在学习
Spark
的时候,到底在学习什么?
王知无(import_bigdata)
·
2024-02-08 14:00
大数据
spark
java
python
数据库
深入理解
Spark
BlockManager:定义、原理与实践
深入理解
Spark
BlockManager:定义、原理与实践1.定义
Spark
是一个开源的大数据处理框架,其主要特点是高性能、易用性以及可扩展性。
涤生大数据
·
2024-02-08 14:57
spark
大数据
分布式
spark
spark
.shuffle.service.enabled
操作场景
Spark
系统在运行含shuffle过程的应用时,Executor进程除了运行task,还要负责写shuffle数据,给其他Executor提供shuffle数据。
不搬砖的程序员不是好程序员
·
2024-02-08 13:59
spark
spark
spark
好的文章链接
https://blog.51cto.com/u_16099325/6763760`java
spark
官方文档
spark
javaapi手册http://www.17bigdata.com/book/
spark
Trank-Lw
·
2024-02-08 13:18
spark
大数据
分布式
四、Docker Daemon 中NewDaemon的实现(摘自《Docker
源码分析
》)
1、NewDaemon作用简介在Docker架构中有很多重要的概念,如:graph,graphdriver,execdriver,networkdriver,volumes,Dockercontainers等。Docker在实现过程中,需要将以上实体进行统一化管理,而DockerDaemon中的daemon实例就是设计用来完成这一任务的实体。2、NewDaemon介绍NewDaemon函数的执行完
elsen_zhao
·
2024-02-08 12:48
史上最全OLAP对比
目录1.什么是OLAP2.OLAP引擎的常见操作3.OLAP分类MOLAP的优点和缺点ROLAP的优点和缺点4.并发能力与查询延迟对比5.执行模型对比5.OLAP引擎的主要特点5.2
Spark
SQL、FlinkSQL5.3Clickhouse5.4Elasticsearch5.5Presto5.6Impala5.7Doris5.8Druid5.9Kylin
只会写demo的程序猿
·
2024-02-08 11:04
数仓
spark
hadoop
数据仓库
通过nginx学习linux进程名的修改
目录1.缘起2.背景知识3.
源码分析
3.1准备工作3.2设置进程名字1.缘起 在运行nginx的时候,用ps查看nginx的进程信息,可能的输出如下:root421693105016:51?
码农心语
·
2024-02-08 11:30
nginx学习
LINUX
nginx
学习
linux
setproctile
修改进程名
nginx stream proxy 模块的ssl连接
源码分析
目录1.源起2.分析验证环境的配置3.
源码分析
3.1代理模块的请求入口点分析3.2发起与上游服务器的连接3.3连接回调3.4TCP连接建立成功后为上下游数据透传做准备3.5TCP连接的ssl上下文初始化
码农心语
·
2024-02-08 11:59
nginx学习
c++开发
高性能
nginx
ssl
运维
proxy
stream
源码分析
Spark
:基于莱文斯坦(Levenshtein)距离计算字符串相似度
以下程序代码基于
spark
,使用scala语言,测试时间:2018-08-03str1和str2相似度=1-Levenshtein距离/max(length(str1),length(str2))valdf
xuejianbest
·
2024-02-08 11:25
大数据
算法
编程语言/Scala
大数据/spark
Levenshtein
字符串相似
莱文斯坦距离
spark
scala
MML
Spark
+
Spark
:py
spark
+lightGBM应用实践
MML
Spark
,即MicrosoftMachineLearningforApache
Spark
,是微软开源的一个针对Apache
Spark
的深度学习和数据可视化的库。
bensonrachel
·
2024-02-08 10:38
spark
sql 数据类型转换_
spark
sql时间类型转换以及其他
1.
spark
sql的日期转换一般使用两种形式第一种使用to_timestamp(REACHTIME1,"yyyy-MM-ddHH24:mi:ss")//它将字符串时间转换为日期类型例如2018-10-
weixin_39535527
·
2024-02-08 10:02
spark
sql
数据类型转换
上一页
8
9
10
11
12
13
14
15
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他