FZQuantum

[大数据计算基础] 大数据计算系统

大数据计算系统
大数据计算框架的几个要素：
• 计算场景: 适用于何种任务使用？
• 抽象：程序员看到的框架是什么样的？
• API：程序员如何使用框架？
• 系统架构：系统有哪些模块？
• 基本数据操作：如何操作数据？如何高效实现？
• 流程优化：如何将一个计算任务转化为基本数据操作执行过程？
• 流程调度：如何有效执行基本数据操作？
• 数据存储机制：如何存储数据？
• 事务处理：如何确保计算过程正确地进行？

分别对于几种计算系统

大数据批处理计算框架：
大数据实时计算框架
大图计算框架
目录
- 一. 大数据批处理计算框架
- - 1.Hadoop
  - 2.Spark
进行总结

一. 大数据批处理计算框架

1.Hadoop

Hadoop是一个开源的、可靠的、可扩展的分布式并行计算框架，主要包括：
– MapReduce 离线大数据分析计算引擎
– HDFS – 分布式文件系统
– YARN– 任务执行调度资源管理框架
– Hbase – NoSQL数据库
–Hive – 分布式数据仓库

计算场景: 批处理
抽象：Map-Reduce 函数模型
MapReduce并行处理的基本过程：

1.有一个待处理的大数据，被划分为大小相同的数据块(如 64MB),及与此相应的用户作业程序
2.系统中有一个负责调度的主节点(Master), 以及数据Map和 Reduce工作节点 (Worker)
3.用户作业程序提交给主节点
4.主节点为作业程序寻找和配备可用的 Map节点，并将程序传送给map节点
5.主节点也为作业程序寻找和配备可用的 Reduce节点，并将程序传送给Reduce 节点
6.主节点启动每个 Map节点执行程序，每个map节点尽可能读取本地或本机架的数据进行计算
7.每个Map节点处理读取的数据块,并做一些数据整理工作(combining, sorting等)并将中间结果存放在本地；同时通知主节点计算任务完成并告知中间结果数据存储位置
8.主节点等所有Map节点计算完成后，开始启动Reduce节点运行； Reduce节点从主节点所掌握的中间结果数据位置信息，远程读取这些数据
9.Reduce节点计算结果汇总输出到一个结果文件即获得整个处理结果

API：重载MapReduce函数

以wordcount为案例
很简单，就是重载一下map函数和reduce函数，给出具体的实现即可

系统架构
可以分为客户端节点，JobTasker节点，TaskTracker节点

如上图所示，一个 MapReduce程序指定的一个完整计算过程在Hadoop里被称为一个作业（Job） ，而一个作业在执行过程中可以被拆分为若干 Map和Reduce任务完成（最简单的wordcount中Map拆单词，Reduce按Map后的Key归并组装）

MapReduce框架中进行并行计算的基本事务单元被称为任务（Task） ，分为Map 和Reduce 任务，一个作业（Job）通常包含多个任务（Task）

客户端节点是面向外部客户提供输入输出接口的节点，其中包含我们实现的MapReduce程序，和替程序与 MapReduce运行框架交互的对象 ——JobClient

JobTracker 是MapReduce框架的总的管理者，它协调MapReduce作业，给下面工作节点分配任务和监控任务，同时由负责对接上面的客户端节点，类似于部门经理之类的活

TaskTracker 执行JobTracker分配的任务，是具体工作的执行者，类似公司里的程序员，按工作类型可以分为Map TaskTracker（前端程序员）和Reduce TaskTracker （后端程序员）两类，下属具体的JVM和资源(类似公司的电脑)

运行流程

流程优化：无 (额外的DAG模型生成工具)
流程调度：基础任务调度、Map与Reduce函数的执行

初始化：

MapReduce程序创建新的JobClient
JobClient向JobTracker请求获得一个新的JobId标识本次作业
JobClient将运行作业需要的相关资源放入作业对应的HDFS目录、计算分片数量和map任务数量
向JobTracker提交作业，并获得作业的状态对象句柄
总的来看就好像是新建一个JobClient对象，然后给相应的信息和计算资源

然后进行作业调度

作业提交请求放入队列等待调度
从HDFS中取出作业分片信息，创建对应数量的TaskInProgress调度和监控Map任务

作业调度大致有先进先出（FIFO）公平（Fair）调度，能力（Capacity）调度器三种

下面进行的就是任务分配，差不多就是创建TaskTracker，然后JobTracker与这些TaskTracker进行通信，保活检测等

等待前三部完成后，后面进行的就是具体的Spilt-Map-Shuffle-Reduce-Output过程了
比较值得说的就属于Shuffle
Shuffle顾名思义，洗牌，做的就是Map后进行文件排序和部分的合并（合并Map产生的中间数据），如下图所示：

数据存储机制

HDFS
采用NameNode 和DataNode 的结构，NameNode 是整个文件系统的大脑，提供整个文件系统的目录信息，各个文件的分块信息，数据块的位置信息，并且管理各个数据服务器。 DataNode 是数据服务器，分布式文件系统中的每一个文件，都被切分成若务器上

HDFS中每个文件都会被切分成若干个块（Block），默认64MB，每一块都有连续的一段文件内容是存储的基本单位。客户端写文件的时候，不是一个字节一个字节写入文件系统的，而是累计到一定数量后，往文件写入数个数据包（Packet ）。在每一个数据包中，都会将数据切成更小的块（Chunk ）（ 512 字节）

HDFS读：

1、使用HDFS Client，向远程的Namenode发起RPC（远程过程调用）请求；
2、Namenode会视情况返回文件的部分或者全部block列表，对于每个block， Namenode都会返回有该block拷贝的datanode地址；
3-4、HDFS Client 选取离客户端最接近的datanode来读取block；
5、当读完列表的block后，如果文件读取还没有结束，客户端开发库会继续向Namenode 获取下一批的block列表。
6、读取完当前block的数据后，关闭与当前的datanode连接，并为读取下一个block寻找最佳的datanode

HDFS写：

1.HDFS Client 向远程的Namenode发起RPC请求；
2.Namenode会检查要创建的文件是否已经存在，创建者是否有权限进行操作，成功则会为文件创建一个记录，否则会让客户端抛出异常；
3.当客户端开始写入文件的时候，开发库会将文件切分成多个packets，并在内部以"data queue"的形式管理这些packets，并向Namenode申请新的blocks，获取用来存储replicas的合适的datanodes列表，列表的大小根据在Namenode中对replication的设置而定。
4. 开始以pipeline（管道）的形式将packet写入所有的replicas中。开发库把 packet以流的方式写入第一个datanode，该datanode把该packet存储之后，再将其传递给在此pipeline中的下一个datanode，直到最后一个datanode，这种写数据的方式呈流水线的形式。
5. 最后一个datanode成功存储之后会返回一个ack packet，在pipeline里传递至客户端，在客户端的开发库内部维护着"ack queue"，成功收到datanode返回的ack packet后会从"ack queue"移除相应的packet。
6. 如果传输过程中，有某个datanode出现了故障，那么当前的pipeline会被关闭，出现故障的datanode会从当前的pipeline中移除，剩余的block会继续剩下的datanode中继续以pipeline的形式传输，同时Namenode会分配一个新的 datanode，保持replicas设定的数量。

HDFS优点：支持扩展
HDFS不擅长：

多数据中心情况
低延迟数据访问需求（10ms）
大量的小文件
多个数据写入者

事务处理
就是讲Hadoop的容错机制
节点的容错：
主节点中会周期性地设置检查点(checkpoint)，检查整个计算作业的执行情况，一旦某个任务失效，可以从最近有效的检查点开始重新执行，避免从头开始计算的时间浪费。
工作节点失效是很普遍发生的，主节点会周期性地给工作节点发送检测命令，如果工作节点没有回应，这认为该工作节点失效，主节点将终止该工作节点的任务并把失效的任务重新调度到其它工作节点上重新执行

TaskTracker的容错：

心跳监测：已完成的任务会正常返回，未完成的任务则重新分配TaskTracker节点执行
TaskTracker黑名单机制：每个Job会维护一个TaskTracker黑名单，将不好使的TaskTracker加进去，以后将不在该TaskTracker上调度任何task

容错的恢复

重启出错的TaskTracker 即可

补充内容：
仅供参考
MapReduce 1.0存在很多缺点：

JobTracker 是 Map-reduce 的集中处理点，存在单点故障。
JobTracker 完成了太多的任务，造成了过多的资源消耗，当 map-reduce job 非常多的时候，会造成很大的内存开销。
在 TaskTracker 端，以map/reducetask 的数目作为资源的表示过于简单，没有考虑到 cpu/ 内存的占用情况。
MapReduce 框架在有任何重要的或者不重要的变化 ( 例如 bug 修复，性能提升和特性化 ) 时，都会强制进行系统级别的升级更新。强制让分布式集群系统的每一个用户端同时更新。

因此升级到2.0，使用Yarn进行调度
Yarn里面主要可以分为三种模块：
ResourceManager ：调度、启动每一个 Job 所属的 ApplicationMaster、另外监控 ApplicationMaster ，是Client和ApplicationMaster 之间交流的中间件

处理客户端请求
启动/监控ApplicationMaster
监控NodeManager – 资源分配与调度

NodeManager ：类似老版本的TaskTracker

单个节点上的资源管理
处理来自ResourceManager的命令
处理来自ApplicationMaster的命令

ApplicationMaster ：负责一个 Job 生命周期内的所有工作，类似老的框架中 JobTracker

数据切分
为应用程序申请资源，并分配给内部任务
任务监控与容错 Hadoop

YARN 容错

ResourceManager
– 存在单点故障；
– 基于ZooKeeper实现。
NodeManager
–失败后，ResourceManager 将失败任务告诉对应的ApplicationMaster；
–ApplicationMaster决定如何处理失败的任务。
ApplicationMaster
–失败后，由ResourceManager重启；
–ApplicationMaster需处理内部任务的容错问题；
–ApplicationMaster会保存已经运行完成的Task，重启后无需重新运行已经完成的工作。

2.Spark

在谈Spark之前，我们看看什么是大数据的批处理：

批处理操作作用于大容量静态数据集，并在计算过程完成后返回结果

批处理模式中使用的数据集通常符合下列特征：

有界：批处理数据集代表数据的有限集合，不像流模型一样是无穷的。
持久：数据通常始终存储在某种类型的持久存储位置中。
大量：批处理操作通常是处理极为海量数据集的唯一方法。

批处理适合

需要访问全套记录才能完成的计算工作
对历史数据进行分析

批处理不适合

对处理时间要求较高的场合（这时候需要使用流数据处理框架）

再看一下Spark与Hadoop的对比

不难看出，MapReduce框架把中间结果写入到稳定存储（比如磁盘）中，带来了大量的数据复制、磁盘IO和序列化开销；而Spark在进行处理时，中间内容和计算结果是常驻内存的，这就是Spark中的RDD机制

因为要理解Spark必须先理解其中的RDD机制，spark中的很多特性都和他有关，所以先谈RDD（弹性分布式数据集）
一个RDD是一个分布式对象集合，本质上是一个只读的分区记录集合，提供了一个抽象的数据架构，不必担心底层数据的分布式特性，只需将具体的应用逻辑表达为一系列转换处理。

一个RDD的不同分区可以被保存到集群中不同的节点上，从而可以在集群中的不同节点上进行并行计算

不同RDD之间的转换操作形成依赖关系，可以实现数据流水处理，避免中间数据存储

RDD提供了一种高度受限的共享内存模型

RDD是只读的记录分区的集合，不能直接修改，类似软件构造中的不可变类
只能基于稳定的物理存储中的数据集创建RDD，或者通过在其他RDD上执行确定的转换操作（如map、join和 group by）而创建得到新的RDD ，这里，RDD提供了一组丰富的操作以支持常见的数据运算，分为 “动作”（Action）和“转换”（Transformation）两种类型

RDD的执行过程：

RDD读入外部数据源进行创建
RDD经过一系列的转换（Transformation）操作，每一次都会产生不同的RDD，供给下一个转换操作使用
最后一个RDD经过“动作”操作进行转换，并输出到外部数据源

从上面可以看出RDD的优点：惰性调用、管道化、避免同步等待、不需要保存中间结果、每次操作变得简单

计算的中间结果持久化到内存，数据在内存中的多个RDD操作之间进行传递，避免了不必要的读写磁盘开销

存放的数据可以是Java对象，避免了不必要的对象序列化和反序列化

容错机制：

RDD本身维护着可以用来重建丢失分区的信息

RDD还有优秀的容错机制：

一般的容错机制：数据复制或者记录日志
RDD的容错机制：血缘关系、重新计算丢失分区、无需回滚系统、重算过程在不同节点之间并行、只记录粗粒度的操作

Logo语言的学习路线滕若岚包罗万象 golang 开发语言后端
学习Logo语言的路线图引言在计算机编程领域，有许多种编程语言可以选择，Logo语言因其独特的教育理念和简单性而受到广泛欢迎。Logo语言的设计初衷是为了给学生和初学者提供一个轻松愉快的编程学习体验，让他们在学习编程的过程中培养逻辑思维能力和创造力。本文将为您提供一条系统的Logo学习路线，使您能够从基础知识起步，逐渐掌握这门语言。一、Logo语言基础1.1什么是Logo语言？Logo语言最早是在
【人工智能基础2】Tramsformer架构、自然语言处理基础、计算机视觉总结 roman_日积跬步-终至千里人工智能习题人工智能自然语言处理计算机视觉
文章目录七、Transformer架构1.替代LSTM的原因2.Transformer架构：编码器-解码器架构3.Transformer架构原理八、自然语言处理基础1.语言模型基本概念2.向量语义3.预训练语言模型的基本原理与方法4.DeepSeek基本原理九、计算机视觉七、Transformer架构1.替代LSTM的原因处理极长序列时，效率下降：虽然LSTM设计的初衷是解决长期依赖问题，即让模型
【python web】一文掌握 Flask 的基础用法数据知道 python 前端 flask
文章目录一、Flask介绍1.1安装Flask二、Flask的基本使用2.1创建第一个Flask应用2.2路由与视图函数2.3请求与响应2.4响应对象2.5模板渲染2.6模板继承2.7静态文件管理2.8Blueprint蓝图2.9错误处理三、Flask扩展与插件四、部署Flask应用五、总结Flask是一个轻量级的PythonWeb框架，因其简单易用、灵活性高而受到广泛欢迎。本文将全面介绍Flas
K8S学习之基础三十四：K8S之监控Prometheus部署pod版云上艺旅 K8S学习 kubernetes 学习 prometheus 云原生
使用KubernetesPod的方式部署Prometheus是一种常见的方法，尤其是在容器化和微服务架构中。以下是详细的步骤：1.创建命名空间（可选）为了方便管理，可以为Prometheus创建一个单独的命名空间。yaml复制apiVersion:v1kind:Namespacemetadata:name:monitoring将上述内容保存为namespace.yaml，然后应用：bash复制ku
K8S学习之基础三十五：k8s之Prometheus部署模式云上艺旅 K8S学习 kubernetes 学习 prometheus 云原生容器
Prometheus有多种部署模式，适用于不同的场景和需求。以下是几种常见的部署模式：1.单节点部署这是最简单的部署模式，适用于小型环境或测试环境。特点：单个Prometheus实例负责所有的数据采集、存储和查询。配置简单，易于维护。不具备高可用性和扩展性。适用场景：小型项目或测试环境。对高可用性要求不高的场景。部署步骤：下载并解压Prometheus。配置prometheus.yml。启动Pro
怎么做一个AI产品经理？ AI筑梦师 AI产品经理人工智能产品经理
AI产品经理全面进化：在人工智能迅猛发展的时代，产品经理的角色正经历前所未有的转型。从传统的需求捕捉者到技术与商业紧密结合的创新推动者，AI产品经理肩负着将前沿AI技术转化为解决用户痛点的产品的重要任务。随着大数据、云计算和大模型技术的不断成熟，产品经理不仅需要具备敏锐的市场洞察，还必须深刻理解AI技术本质，跨界整合技术、数据与业务优势，从而推动产品的持续创新与落地。本文将全面解析AI产品经理的角
如何禁止电脑中某个应用联网办公小百知软件技术电脑文件管理技巧电脑
一、通过防火墙基础设置（快速操作）打开控制面板在任务栏搜索框输入“控制面板”并打开，将右上角“查看方式”切换为“大图标”。进入防火墙设置点击WindowsDefender防火墙→左侧选择允许应用或功能通过WindowsDefender防火墙。禁用目标应用的网络权限在列表中找到需禁用的应用，取消其勾选的专用网络和公用网络，点击确定保存。二、通过高级出站规则（彻底禁止）创建出站规则在防火墙设置界面，点
C语言基础知识05---必背+函数努力做小白 C语言学习算法数据结构 c语言
目录必备知识点1、C语言5大分区1.1局部变量1.2全局变量1.3静态局部变量1.4外部声明变量2、关键字2.1static2.2extern3、局部变量和全局变量能不能同名？4、实参&&形参函数1、函数的作用2、函数的分类2.1主函数2.2子函数3、函数命名4、函数定义格式5、函数传参5.1值传参5.2地址传参6、函数类型6.1函数的声明6.2函数调用6.3递归函数7、指针函数&&函数指针7.1
封神台SQL注入-基础靶场1-布尔盲注原味瓜子、 SQL注入布尔盲注封神台 SQL注入
文章目录布尔盲注（一）布尔盲注（二）布尔盲注（三）布尔盲注（一）1、判断注入类型id=1and1=1//有数据id=1and1=2//noresultsfound判断为数字型布尔盲注2、判断数据库长度，获取数据库名andlength(database())=1数据库名长12抓包，爆破，获取andascii(substr(database(),1
spring security学习入门指引 LCY133 web开发 spring 学习 java
学习SpringSecurity可以从以下几个方面逐步深入，结合理论与实践，以下是具体的学习路径建议：1.基础准备•熟悉Spring框架：先掌握SpringCore、SpringMVC和SpringBoot的基础，理解依赖注入（DI）、AOP、Bean生命周期等核心概念。•理解安全基本概念：了解认证（Authentication）、授权（Authorization）、加密（Hashing/Encr
Spring(6）——Spring、Spring Boot 与 Spring MVC 的关系与区别南山不太冷 Spring spring spring boot mvc
Spring、SpringBoot与SpringMVC的关系与区别1.核心定位Spring定位：基础框架，提供IoC（控制反转）和DI（依赖注入）核心功能，管理对象生命周期及依赖关系。功能：支持事务管理、AOP（面向切面编程）、数据访问等，适用于所有Java应用（不限于Web）。SpringMVC定位：Spring的子框架，专注于Web层开发，基于MVC（Model-View-Controller
无人机学习入门一颗微竹无人机无人机
设备：电脑+遥控器+小飞机+fpv+充电器+各种工具配件设备最开始只有电脑，慢慢的东西越来越多。学习理论知识空域与航空法律法规、安全教育无人机基础（在mooc平台和智慧职教平台上很多课程，当然B站也很多，自学基础内容）目录大概如下：1）无人机的历史2）无人机分类3）无人机系统组成（直升机、多旋翼、固定翼无人机、其他特殊结构）4）无人机飞行原理、空气动力学5）飞行控制、导航系统6）任务载荷学习实践知
系统架构师备考——软件可靠性基础知识篇（上）牛马程序员小邓系统架构师备考笔记系统架构
系统架构师备考日记（3.11）第9章软件可靠性基础知识篇（上）文章目录系统架构师备考日记（3.11）考点一、软件可靠性基本概念1.1软件可靠性定义1.2软件可靠性的定量描述1.3可靠性目标1.4可靠性测试的意义1.5广义的可靠性测试与狭义的可靠性测试二、软件可靠性建模2.1影响软件可靠性的因素2.2软件可靠性的建模方法2.3软件可靠性模型分类三、软件可靠性管理总结考点软件可靠性基本概念、建模、管理
系统架构师备考——软件可靠性基础知识篇（下）牛马程序员小邓系统架构
系统架构师备考日记（3.13）第9章软件可靠性基础知识篇（下）文章目录系统架构师备考日记（3.13）考点一、软件可靠性设计1.1容错设计技术1.2检错技术1.3降低复杂度设计1.4系统配置技术二、软件可靠性测试2.1软件可靠性测试概述2.2定义软件运行剖面2.3可靠性测试用例设计2.4软件可靠性测试的实施三、软件可靠性评价3.1软件可靠性评价概述3.2怎样选择可靠性模型3.3可靠性数据的收集3.4
AI人工智能中的概率论与统计学原理与Python实战：Python实现概率模型 AI天才研究院 AI实战 AI大模型企业级应用开发实战大数据人工智能语言模型 AI LLM Java Python 架构设计 Agent RPA
1.背景介绍随着人工智能技术的不断发展，概率论与统计学在人工智能领域的应用越来越广泛。概率论与统计学是人工智能中的基础知识之一，它们在机器学习、深度学习、自然语言处理等领域都有着重要的作用。本文将介绍概率论与统计学的核心概念、算法原理、具体操作步骤以及Python实现方法，并通过具体代码实例进行详细解释。2.核心概念与联系2.1概率论与统计学的区别概率论是一门数学学科，它研究随机事件发生的可能性。
二值逻辑、三值逻辑到多值逻辑的变迁（含示例）搏博人工智能原理算法人工智能机器学习线性代数图像处理数据分析
二值逻辑、三值逻辑到多值逻辑的变迁是一个逻辑体系不断拓展和深化的过程，反映了人们对复杂现象和不确定性问题认识的逐步深入。前文，我们已经探讨过命题逻辑与谓词逻辑，了解了如何用符号语言从浅入深地刻画现实世界。具体可以看我的CSDN文章：人工智能的数学基础之命题逻辑与谓词逻辑（含示例）-CSDN博客人工智能中用到的逻辑可概括地划分为两大类。第一类是经典命题逻辑和一阶谓词逻辑，第二类是泛指除经典逻辑之外的
这里是 Grok 3 为我规划的大学物联网工程自学计划！王倚山物联网学习开发语言
我理解你可能希望我提供更详细的优化版本，包含更具体的技术细节、时间分配、资源推荐以及项目示例，以便让规划更具操作性。我将在保持原有结构的基础上，显著扩展每个阶段的内容，增加更多具体建议和实践指导，确保优化后的规划更加详尽、全面，同时仍然基于你的裸机开发经验进行调整。优化后的详细学习规划总体思路（扩展版）你的裸机开发经验（数据采集、控制、配网、上云、手机交互）表明你已经掌握了嵌入式开发的基础技能，如
matlab从无到有系列（二）：矩阵运算基础左手の明天 Matlab matlab 矩阵线性代数
目录矩阵运算典例各种矩阵的生成全一矩阵、全零矩阵和单位矩阵随机矩阵特殊矩阵矩阵的范式矩阵旋转和矩阵变维矩阵运算典例2.1在MATLAB中如何建立矩阵，并将其赋予变量a？>> a=[573;491]2.2有几种建立矩阵的方法？各有什么优点？
JavaScript 的 requestAnimationFrame 小华0000 javascript 开发语言 ecmascript
在现代Web开发中，用户体验至关重要。动画作为用户交互的重要组成部分，如果处理不当，很容易出现卡顿、掉帧等问题，严重影响用户体验。幸运的是，JavaScript提供了一个强大的API：requestAnimationFrame（简称rAF），它为我们创建平滑、高效的动画提供了坚实的基础。本文将深入探讨requestAnimationFrame的原理、使用、高级技巧以及在实际项目中的应用，帮助你掌握
css预处理器sass 小华0000 scss 前端 css
在前端开发的世界中，CSS是构建网页样式的基础。然而，随着项目规模的增大，纯CSS的编写和维护往往会变得复杂而繁琐。为了解决这些痛点，Sass（SyntacticallyAwesomeStyleSheets）应运而生。Sass是一种CSS预处理器，它扩展了CSS的功能，让CSS的编写更加高效、灵活和易于维护。本文将深入探讨Sass的概念、优势、语法、以及如何在实际项目中应用它，帮助你提升CSS技能
MySQL0基础概念4 wqx951 mysql sql
MySQL体系结构概述1.MySQL系统的重要组件包括连接管理器、线程管理器、命令分发器。2.连接管理器负责接收用户请求，转交给线程管理器，验证用户访问。3.用户请求包括查询命令，这些命令由命令分发器处理，如交友、缓存、解析结果或记录用户行为。MySQL查询处理流程1.查询处理流程包括高速缓存查询、词法分析、语法分析、结果缓存检查和分析后结果处理。2.如果查询结果在缓存中，直接返回缓存结果；否则，
【数学基础】线性代数#1向量和矩阵初步 -一杯为品- 数学线性代数矩阵
本系列内容介绍：主要参考资料：《深度学习》[美]伊恩·古德菲洛等著《机器人数学基础》吴福朝张铃著文章为自学笔记，仅供参考。目录标量、向量、矩阵和张量矩阵运算单位矩阵和逆矩阵线性相关和生成子空间范数特殊类型的矩阵和向量特征分解奇异值分解Moore-Penrose伪逆迹运算行列式标量、向量、矩阵和张量标量标量是一个单独的数。向量向量是一列有序排列的数：x=[x1x2⋮xn]\boldsymbolx=\
网络通信安全：全面探索与深入分析 baimao__沧海安全数据库 sqlserver sql android web安全
**摘要：**本文全面探索网络通信安全相关内容。首先阐述网络通信安全的基本概念与原理，包括网络通信模型、安全目标以及加密技术基础。接着详细分析其面临的威胁，涵盖恶意软件（病毒、蠕虫、特洛伊木马）、网络攻击（DoS/DDoS、网络嗅探、SQL注入）和社会工程学攻击等。然后介绍防护机制，如防火墙、IDS与IPS、VPN、数据加密技术应用、身份认证与访问控制等。还论述了网络通信安全在企业、金融、政府领域
重生之我在学Vue--第16天 Vue 3 插件开发野生的程序媛 Vue 前端成仙之路 vue.js 前端 javascript 前端框架
重生之我在学Vue–第16天Vue3插件开发文章目录重生之我在学Vue--第16天Vue3插件开发前言一、插件的作用与开发思路1.1插件能做什么？1.2插件开发四部曲二、开发全局通知插件2.1插件基础结构2.2完整插件代码（带注释解析）2.3样式文件notification.css三、插件的安装与使用3.1在main.js中安装3.2在组件中使用四、插件开发进阶技巧4.1支持TypeScript类
Spring Boot中使用RabbitMQ实现简单的消息发送与接收 Takumilovexu MQ java-rabbitmq rabbitmq spring boot
文章目录环境准备1.RabbitMQ的基础配置2.实现消息发送功能3.实现消息接收功能4.总结在微服务架构和分布式系统中，消息队列是实现异步通信和解耦的重要工具。RabbitMQ作为一种常见的消息中间件，广泛应用于消息传递、任务分发等场景。本文将带你一步步实现如何在SpringBoot应用中使用RabbitMQ进行消息的发送和接收。我们将构建一个消息发送者（Publisher）和一个消息接收者（C
Kotlin知识体系(一) : Kotlin的五大基础语法特性氦客知识体系 -Kotlin基础 kotlin 开发语言 android 基础语法特性知识体系
前言在Android开发领域，Kotlin凭借其简洁性和安全性已成为官方推荐语言。本文将通过Kotlin的五大基础语法特性，结合实际应用场景展示它们在Android开发中的独特价值。一、变量声明：val与var的哲学1.1不可变优先原则Kotlin的val关键字用于声明不可变变量（相当于Java的final），这是构建可靠Android应用的基石：valPI=3.14159//类型推断为Doubl
运维面试常问的100道题（大数据统计）無爲謂人工智能运维面试
一、基础知识类1、请解释什么是运维？运维是指对企业的IT系统进行运行维护，包括硬件设备、软件系统、网络等的监控、管理、优化和故障处理，以确保系统的稳定、高效运行，满足业务需求。2、简述运维的主要职责有哪些？服务器的安装、配置、维护和监控。网络设备的管理和维护。数据库的管理和维护。应用系统的部署、升级和维护。故障处理和应急响应。性能优化和容量规划。安全管理和漏洞修复。3、什么是服务器？有哪些类型？服
深入探索文件上传基础及过滤方式：Web 安全的关键防线阿贾克斯的黎明网络安全 web安全
目录深入探索文件上传基础及过滤方式：Web安全的关键防线文件上传基础文件上传的安全风险文件上传的过滤方式在Web应用程序的安全领域中，文件上传功能是一把双刃剑。它为用户提供了极大的便利，比如用户可以上传头像、文档等各类文件，但同时也给Web应用带来了诸多安全风险。恶意用户可能利用文件上传漏洞，上传恶意脚本文件，进而获取服务器权限，导致敏感信息泄露、网站被篡改等严重后果。因此，深入了解文件上传基础及
前端初学者，有哪些适合的学习网站？四六的六前端学习个人开发
对于前端初学者而言，选择合适的学习网站至关重要，以下是一些我知道的优质学习平台，在这里分享给大家：菜鸟教程：该网站以其简洁明了的界面设计和通俗易懂的教程内容而受到广大初学者的欢迎。其前端教程体系涵盖了前端开发的大量入门知识，包括HTML、CSS、JavaScript等基础技术，以及当前主流的前端框架和工具的使用方法，如Vue.js、React、Webpack等。教程内容的讲解方式深入浅出，注重从基
Spring 核心注解深度解析教程我不是少爷. Java基础 spring python java
（涵盖@Component/@Repository/@Service/@Controller/@Autowired/@Qualifier/@Resource/@Value）一、组件扫描与分层注解1.@Component基础组件标识@Component//通用组件标识publicclassBasicComponent{//会被Spring自动扫描并注册为Bean}特性：所有组件注解的基类默认Bean
解线性方程组 qiuwanchi
package gaodai.matrix; import java.util.ArrayList; import java.util.List; import java.util.Scanner; public class Test { public static void main(String[] args) { Scanner scanner = new Sc
在mysql内部存储代码 annan211 性能 mysql 存储过程触发器
在mysql内部存储代码在mysql内部存储代码，既有优点也有缺点，而且有人倡导有人反对。先看优点： 1 她在服务器内部执行，离数据最近，另外在服务器上执行还可以节省带宽和网络延迟。 2 这是一种代码重用。可以方便的统一业务规则，保证某些行为的一致性，所以也可以提供一定的安全性。 3 可以简化代码的维护和版本更新。 4 可以帮助提升安全，比如提供更细
Android使用Asynchronous Http Client完成登录保存cookie的问题 hotsunshine android
Asynchronous Http Client是android中非常好的异步请求工具除了异步之外还有很多封装比如json的处理，cookie的处理引用 Persistent Cookie Storage with PersistentCookieStore This library also includes a PersistentCookieStore whi
java面试题 Array_06 java 面试
java面试题第一，谈谈final, finally, finalize的区别。 final-修饰符（关键字）如果一个类被声明为final，意味着它不能再派生出新的子类，不能作为父类被继承。因此一个类不能既被声明为 abstract的，又被声明为final的。将变量或方法声明为final，可以保证它们在使用中不被改变。被声明为final的变量必须在声明时给定初值，而在以后的引用中只能
网站加速 oloz 网站加速
前序:本人菜鸟，此文研究总结来源于互联网上的资料，大牛请勿喷！本人虚心学习，多指教. 1、减小网页体积的大小，尽量采用div+css模式，尽量避免复杂的页面结构，能简约就简约。 2、采用Gzip对网页进行压缩； GZIP最早由Jean-loup Gailly和Mark Adler创建，用于UNⅨ系统的文件压缩。我们在Linux中经常会用到后缀为.gz
正确书写单例模式随意而生 java 设计模式单例
　　单例模式算是设计模式中最容易理解，也是最容易手写代码的模式了吧。但是其中的坑却不少，所以也常作为面试题来考。本文主要对几种单例写法的整理，并分析其优缺点。很多都是一些老生常谈的问题，但如果你不知道如何创建一个线程安全的单例，不知道什么是双检锁，那这篇文章可能会帮助到你。　　懒汉式，线程不安全　　当被问到要实现一个单例模式时，很多人的第一反应是写出如下的代码，包括教科书上也是这样
单例模式香水浓 java
懒汉调用getInstance方法时实例化 public class Singleton { private static Singleton instance; private Singleton() {} public static synchronized Singleton getInstance() { if(null == ins
安装Apache问题：系统找不到指定的文件 No installed service named "Apache2" AdyZhang apache http server
安装Apache问题：系统找不到指定的文件 No installed service named "Apache2" 每次到这一步都很小心防它的端口冲突问题，结果，特意留出来的80端口就是不能用，烦。解决方法确保几处： 1、停止IIS启动 2、把端口80改成其它（譬如90，800，，，什么数字都好） 3、防火墙(关掉试试) 在运行处输入 cmd 回车，转到apa
如何在android 文件选择器中选择多个图片或者视频？ aijuans android
我的android app有这样的需求，在进行照片和视频上传的时候，需要一次性的从照片/视频库选择多条进行上传但是android原生态的sdk中，只能一个一个的进行选择和上传。我想知道是否有其他的android上传库可以解决这个问题，提供一个多选的功能，可以使checkbox之类的，一次选择多个处理方法官方的图片选择器(但是不支持所有版本的androi，只支持API Level
mysql中查询生日提醒的日期相关的sql baalwolf mysql
SELECT sysid,user_name,birthday,listid,userhead_50,CONCAT(YEAR(CURDATE()),DATE_FORMAT(birthday,'-%m-%d')),CURDATE(), dayofyear( CONCAT(YEAR(CURDATE()),DATE_FORMAT(birthday,'-%m-%d')))-dayofyear(
MongoDB索引文件破坏后导致查询错误的问题 BigBird2012 mongodb
问题描述： MongoDB在非正常情况下关闭时，可能会导致索引文件破坏，造成数据在更新时没有反映到索引上。解决方案：使用脚本，重建MongoDB所有表的索引。 var names = db.getCollectionNames(); for( var i in names ){ var name = names[i]; print(name);
Javascript Promise bijian1013 JavaScript Promise
Parse JavaScript SDK现在提供了支持大多数异步方法的兼容jquery的Promises模式，那么这意味着什么呢，读完下文你就了解了。一.认识Promises “Promises”代表着在javascript程序里下一个伟大的范式，但是理解他们为什么如此伟大不是件简
[Zookeeper学习笔记九]Zookeeper源代码分析之Zookeeper构造过程 bit1129 zookeeper
Zookeeper重载了几个构造函数，其中构造者可以提供参数最多，可定制性最多的构造函数是 public ZooKeeper(String connectString, int sessionTimeout, Watcher watcher, long sessionId, byte[] sessionPasswd, boolea
【Java命令三】jstack bit1129 jstack
jstack是用于获得当前运行的Java程序所有的线程的运行情况(thread dump），不同于jmap用于获得memory dump [hadoop@hadoop sbin]$ jstack Usage: jstack [-l] <pid> (to connect to running process) jstack -F
jboss 5.1启停脚本　动静分离部署 ronin47
以前启动jboss，往各种xml配置文件，现只要运行一句脚本即可。start nohup sh /**/run.sh -c servicename -b ip -g clustername -u broatcast jboss.messaging.ServerPeerID=int -Djboss.service.binding.set=p
UI之如何打磨设计能力? brotherlamp UI ui教程 ui自学 ui资料 ui视频
在越来越拥挤的初创企业世界里，视觉设计的重要性往往可以与杀手级用户体验比肩。在许多情况下，尤其对于 Web 初创企业而言，这两者都是不可或缺的。前不久我们在《右脑革命：别学编程了，学艺术吧》中也曾发出过重视设计的呼吁。如何才能提高初创企业的设计能力呢?以下是 9 位创始人的体会。 1.找到自己的方式如果你是设计师，要想提高技能可以去设计博客和展示好设计的网站如D-lists或
三色旗算法 bylijinnan java 算法
import java.util.Arrays; /** 问题：假设有一条绳子，上面有红、白、蓝三种颜色的旗子，起初绳子上的旗子颜色并没有顺序，您希望将之分类，并排列为蓝、白、红的顺序，要如何移动次数才会最少，注意您只能在绳子上进行这个动作，而且一次只能调换两个旗子。网上的解法大多类似：在一条绳子上移动，在程式中也就意味只能使用一个阵列，而不使用其它的阵列来
警告:No configuration found for the specified action: \'s chiangfai configuration
1.index.jsp页面form标签未指定namespace属性。  <%@taglib prefix="s" uri="/struts-tags"%> ... <s:form action="submit" method="post"&g
redis -- hash_max_zipmap_entries设置过大有问题 chenchao051 redis hash
使用redis时为了使用hash追求更高的内存使用率，我们一般都用hash结构，并且有时候会把hash_max_zipmap_entries这个值设置的很大，很多资料也推荐设置到1000，默认设置为了512，但是这里有个坑 #define ZIPMAP_BIGLEN 254 #define ZIPMAP_END 255 /* Return th
select into outfile access deny问题 daizj mysql txt 导出数据到文件
本文转自：http://hatemysql.com/2010/06/29/select-into-outfile-access-deny%E9%97%AE%E9%A2%98/ 为应用建立了rnd的帐号，专门为他们查询线上数据库用的，当然，只有他们上了生产网络以后才能连上数据库，安全方面我们还是很注意的，呵呵。授权的语句如下： grant select on armory.* to rn
phpexcel导出excel表简单入门示例 dcj3sjt126com PHP Excel phpexcel
<?php error_reporting(E_ALL); ini_set('display_errors', TRUE); ini_set('display_startup_errors', TRUE); if (PHP_SAPI == 'cli') die('This example should only be run from a Web Brows
美国电影超短200句 dcj3sjt126com 电影
1. I see．我明白了。2. I quit! 我不干了!3. Let go! 放手!4. Me too．我也是。5. My god! 天哪!6. No way! 不行!7. Come on．来吧(赶快)8. Hold on．等一等。9. I agree。我同意。10. Not bad．还不错。11. Not yet．还没。12. See you．再见。13. Shut up!
Java访问远程服务 dyy_gusi httpclient webservice get post
随着webService的崛起，我们开始中会越来越多的使用到访问远程webService服务。当然对于不同的webService框架一般都有自己的client包供使用，但是如果使用webService框架自己的client包，那么必然需要在自己的代码中引入它的包，如果同时调运了多个不同框架的webService，那么就需要同时引入多个不同的clien
Maven的settings.xml配置 geeksun settings.xml
settings.xml是Maven的配置文件，下面解释一下其中的配置含义： settings.xml存在于两个地方： 1.安装的地方：$M2_HOME/conf/settings.xml 2.用户的目录：${user.home}/.m2/settings.xml 前者又被叫做全局配置，后者被称为用户配置。如果两者都存在，它们的内容将被合并，并且用户范围的settings.xml优先。
ubuntu的init与系统服务设置 hongtoushizi ubuntu
转载自： http://iysm.net/?p=178 init Init是位于/sbin/init的一个程序，它是在linux下，在系统启动过程中，初始化所有的设备驱动程序和数据结构等之后，由内核启动的一个用户级程序，并由此init程序进而完成系统的启动过程。 ubuntu与传统的linux略有不同，使用upstart完成系统的启动，但表面上仍维持init程序的形式。运行
跟我学Nginx+Lua开发目录贴 jinnianshilongnian nginx lua
使用Nginx+Lua开发近一年的时间，学习和实践了一些Nginx+Lua开发的架构，为了让更多人使用Nginx+Lua架构开发，利用春节期间总结了一份基本的学习教程，希望对大家有用。也欢迎谈探讨学习一些经验。目录第一章安装Nginx+Lua开发环境第二章 Nginx+Lua开发入门第三章 Redis/SSDB+Twemproxy安装与使用第四章 L
php位运算符注意事项 home198979 位运算 PHP &
$a = $b = $c = 0; $a & $b = 1; $b | $c = 1 问a,b,c最终为多少? 当看到这题时，我犯了一个低级错误，误以为位运算符会改变变量的值。所以得出结果是1 1 0 但是位运算符是不会改变变量的值的，例如： $a=1;$b=2; $a&$b; 这样a,b的值不会有任何改变
Linux shell数组建立和使用技巧 pda158 linux
1.数组定义　　[chengmo@centos5 ~]$ a=(1 2 3 4 5) 　　[chengmo@centos5 ~]$ echo $a 　　1 　　一对括号表示是数组，数组元素用“空格”符号分割开。　　 2.数组读取与赋值　　得到长度：　　[chengmo@centos5 ~]$ echo ${#a[@]} 　　5 　　用${#数组名[@或
hotspot源码(JDK7) ol_beta java HotSpot jvm
源码结构图，方便理解： ├─agent Serviceab
Oracle基本事务和ForAll执行批量DML练习 vipbooks oracle sql
基本事务的使用：从账户一的余额中转100到账户二的余额中去，如果账户二不存在或账户一中的余额不足100则整笔交易回滚 select * from account; -- 创建一张账户表 create table account( -- 账户ID id number(3) not null, -- 账户名称 nam

[大数据计算基础] 大数据计算系统

目录

一. 大数据批处理计算框架

1.Hadoop

2.Spark

你可能感兴趣的:(大数据计算基础,大数据)