vcould163

网易视频云技术分享：一个SparkSQL的作业的一生

网易视频云是网易倾力打造的一款基于云计算的分布式多媒体处理集群和专业音视频技术，提供稳定流畅、低时延、高并发的视频直播、录制、存储、转码及点播等音视频的PAAS服务，在线教育、远程医疗、娱乐秀场、在线金融等各行业及企业用户只需经过简单的开发即可打造在线音视频平台。现在，网易视频云的技术专家给大家分享一则技术文：一个SparkSQL的作业的一生。

Spark是时下很火的计算框架，由UC Berkeley AMP Lab研发，并由原班人马创建的Databricks负责商业化相关事务。而SparkSQL则是Spark之上搭建的SQL解决方案，主打交互查询场景。

人人都说Spark／SparkSQL快，各种Benchmark满天飞，但是到底Spark／SparkSQL快么，或者快在哪里，似乎很少有人说得清。因为Spark是基于内存的计算框架？因为SparkSQL有强大的优化器？本文将带你看一看一个SparkSQL作业到底是如何执行的，顺便探讨一下SparkSQL和Hive On MapReduce比起来到底有何其别。

SQL On Hadoop的解决方案已经玲琅满目了，不管是元祖级的Hive，Cloudera的Impala，MapR的Drill，Presto，SparkSQL甚至Apache Tajo，IBM BigSQL等等，各家公司都试图解决SQL交互场景的性能问题，因为原本的Hive On MapReduce实在太慢了。

那么Hive On MapReduce和SparkSQL或者其他交互引擎相比，慢在何处呢？让我们先看看一个SQL On Hadoop引擎到底如何工作的。

现在的SQL On Hadoop作业，前半段的工作原理都差不多，类似一个Compiler，分来分去都是这基层。

小红是数据分析，她某天写了个SQL来统计一个分院系的加权均值分数汇总。

SELECT dept, avg(math_score * 1.2) + avg(eng_score * 0.8) FROM studentsGROUP BY dept;

其中STUDENTS表是学生分数表（请不要在意这个表似乎不符合范式，很多Hadoop上的数据都不符合范式，因为Join成本高，而且我写表介绍也会很麻烦）。

她通过网易大数据的猛犸系统提交了这个查询到某个SQL On Hadoop平台执行，然后她放下工作，切到视频网页看一会《琅琊榜》。

在她看视频的时候，我们的SQL平台可是有很努力的工作滴。

首先是查询解析。

这里和很多Compiler类似，你需要一个Parser（就是著名的程序员约架专用项目），Parser（确切说是Lexer加Parser）的作用是把一个字符串流变成一个一个Token，再根据语法定义生成一棵抽象语法树AST。这里不详细展开，童鞋们可以参考编译原理。比较多的项目会选ANTLR（Hive啦，Presto啦等等），你可以用类似BNF的范式来写Parser规则，当然也有手写的比如SparkSQL。AST会进一步包装成一个简单的基本查询信息对象，这个对象包含了一个查询基本的信息，比如基本语句的类型是SELECT还是INSERT，WHERE是什么，GROUP BY是什么，如果有子查询，还需要递归进去，这个东西大致来说就是所谓的逻辑计划。

TableScan(students)

-> Project(dept, avg(math_score * 1.2) + avg(eng_score * 0.8))

->TableSink

上面是无责任示意，具体到某个SQL引擎会略有不同，但是基本上都会这么干。如果你想找一个代码干净易懂的SQL引擎，可以参考Presto（可以算我读过的开源代码写的最漂亮的了）。

到上面为止，你已经把字符串转换成一个所谓的LogicalPlan，这个Plan距离可以求值来说还比较残疾。最基本来说，我还不知道dept是个啥吧，math_score是神马类型，AVG是个什么函数，这些都不明了。这样的LogicalPlan可以称为Unresolved（残疾的）Logical Plan。

缺少的是所谓的元数据信息，这里主要包含两部分：表的Schema和函数信息。表的Schema信息主要包含表的列定义（名字，类型），表的物理位置，格式，如何读取；函数信息是函数签名，类的位置等。

有了这些，SQL引擎需要再一次遍历刚才的残废计划，进行一次深入的解析。最重要的处理是列引用绑定和函数绑定。列引用绑定决定了一个表达式的类型。而有了类型你可以做函数绑定。函数绑定几乎是这里最关键的步骤，因为普通函数比如CAST，和聚合函数比如这里的AVG，分析函数比如Rank以及Table Function比如explode都会用完全不同的方式求值，他们会被改写成独立的计划节点，而不再是普通的Expression节点。除此之外，还需要进行深入的语义检测。比如GROUP BY是否囊括了所有的非聚合列，聚合函数是否内嵌了聚合函数，以及最基本的类型兼容检查，对于强类型的系统，类型不一致比如date = ‘2015-01-01’需要报错，对于弱类型的系统，你可以添加CAST来做Type（类型） Coerce（苟合）。

然后我们得到了一个尚未优化的逻辑计划：

TableScan(students=>dept:String, eng_score:double, math_score:double)

->Project(dept, math_score * 1.2:expr1, eng_score * 0.8:expr2)

->Aggregate(avg(expr1):expr3, avg(expr2):expr4, GROUP:dept)

->Project(dept, expr3+expr4:avg_result)

->TableSink(dept, avg_result->Client)

所以我们可以开始上肉戏了？还早呢。

刚才的计划，还差得很远，作为一个SQL引擎，没有优化怎么好见人？不管是SparkSQL还是Hive，都有一套优化器。大多数SQL on Hadoop引擎都有基于规则的优化，少数复杂的引擎比如Hive，拥有基于代价的优化。规则优化很容易实现，比如经典的谓词下推，可以把Join查询的过滤条件推送到子查询预先计算，这样JOIN时需要计算的数据就会减少（JOIN是最重的几个操作之一，能用越少的数据做JOIN就会越快），又比如一些求值优化，像去掉求值结果为常量的表达式等等。基于代价的优化就复杂多了，比如根据JOIN代价来调整JOIN顺序（最经典的场景），对SparkSQL来说，代价优化是最简单的根据表大小来选择JOIN策略（小表可以用广播分发），而没有JOIN顺序交换这些，而JOIN策略选择则是在随后要解释的物理执行计划生成阶段。

到这里，如果还没报错，那你就幸运滴得到了一个Resolved（不残废的）Logical Plan了。这个Plan，再配上表达式求值器，你也可以折腾折腾在单机对表查询求值了。但是，我们不是做分布式系统的么？数据分析妹子已经看完《琅琊榜》的片头了，你还在悠闲什么呢？

为了让妹子在看完电视剧之前算完几百G的数据，我们必须借助分布式的威力，毕竟单节点算的话够妹子看完整个琅琊榜剧集了。刚才生成的逻辑计划，之所以称为逻辑计划，是因为它只是逻辑上看起来似乎能执行了（误），实际上我们并不知道具体这个东西怎么对应Spark或者MapReduce任务。

逻辑执行计划接下来需要转换成具体可以在分布式情况下执行的物理计划，你还缺少：怎么和引擎对接，怎么做表达式求值两个部分。

表达式求值有两种基本策略，一个是解释执行，直接把之前带来的表达式进行解释执行，这个是Hive现在的模式；另一个是代码生成，包括SparkSQL，Impala，Drill等等号称新一代的引擎都是代码生成模式的（并且配合高速编译器）。不管是什么模式，你最终把表达式求值部分封装成了类。代码可能长得类似如下：

// math_score * 1.2val leftOp = row.get(1/* math_score column index */);

val result = if (leftOp == null) then null else leftOp * 1.2;

每个独立的SELECT项目都会生成这样一段表达式求值代码或者封装过的求值器。但是AVG怎么办？当初写wordcount的时候，我记得聚合计算需要分派在Map和Reduce两个阶段呀？这里就涉及到物理执行转换，涉及到分布式引擎的对接。

AVG这样的聚合计算，加上GROUP BY的指示，告诉了底层的分布式引擎你需要怎么做聚合。本质上来说AVG聚合需要拆分成Map阶段来计算累加，还有条目个数，以及Reduce阶段二次累加最后每个组做除法。

因此我们要算的AVG其实会进一步拆分成两个计划节点：Aggregates(Partial)和Aggregates（Final）。Partial部分是我们计算局部累加的部分，每个Mapper节点都将执行，然后底层引擎会做一个Shuffle，将相同Key（在这里是Dept）的行分发到相同的Reduce节点。这样经过最终聚合你才能拿到最后结果。

拆完聚合函数，如果只是上面案例给的一步SQL，那事情比较简单，如果还有多个子查询，那么你可能面临多次Shuffle，对于MapReduce来说，每次Shuffle你需要一个MapReduce Job来支撑，因为MapReduce模型中，只有通过Reduce阶段才能做Shuffle操作，而对于Spark来说，Shuffle可以随意摆放，不过你要根据Shuffle来拆分Stage。这样拆过之后，你得到一个多个MR Job串起来的DAG或者一个Spark多个Stage的DAG（有向无环图）。

还记得刚才的执行计划么？它最后变成了这样的物理执行计划：

TableScan->Project(dept, math_score * 1.2: expr1, eng_score * 0.8: expr2)

-> AggretatePartial(avg(expr1):avg1, avg(expr2):avg2, GROUP: dept)

-> ShuffleExchange(Row, KEY:dept)

-> AggregateFinal(avg1, avg2, GROUP:dept)

-> Project(dept, avg1 + avg2)

-> TableSink

这东西到底怎么在MR或者Spark中执行啊？对应Shuffle之前和之后，物理上它们将在不同批次的计算节点上执行。不管对应MapReduce引擎还是Spark，它们分别是Mapper和Reducer，中间隔了Shuffle。上面的计划，会由ShuffleExchange中间断开，分别发送到Mapper和Reducer中执行，当然除了上面的部分还有之前提到的求值类，也都会一起序列化发送。

实际在MapReduce模型中，你最终执行的是一个特殊的Mapper和特殊的Reducer，它们分别在初始化阶段载入被序列化的Plan和求值器信息，然后在map和reduce函数中依次对每个输入求值；而在Spark中，你生成的是一个一个RDD变换操作。

比如一个Project操作，对于MapReduce来说，伪代码大概是这样的：

void configuration() {

context = loadContext()

}void map(inputRow) {

outputRow = context.projectEvaluator (inputRow);

write(outputRow);

}

对于Spark，大概就是这样：

currentPlan.mapPartitions { iter => projection = loadContext()

iter.map { row => projection(row) } }

至此为止，引擎帮你愉快滴提交了Job，你的集群开始不紧不慢地计算了。

到这里为止，似乎看起来SparkSQL和Hive On MapReduce没有什么区别？其实SparkSQL快，并不快在引擎。

SparkSQL的引擎优化，并没有Hive复杂，毕竟人Hive多年积累，十多年下来也不是吃素的。但是Spark本身快呀。

Spark标榜自己比MapReduce快几倍几十倍，很多人以为这是因为Spark是“基于内存的计算引擎”，其实这不是真的。Spark还是要落磁盘的，Shuffle的过程需要也会将中间数据吐到本地磁盘上。所以说Spark是基于内存计算的说法，不考虑手动Cache的情景，是不正确的。

SparkSQL的快，根本不是刚才说的那一坨东西哪儿比Hive On MR快了，而是Spark引擎本身快了。

事实上，不管是SparkSQL，Impala还是Presto等等，这些标榜第二代的SQL On Hadoop引擎，都至少做了三个改进，消除了冗余的HDFS读写，冗余的MapReduce阶段，节省了JVM启动时间。

在MapReduce模型下，需要Shuffle的操作，就必须接入一个完整的MapReduce操作，而接入一个MR操作，就必须将前阶段的MR结果写入HDFS，并且在Map阶段重新读出来，这才是万恶之源。

事实上，如果只是上面的SQL查询，不管用MapReduce还是Spark，都不一定会有显著的差异，因为它只经过了一个shuffle阶段。

真正体现差异的，是这样的查询：

SELECT g1.name, g1.avg, g2.cntFROM (SELECT name, avg(id) AS avg FROM students GROUP BY name) g1JOIN (SELECT name, count(id) AS cnt FROM students GROUP BY name) g2ON (g1.name = g2.name)ORDER BY avg;

而他们所对应的MR任务和Spark任务分别是这样的：

一次HDFS中间数据写入，其实会因为Replication的常数扩张为三倍写入，而磁盘读写是非常耗时的。这才是Spark速度的主要来源。

另一个加速，来自于JVM重用。考虑一个上万Task的Hive任务，如果用MapReduce执行，每个Task都会启动一次JVM，而每次JVM启动时间可能就是几秒到十几秒，而一个短Task的计算本身可能也就是几秒到十几秒，当MR的Hive任务启动完成，Spark的任务已经计算结束了。对于短Task多的情形下，这是很大的节省。

云原生和“可移植性”到底意味着什么
虽然上云，拥抱云计算已经成为当今几乎所有企业的必走之路，但对于“在云原生环境中进行开发”和“依赖某些云供应商提供的，以平台为中心的工具”这两种做法，它们之间依然存在非常清晰的界限。所以你是否好奇，采用云原生方法到底能为业务带来哪些好处？该采用哪种云计算？在云中运行应用程序和工作负载，并不意味着就可以算得上一家云原生的公司。云原生应用程序应该可以在不同的云平台上运行，甚至可以通过混合模式在企业内部运
融云 IM 干货丨私有云IMKit支持哪些国家的语言？融云即时通讯im
私有云IMKit支持以下国家的语言：默认支持的语言简体中文(zh_CN)英语(en_US)阿拉伯语(ar)其他语言支持除了上述默认支持的语言外，IMKit还支持通过客户端单独适配其他语言。例如，可以通过以下步骤添加日语支持：创建Localizations：选择日语。创建Strings文件：命名必须和SDK的国际化文件一致，例如RongCloudKit。设置对应语言的文案：将IMKit内置的Rong
融云 IM 干货丨私有云IMKit的自定义功能有哪些创新点？融云im即时通讯
私有云IMKit的自定义功能具有多个创新点，以下是一些主要的创新点：1.跨平台支持IMKit支持在多个主流平台上集成使用，包括Android、iOS、Web等。这意味着开发者可以使用一套代码，创建适用于多个平台的应用，提高开发效率和应用的可移植性。2.易用易集成IMKit默认提供了会话列表、会话界面、输入界面、消息显示等封装好的组件，并且支持位置、动态表情、小视频等插件。应用开发者可直接集成使用，
融云 IM 干货丨私有云IMKit源码支持哪些自定义功能？融云即时通信im
私有云IMKit源码支持多种自定义功能，以下是一些主要的自定义功能：1.自定义输入区域自定义输入模式：可以自定义输入区域的模式，例如文本输入、语音输入等。自定义扩展区域（插件）：可以添加自定义的扩展区域，例如添加新的功能按钮或插件。自定义表情：可以自定义表情的显示和使用。2.自定义消息类型注册自定义消息：在建立IM连接之前，使用imkit实例的registerMessageType方法来注册自定义
低延迟更灵活，开发者怎能不爱分布式云
为了努力部署和管理复杂的数据密集型应用程序，从而满足客户不断变化的需求，我们需要一种方法让这些应用程序和工作负载更接近位于全球任意一个角落的客户。过去多年来，云计算满足了这种需求。不过这就够了吗？适合过去的东西，就一定适合将来吗？未必！根据重点关注开发者想法的研究公司SlashData的一项新研究，全球开发者正越来越多地将分布式云计算视为保障最佳客户体验的方法。根据Akamai的委托，这项名为“开
华为云开天 aPaaS 平台的流使用体验
Python中的class体内定义方法时，如果没有显式地包含self参数，有时候依然可以被调用。这是一个非常有趣的话题，因为它涉及到对Python中类与对象之间关系的更深理解。要理解为什么这种情况下方法依然能够被调用，我们需要逐步拆解Python类的构造方式以及方法绑定的原理。
海康/大华/宇视等网络摄像头云台控制功能探测方法解析摄像头开发rtsp流媒体
熟悉我们的小伙伴都知道，当我们的RTSP/Onvif流媒体服务器与摄像头可以进行网络连接时，通过RTSP/Onvif流媒体服务器自带的Onvif探测即可实现Onvif摄像头的设备IP探测，成功后返回需要的流地址，实现摄像头的PTZ云台控制，PTZ控制包含转动、变焦等。但是我们经常会遇到有用户反馈，第一、不知道自己的摄像头是否支持Onvif协议；第二、自己探测显示支持Onvif协议，但是通过Onvi
JavaWeb 开发入门：从基础到应用大梦百万秋知识学爆 java
JavaWeb是基于Java技术构建的Web应用开发体系。得益于Java的跨平台性和强大的生态系统，JavaWeb长期以来一直是企业级开发的首选方案之一。本篇博客将从JavaWeb的基本概念、核心技术到实际项目开发，带你全面了解如何利用JavaWeb构建一个动态网站。什么是JavaWeb？JavaWeb是使用Java技术开发Web应用程序的总称，通常包括动态网页、交互式功能和后端逻辑。它支持开发以
云原生前端开发：打造现代化高性能的用户体验大梦百万秋知识学爆状态模式
引言：前端开发的新风向在过去的几年中，前端开发领域经历了快速的演变，从早期的静态网页到如今复杂的单页应用（SPA），再到微前端架构和渐进式Web应用（PWA），前端技术一直处于技术变革的中心。而随着云原生的理念在后端开发中逐渐成熟，前端开发也迎来了新的机遇和挑战。云原生前端开发意味着应用的架构设计和开发方式需要更加注重现代化的开发工具链、灵活性、性能优化和可扩展性。本文将从技术角度讨论如何运用云原
NPM：切换国内镜像源 Monly21 JS npm 前端 node.js
一、查看现在的镜像源通常默认官方源是https://registry.npmjs.orgnpmconfiggetregistry二、切换镜像源//切换淘宝源npmconfigsetregistryhttps://registry.npm.taobao.org//切换腾讯源npmconfigsetregistryhttp://mirrors.cloud.tencent.com/npm///切换阿里云
Flask 和阿里云 OSS 实现文件上传功能 ivwdcwso 开发 flask 阿里云 python oss
在本教程中,我们将学习如何使用Flask框架和阿里云对象存储服务(OSS)来创建一个简单而强大的文件上传应用。这个应用将允许用户通过Web界面上传文件,然后将文件安全地存储到阿里云OSS中,并返回可访问的文件URL。准备工作在开始之前,请确保您已经完成以下准备工作:安装Python(推荐Python3.7+)安装Flask:pipinstallflask安装阿里云OSSSDK:pipinstall
处理没有提示的字符串、计算相隔天数应用题 malloc-free 算法 c语言
正常情况下，小云每天跑1千米。如果某天是周一或者月初（1日），为了激励自己，小云要跑2千米。如果同时是周一或月初，小云也是跑2千米。小云跑步已经坚持了很长时间，从1990年1月1日周一（含）到2022年2月20日周日（含）。请问某一天小云总共跑步多少千米？输入格式:有多组数据，每行为三个正整数，且不超过小云跑步日期的范围。输出格式:对每一组输入，在一行中输出小云总共跑步多少千米。输入样例:2020
FFA 2024 「流批一体」专场：探索在不同场景的流批一体 Apache Flink
FlinkForwardAsia2024即将盛大开幕！作为ApacheFlink社区备受期待的年度盛会之一，本届大会将于11月29至30日在上海隆重举行。FlinkForwardAsia（简称FFA）是由Apache官方授权的社区技术大会，旨在汇聚领先的行业实践与技术动态。在众多合作伙伴和技术开发者的支持下，FFA已成功举办六届。适逢ApacheFlink诞生10周年，今年的FFA将与广大开发者分
python微博关键词爬虫嵌入式开发项目 2025年爬虫精通专栏 python 爬虫开发语言媒体
目录记一次阿里云盾滑块验证分析并通过操作环境数据接口proxy配置根据关键词获取userid根据userid获取信息数据保存数据：记一次阿里云盾滑块验证分析并通过操作环境win10、macPython3.9数据接口搜索https://**********?containerid=100103type%3D{chanenl}%26q%3D{quote(self.words)}&page_type=s
基于区块链的云上数据访问控制模型研究 XLYcmy 论文阅读阅读笔记网络安全论文阅读论文笔记区块链访问控制云数据
论⽂选择理由:汉语论⽂,对于新⼿⼊⼿阅读相对容易之前,进⾏过区块链⽅⾯的研究，有⼀定基础⽅便理解论⽂通读情况:①基本掌握论⽂所提出背景和要解决的问题②⼤致理解论⽂所提出的⽅案和优势收获:⼤致梳理出⼀篇做的架构:(我的理解)背景→现有⽅案不⾜→预备免识→提出⽅案→⽅案核⼼设计与算法→与其他⽅案对比→设计实验环境与实验指标进⾏⽅案验证→总结与展望
【MySQL】Mysql数据库导入导出sql文件、备份数据库、迁移数据库程序员洲洲数据库数据库 mysql 导入导出sql sql文件备份迁移
本文摘要：本文提出了xxx的实用开发小技巧。作者介绍：我是程序员洲洲，一个热爱写作的非著名程序员。CSDN全栈优质领域创作者、华为云博客社区云享专家、阿里云博客社区专家博主。同时欢迎大家关注其他专栏，我将分享Web前后端开发、人工智能、机器学习、深度学习从0到1系列文章。同时洲洲已经建立了程序员技术交流群，如果您感兴趣，可以私信我加入我的社群，也可以直接vx联系（文末有名片）v：bdizztt随时
Sealos 将计算节点加入 kubeadm 安装的 Kubernetes 集群 ivwdcwso 运维 kubernetes 容器云原生 k8s sealos
引言Kubernetes是云原生应用的核心平台，而kubeadm是官方推荐的Kubernetes集群部署工具。然而，随着集群规模的扩大，手动管理节点变得越来越复杂。Sealos作为一款以Kubernetes为内核的云操作系统，提供了简单高效的节点管理功能，能够轻松地将计算节点加入到现有的Kubernetes集群中。本文将详细介绍如何在使用kubeadm安装主节点的基础上，使用Sealos将计算节点
Java全栈项目 - 农产品溯源管理系统开发实践天天进步2015 Java项目实战 java 开发语言
一、项目介绍农产品溯源管理系统是一个基于Java全栈技术开发的现代化信息系统，旨在实现农产品从种植、生产到销售的全过程追踪管理。本系统帮助提高农产品质量安全监管效率，保障食品安全。二、技术架构后端技术栈：SpringBoot2.5.xSpringSecurityMyBatisPlusMySQL8.0RedisJWT认证前端技术栈：Vue.js3.0ElementPlusAxiosEchartsVu
舵机SG90详解
舵机，也叫伺服电机，在嵌入式开发中，舵机作为一种常见的运动控制组件，具有广泛的应用。其中，SG90舵机以其高效、稳定的性能特点，成为了许多工程师和爱好者的首选，无论是航模、云台、机器人、智能小车中都有它的身影。本文将深入探讨SG90舵机的技术规格、工作原理和使用方法，为您展现SG90舵机的功能和无限可能。1.源码下载及前置阅读本文首发良许嵌入式网：https://www.lxlinux.net/e
项目管理工具 project 替代：2024年8大主流选择
文章将介绍以下8款项目管理工具：1.Worktile；2.PingCode；3.云之家；4.奕锐斯；5.奥博思；6.Monday.com；7.Asana；8.Basecamp。本文整理了2024年8大主流项目管理工具，将详细介绍这些工具的特点以及它们为何能成为市场的热门选择，帮企业找到最符合需求的项目管理工具，轻松掌控项目进度，提升团队协作和产出。一、2024年8大主流项目管理工具1.Workti
Java在云计算中的应用：Java的秘密云基地五行星辰偷偷的学Java java 云计算开发语言
Java在云计算领域的应用非常广泛，它以其跨平台性、强大的生态系统和安全性成为了构建云服务的重要工具。以下是Java在云计算中的一些关键应用和优势：1.微服务架构Java特别是SpringBoot框架，为开发微服务提供了强大支持。通过微服务架构，Java应用可以轻松创建独立、自包含的服务，这些服务可以被部署在云环境中，实现快速扩展和灵活管理。实践案例分析：基于Java的微服务电商平台：使用Spri
Centos7挂载LVM卷 centoslvm
1.背景给单位的云主机上安装一块云硬盘，容量是1T，由于该云主机需要存放大量数据，为了保证将来硬盘具有可扩展性，决定使用LVM来管理硬盘。2.硬盘分区查找到硬盘，然后添加分区fdisk/dev/vdbn--添加新分区p--查看分区t--修改分区的type为lvm15--15表示的是lvm，如果是16禁止的，则为8ew--保存分区结果3.查看分区结果lsblk可以看到产生了/dev/vdb1这个分区
小团队docker hub被墙的终极方案：基于docker打造本地docker仓库镜像
docker被墙了，docker又可以了...，经历了几次被折腾了，我决定彻底在团队内部解决这一问题。在使用该方案前，配置过代理，也设置过阿里云的仓库源，但效果都不太理想，最终打造了内部的仓库镜像，完美的解决团队在拉取docker镜像时遇到的问题。前提预实现当前功能，需要满足以下前提：有可用的代理有个docker环境的主机基础实现在这直接给docker-compose.yml文件：services
云手机：虚拟技术的革命性应用与实体手机的优劣对比云云321 智能手机服务器矩阵线性代数安全
在近年来，随着互联网的火速发展，云手机作为一种新兴的技术产品，在游戏行业特别是手游市场中掀起了一股热潮。云手机，顾名思义，是架设在ARM虚拟服务器上的手机，其独特的虚拟技术为用户带来了前所未有的使用体验。那么，云手机与实体手机相比，究竟有哪些优劣呢？让我们来一探究竟。云手机的优势应用不占本地内存实体手机中，应用的安装和运行都会占用手机的内存空间。随着用户下载的应用越来越多，内存空间往往会变得捉襟见
亚矩阵云手机:搭建TikTok视频矩阵的高效解决方案云云321 矩阵智能手机线性代数
随着TikTok在全球范围内的快速崛起，越来越多的企业和个人创作者开始重视这一平台的推广营销潜力。TikTok视频作为一种有效的营销策略，通过多个账号的矩阵协同运营，能够显著提升品牌影响力和内容传播效果。而亚矩阵云手机，作为一种创新的云手机技术解决方案，为TikTok视频矩阵的搭建提供了强大的支持。TikTok视频矩阵概述TikTok视频矩阵是指通过创建和管理多个TikTok账号，形成一个相互协同
云手机能用来干什么？云手机在跨境电商领域的用途云云321 智能手机线性代数安全服务器矩阵
近年来，随着云手机的兴起，云技术越来越多的应用在我们工作和生活当中。云手机是一种在云端运行的手机，所有的运算和存储都在服务器上完成，用户端只是起到输入和输出的作用。作为一种全新的技术，它具体有哪些应用场景呢？作为跨境电商领域的从业者，我们能用亚矩阵云手机做什么呢？亚矩阵云手机是海外市场营销的好工具对跨境电商来说最大的困境是没有流量，怎么样增加产品的曝光，让全球60亿人看到我们的产品是每个外贸企业都
2025年01月19日Github流行趋势油泼辣子多加 GitHub每日趋势 github
项目名称：MiniCPM-o项目地址url：https://github.com/OpenBMB/MiniCPM-o项目语言：Python历史star数：15826今日star数：959项目维护者：yiranyyu,iceflame89,yaoyuanTHU,LDLINGLINGLING,tc-mb项目简介：MiniCPM-o2.6:一个适用于视觉、语音和多模态直播的GPT-4o级别模型，可在手机
golang学习笔记08——如何调用阿里oss sdk实现访问对象存储？ GoppViper golang学习笔记 golang 学习笔记阿里云对象存储后端
推荐学习文档golang应用级os框架，欢迎stargolang应用级os框架使用案例，欢迎star案例：基于golang开发的一款超有个性的旅游计划app经历golang实战大纲golang优秀开发常用开源库汇总想学习更多golang知识，这里有免费的golang学习笔记专栏首先确保安装了阿里云OSS的GoSDK：goget-ugithub.com/aliyun/aliyun-oss-go-sd
足球直播站源码怎么搭建 sanx18 1024程序员节阿里云腾讯云开发语言 java
搭建一个足球直播站涉及到多个步骤，包括获取源码、准备开发环境、部署配置、自定义内容和样式、测试优化以及上线运营。以下是搭建足球直播站的大致流程：1.获取体育直播源码：你可以从“ggscore”获取体育直播源码，这些源码通常包含赛事直播、社区论坛、竞猜比分、新闻头条、微短视频、赛事情报、赛程表、赛事资料库、即时聊天等基础模块。开发语言可能包括PHP、VUE、安卓JAVA、苹果OC等。2.准备开发环境
Centos7.9 离线安装docker 有谁看见我的剑了？ docker docker 容器运维
实验环境：[root@192~]#cat/etc/system-releaseCentOSLinuxrelease7.9.2009(Core)下载二进制压缩包a.官网下载地址：https://download.docker.com/linux/static/stable/x86_64/b.阿里云下载地址https://mirrors.aliyun.com/docker-ce/linux/stati
jsonp 常用util方法 hw1287789687 jsonp jsonp常用方法 jsonp callback
jsonp 常用java方法 (1)以jsonp的形式返回:函数名(json字符串) /*** * 用于jsonp调用 * @param map : 用于构造json数据 * @param callback : 回调的javascript方法名 * @param filters : <code>SimpleBeanPropertyFilter theFilt
多线程场景 alafqq 多线程
0 能不能简单描述一下你在java web开发中需要用到多线程编程的场景？0 对多线程有些了解，但是不太清楚具体的应用场景，能简单说一下你遇到的多线程编程的场景吗？ Java多线程 2012年11月23日 15:41 Young9007 Young9007 4 0 0 4 Comment添加评论关注(2) 3个答案按时间排序按投票排序 0 0 最典型的如： 1、
Maven学习——修改Maven的本地仓库路径 Kai_Ge maven
安装Maven后我们会在用户目录下发现.m2 文件夹。默认情况下，该文件夹下放置了Maven本地仓库.m2/repository。所有的Maven构件(artifact)都被存储到该仓库中，以方便重用。但是windows用户的操作系统都安装在C盘，把Maven仓库放到C盘是很危险的，为此我们需要修改Maven的本地仓库路径。
placeholder的浏览器兼容 120153216 placeholder
【前言】自从html5引入placeholder后，问题就来了，不支持html5的浏览器也先有这样的效果，各种兼容，之前考虑，今天测试人员逮住不放，想了个解决办法，看样子还行，记录一下。【原理】不使用placeholder，而是模拟placeholder的效果，大概就是用focus和focusout效果。【代码】 <scrip
debian_用iso文件创建本地apt源 2002wmj Debian
1.将N个debian-506-amd64-DVD-N.iso存放于本地或其他媒介内，本例是放在本机/iso/目录下 2.创建N个挂载点目录如下： debian:~#mkdir –r /media/dvd1 debian:~#mkdir –r /media/dvd2 debian:~#mkdir –r /media/dvd3 …. debian:~#mkdir –r /media
SQLSERVER耗时最长的SQL 357029540 SQL Server
对于DBA来说，经常要知道存储过程的某些信息： 1. 执行了多少次 2. 执行的执行计划如何 3. 执行的平均读写如何 4. 执行平均需要多少时间列名 &
com/genuitec/eclipse/j2eedt/core/J2EEProjectUtil 7454103 eclipse
今天eclipse突然报了com/genuitec/eclipse/j2eedt/core/J2EEProjectUtil 错误，并且工程文件打不开了，在网上找了一下资料，然后按照方法操作了一遍，好了，解决方法如下：错误提示信息： An error has occurred.See error log for more details. Reason: com/genuitec/
用正则删除文本中的html标签 adminjun java html 正则表达式去掉html标签
使用文本编辑器录入文章存入数据中的文本是HTML标签格式，由于业务需要对HTML标签进行去除只保留纯净的文本内容，于是乎Java实现自动过滤。如下： public static String Html2Text(String inputString) { String htmlStr = inputString; // 含html标签的字符串 String textSt
嵌入式系统设计中常用总线和接口 aijuans linux 基础
嵌入式系统设计中常用总线和接口任何一个微处理器都要与一定数量的部件和外围设备连接，但如果将各部件和每一种外围设备都分别用一组线路与CPU直接连接，那么连线
Java函数调用方式——按值传递 ayaoxinchao java 按值传递对象基础数据类型
Java使用按值传递的函数调用方式，这往往使我感到迷惑。因为在基础数据类型和对象的传递上，我就会纠结于到底是按值传递，还是按引用传递。其实经过学习，Java在任何地方，都一直发挥着按值传递的本色。首先，让我们看一看基础数据类型是如何按值传递的。 public static void main(String[] args) { int a = 2;
ios音量线性下降 bewithme ios音量
直接上代码吧 //second 几秒内下降为0 - (void)reduceVolume:(int)second { KGVoicePlayer *player = [KGVoicePlayer defaultPlayer]; if (!_flag) { _tempVolume = player.volume;
与其怨它不如爱它 bijian1013 选择理想职业规划
抱怨工作是年轻人的常态，但爱工作才是积极的心态，与其怨它不如爱它。一般来说，在公司干了一两年后，不少年轻人容易产生怨言，除了具体的埋怨公司“扭门”，埋怨上司无能以外，也有许多人是因为根本不爱自已的那份工作，工作完全成了谋生的手段，跟自已的性格、专业、爱好都相差甚远。
一边时间不够用一边浪费时间 bingyingao 工作时间浪费
一方面感觉时间严重不够用，另一方面又在不停的浪费时间。每一个周末，晚上熬夜看电影到凌晨一点，早上起不来一直睡到10点钟，10点钟起床，吃饭后玩手机到下午一点。精神还是很差，下午像一直野鬼在城市里晃荡。为何不尝试晚上10点钟就睡，早上7点就起，时间完全是一样的，把看电影的时间换到早上，精神好，气色好，一天好状态。控制让自己周末早睡早起，你就成功了一半。有多少个工作
【Scala八】Scala核心二：隐式转换 bit1129 scala
Implicits work like this: if you call a method on a Scala object, and the Scala compiler does not see a definition for that method in the class definition for that object, the compiler will try to con
sudoku slover in Haskell (2) bookjovi haskell sudoku
继续精简haskell版的sudoku程序，稍微改了一下，这次用了8行，同时性能也提高了很多，对每个空格的所有解不是通过尝试算出来的，而是直接得出。 board = [0,3,4,1,7,0,5,0,0, 0,6,0,0,0,8,3,0,1, 7,0,0,3,0,0,0,0,6, 5,0,0,6,4,0,8,0,7,
Java-Collections Framework学习与总结-HashSet和LinkedHashSet BrokenDreams linkedhashset
本篇总结一下两个常用的集合类HashSet和LinkedHashSet。它们都实现了相同接口java.util.Set。Set表示一种元素无序且不可重复的集合；之前总结过的java.util.List表示一种元素可重复且有序
读《研磨设计模式》-代码笔记-备忘录模式-Memento bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.ArrayList; import java.util.List; /* * 备忘录模式的功能是，在不破坏封装性的前提下，捕获一个对象的内部状态，并在对象之外保存这个状态，为以后的状态恢复作“备忘”
《RAW格式照片处理专业技法》笔记 cherishLC PS
注意，这不是教程！仅记录楼主之前不太了解的一、色彩（空间）管理作者建议采用ProRGB（色域最广），但camera raw中设为ProRGB，而PS中则在ProRGB的基础上，将gamma值设为了1.8（更符合人眼）注意：bridge、camera raw怎么设置显示、输出的颜色都是正确的（会读取文件内的颜色配置文件），但用PS输出jpg文件时，必须先用Edit->conv
使用 Git 下载 Spring 源码编译 for Eclipse crabdave eclipse
使用 Git 下载 Spring 源码编译 for Eclipse 1、安装gradle，下载 http://www.gradle.org/downloads 配置环境变量GRADLE_HOME，配置PATH %GRADLE_HOME%/bin，cmd，gradle -v 2、spring4 用jdk8 下载 https://jdk8.java.
mysql连接拒绝问题 daizj mysql 登录权限
mysql中在其它机器连接mysql服务器时报错问题汇总一、[running][email protected]:~$mysql -uroot -h 192.168.9.108 -p //带-p参数，在下一步进行密码输入 Enter password: //无字符串输入 ERROR 1045 (28000): Access
Google Chrome 为何打压 H.264 dsjt apple html5 chrome Google
Google 今天在 Chromium 官方博客宣布由于 H.264 编解码器并非开放标准，Chrome 将在几个月后正式停止对 H.264 视频解码的支持，全面采用开放的 WebM 和 Theora 格式。 Google 在博客上表示，自从 WebM 视频编解码器推出以后，在性能、厂商支持以及独立性方面已经取得了很大的进步，为了与 Chromium 现有支持的編解码器保持一致，Chrome
yii 获取控制器名和方法名 dcj3sjt126com yii framework
1. 获取控制器名在控制器中获取控制器名: $name = $this->getId(); 在视图中获取控制器名: $name = Yii::app()->controller->id; 2. 获取动作名在控制器beforeAction()回调函数中获取动作名: $name =
Android知识总结（二） come_for_dream android
明天要考试了，速速总结如下 1、Activity的启动模式 standard：每次调用Activity的时候都创建一个（可以有多个相同的实例，也允许多个相同Activity叠加。） singleTop：可以有多个实例，但是不允许多个相同Activity叠加。即，如果Ac
高洛峰收徒第二期：寻找未来的“技术大牛” ——折腾一年，奖励20万元 gcq511120594 工作项目管理
高洛峰，兄弟连IT教育合伙人、猿代码创始人、PHP培训第一人、《细说PHP》作者、软件开发工程师、《IT峰播》主创人、PHP讲师的鼻祖！首期现在的进程刚刚过半，徒弟们真的很棒，人品都没的说，团结互助，学习刻苦，工作认真积极，灵活上进。我几乎会把他们全部留下来，现在已有一多半安排了实际的工作，并取得了很好的成绩。等他们出徒之日，凭他们的能力一定能够拿到高薪，而且我还承诺过一个徒弟，当他拿到大学毕
linux expect heipark expect
1. 创建、编辑文件go.sh #!/usr/bin/expect spawn sudo su admin expect "*password*" { send "13456\r\n" } interact 2. 设置权限 chmod u+x go.sh 3.
Spring4.1新特性——静态资源处理增强 jinnianshilongnian spring 4.1
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
idea ubuntuxia 乱码 liyonghui160com
1.首先需要在windows字体目录下或者其它地方找到simsun.ttf 这个字体文件。 2.在ubuntu 下可以执行下面操作安装该字体： sudo mkdir /usr/share/fonts/truetype/simsun sudo cp simsun.ttf /usr/share/fonts/truetype/simsun fc-cache -f -v
改良程序的11技巧 pda158 技巧
有很多理由都能说明为什么我们应该写出清晰、可读性好的程序。最重要的一点，程序你只写一次，但以后会无数次的阅读。当你第二天回头来看你的代码时，你就要开始阅读它了。当你把代码拿给其他人看时，他必须阅读你的代码。因此，在编写时多花一点时间，你会在阅读它时节省大量的时间。让我们看一些基本的编程技巧：尽量保持方法简短永远永远不要把同一个变量用于多个不同的
300个涵盖IT各方面的免费资源（下）——工作与学习篇 shoothao 创业免费资源学习课程远程工作
工作与生产效率: A. 背景声音 Noisli:背景噪音与颜色生成器。 Noizio:环境声均衡器。 Defonic:世界上任何的声响都可混合成美丽的旋律。 Designers.mx:设计者为设计者所准备的播放列表。 Coffitivity:这里的声音就像咖啡馆里放的一样。 B. 避免注意力分散 Self Co
深入浅出RPC uule rpc
深入浅出RPC-浅出篇深入浅出RPC-深入篇 RPC Remote Procedure Call Protocol 远程过程调用协议它是一种通过网络从远程计算机程序上请求服务，而不需要了解底层网络技术的协议。RPC协议假定某些传输协议的存在，如TCP或UDP，为通信程序之间携带信息数据。在OSI网络通信模型中，RPC跨越了传输层和应用层。RPC使得开发

网易视频云技术分享：一个SparkSQL的作业的一生

你可能感兴趣的:(技术开发,视频云,网易视频云,云直播)