google borg

原文: http://pipul.org/2015/05/large-scale-cluster-management-at-google-with-borg/

google集群操作系统borg

1. Introduction

google服务器集群的管理系统，类似于百度的Matrix，阿里的fuxi，腾讯的台风平台等等，还有开源的mesos

Borg provides three main benefits: it

hides the details of resource management and failure handling so its users can focus on application development instead;
operates with very high reliability and availability, and supports applications that do the same; and
lets us run workloads across tens of thousands of machines effectively.

2. The user perspective

borg主要面向于系统管理员和google开发者，这些用户在borg上面运行他们的服务和应用程序，用户以job的形式提交任务，每个job包含一个或者多个tasks，每个job运行在一个cell里，cell是机器的集合，可以理解为是一个逻辑的IDC

2.1 The workload

borg上运行的服务通常可以分为两类：

prod：long-running服务，几乎不停机，时延敏感，例如gmail，google docs，google搜索等等，另外还有一些google内部的基础架构平台，例如bigtable，GFS
non-prod：batch型任务，时延不敏感，通常几小时或者几天即可跑完

这两种不通类型的任务在borg的cell里通常是混部的，同时又需要结合不同类型任务的特点，以及IDC属性，等等做出不同的调度策略。例如end-user-facing服务利用率通常都会有一个固定的模式，白天的时候利用率很高，晚上机器又很闲，深夜可能几乎没什么访问量等等，另外Batch型任务执行时间段，一般上来跑个几分钟，几小时就完成任务了。等等。

borg最主要的目的，就是要提高机器的利用率。

在google内部，很多应用程序框架都是构建在borg之上的，例如mapreduce系统，FlumeJava，Millwheel，Pregel，还有google的分布式存储服务，例如GFS，Bigtable，Megastore。像mapreduce，flumejava这种服务，master和他们的job都是跑在borg上的，这里的master和job区别于borg里的master和job

In a representative cell, prod jobs are allocated about 70% of the total CPU resources and represent about 60% of the total CPU usage; they are allocated about 55% of the total memory and represent about 85% of the total memory usage.

2.2 Clusters and cells

数据中心 > 集群 > cell

A cluster usually hosts one large cell and may have a few smaller-scale test or special-purpose cells. We assiduously avoid any single point of failure. 中等规模的cell大约10k台服务器左右，不包括测试cell，我的理解这些smaller-scale test cell的主要作用是小流量专用？每个机器上可供调度的资源类型包括：cpu，内存，网络，磁盘，甚至是处理器性能，类型，以及ssd，ip地址等等（我的理解，对于某些类型的服务，是需要固定IP，而不允许随意调度，例如存储系统）。

用户在提交job的时候申请资源，然后borg将它们调度到某机器上执行，监控他们的状态，如果有必要在job的状态failed后重启它们

2.3 Jobs and tasks

job的属性包括：名称，owner，tasks，同时还包括一些调度的约束条件，例如处理器架构，os版本，ip地址等等，这些会影响borg-master调度的结果，当然这些条件不一定是强制约束的，分hard和soft两种。

一个job只能跑在一个cell里，每个job会有N个task，每个task运行期间会有多个进程，google并没有使用虚拟机的方式来进行task之间的资源隔离，而是使用轻量级的容器技术cgroup。

task也有自己的属性：资源需求和一个index，大部分时候一个job里的所有task的资源需求都是一样的。

Users operate on jobs by issuing remote procedure calls (RPCs) to Borg, most commonly from a command-line tool, other Borg jobs, or our monitoring systems

job是通过一个google自己实现的BCL语言来描述的，用户可以通过update的方式来更新job的描述文件，基于过程状态机：

update过程是轻量的，非原子的，而且也是有可能会失败的，Updates are generally done in a rolling fashion, and a limit can be imposed on the number of task disruptions (reschedules or preemptions) an update causes; any changes that would cause more disruptions are skipped

2.4 Allocs

alloc的本质上就是现在的容器，用来运行一个或者多个task，是task的运行环境，是一组资源的描述。只要是alloc里的资源，不管有没有使用，都是已经分配了的（不允许给Batch类型的任务使用）。不过google也提到这个alloc是可以并发使用，也可以是重复利用的，并发的意思是说多个task可以同时跑在一个alloc里，重复利用的意思是说一个task跑完了可以继续分配给另外一个task使用。

并发使用可以举个例子：有两个Job，一个job是web server实例，另一个job是相关的一些task，例如日志收集等等，这两个job的task可以同时跑在一个alloc里，这样日志收集模块可以将web server的日志从local disk传输到分布式文件系统里。

通常一个task会关联一个alloc，一个job会关联一个alloc set

2.5 Priority, quota, and admission control

每个task都会有一个优先级，高优先级的task可以抢占低优先级的task的资源，优先级是一个正整数，borg里将这些优先级分成4类：monitoring, production, batch, and best eort

如果一个task被抢占了，通常会调度到别的机器上继续运行（同一个cell），we disallow tasks in the production priority band to preempt one another （单指production级别的还是平级的job都不能相互抢占？）

优先级确定是否抢占，quota决定是否可以调度，quota表示所需要的资源，例如cpu，内存，网络带宽，磁盘配额等等

高优先级的task通常会比低优先级的task需要更多的quota，用户申请资源的时候建议申请的比实际的资源占用高一些，以确保task不会因为超发而被kill掉，特别是内存。另外，多申请些资源也可以应对流量突发的情况。

优先级0可以有无穷大的quota，但通常会因为资源不足处于PENDING状态而得不到调度

2.6 Naming and monitoring

仅仅创建和调度task运行是不够的，从服务的角度来说，还需要有一个服务自动发现的机制，调度需要对用户透明，做到用户无感知。borg的Borg name service（BNS）就是为了解决这个问题的。

borg为每个task创建一个BNS名字：cell名 + job名 + task索引，BNS名字和task的hostname + port会被持久化到chubby上，通过DNS解析，用户凭BNS名字就能找到task，另外，Job的task数量和每个task的健康状态也会更新到chubby上，这么做的目的主要是为了服务（这里的服务是指job本身，可能是个web server，也可能是个分布式存储系统等等）的高可用，对用户请求做负载均衡。

每个task都会有一个内置的http服务，暴漏一些task的健康信息和各种性能指标，例如rpc时延等等。borg通过监控某个特定的url来决定task是否正常，如果不正常，比如http返回错误码等，就重启task。

google还有一个叫sigma的系统，用户通过web界面就可以直观的观察到用户自己所有的job，cell状态，甚至是task的健康信息，资源利用率，日志，状态变更历史等等。日志是rotated的，避免打飞磁盘，另外，为了调试方便，即使task运行结束后，log也会保留一段时间。

If a job is not running Borg provides a “why pending?” annotation, together with guidance on how to modify the job’s resource requests to better fit the cell. We publish guidelines for “conforming” resource shapes that are likely to schedule easily.

3. Borg architecture

每个cell，包含一个控制器，borgmaster，同时cell里的每个机器，都运行着一个叫borglet的agent程序，不管是master和agent，都是用c++写的

3.1 Borgmaster

每个master包含两个进程，一个主进程，一个调度进程，主进程处理用户请求，例如创建job，查询job等等，It also manages state machines for all of the objects in the system (machines, tasks, allocs, etc.), communicates with the Borglets, and offers a web UI as a backup to Sigma.

master有5个副本，每个副本维护一份整个cell状态的内存拷贝，并持久化到一个 highly-available, distributed, Paxos-based store 的本地磁盘上。通过paxos选出一个leader，负责处理cell状态变更的所有请求，例如用户提交一个job，停止一个job等。如果leader宕机之后，chubby会选举出另外一个leader来提供服务，整个过程大概需要10s左右，如果cell规模很大，这个时间可能会持续到1分钟。

master会定期checkpoint，snapshot + change log，这样可以将borgmaster恢复到以往任意的一个时间点，fixing it by hand in extremis; building a persistent log of events for future queries; and offline simulations.

TODO: Fauxmaster

3.2 Scheduling

当用户提交一个job时，borgmaster会将job的元数据存储到一个基于paxos的存储系统里，同时将job的task放到pending队列，如上面我们提到的master架构，这个队列会被另外一个调度器进程定期异步地扫描，调度器进程一旦发现某个机器能够满足task的运行条件（例如资源是否足够，是否符合某些特定约束，处理器架构，内核版本等等），就将task调度到改机器上运行（注意：调度器调度的对象是task而不是job）

The scan proceeds from high to low priority, modulated by a round-robin scheme within a priority to ensure fairness across users and avoid head-of-line blocking behind a large job.

调度算法包括两部分：

feasibility checking: to find machines on which the task could run,
scoring: which picks one of the feasible machines.

在feasibility checking阶段，调度器检查机器是否满足job的约束条件以及是否有足够的可用资源（包括已经分配给低优先级job的资源，这些资源是可以被抢占的）。这里可用资源的定义是：

如果task的优先级是prod的，那么机器的可用资源需要减去task的limit
如果task的优先级是non-prod的，那么机器上的可用资源只需要减去task已使用资源

在scoring阶段，对机器进行打分，挑选出最合适的一个机器运行task，打分机制：

主要是根据borg内置的各种优化指标给候选调度结果打分，如最小化被抢占的Task数，尽量选择已经下载了相同package的机器，降低硬件故障会影响的Task数，高低优先级混部等
也支持用户直接传入的一些偏好设置

打分模型主要有两种：

E-PVM，通过多个维度计算出一个单一的指标，但是实际操作上，E-PVM算法经常会将task打散到不同的机器上，这样的好处是让机器保留一点资源以应对峰值负载，坏处是资源碎片太多，会导致某些大型的task调度不上来。所以这种算法也叫worst fit
和worst fit对立的是best fit，就是尽可能的将task紧凑地调度到一个机器上，好处是减少资源碎片，有利于大型作业的调度，坏处是对Batch型任务不友好，而且无法应对任务的峰值负载

borg目前使用的是介于worst fit和best fit之间的一个变种：hybrid，尽可能的减少闲置资源。

如果打分后选择出来的机器可用资源不足，那么抢占就会发生，低优先级的作业首先会被踢掉，直到有足够的空闲资源为止。被抢占的作业重新回到borgmaster的PENDING队列里等待迁移（如果得不到资源也有饿死的可能）。

由于大部分包都是不会被修改的，所以borg在调度的时候还有一些优化的策略，为了减少每次部署时下载包的时间（平均25s左右），borg在调度时会优先选择那些已经存在这个包的机器。（由于包很少被修改的特性，包是可以被cache的）

3.3 Borglet

borglet是borg运行在单机上的agent程序，borglet的职责如下：

启/停任务
如果任务失败，负责任务重启
任务之间的资源隔离，主要通过修改内核参数来实现，例如cgroup等等
日志
监控&报告任务状态

borgmaster会定期轮询所有的borglet，收集处理所有任务的运行状态。master连agent的好处是有利于master控制负载，也有大部分分布式系统是agent去连master的，好处是master的异常处理逻辑相对简单。

前面我们提到master是多副本的，leader负责向agent发送心跳，并根据agent的返回结果更新master的状态，为了提高性能，心跳的内容可能会被压缩，只传输diff。另外，如果一个borglet长期不响应master的心跳，则master会认为该机器已经宕机，并且这机器上的所有task都会被重新调度。如果borglet突然恢复，则master会让该机器kill掉所有的task。

master宕机并不影响borglet以及正在运行的task，另外，borglet进程挂了也是不影响正在运行的task的。

3.4 Scalability

在google里，平均每个borgmaster需要管理数千台机器（前面我们提过，一个中等规模的cell大约是1w台服务器左右），有些cell每分钟提交的任务数就超过1w个，一个繁忙的borgmaster甚至可以用到10-14核，超过50G的内存。那么google如何解决集群规模不断扩展带来的可扩展性问题呢？

早期的borgmaster只有一个简单的，同步的循环过程：

接收用户请求
调度任务
和borglets通讯

为了解决大集群，borgmaster分离出一个调度进程，两个进程并行协作，当然，灾备是有的。

分离出来的调度进程职责是：

从elected master接收cell状态 (including both assigned and pending work);
更新本地拷贝
预调度task（并非真正的调度）
通知master确认调度结果（可能成功or失败，例如过期）

这个过程和Omega里的乐观并发控制精神是一致的，borg最近还新增了一个feature，针对不同的workload类型使用不同的调度器

此外，borg针对可扩展性还做了几个优化：

Score caching: 给机器打分的开销是很大的，而且通常机器的属性静态的，task的属性也不会经常发生变化，所以，这个结果可以cache，除非机器或者task属性发生变化
Equivalence classes: 同一个job里的task通常都有一致的资源需求和约束条件，borg这将这些具有相同配置的task进行分类，打分的时候只按照分类给机器打分
Relaxed randomization: 只随机取一部分机器或者纬度来进行打分，以提升效率。

4. Availability

在一个大型的分布式系统里，单点故障是常态，运行在borg中的task，故障的原因既可能是机器宕机，也可能是被抢占调度，下图是borg测试数据里发现的被抢占情况：

除了应用程序自身需要考虑容灾之外，borg在此方面也做了不少事情，来提高job的可用性：

automatically reschedules evicted tasks, on a new machine if necessary
reduces correlated failures by spreading tasks of a job across failure domains such as machines, racks, and power domains
limits the allowed rate of task disruptions and the number of tasks from a job that can be simultaneously down during maintenance activities such as OS or machine upgrades
uses declarative desired-state representations and idempotent mutating operations, so that a failed client can harmlessly resubmit any forgotten requests
rate-limits finding new places for tasks from machines that become unreachable, because it cannot distinguish between large-scale machine failure and a network partition
avoids repeating task::machine pairings that cause task or machine crashes
recovers critical intermediate data written to local disk by repeatedly re-running a logsaver task (x2.4), even if the alloc it was attached to is terminated or moved to another machine. Users can set how long the system keeps trying; a few days is common

【EI+Scopus+Google Scholar三平台护航】2025年8-9月智能融合：计算建模、人工智能与物联网、机械制造与智能控制以及人工智能与数字化管理等领域的创新之旅
【EI+Scopus+GoogleScholar三平台护航】2025年8-9月智能融合：计算建模、人工智能与物联网、机械制造与智能控制以及人工智能与数字化管理等领域的创新之旅【EI+Scopus+GoogleScholar三平台护航】2025年8-9月智能融合：计算建模、人工智能与物联网、机械制造与智能控制以及人工智能与数字化管理等领域的创新之旅文章目录【EI+Scopus+GoogleSchol
Google Maps 安装使用教程小奇JAVA面试安装使用教程地图
一、GoogleMaps简介GoogleMaps是谷歌提供的地图服务，通过其JavaScriptAPI，开发者可以在网页中嵌入地图，添加标记、路径、地理编码、路线导航等功能，适用于位置展示、物流追踪、LBS应用等场景。二、获取GoogleMapsAPIKey登录GoogleCloud平台：https://console.cloud.google.com/创建项目启用MapsJavaScriptAP
Android 解析手机号码归属地夏沫琅琊 android android
Android解析手机号码归属地本文主要介绍下android项目中解析手机号码归属地的一种实现方式.1:libphonenumber库https://mvnrepository.com/artifact/com.googlecode.libphonenumber/geocoder/3.8仓库地址.https://github.com/google/libphonenumber/目前是在kotlin
BERT（Bidirectional Encoder Representations from Transformers） jerwey bert 人工智能深度学习
BERT（BidirectionalEncoderRepresentationsfromTransformers）是由Google于2018年提出的一种基于Transformer架构的预训练语言模型，属于大型语言模型（LLM）的一种重要类型。其核心特点和技术定位如下：1.核心架构Encoder-Only结构：BERT仅使用Transformer的编码器（Encoder），通过多层堆叠捕捉文本的双向
基于Google Gemini 探索大语言模型在医学领域应用评估和前景知来者逆 LLM 语言模型搜索引擎人工智能 Gemini 大语言模型医疗健康医疗
概述近年来，大规模语言模型（LLM）在理解和生成人类语言方面取得了显著的飞跃，这些进步不仅推动了语言学和计算机编程的发展，还为多个领域带来了创新的突破。特别是模型如GPT-3和PaLM，它们通过吸收海量文本数据，已经能够掌握复杂的语言模式。人工智能技术的迅猛发展不断推动着LLM的进化，并加速了这一领域的专业创新。这些进步是随着模型规模的扩大、数据量的增加以及计算能力的提升而逐步实现的，其中许多尖端
GooglePlayGamesPlugin 接入过程中遇到的问题韩初心 Unity3D 学习笔记 ERROR Exception launching tok
20180201刚发现，只要画红框的这两个参数都填对GooglePlayGamesPlugin-0.9.42.unitypackage也是可以用的==================================================play-games-plugin-for-unity的git地址https://github.com/playgameservices/play-gam
一篇文章了解_docker weixin_30729609 php 测试 python
（一）Docker介绍2018年10月6日星期六15:04什么就Docker?Docker是一个开源项目，诞生于2013年初，最初是dotCloud公司内部的一个业余项目。它基于Google公司推出的Go语言实现。项目后来加入了Linux基金会，遵从了Apache2.0协议，项目代码在GitHub上进行维护。Docker项目的目标是实现轻量级的操作系统虚拟化解决方案。Docker的基础是Linux
常用指令合集（DOS/Linux/git/Maven等）
文章目录常用指令收集vmware虚拟机联网设置ubuntu常见问题设置apt相关指令：gcc编译相关指令sqlite3VSCode快捷键：收索引擎技巧（google）Intelideashell--LinxvimgitDOS:mavendockerkubectl指令nginx配置redis-clientMySQLlinux下java进程排错MongoDBCentOSJDK安装配置UbuntuJDK
APP上架篇一：上架资质要求李小白杂货铺斜杠人生 App上架 App发布 App分发资质要求费用详情
文章目录系列文章AppleStore商店上架App官方文档资质要求费用详情GooglePlay商店上架App官方文档资质要求费用详情华为应用商店上架App官方文档资质要求费用详情小米应用商店上架App官方文档资质要求费用详情OPPO应用商店上架App官方文档资质要求费用详情vivo应用商店上架App官方文档资质要求费用详情应用宝上架App官方文档资质要求费用详情百度手机助手上架App官方文档资质要
Skia图形库：绘制2D世界的核心组件
文章摘要Skia是Google开发的跨平台2D图形库，核心组件包括：SkCanvas（绘图入口）、SkPaint（画笔样式）、SkPath（几何形状）、SkImage/SkBitmap（图片处理）、SkFont/SkTypeface（文本渲染）以及SkSurface（画布载体）。支持CPU/GPU/PDF/SVG多种渲染后端，广泛应用于Chrome、Flutter等项目中，提供从基础绘图到高级特效
LLM大模型命名规则与部署硬件实践手册
文章目录一、理论基础：从信息编码到系统设计1.1命名系统的信息论基础1.2硬件架构与模型运行的关系1.3量化技术的数学原理二、国际主流模型命名规则深度解析2.1OpenAI：极简主义与功能导向2.2AnthropicClaude：诗意命名的技术内涵2.3GoogleGemini：统一品牌下的分层架构2.4MetaLlama：开源社区的透明化命名三、国内主流模型命名规则与文化内涵3.1百度文心：知识
MapReduce分布式计算框架：从原理到实战 AI妈妈手把手 mapreduce 前端大数据分布式计算 python 人工智能
大家好！今天我们来聊聊大数据处理领域的一个重要框架——MapReduce。作为Google提出的经典分布式计算模型，MapReduce极大地简化了海量数据的处理流程。无论你是大数据新手还是有一定经验的开发者，这篇文章都会让你对MapReduce有更深入的理解。我们还会通过实际代码示例来展示它的强大功能！一、MapReduce是什么？想象你有一个装满10亿本书的图书馆，现在需要统计所有书中"大数据"
论文检索相关网站
在B站或是别的地方搜索到查阅论文，检索资料的网站，方便自己下次查找论文1.中国知网检索-中国知网(cnki.net)2.Scopus.Scopuspreview-Scopus-欢迎使用Scopus3.谷歌学术evtol多旋翼-Google学术搜索4.WebofScienceDocumentSearch-AllDatabases(webofscience.com)5.IEEE工程IEEE-搜索结果6
2025年智能计算与人机交互国际会议（ICHCI 2025）
2025InternationalConferenceonIntelligentComputingandHumanComputerInteraction【一】、大会信息会议简称：ICHCI2025大会地点：中国·温州收录检索：提交EiCompendex,CPCI,CNKI,GoogleScholar等【二】、会议简介2025年智能计算与人机交互国际会议将在中国温州隆重召开。旨在为全球从事大数据、人
一款功能强大的本地数据全文搜索引擎Anytxt Searcher AitTech 搜索引擎
AnytxtSearcher是一款功能强大的本地数据全文搜索引擎，它类似于本地磁盘的Google搜索引擎，是理想的桌面内容搜索工具。以下是关于AnytxtSearcher的详细介绍及使用方法：AnytxtSearcher是什么？AnytxtSearcher内置了一个功能强大的文档解析引擎，该引擎无需安装任何其他软件即可提取常用文档的文本，并结合内置的高速索引系统来存储文本的元数据。用户可以使用An
AI 编程对决：Gemini CLI vs Claude Code，谁是最佳 AI 编码工具？ charieli-fh 人工智能大模型
1.引言：AI编码工具的崛起在软件开发的快节奏世界中，人工智能（AI）工具正迅速从辅助角色转变为不可或缺的伙伴。它们不再仅仅是提供代码补全，而是能够理解复杂上下文、执行多步骤任务，甚至自动化整个工作流的智能代理。这种转变正在重塑开发者的日常工作，提高生产力，并加速创新。在众多涌现的AI编码工具中，Google的GeminiCLI和Anthropic的ClaudeCode脱颖而出，各自代表了AI辅助
MapReduce01：基本原理和wordCount代码实现冬至喵喵大数据 mapreduce
本篇文章中，笔者记录了自己对于MapReduce的肤浅理解，参考资料主要包括《大数据Hadoop3.X分布式处理实战》和网络视频课程。下文介绍了MapReduce的基本概念、运行逻辑以及在wordCount代码示例。一、MapReduce概述1.概述google为解决其搜索引擎中的大规模网页数据的并行化处理问题，设计了MapReduce，在发明MapReduce之后首先用其重新改写了搜索引擎中we
[转载] [Mark]分布式存储必读论文 weixin_30945039 大数据数据库
原文:http://50vip.com/423.html分布式存储泛指存储存储和管理数据的系统，与无状态的应用服务器不同，如何处理各种故障以保证数据一致，数据不丢，数据持续可用，是分布式存储系统的核心问题，也是极具挑战的问题。本文总结了分布式存储领域的经典论文，供大家参考。TheGoogleFileSystem.SanjayGhemawat,HowardGobioff,andShun-TakLeu
Linux下载Google Chrome OKay_J linux chrome 经验分享笔记
不同发行版上安装GoogleChrome在Ubuntu、Debian和LinuxMint上安装在RedHat、CentOS和Fedora上安装在ArchLinux和Manjaro上安装首先更新安装包sudoapt-getupdate在Ubuntu、Debian和LinuxMint上安装输入以下命令wgethttps://dl.google.com/linux/direct/google-chrom
探索Gemini Balance：Google Gemini API的代理与负载均衡解决方案几道之旅人工智能智能体及数字员工负载均衡运维人工智能
引言在人工智能领域，API的高效使用和管理至关重要。尤其是当涉及到Google的GeminiAPI时，为了实现更稳定、更高效的服务，我们需要一个强大的代理和负载均衡工具。今天，我们就来深入了解一下GeminiBalance这个开源项目，它为GeminiAPI的使用提供了全面而灵活的解决方案。项目概述GeminiBalance是一个基于PythonFastAPI构建的应用程序，主要用于提供Googl
wpf打包一个独立的库 null_null999 windows
https://www.google.com/search?q=wpf+%E6%89%93%E5%8C%85%E4%B8%80%E4%B8%AA%E7%8B%AC%E7%AB%8B%E5%BA%93&newwindow=1&sca_esv=32f9ae821a1b1a5d&sxsrf=AE3TifNo_KqCzke3ZkSz6zdxZGXDQv6lWA%3A1751356705342&ei=IZV
Paper Reading《SoK: Prudent Evaluation Practices for Fuzzing》小苑同学安全性测试网络安全
论文链接：https://ieeexplore.ieee.org/stamp/stamp.jsp?tp=&arnumber=10646824IEEESSP20241Introduction（背景意义）模糊测试是发现软件漏洞的高效方法，被Meta、Google等企业广泛应用，且大量学术研究持续改进其技术（如覆盖反馈、领域扩展）。过去六年（2018-2023）中，顶级安全与软件工程会议上发表了超280
在NVIDIA Jetson和RTX上运行Google DeepMind的Gemma 3N：多模态AI的边缘计算革命扫地的小何尚人工智能边缘计算 GPU NVIDIA nlp cuda
在NVIDIAJetson和RTX上运行GoogleDeepMind的Gemma3N：多模态AI的边缘计算革命文章目录在NVIDIAJetson和RTX上运行GoogleDeepMind的Gemma3N：多模态AI的边缘计算革命引言：多模态AI进入边缘计算时代文章结构概览第一章：Gemma3N模型技术架构深度解析1.1Gemma3N模型概述与发展历程1.1.1模型架构的核心设计原则1.1.2多模态
一站式 IT 资产管理：零信任产品的多维对比 scuter_yu 安全网络
在数字化转型的浪潮中，企业面临着日益复杂的网络安全挑战，零信任安全理念应运而生并逐渐成为保障企业信息安全的重要手段。腾讯iOA零信任产品、深信服零信任安全解决方案、奇安信零信任安全解决方案以及GoogleBeyondCorp零信任网络架构等产品在市场上各有千秋，尤其在一站式IT资产管理方面，它们展现了不同的特色与优势。以下是对每款产品在一站式IT资产管理方面的分点对比：腾讯iOA零信任产品细粒度统
在Flutter中生成App Bundle并上架Google Play getapi flutter
Rantool要在Flutter中生成AppBundle并上架GooglePlay，请按照以下步骤操作：1.准备签名密钥首先需要创建一个密钥库用于签名：keytool-genkey-v-keystoreupload-keystore.jks-keyalgRSA-keysize2048-validity10000-aliasupload2.配置签名在项目的android目录下创建key.proper
AI人工智能领域：Bard的崛起之路 AIGC应用创新大全人工智能 bard ai
AI人工智能领域：Bard的崛起之路关键词：Bard、GoogleAI、大语言模型、对话式AI、自然语言处理、生成式AI、AI竞争摘要：本文深入探讨GoogleBard的发展历程、技术架构及其在AI领域的地位。我们将从Bard的诞生背景开始，分析其核心技术原理，比较与其他大语言模型的异同，并通过实际案例展示其应用场景。最后展望Bard的未来发展方向及面临的挑战。背景介绍目的和范围本文旨在全面解析G
LevelDB、BoltDB 和 RocksDB区块链应用比较 MetaverseMan 区块链
LevelDB、BoltDB和RocksDB是三种常用的键值存储数据库，它们在区块链领域（如以太坊、比特币等）或其他高性能应用中有广泛应用。虽然它们都是嵌入式键值存储，但设计目标、性能特性、功能支持和适用场景有显著差异。以下是它们的详细对比，特别是结合区块链公链（如以太坊）中可能涉及的场景。1.LevelDB概述：LevelDB是由Google开发的一个轻量级嵌入式键值存储库，基于LSM树（Log
从零到百亿流量：跨云平台高可用Web架构设计与成本优化全攻略风劝我要释怀 azure aws googlecloud 云计算
在互联网流量爆发式增长的今天，如何构建一个既能支撑百亿级请求、又具备极致成本效益的Web系统，成为技术团队的核心挑战。本文将以AWS、GoogleCloud、Azure等主流云平台为例，揭秘从零起步到承载海量流量的全链路架构设计策略，涵盖技术选型、容灾设计、成本优化等实战经验。一、架构设计原则：弹性、分层与解耦1.基础架构选型：跨云混合部署多云负载均衡通过CloudflareLoadBalanci
google-perftools工具定位内存泄漏 bantinghy 调试内存泄漏
google-perftools工具Centos7安装[root@locahost]#cat/etc/centos-releaseCentOSLinuxrelease7.4.1708#安装unwind[root@locahost]#wgethttp://download.savannah.gnu.org/releases/libunwind/libunwind-0.99.tar.gz[root@l
js 允许生成特殊的变量名基于字符集编码混淆的 XSS 绕过漏洞 -- Google 2025 Lost In Transliteration A5rZ 网络安全
题目实现了一个字符转换工具在/file路由用户可以通过ct参数自定义Content-Type//文件路由-提供静态文件服务（JS和CSS），支持内容类型验证app.MapGet("/file",(stringfilename="",string?ct=null,string?q=null)=>{//根据文件名查找对应的模板文件string?template=FindFile(filename);i
ASM系列六利用TreeApi 添加和移除类成员 lijingyao8206 jvm 动态代理 ASM 字节码技术 TreeAPI
同生成的做法一样，添加和移除类成员只要去修改fields和methods中的元素即可。这里我们拿一个简单的类做例子，下面这个Task类，我们来移除isNeedRemove方法，并且添加一个int 类型的addedField属性。 package asm.core; /** * Created by yunshen.ljy on 2015/6/
Springmvc-权限设计 bee1314 spring Web jsp
万丈高楼平地起。权限管理对于管理系统而言已经是标配中的标配了吧，对于我等俗人更是不能免俗。同时就目前的项目状况而言，我们还不需要那么高大上的开源的解决方案，如Spring Security，Shiro。小伙伴一致决定我们还是从基本的功能迭代起来吧。目标： 1.实现权限的管理（CRUD） 2.实现部门管理（CRUD) 3.实现人员的管理（CRUD） 4.实现部门和权限
算法竞赛入门经典（第二版）第2章习题 CrazyMizzz c 算法
2.4.1 输出技巧 #include <stdio.h> int main() { int i, n; scanf("%d", &n); for (i = 1; i <= n; i++) printf("%d\n", i); return 0; } 习题2-2 水仙花数(daffodil
struts2中jsp自动跳转到Action 麦田的设计者 jsp webxml struts2 自动跳转
1、在struts2的开发中，经常需要用户点击网页后就直接跳转到一个Action，执行Action里面的方法，利用mvc分层思想执行相应操作在界面上得到动态数据。毕竟用户不可能在地址栏里输入一个Action（不是专业人士） 2、＜jsp:forward page="xxx.action" /＞，这个标签可以实现跳转，page的路径是相对地址,不同与jsp和j
php 操作webservice实例 IT独行者 PHP webservice
首先大家要简单了解了何谓webservice，接下来就做两个非常简单的例子，webservice还是逃不开server端与client端。我测试的环境为：apache2.2.11 php5.2.10做这个测试之前，要确认你的php配置文件中已经将soap扩展打开，即extension=php_soap.dll; OK 现在我们来体验webservice //server端 serve
Windows下使用Vagrant安装linux系统 _wy_ windows vagrant
准备工作：下载安装 VirtualBox ：https://www.virtualbox.org/ 下载安装 Vagrant ：http://www.vagrantup.com/ 下载需要使用的 box ：官方提供的范例：http://files.vagrantup.com/precise32.box 还可以在 http://www.vagrantbox.es/
更改linux的文件拥有者及用户组(chown和chgrp) 无量 c linux chgrp chown
本文（转） http://blog.163.com/yanenshun@126/blog/static/128388169201203011157308/ http://ydlmlh.iteye.com/blog/1435157 一、基本使用：使用chown命令可以修改文件或目录所属的用户：命令
linux下抓包工具矮蛋蛋 linux
原文地址： http://blog.chinaunix.net/uid-23670869-id-2610683.html tcpdump -nn -vv -X udp port 8888 上面命令是抓取udp包、端口为8888 netstat -tln 命令是用来查看linux的端口使用情况 13 . 列出所有的网络连接 lsof -i 14. 列出所有tcp 网络连接信息 l
我觉得mybatis是垃圾！：“每一个用mybatis的男纸，你伤不起” alafqq mybatis
最近看了每一个用mybatis的男纸，你伤不起原文地址：http://www.iteye.com/topic/1073938 发表一下个人看法。欢迎大神拍砖；个人一直使用的是Ibatis框架，公司对其进行过小小的改良；最近换了公司，要使用新的框架。听说mybatis不错；就对其进行了部分的研究；发现多了一个mapper层；个人感觉就是个dao；
解决java数据交换之谜百合不是茶数据交换
交换两个数字的方法有以下三种，其中第一种最常用 /* 输出最小的一个数 */ public class jiaohuan1 { public static void main(String[] args) { int a =4; int b = 3; if(a<b){ // 第一种交换方式 int tmep =
渐变显示 bijian1013 JavaScript
<style type="text/css"> #wxf { FILTER: progid:DXImageTransform.Microsoft.Gradient(GradientType=0, StartColorStr=#ffffff, EndColorStr=#97FF98); height: 25px; } </style>
探索JUnit4扩展：断言语法assertThat bijian1013 java 单元测试 assertThat
一.概述 JUnit 设计的目的就是有效地抓住编程人员写代码的意图，然后快速检查他们的代码是否与他们的意图相匹配。 JUnit 发展至今，版本不停的翻新，但是所有版本都一致致力于解决一个问题，那就是如何发现编程人员的代码意图，并且如何使得编程人员更加容易地表达他们的代码意图。JUnit 4.4 也是为了如何能够
【Gson三】Gson解析{"data":{"IM":["MSN","QQ","Gtalk"]}} bit1129 gson
如何把如下简单的JSON字符串反序列化为Java的POJO对象? {"data":{"IM":["MSN","QQ","Gtalk"]}} 下面的POJO类Model无法完成正确的解析： import com.google.gson.Gson;
【Kafka九】Kafka High Level API vs. Low Level API bit1129 kafka
1. Kafka提供了两种Consumer API High Level Consumer API Low Level Consumer API(Kafka诡异的称之为Simple Consumer API，实际上非常复杂) 在选用哪种Consumer API时，首先要弄清楚这两种API的工作原理，能做什么不能做什么，能做的话怎么做的以及用的时候，有哪些可能的问题
在nginx中集成lua脚本：添加自定义Http头，封IP等 ronin47 nginx lua
Lua是一个可以嵌入到Nginx配置文件中的动态脚本语言，从而可以在Nginx请求处理的任何阶段执行各种Lua代码。刚开始我们只是用Lua 把请求路由到后端服务器，但是它对我们架构的作用超出了我们的预期。下面就讲讲我们所做的工作。强制搜索引擎只索引mixlr.com Google把子域名当作完全独立的网站，我们不希望爬虫抓取子域名的页面，降低我们的Page rank。 location /{
java-归并排序 bylijinnan java
import java.util.Arrays; public class MergeSort { public static void main(String[] args) { int[] a={20,1,3,8,5,9,4,25}; mergeSort(a,0,a.length-1); System.out.println(Arrays.to
Netty源码学习-CompositeChannelBuffer bylijinnan java netty
CompositeChannelBuffer体现了Netty的“Transparent Zero Copy” 查看API（ http://docs.jboss.org/netty/3.2/api/org/jboss/netty/buffer/package-summary.html#package_description）可以看到，所谓“Transparent Zero Copy”是通
Android中给Activity添加返回键 hotsunshine Activity
// this need android:minSdkVersion="11" getActionBar().setDisplayHomeAsUpEnabled(true); @Override public boolean onOptionsItemSelected(MenuItem item) {
静态页面传参 ctrain 静态
$(document).ready(function () { var request = { QueryString : function (val) { var uri = window.location.search; var re = new RegExp("" + val + "=([^&?]*)", &
Windows中查找某个目录下的所有文件中包含某个字符串的命令 daizj windows 查找某个目录下的所有文件包含某个字符串
findstr可以完成这个工作。 [html] view plain copy >findstr /s /i "string" *.* 上面的命令表示，当前目录以及当前目录的所有子目录下的所有文件中查找"string&qu
改善程序代码质量的一些技巧 dcj3sjt126com 编程 PHP 重构
有很多理由都能说明为什么我们应该写出清晰、可读性好的程序。最重要的一点，程序你只写一次，但以后会无数次的阅读。当你第二天回头来看你的代码时，你就要开始阅读它了。当你把代码拿给其他人看时，他必须阅读你的代码。因此，在编写时多花一点时间，你会在阅读它时节省大量的时间。让我们看一些基本的编程技巧：尽量保持方法简短尽管很多人都遵
SharedPreferences对数据的存储 dcj3sjt126com
SharedPreferences简介： &nbs
linux复习笔记之bash shell (2) bash基础 eksliang bash bash shell
转载请出自出处： http://eksliang.iteye.com/blog/2104329 1.影响显示结果的语系变量（locale） 1.1locale这个命令就是查看当前系统支持多少种语系，命令使用如下： [root@localhost shell]# locale LANG=en_US.UTF-8 LC_CTYPE="en_US.UTF-8"
Android零碎知识总结 gqdy365 android
1、CopyOnWriteArrayList add(E) 和remove(int index)都是对新的数组进行修改和新增。所以在多线程操作时不会出现java.util.ConcurrentModificationException错误。所以最后得出结论：CopyOnWriteArrayList适合使用在读操作远远大于写操作的场景里，比如缓存。发生修改时候做copy，新老版本分离，保证读的高
HoverTree.Model.ArticleSelect类的作用 hvt Web .net C#hovertree asp.net
ArticleSelect类在命名空间HoverTree.Model中可以认为是文章查询条件类，用于存放查询文章时的条件，例如HvtId就是文章的id。HvtIsShow就是文章的显示属性，当为-1是，该条件不产生作用，当为0时，查询不公开显示的文章，当为1时查询公开显示的文章。HvtIsHome则为是否在首页显示。HoverTree系统源码完全开放，开发环境为Visual Studio 2013
PHP 判断是否使用代理 PHP Proxy Detector 天梯梦 proxy
1. php 类 I found this class looking for something else actually but I remembered I needed some while ago something similar and I never found one. I'm sure it will help a lot of developers who try to
apache的math库中的回归——regression（翻译） lvdccyb Math apache
这个Math库，虽然不向weka那样专业的ML库，但是用户友好，易用。多元线性回归，协方差和相关性（皮尔逊和斯皮尔曼），分布测试（假设检验，t，卡方，G），统计。数学库中还包含，Cholesky，LU，SVD，QR，特征根分解，真不错。基本覆盖了：线代，统计，矩阵，最优化理论曲线拟合常微分方程遗传算法（GA），还有3维的运算。。。
基础数据结构和算法十三：Undirected Graphs (2) sunwinner Algorithm
Design pattern for graph processing. Since we consider a large number of graph-processing algorithms, our initial design goal is to decouple our implementations from the graph representation
云计算平台最重要的五项技术 sumapp 云计算云平台智城云
云计算平台最重要的五项技术 1、云服务器云服务器提供简单高效，处理能力可弹性伸缩的计算服务，支持国内领先的云计算技术和大规模分布存储技术，使您的系统更稳定、数据更安全、传输更快速、部署更灵活。特性机型丰富通过高性能服务器虚拟化为云服务器，提供丰富配置类型虚拟机，极大简化数据存储、数据库搭建、web服务器搭建等工作；仅需要几分钟，根据CP
《京东技术解密》有奖试读获奖名单公布 ITeye管理员活动
ITeye携手博文视点举办的12月技术图书有奖试读活动已圆满结束，非常感谢广大用户对本次活动的关注与参与。 12月试读活动回顾： http://webmaster.iteye.com/blog/2164754 本次技术图书试读活动获奖名单及相应作品如下：一等奖（两名） Microhardest：http://microhardest.ite