OpenAnolis小助手

致敬 hacker ：盘点内存虚拟化探索之路｜龙蜥技术

云与虚拟化

云计算是通过 Internet 服务的方式提供动态可伸缩资源的计算模式，经过多年的发展已成为企业 IT 技术的重要支撑。虚拟化是云计算的核心技术之一，将一台计算机抽象为多台逻辑计算机，即虚拟机，每个虚拟机是一个单独安全的环境，可运行不同的操作系统且互不影响。

虚拟化技术给资源使用和调度带来了极大便利，云计算系统可以根据负载情况及时进行资源调度，在提升资源利用率的同时保证应用和服务不会因资源不足而影响服务质量。然而虚拟化也是有代价的，对资源的抽象带来了性能损失，这也是虚拟化一直致力解决的问题。

虚拟化的资源抽象可以简单划分为三部分：CPU 虚拟化、内存虚拟化和设备虚拟化。其中设备虚拟化已经可以实现网络、存储等设备直通虚拟机，没有性能损失；CPU 虚拟化在硬件特性的支持下，执行普通指令性能与裸机相同；而内存虚拟化相比裸机，仍然存在较大差异，是当下值得关注的问题。

内存虚拟化

虚拟内存：说到内存虚拟化，就不得不提虚拟内存的概念。早期的操作系统只有物理地址且空间有限，进程使用内存时必须小心翼翼以避免覆盖其他进程的内存。为避免此问题，虚拟内存的概念被抽象出来，保证每个进程都有一块连续的、独立的虚拟内存空间。进程直接通过 VA（Virtual Address）使用内存，CPU 访存时发出的 VA 由硬件 MMU（Memory Management Unit）拦截并转换为 PA（Physical Address），VA 到 PA 的映射使用页表进行管理，MMU 在转换时会自动查询页表。

内存虚拟化：与虚拟内存的概念类似，一台主机上的每个虚拟机认为自己独占整个物理地址空间，因而需要对内存再做一次抽象，即内存虚拟化，保证每个虚拟机都有独立的地址空间。这样一来，在虚拟机和物理机中均有 VA 和 PA 的概念，即 GVA（Guest Virtual Address）和 GPA（Guest Physical Address），以及 HVA（Host Virtual Address）和 HPA（Host Physical Address）。虚拟机内的程序使用的是GVA，最终需要转换成 HPA。两个 VA 到 PA（ GVA 到 GPA 以及 HVA 到 HPA）的映射同样使用页表管理，GPA 到 HVA 一般是几段连续的线性映射，由虚拟机的管理程序 VMM（Virtual Machine Monitor）进行管理。

进程访存需要从 VA 转换成 PA，在引入内存虚拟化后，转换路径发生了很大的变化。原本只需要将 VA 转换为 PA，虚拟化后转换过程变成 GVA -> GPA -> HVA -> HPA 。路径变得更长更复杂之后，对于访存的安全和性能都带来了挑战，这两点也是内存虚拟化需要达到的目标：1）安全，即地址转换的合法性，虚拟机不能访问不属于自己的内存；2）性能，即地址转换的高效性，包括转换关系建立的开销低，以及转换过程本身的开销低。

经典方案

为达成内存虚拟化的目标，已经有很多虚拟化方案被提出，SPT（Shadow Page Table）和 EPT（Extended Page Table）是两种典型的方案，也是大家最熟悉的方案。我们先以此为切入点，看看他们是如何工作的，然后再讨论其他的虚拟化方案。

SPT：由于最初的硬件只支持一层页表转换，直接用来转换虚拟机或物理机上的 VA 到 PA 都无法完成 GVA 到 HPA 的转换。因此 SPT 建立了一条捷径，即影子页表，直接管理 GVA 到 HPA 的映射，如下图所示。每一个影子页表实例对应虚拟机内一个进程，影子页表的建立需要 VMM 查询虚拟机内进程的页表。

由于影子页表管理的是 GVA 到 HPA 的直接映射，SPT 地址转换路径与物理机路径相当，直接查询一层页表就可以完成地址转换。在使用 4 级页表时，转换过程如下图所示。

优势：SPT 地址转换过程的开销低，与物理机相当。

劣势：

1）地址转换关系的建立开销很大，为保证地址转换的合法性，所有的转换关系建立，即虚拟机进程的页表修改，都会被拦截之后陷出到特权的 VMM 中代为执行；

2）影子页表本身需要占用内存，且一个影子页表只对应虚拟机内一个进程，整体会占用较多内存资源。

EPT：后来的硬件针对虚拟化增加了嵌套页表的支持，使得硬件可以自动完成两层页表转换。EPT 即是基于硬件支持的方案，在管理 GVA 到 GPA 的虚拟机页表基础上，新增扩展页表管理 GPA 到 HPA 的映射，如下图所示。这两层页表相互独立，两层映射关系转换都由硬件自动完成。

由于虚拟机内各级页表（gL4, gL3, gL2, gL1）内容只是 GPA，查询下一级时必须先经扩展页表（nL4, nL3, nL2, nL1）转换为 HPA，使得整个转换路径很长。在两层页表均为 4 级时，转换过程如下图所示。

优势：地址转换关系的建立开销低，独立的 EPT 页表的存在保证了地址转换的合法性，因此虚拟机的页表可以自行修改而无需 VMM 的干预。

劣势：转换过程的开销很大，最坏情况下需要 24（4 + 4 + 4 * 4）次硬件查表转换。

两种经典的方案在安全上都有坚实的保证，但在性能上各有缺陷。SPT 为保证地址转换的合法性在建立转换关系时付出了很大代价，而 EPT 虽然消除了建立转换关系的开销，转换路径却更长了。

其他探索

业界和学术界关于内存虚拟化还有很多的探索，基本思想与 SPT 或 EPT 类似，可以据此分为三类来看：

1）一层页表方案。与 SPT 类似，使用一层页表直接管理 GVA 到 HPA 的映射；

2）两层页表方案。与 EPT 类似，使用两层独立页表分别管理 GVA 到 GPA 以及 GPA 到 HPA 的映射；

3）混合方案。结合前两类方案，进行动态的选择。

Direct Paging：一层页表方案，这是 Xen 在早期硬件仅支持一层页表时的半虚拟化方案。相比于 SPT 最大的区别是，没有单独维护 GVA 到 GPA 的虚拟机页表，虚拟机知道自己处于虚拟化环境，即知道自己的页表内容是 HPA。虚拟机修改页表也需要陷出，但是采用主动陷出的方式，可以 batch 化，而 SPT 则是被动拦截陷出；读取页表时只能拿到 HPA，需要查一张 M2P（Machine to Physical）表才能得到 GPA。

Direct Paging 同样使用一层页表管理 GVA 到 HPA 映射，地址转换的路径与 SPT 是相同的。在使用 4 级页表时，最坏只需 4 次查表。

优势：地址转换过程的开销低，与物理机相当。

劣势：

1）地址转换关系的建立开销很大，所有页表修改都需要主动陷出；

2）需要虚拟机做半虚拟化的适配，虚拟机需要感知自己的页表管理的是 GVA 到 HPA 的映射。

Direct Segment：两层页表方案，这是学术界基于新硬件的方案。GVA 到 GPA 的映射管理与 EPT 相同，同样采用多级页表。但 GPA 到 HPA 的映射采用分段机制， GPA 转换为 HPA 时只需要通过硬件加上一个偏移即可。

GPA 虽然不等于 HPA，但二者的映射关系十分简单，只需要 Direct Segment 硬件添加一个偏移，整个转换路径与物理机的路径相比差别很小，仅多了几次硬件偏移。虚拟机使用 4 级页表时，转换路径如下图所示，其中 DS 表示 GPA 到 HPA 转换的硬件支持。

优势：地址转换关系的建立开销低，同时转换过程的开销也很低。

劣势：

1）需要硬件支持 GPA 到 HPA 分段映射，现有的硬件不具备这样的功能；

2）需要分配大段连续的内存，即主机不能有太多内存碎片。

Flat EPT：两层页表方案，这也是学术界提出的基于新硬件的方案。整体与 EPT 非常相似，唯一的区别在于 EPT 管理 GPA 到 HPA 的使用多级页表，一般是 4 级，每级 512 项；而 Flat EPT 使用仅有一级的扁平页表，表项远不止 512。

与 EPT 相同，虚拟机内各级页表的内容也是 GPA，查询下一级时需要先经过扁平扩展页表（nL4）转换为 HPA。由于扁平扩展页表只有一级，转换路径相比 EPT 缩短了非常多。在虚拟机内使用4级页表时，转换路径如下图所示，最坏只需 9（4 + 1 + 4 * 1）次查表。

优势：地址转换关系的建立开销低，同时转换过程的开销也较低。相比于 Direct Segment 对内存分配要求很低，只需要少量连续内存用作扁平扩展页表即可（8G规格虚拟机只需要 16M）。

劣势：需要硬件支持扁平扩展页表，当前的硬件只支持表项为 512 的多级扩展页表。

Mix SPT and EPT：混合方案，这是学术界较早提出的方案，简单而言就是动态的分时切换 SPT 与 EPT。在虚拟机运行时监控和采集 TLB miss 与 Page Fault 的数据，在二者达到设定的阈值时进行 SPT 与 EPT 之间的切换，如下图所示：

TLB miss 率高于阈值 T1，Page Fault 频率低于阈值 T2 时，从 EPT 切换到 SPT
TLB miss 率低于阈值 T1，Page Fault 频率高于阈值 T2 时，从 SPT 切换到 EPT

优势：有机会充分利用SPT与EPT的优势，达到更好的性能。

劣势：

1）页表切换阈值的设定很困难，硬件配置都可能影响阈值；

2）SPT与EPT的切换也是有代价的，主要是SPT的销毁与重建。

总结

一层页表显著的优势是地址转换过程开销低，与物理机相同，需要解决的问题是减少地址转换建立的开销。一个可能的方向是放弃一些安全性，让页表的修改更轻量；另一个更实际的方向是在合适的场景使用，即针对页表修改不频繁的负载使用。

两层页表的优势是地址转换建立的开销小，虚拟机可以独立修改页表，需要考虑的问题是缩短转换路径。这个方向其实可行性很高，但是依赖新硬件的支持，短期不太可能出现符合要求的新硬件。

混合页表的设计初衷是希望充分利用两类页表的优势，但是做好动态的模式切换是非常困难的，负载的差异甚至硬件的差异都可能影响切换的效果。或许针对已知负载做定向的调优是一个可行的方向。

长远来看，如果有新硬件的加持，两层页表（尤其是Flat EPT）是比较完善的方案，地址转换可以很高效，也不需要在安全和通用性上做一些牺牲。但是短期来看，新硬件为时尚早，在一层页表方案上做进一步的探索和优化，是更加实际的。我们将会持续在内存虚拟化这条路径探索更多的可能，欢迎大家加入 OpenAnolis 龙蜥社区讨论交流。

—— 完 ——

关于作者

陶志恒（君川），2020年加入阿里云操作系统-云原生底层系统团队，目前从事性能优化方向的工作。

招贤纳士

我们是来自阿里云的操作系统团队，寻找有内核、虚拟化、容器、网络、存储、安全等系统技术经验，并有志于打造云原生底层系统的优秀人才，欢迎联系我们（邮箱：shaokang.hwd@alibaba-inc.com）。

加入龙蜥社群

加入微信群：添加社区助理-龙蜥社区小龙（微信：openanolis_assis），备注【龙蜥】拉你入群；加入钉钉群：可扫码或搜钉钉群号（33311793）。欢迎开发者/用户加入龙蜥OpenAnolis社区交流，共同推进龙蜥社区的发展，一起打造一个活跃的、健康的开源操作系统生态！

龙蜥社区_小龙

钉钉群二维码

关于龙蜥社区

龙蜥社区是由企事业单位、高等院校、科研单位、非营利性组织、个人等按照自愿、平等、开源、协作的基础上组成的非盈利性开源社区。龙蜥社区成立于2020年9月，旨在构建一个开源、中立、开放的Linux上游发行版社区及创新平台。

短期目标是开发Anolis OS作为CentOS替代版，重新构建一个兼容国际Linux主流厂商发行版。中长期目标是探索打造一个面向未来的操作系统，建立统一的开源操作系统生态，孵化创新开源项目，繁荣开源生态。

加入我们，一起打造面向未来的开源操作系统！

Https：//openanolis.cn

往期精彩推荐

1.关于龙蜥社区20个问题 | 龙蜥问答第1期

2.内核热补丁，真的安全么？| 龙蜥技术

3.龙蜥社区成立LoongArch SIG，发布龙芯版路线图

4.中国系统加入龙蜥社区，共建国际领先开源社区

戳“阅读原文”直达 OpenAnolis 龙蜥社区官网

https://openanolis.cn

C++使用Onnxruntime/TensorRT模型推理奇华智能 AI c++开发语言人工智能 AI 计算机视觉
onnxruntime和tensorrt是我们常用的两种推理方式，下面整理了两个推理示例，仅供参考。步骤流程模型训练，python下生成pytorch的模型.pth，并基于.pth模型进行推理python下依据模型推理实现从.pth转向.onnxpython下基于.onnx进行推理，与后续两种推理方式种的推理结果进行比较环境windows10+RTX308015GB显存cuda11.3onnxru
GitLab 密钥详解：如何安全地使用 SSH 密钥进行身份验证 Crazy learner Linux基本命令 gitlab 安全 ssh
目录一、什么是GitLabSSH密钥？二、为什么要使用SSH密钥？三、如何生成SSH密钥？1.Linux/macOS2.Windows四、将公钥添加到GitLab五、配置SSH客户端六、常见问题及解决方案七、总结GitLab是一个功能强大的Git仓库管理平台，它支持通过SSH密钥进行身份验证，提供了比传统的用户名和密码登录方式更安全的认证机制。本文将深入探讨GitLab的SSH密钥，包括如何生成、
数据分类分级：如何用AI自动打标签（附Python代码示例）活力板蓝根数据治理人工智能分类 python
数据分类分级：如何用AI自动打标签（附Python代码示例）1.引言在当今数字化时代，数据的安全管理变得越来越重要。数据分类分级不仅是合规要求，更是保护核心资产的重要手段。然而，随着数据量的激增，传统的人工分类方式已经难以应对这个问题。本文将介绍如何利用AI技术实现数据的自动分类分级。希望大家享用愉快！2.技术方案概述2.1问题定义目标：将数据按照敏感度（公开、内部、机密）和业务类型（财务、人事、
【Python】使用Python脚本生成文件头注释哇咔咔哇咔 Python脚本 python
文章目录一、引言二、详细代码三、运行实例一、引言在大家平常编写代码的过程中，可能会需要生成文件头来说明代码的作者信息、版权、联系方式、编写时间、文件名、使用的软件、代码简单概述等来说明代码文件详情。此代码会自动化创建符合规范的Python文件头注释二、详细代码#-*-coding:utf-8-*-#@Time:2024/10/0518:17#@Author:哇咔咔哇咔#@Email:yannbao
Python使用browser_cookie3库来读取浏览器Cookies 飞起来fly呀 Python python 浏览器 cookies
browser_cookie3是一个强大且实用的Python模块，用于从各种常用浏览器中提取Cookies。这在进行Web请求时特别有用，因为它允许您直接使用登录会话Cookies进行操作，而无需手动输入凭据。以下是关于如何使用browser_cookie3模块从浏览器中提取Cookies的详细步骤：1.安装browser_cookie3模块首先，确保您的工作环境中已安装了browser_cook
【Python 开发网络爬虫抓取客户订单网站数据】局外人_Jia python 爬虫数据库开发语言字符串正则表达式
以下是使用Python开发网络爬虫抓取客户订单网站数据的完整指南，包含技术实现、注意事项和法律合规性说明：一、准备工作：法律与合规性确认合法性：检查目标网站的robots.txt文件（如https://example.com/robots.txt）。确保遵守网站的《服务条款》（TermsofService）。如果涉及用户隐私数据（如订单详情），需获得明确授权。推荐替代方案：优先使用网站提供的API
【python数据挖掘之numpy】-数组及对象属性和数据转换 sc.溯琛 python 数据挖掘 numpy
Numpy是一个Python库，用于处理多维数组和矩阵，以及针对这些数组执行数学运算的函数。它提供了高效的数组对象和相关的操作，可以用于快速处理大量数据。Numpy的主要功能包括：创建数组、数组运算、数组索引和切片、线性代数、随机数生成等。Numpy在科学计算、数据分析、机器学习等领域都广泛应用。tips：（本博文在jupyter中实训）目录一、创建数组对象1.array（）函数来创建数组的对象2
【数据分析之道-NumPy(二)】多种方式创建数组_创建一个3行4列的二维数组(1) 2401_84159839 程序员数据分析 numpy 数据挖掘
专栏导读✍作者简介：i阿极，CSDNPython领域新星创作者，专注于分享python领域知识。✍本文录入于《数据分析之道》，本专栏针对大学生、初级数据分析工程师精心打造，对python基础知识点逐一击破，不断学习，提升自我。✍订阅后，可以阅读《数据分析之道》中全部文章内容，包含python基础语法、数据结构和文件操作，科学计算，实现文件内容操作，实现数据可视化等等。✍还可以订阅进阶篇《数据分析之
三次握手内部实现原理 yourkin666 网络
socket()创建一个新的套接字intsocket(intdomain,inttype,intprotocol)；参数：domain：地址族，如AF_INET（IPv4），AF_INET6（IPv6）type：套接字类型，如SOCK_STREAM（TCP），SOCK_DGRAM（UDP）protocol：协议类型，通常为0（默认协议）返回值：成功返回套接字描述符，失败返回-1Linux操作系统流
spaCy 入门：自然语言处理的高效工具 zru_9602 人工智能自然语言处理人工智能
spaCy入门：自然语言处理的高效工具引言spaCy是一个功能强大的开源Python库，专注于工业级的自然语言处理（NLP）。它以其高效的性能、简洁的API和对多种语言的支持而闻名。无论是进行文本分析、信息提取还是构建智能聊天机器人，spaCy都是一个不可或缺的工具。本文将从零开始，介绍spaCy的基本功能和使用方法，并通过示例代码帮助你快速上手。1.安装spaCy在开始之前，首先需要安装spaC
Python 基本语法全解析：从安装到应用木觞清 7天熟练Python python 开发语言
Python是一种广泛使用的高级编程语言，因其简洁易懂的语法和强大的功能而受到开发者的喜爱。从数据分析到人工智能，Python都在各个领域占据着重要地位。如果你是编程新手，Python是一个非常适合入门的语言。本篇博客将带你从安装Python到理解其基础语法，再到实际应用中常见的内置函数、文件操作及第三方库的使用。1.Python安装与环境配置在开始编写Python程序之前，你首先需要在你的电脑上
大智能：大数据+大模型+大算力_大算力大数据大模型 AI学习不迷路大数据大模型人工智能语言模型 ai 产品经理算力
在近日举行的“2022中国人工智能产业年会”主论坛上，中国人工智能学会监事长、中国工程院院士蒋昌俊在报告中表示，人工智能的发展已经历了数十年的过程，大模型ChatGPT在今年春节前后突然出现，大家还没有来得及深度思考就已经“扑面而来”。蒋昌俊大智能的研究进展科学技术的研究约分为两大范式，一是牛顿力学奠定了理论计算的范式，二是开普勒开启数据的范式。之后经历了实验归纳、理论的逻辑推演，以及计算模拟、最
isdigit（）和isdecimal（） CptainLee python str方法
在Python中，`isdecimal()`和`isdigit()`是字符串方法，用于检查字符串是否只包含数字。虽然它们看起来功能相似，但它们在处理某些特殊字符时的行为有所不同。以下是它们的详细区别和使用场景。---###**1.`isdigit()`**####**定义**`isdigit()`方法用于检查字符串是否只包含数字字符。它返回`True`如果所有字符都是数字，否则返回`False`。
不可不知的dataclasses | python小知识 aiweker 跟我学python python
不可不知的dataclasses|python小知识在Python中，dataclasses模块自Python3.7版本引入以来，便成为了许多开发者管理数据结构的首选工具。它简化了类的定义，特别是对于那些主要用于存储数据的类。本文将详细介绍dataclasses的功能、应用场景，并通过代码例子进行解释说明。1.基本功能与用法dataclasses提供了一个@dataclass装饰器，通过它，可以极
RagFlow专题四、RagFlow 代码实战：基于通义千问（百炼平台）的检索增强生成（RAG）实现伯牙碎琴大模型 RagFlow RAG 检索增强
RagFlow代码实战：基于通义千问（百炼平台）的检索增强生成（RAG）实现在本篇文章中，我们将从代码实战的角度，讲解如何使用RagFlow结合通义千问（百炼平台API）进行检索增强生成（RAG），实现一个完整的AI检索+生成应用。1.环境搭建在本次代码实战中，我们需要完成以下准备工作：安装Python运行环境安装依赖库（向量数据库+检索库+通义千问APISDK）配置API密钥搭建RagFlow基
Rocky Linux 8.5 6G内存静默模式(没图形界面)安装Oracle 19C 三生暮雨渡瀟瀟 Oracle oracle
Oracle19c下载地址DatabaseSoftwareDownloads|Oraclehttps://www.oracle.com/database/technologies/oracle-database-software-downloads.html#db_ee目录一、准备服务器1、服务器可以克隆、自己装2、修改主机名3、重启4、关闭selinux5、关闭防火墙5.1、关闭防火墙5.2、设
模板注入漏洞（SSTI）学习笔记栀寒老醑学习笔记网络安全安全 web安全系统安全安全架构
模板注入漏洞（SSTI）学习笔记1.模板注入简介什么是模板引擎？模板引擎用于将动态数据渲染到静态页面（如HTML）。例如，Jinja2（Python）、Twig（PHP）等。示例：#Flask中使用Jinja2渲染模板fromflaskimportrender_template@app.route('/')defindex():user_input=request.args.get('name')
Centos配置suiqd及路由转发新时代先锋 centos 服务器运维网络 linux
文章目录赛题1.关闭Selinux及防火墙2.安装squid服务，并启动3.开启路由转发，提供路由功能4.Firefox浏览器设置代理访问任意页面，出现下面的信息就表示，代理设置成功赛题2.squid•安装squid服务，开启路由转发，为当前实验环境提供路由功能；Squid是-个高性能的http代理服务器和web缓存服务器，可以很好的实现HTTP和FTP以及DNS查询、SSL等应用的缓存代理。1、
【2025年春季】全国CTF夺旗赛-从零基础入门到竞赛，看这一篇就稳了！白帽子凯哥 web安全学习安全 CTF夺旗赛网络安全
基于入门网络安全/黑客打造的：黑客&网络安全入门&进阶学习资源包目录一、CTF简介二、CTF竞赛模式三、CTF各大题型简介四、CTF学习路线4.1、初期1、html+css+js（2-3天）2、apache+php（4-5天）3、mysql（2-3天）4、python(2-3天)5、burpsuite（1-2天）4.2、中期1、SQL注入（7-8天）2、文件上传（7-8天）3、其他漏洞（14-15
Python基础（字符串与列表）练习羡江007 python 开发语言
###题干#做一个简单的用户信息管理系统：#提示用户依次输入姓名，年龄和爱好#并且在输入完成之后，一次性将用户输入的数据展示出来'''user_name=input('请输入您的姓名：')user_age=input('请输入您的年龄：')user_hobby=input('请输入您的爱好：')print(f'以下是您的信息：\n姓名：{user_name}\n年龄：{user_age}\n爱好：
别只会用别人的模型了，自学Ai大模型，顺序千万不要搞反了！刚入门的小白必备！ ai大模型应用开发人工智能 pdf 机器学习面试 AI
在使用诸如DeepSeek、ChatGPT、豆包、文心一言等大模型之余，你是否知道这些大模型背后的技术原理是什么？假如让你从头开始学习大模型，你知道应该遵循什么样的路线嘛？今天给大家介绍一下Ai大模型的学习路线，顺序千万不要搞反了！，大家可以按照这个路线进行学习。一、前置阶段数学：线性代数、高等数学自然语言处理：Word2Vec、Seq2SeqPython：Pyotch、Tensorflow二、基
github操作大哥喝阔落 github
在本地创建一个Git仓库并将其上传到GitHub的整个流程可以分为以下几个步骤。以下是详细的说明和对应的命令：1.安装Git确保你的系统已经安装了Git。如果未安装，可以通过以下方式安装：Windows:下载GitforWindows并安装。macOS:使用brewinstallgit或直接从官网下载。Linux:使用包管理器安装，例如sudoaptinstallgit。验证安装是否成功：git-
Python的标准库heapq模块的介绍和简单应用新时代先锋理论知识 python 算法开发语言数据结构
文章目录1.堆的基本概念2.`heapq`模块的基本使用2.1创建堆2.2插入元素2.3弹出元素3.其他重要函数3.1`heappushpop`3.2`heapreplace`3.3`nlargest`和`nsmallest`3.4`merge`4.堆的应用场景4.1优先队列4.2堆排序5.结论heapq是Python标准库中一个非常有用的模块，主要用于实现堆（Heap）数据结构，特别是最小堆（M
Linux云计算SRE-第十七周晨曦启明711 linux 运维服务器
1.做三个节点的redis集群。1、编辑redis节点node0(10.0.0.100)、node1(10.0.0.110)、node2(10.0.0.120)的安装脚本[root@node0~]#viminstall_redis.sh#!/bin/bash#指定脚本解释器为bashREDIS_VERSION=redis-7.2.7#定义Redis的版本号PASSWORD=123456#设置Red
C#开发串口通讯软件如何如何避免串口通讯中的资源竞争？ openwin_top c#串口应用开发问题系列 c#开发语言串口上位机通讯
microPythonPython最小内核源码解析NI-motion运动控制c语言示例代码解析python编程示例系列python编程示例系列二python的Web神器Streamlit如何应聘高薪职位在C#中开发串口通讯软件时，避免资源竞争是确保系统稳定性和数据完整性的关键。资源竞争通常发生在多个线程或进程同时访问同一个串口资源时。为了避免这种情况，可以采取以下措施：使用锁机制（Lock）：使用
windows10和Ubuntu22.04双系统如何同步系统时间 mkid916 ubuntu linux 运维
环境说明：电脑全盘重新分区，先安装windows10操作系统（目标是使用windows10的引导），再安装Ubuntu22.04版。个人建议，Ubuntu整体安装在一个分区就可以，不去单独自定义多个分区。两个系统时间机制不同，都会修改BIOS的时间，所以目标是修改Ubuntu的时间机制，改为windows的。Ubuntu命令行的步骤如下：安装时间同步工具sudoaptinstallntpdate同
（一）spark是什么？一智哇大数据框架学习 spark big data 大数据
1.spark是什么？spark是一个用来实现快速，通用的集群计算平台spark适用于各种各样原先需要多种不同的分布式平台的场景，包括批处理，迭代算法，交互式查询，流处理。通过在一个统一的框架下支持这些不同的计算，spark使我们可以简单而低耗地把各种处理流程整合在一起。2.spark的用途（1）：数据科学任务具备SQL、统计、预测建模（机器学习）等方面的经验，以及一定的python，matlab
python-selenium控制浏览器多开窗口一晌小贪欢 Python自动化办公 selenium python selenium chrome
1、视频展示-多开5个百度页面目录结构只要在当前目录下放上自己所在的谷歌驱动器：谷歌驱动器如何下载，请参考博客：请点我奉上代码importtimefromseleniumimportwebdriver
如何解决 MySQL 数据库服务器 CPU 飙升的情况 mysql数据库sql
大家好，我是V哥。当MySQL数据库服务器CPU飙升时，我们应该怎么办？从何入手解决问题，有没有什么套路，因为自古真情留不住，唯有套路得人心，虽然这是一句玩笑话，也算很贴切，遇到这种问题，你有哪些手段去排查是致关重要的，下面是V哥整理的套路，可按以下步骤来解决问题。先赞再看，你必腰缠万贯。先来看一下有哪些套路1.定位问题使用工具监控：通过系统监控工具（如Linux下的top、htop、vmstat
场景题：有40亿个QQ号如何去重？仅1GB内存后端java面试
场景题：有40亿个QQ号如何去重？仅1GB内存场景题也有一些套路可以考虑，比如去重、判断给定数据是否存在1.大数据去重1.1现在有40亿个QQ号如何去重？仅1GB内存参考链接：https://juejin.cn/post/7396332696660131849介绍2种方法：Bitmap和布隆过滤器方法一：Bitmap首先介绍下什么是位图Bitmap位图是使用bit数组表示的，它只存储0或者1，因此
HttpClient 4.3与4.3版本以下版本比较 spjich java httpclient
网上利用java发送http请求的代码很多，一搜一大把，有的利用的是java.net.*下的HttpURLConnection，有的用httpclient，而且发送的代码也分门别类。今天我们主要来说的是利用httpclient发送请求。 httpclient又可分为 httpclient3.x httpclient4.x到httpclient4.3以下 httpclient4.3
Essential Studio Enterprise Edition 2015 v1新功能体验 Axiba .net
概述：Essential Studio已全线升级至2015 v1版本了！新版本为JavaScript和ASP.NET MVC添加了新的文件资源管理器控件，还有其他一些控件功能升级，精彩不容错过，让我们一起来看看吧！ syncfusion公司是世界领先的Windows开发组件提供商，该公司正式对外发布Essential Studio Enterprise Edition 2015 v1版本。新版本
[宇宙与天文]微波背景辐射值与地球温度 comsci 背景
宇宙这个庞大,无边无际的空间是否存在某种确定的,变化的温度呢? 如果宇宙微波背景辐射值是表示宇宙空间温度的参数之一,那么测量这些数值,并观测周围的恒星能量输出值,我们是否获得地球的长期气候变化的情况呢? &nbs
lvs-server 男人50 server
#!/bin/bash # # LVS script for VS/DR # #./etc/rc.d/init.d/functions # VIP=10.10.6.252 RIP1=10.10.6.101 RIP2=10.10.6.13 PORT=80 case $1 in start) /sbin/ifconfig eth2:0 $VIP broadca
java的WebCollector爬虫框架 oloz 爬虫
WebCollector主页： https://github.com/CrawlScript/WebCollector 下载：webcollector-版本号-bin.zip将解压后文件夹中的所有jar包添加到工程既可。接下来看demo package org.spider.myspider; import cn.edu.hfut.dmic.webcollector.cra
jQuery append 与 after 的区别小猪猪08
1、after函数定义和用法： after() 方法在被选元素后插入指定的内容。语法： $(selector).after(content) 实例： <html> <head> <script type="text/javascript" src="/jquery/jquery.js"></scr
mysql知识充电香水浓 mysql
索引索引是在存储引擎中实现的，因此每种存储引擎的索引都不一定完全相同，并且每种存储引擎也不一定支持所有索引类型。根据存储引擎定义每个表的最大索引数和最大索引长度。所有存储引擎支持每个表至少16个索引，总索引长度至少为256字节。大多数存储引擎有更高的限制。MYSQL中索引的存储类型有两种：BTREE和HASH，具体和表的存储引擎相关； MYISAM和InnoDB存储引擎
我的架构经验系列文章索引 agevs 架构
下面是一些个人架构上的总结，本来想只在公司内部进行共享的，因此内容写的口语化一点，也没什么图示，所有内容没有查任何资料是脑子里面的东西吐出来的因此可能会不准确不全，希望抛砖引玉，大家互相讨论。要注意，我这些文章是一个总体的架构经验不针对具体的语言和平台，因此也不一定是适用所有的语言和平台的。（内容是前几天写的，现附上索引）前端架构 http://www.
Android so lib库远程http下载和动态注册 aijuans andorid
一、背景在开发Android应用程序的实现，有时候需要引入第三方so lib库，但第三方so库比较大，例如开源第三方播放组件ffmpeg库, 如果直接打包的apk包里面, 整个应用程序会大很多.经过查阅资料和实验，发现通过远程下载so文件，然后再动态注册so文件时可行的。主要需要解决下载so文件存放位置以及文件读写权限问题。二、主要
linux中svn配置出错 conf/svnserve.conf:12: Option expected 解决方法 baalwolf option
在客户端访问subversion版本库时出现这个错误： svnserve.conf:12: Option expected 为什么会出现这个错误呢，就是因为subversion读取配置文件svnserve.conf时，无法识别有前置空格的配置文件，如### This file controls the configuration of the svnserve daemon, if you##
MongoDB的连接池和连接管理 BigCat2013 mongodb
在关系型数据库中，我们总是需要关闭使用的数据库连接，不然大量的创建连接会导致资源的浪费甚至于数据库宕机。这篇文章主要想解释一下mongoDB的连接池以及连接管理机制，如果正对此有疑惑的朋友可以看一下。通常我们习惯于new 一个connection并且通常在finally语句中调用connection的close()方法将其关闭。正巧，mongoDB中当我们new一个Mongo的时候，会发现它也
AngularJS使用Socket.IO bijian1013 JavaScript AngularJS Socket.IO
目前，web应用普遍被要求是实时web应用，即服务端的数据更新之后，应用能立即更新。以前使用的技术（例如polling）存在一些局限性，而且有时我们需要在客户端打开一个socket，然后进行通信。 Socket.IO(http://socket.io/)是一个非常优秀的库，它可以帮你实
[Maven学习笔记四]Maven依赖特性 bit1129 maven
三个模块为了说明问题，以用户登陆小web应用为例。通常一个web应用分为三个模块，模型和数据持久化层user-core, 业务逻辑层user-service以及web展现层user-web， user-service依赖于user-core user-web依赖于user-core和user-service 依赖作用范围 Maven的dependency定义
【Akka一】Akka入门 bit1129 akka
什么是Akka Message-Driven Runtime is the Foundation to Reactive Applications In Akka, your business logic is driven through message-based communication patterns that are independent of physical locatio
zabbix_api之perl语言写法 ronin47 zabbix_api之perl
zabbix_api网上比较多的写法是python或curl。上次我用java－－http://bossr.iteye.com/blog/2195679，这次用perl。for example: #!/usr/bin/perl use 5.010 ; use strict ; use warnings ; use JSON :: RPC :: Client ; use
比优衣库跟牛掰的视频流出了，兄弟连Linux运维工程师课堂实录，更加刺激，更加实在！ brotherlamp linux运维工程师 linux运维工程师教程 linux运维工程师视频 linux运维工程师资料 linux运维工程师自学
比优衣库跟牛掰的视频流出了，兄弟连Linux运维工程师课堂实录，更加刺激，更加实在！ ----------------------------------------------------- 兄弟连Linux运维工程师课堂实录-计算机基础-1-课程体系介绍1 链接：http://pan.baidu.com/s/1i3GQtGL 密码：bl65 兄弟连Lin
bitmap求哈密顿距离-给定N（1<=N<=100000）个五维的点A(x1,x2,x3,x4,x5)，求两个点X(x1,x2,x3,x4,x5)和Y( bylijinnan java
import java.util.Random; /** * 题目： * 给定N（1<=N<=100000）个五维的点A(x1,x2,x3,x4,x5)，求两个点X(x1,x2,x3,x4,x5)和Y(y1,y2,y3,y4,y5)， * 使得他们的哈密顿距离（d=|x1-y1| + |x2-y2| + |x3-y3| + |x4-y4| + |x5-y5|）最大
map的三种遍历方法 chicony map
package com.test; import java.util.Collection; import java.util.HashMap; import java.util.Iterator; import java.util.Map; import java.util.Set; public class TestMap { public static v
Linux安装mysql的一些坑 chenchao051 linux
1、mysql不建议在root用户下运行 2、出现服务启动不了，111错误，注意要用chown来赋予权限，我在root用户下装的mysql，我就把usr/share/mysql/mysql.server复制到/etc/init.d/mysqld, (同时把my-huge.cnf复制/etc/my.cnf) chown -R cc /etc/init.d/mysql
Sublime Text 3 配置 daizj 配置 Sublime Text
Sublime Text 3 配置解释(默认){// 设置主题文件“color_scheme”: “Packages/Color Scheme – Default/Monokai.tmTheme”,// 设置字体和大小“font_face”: “Consolas”,“font_size”: 12,// 字体选项：no_bold不显示粗体字，no_italic不显示斜体字，no_antialias和
MySQL server has gone away 问题的解决方法 dcj3sjt126com SQL Server
MySQL server has gone away 问题解决方法，需要的朋友可以参考下。应用程序（比如PHP）长时间的执行批量的MYSQL语句。执行一个SQL，但SQL语句过大或者语句中含有BLOB或者longblob字段。比如，图片数据的处理。都容易引起MySQL server has gone away。今天遇到类似的情景，MySQL只是冷冷的说：MySQL server h
javascript/dom:固定居中效果 dcj3sjt126com JavaScript
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml&
使用 Spring 2.5 注释驱动的 IoC 功能 e200702084 spring bean 配置管理 IOC Office
使用 Spring 2.5 注释驱动的 IoC 功能 developerWorks 文档选项将打印机的版面设置成横向打印模式打印本页将此页作为电子邮件发送将此页作为电子邮件发送级别：初级陈雄华 (quickselect@163.com), 技术总监, 宝宝淘网络科技有限公司 2008 年 2 月 28 日 &nb
MongoDB常用操作命令 geeksun mongodb
1. 基本操作 db.AddUser(username,password) 添加用户 db.auth(usrename,password) 设置数据库连接验证 db.cloneDataBase(fromhost)
php写守护进程（Daemon） hongtoushizi PHP
转载自： http://blog.csdn.net/tengzhaorong/article/details/9764655 守护进程（Daemon）是运行在后台的一种特殊进程。它独立于控制终端并且周期性地执行某种任务或等待处理某些发生的事件。守护进程是一种很有用的进程。php也可以实现守护进程的功能。 1、基本概念 &nbs
spring整合mybatis,关于注入Dao对象出错问题 jonsvien DAO spring bean mybatis prototype
今天在公司测试功能时发现一问题：先进行代码说明： 1，controller配置了Scope="prototype"（表明每一次请求都是原子型） @resource/@autowired service对象都可以（两种注解都可以）。 2，service 配置了Scope="prototype"（表明每一次请求都是原子型）
对象关系行为模式之标识映射 home198979 PHP 架构企业应用对象关系标识映射
HELLO!架构一、概念 identity Map:通过在映射中保存每个已经加载的对象，确保每个对象只加载一次，当要访问对象的时候，通过映射来查找它们。其实在数据源架构模式之数据映射器代码中有提及到标识映射，Mapper类的getFromMap方法就是实现标识映射的实现。二、为什么要使用标识映射？在数据源架构模式之数据映射器中 //c
Linux下hosts文件详解 pda158 linux
　1、主机名：　　无论在局域网还是INTERNET上，每台主机都有一个IP地址，是为了区分此台主机和彼台主机，也就是说IP地址就是主机的门牌号。　　公网：IP地址不方便记忆，所以又有了域名。域名只是在公网（INtERNET)中存在，每个域名都对应一个IP地址，但一个IP地址可有对应多个域名。　　局域网：每台机器都有一个主机名，用于主机与主机之间的便于区分，就可以为每台机器设置主机
nginx配置文件粗解 spjich java nginx
#运行用户#user nobody;#启动进程,通常设置成和cpu的数量相等worker_processes 2;#全局错误日志及PID文件#error_log logs/error.log;#error_log logs/error.log notice;#error_log logs/error.log inf
数学函数 w54653520 java
public class S { // 传入两个整数，进行比较，返回两个数中的最大值的方法。 public int get( int num1, int nu

致敬 hacker ：盘点内存虚拟化探索之路｜龙蜥技术

总结

关于作者

招贤纳士

你可能感兴趣的:(大数据,编程语言,操作系统,python,linux)