以山河作礼。

【山河送书第九期】：揭秘分布式文件系统大规模元数据管理机制——以Alluxio文件系统为例

揭秘分布式文件系统大规模元数据管理机制——以Alluxio文件系统为例

01分布式文件系统元数据的常见类型
- - 文件（inode）元数据
  - 数据块（block）元数据
  - MountTable
  - Worker元数据
02分布式文件系统元数据的存储模式
- - 2.1 元数据存储在堆上（HEAP模式）
  - 2.2 元数据存储在堆外（ROCKS模式）
  - 2.3 堆外存储的内存和磁盘占用
  - 2.4 对堆外存储的缓存加速和调优
  - 2.5在HEAP和ROCKS模式间切换
03特别预告：
04参与方式
05往期赠书回顾

当今，我们的世界已经进入一个数据时代。随着互联网、物联网、5G、大数据、人工智能、自动驾驶、元宇宙等信息技术的快速发展，人们在产生、收集、存储、治理和分析的数据的总量呈快速增长的趋势。形态多样、格式复杂、规模庞大、产生迅速的行业领域大规模数据驱动了底层新型基础支撑计算支撑技术的快速变革。通过过去10多年来工业界和学术界先行者的指引和实践，分布式并行计算和分布式数据存储的技术生态不断演进、丰富繁荣。其中，分布式数据存储管理在这个海量数据处理技术栈中处于基础地位，是众多行业大数据应用分析的基石。

分布式文件系统是从高性能计算到大数据计算时代一直广为应用的主流分布式数据存储管理系统。近些年随着云计算技术的持续发展，分布式对象存储存储、键值存储等技术的应用也开始大行其道。在这个背景下，很多分布式文件系统开始走上对数据存储进行统一高效管理的技术路线。其中，被用户知晓和普遍应该的一款系统是诞生于加州大学伯克利分校的AMPLab的Alluxio，它可以被看作一种统一化大数据虚拟文件系统，不同种类的分布式存储系统（文件系统、对象存储系统）都可以挂载到Alluxio目录中，对提供提供高效统一的访问模式和接口。元数据是一个存储系统中关于数据信息最为重要、正常访问最为频繁的一类关键信息。为了有效地管理来自底层不同分布式存储系统的大规模数据文件和对象，Alluxio需要提供一种高效可扩展的大规模元数据管理机制。

本文以开源版本的Alluxio 2.8为例，揭秘分布式文件系统中常见的大规模元数据管理机制。对Alluxio用户而言，用户通过文件元信息和Alluxio文件系统接口进行互动，通过数据块元信息来读写数据和缓存。文件和数据块元信息由Alluxio Master统一存储和管理。

01分布式文件系统元数据的常见类型

Alluxio Master管理的元数据中，最重要的是文件元数据、数据块元数据、挂载点元数据和Alluxio Worker元数据几类。

文件（inode）元数据

Alluxio文件系统中的每一个文件或文件夹都由一个inode代表，这个inode存储着这个文件所有的属性和元信息，包括文件基本属性、权限信息、管理属性、时间戳、包含的数据块及每一个数据块的元数据等。“inode”这一概念来源于Unix类型的文件系统，在Linux和HDFS等文件系统中被广泛使用，一个inode代表着文件系统目录树上的一个节点。因为Alluxio管理着多个底层存储，所以Alluxio命名空间中的潜在文件数量实际上是所有底层存储中文件的总和。元数据服务作为Alluxio集群中最重要的服务，直接决定了系统的规模、性能和稳定性。值得一提的是，Alluxio文件系统中的inode不一定在底层存储中存在。例如，如果这个路径是用MUST_CACHE方式写入Alluxio，那么Alluxio并不会在底层存储中创建这个文件。此外，如果底层存储是一个对象存储，因为对象存储没有文件夹的概念，所以Alluxio中的文件夹并不会在底层存储中对应实际存在的对象。

总体来说，Alluxio Master对inode的管理可以抽象地分为以下几类：

使用一个InodeTree存储所有的inode信息及inode之间的树状结构（文件夹和文件之间的父子关系），AlluxioMaster维护着文件系统的树状结构。
实现文件系统操作的接口并支持所有对文件的操作。AlluxioMaster开放了一系列文件系统操作接口，并且对每一个操作提供了并发安全和持久化保证，通过这样的方式向上层应用提供了一个分布式文件系统。
通过Journal日志维护一个持久化的状态，保证每一个inode操作的持久性和原子性。AlluxioMaster通过保证inode信息和每一个操作记录在Journal日志中，从而保障在任何情况下inode信息和更改都不会丢失。
Alluxio的InodeTree通过将锁粒度精细到每一个inode，支持inode级别的读写并发访问。对每一个inode通过锁进行并发控制，保证在并发读写中inode的线程安全。

数据块（block）元数据

如果inode对应一个文件，则它有0个（空文件）或多个数据块。对一个新建文件而言，所有数据块大小都由 alluxio.user.block.size.bytes.default 设置，只有最后一个数据块除外。只有1个数据块的文件也算作是最后一个数据块。数据块的元信息管理相对inode而言比较简单，因为数据块之间不具有树状的结构或者亲子关系。

Alluxio Master保存着数据块的元信息以及数据块缓存的当前位置，并对外提供了对这些信息的读写接口。Alluxio Master管理的数据块元数据可以简要地被看作两个键值存储：

（1）

（2）

其中，BlockMetadata记录了数据块的长度。BlockLocation记录了这个数据块（缓存）存在的Alluxio
Worker节点地址，和这个数据块在Alluxio Worker节点上的具体存储位置。

这两个不同的信息被分开存储主要是因为它们的生命周期不同。Block
Metadata是不变的（Immutable）。Alluxio不支持对已经写完的数据块进行随机更改或追加。如果这个文件被重写，它会得到新的FileID（即InodeID）和新的BlockID，旧的数据块会被舍弃。相反，BlockLocation列表是会不断变化的，比如当这个数据块被加载进一个新的Alluxio
Worker，或者被从某一个Alluxio Worker上驱逐之后，这个列表信息都会对应地改变。

MountTable

MountTable管理着所有Alluxio文件系统中的挂载点，提供了诸如挂载点的创建和更改操作。同时Alluxio文件路径和底层存储的文件路径也通过MountTable互相解析对应。

Worker元数据

Alluxio Master对Alluxio Worker元数据的管理包括了追踪当前有哪些正在工作的Alluxio Worker，并且不断更新Alluxio Worker上的缓存列表。Alluxio Master记录的信息主要包括：

（1）Alluxio Worker的地址、启动时间等不变信息。

（2）Alluxio Worker的空间使用情况，包括多层缓存中每层的使用量，随每次心跳更新。

（3）Alluxio Worker中被缓存的所有BlockID和将要从Alluxio Worker中移除的所有BlockID。这些信息随着每一次心跳和数据块操作（加载、驱逐等）而改变。

02分布式文件系统元数据的存储模式

分布式文件系统的元数据存储通常包括堆上存储和堆外存储两种。其中，堆上存储访问高效，但是空间有限，而堆外存储空间大，但如果设计不当会造成性能损失。

2.1 元数据存储在堆上（HEAP模式）

以Alluxio为例，在HEAP模式下，所有元信息都以Java对象的形式存储在JVM的堆中。每一个文件在堆上的内存占用大约为2KB_{4KB。因此，当Alluxio文件系统中有大量的文件时，堆上元信息将会给JVM带来大量内存压力。不难算出，系统中有1亿文件时，JVM上仅仅是存储这些文件的元信息就会占用200GB}400GB。加上Master JVM必须承担的大量RPC操作内存开销，这个JVM对内存的需求是普通服务器很难承受的。

此外，对大部分JVM版本而言，如此数据规模下的GC会变得非常难以管理。Alluxio Master JVM中的这些元信息都是长久存在的对象，尤其会给老年代的GC效率带来很大的影响。尽管有一些商业版JVM可以避免部分或大部分JVM带来的性能和管理问题，但是对大多数用户来说，JVM占用过多还是一个十分棘手的痛点，尤其是Alluxio Master 的JVM可能在未来随着业务扩展可能超出物理机内存的上限。

2.2 元数据存储在堆外（ROCKS模式）

针对HEAP模式难以扩展的问题，Alluxio优化了设计方向。Alluxio 在2.0版本中引入了ROCKS模式，将元信息存储挪到了JVM之外。在ROCKS模式下，Alluxio Master内嵌了一个RocksDB，将文件（和数据块）的元信息从之前的JVM堆上挪到了RocksDB中，而RocksDB的存储介质实际是硬盘而非内存。
使用RocksDB存储元数据只需要配置元数据存储模式并指定RocksDB存储的路径：

alluxio.master.metastore=ROCKS

alluxio.master.metastore.dir=${alluxio.work.dir}/metastore

Alluxio内嵌的RocksDB会使用 alluxio.master.metastore.dir 配置的路径作为自己的元数据存储。以下示例中，我们查看一个运行中的Alluxio集群的RocksDB存储，可以见到Alluxio在RocksDB中保存的Inode和Block元数据各有一个存储目录，并维护了由RocksDB管理的数据文件。RocksDB的存储目录结构在本书中不做赘述，读者可以查看RocksDB的官方文档。

$ ls -al -R metastore/

metastore/:

total 8

drwxrwxr-x. 2 alluxio-user alluxio-group 4096 May 21 03:20 blocks

drwxrwxr-x. 2 alluxio-user alluxio-group 4096 May 21 03:33 inodes

 

metastore/blocks:

total 4264

-rw-r--r--. 1 alluxio-user alluxio-group     0 May 21 03:20 000005.log

-rw-r--r--. 1 alluxio-user alluxio-group    16 May 21 03:20 CURRENT

-rw-r--r--. 1 alluxio-user alluxio-group    36 May 21 03:20 IDENTITY

-rw-r--r--. 1 alluxio-user alluxio-group     0 May 21 03:20 LOCK

-rw-r--r--. 1 alluxio-user alluxio-group 52837 May 21 03:30 LOG

-rw-r--r--. 1 alluxio-user alluxio-group   176 May 21 03:20 MANIFEST-000004

-rw-r--r--. 1 alluxio-user alluxio-group 13467 May 21 03:20 OPTIONS-000009

-rw-r--r--. 1 alluxio-user alluxio-group 13467 May 21 03:20 OPTIONS-000011

 

metastore/inodes:

total 4268

-rw-r--r--. 1 alluxio-user alluxio-group     0 May 21 03:20 000005.log

-rw-r--r--. 1 alluxio-user alluxio-group  1211 May 21 03:33 000012.sst

-rw-r--r--. 1 alluxio-user alluxio-group    16 May 21 03:20 CURRENT

-rw-r--r--. 1 alluxio-user alluxio-group    36 May 21 03:20 IDENTITY

-rw-r--r--. 1 alluxio-user alluxio-group     0 May 21 03:20 LOCK

-rw-r--r--. 1 alluxio-user alluxio-group 58083 May 21 03:33 LOG

-rw-r--r--. 1 alluxio-user alluxio-group   247 May 21 03:33 MANIFEST-000004

-rw-r--r--. 1 alluxio-user alluxio-group 13679 May 21 03:20 OPTIONS-000009

-rw-r--r--. 1 alluxio-user alluxio-group 13679 May 21 03:20 OPTIONS-000011

2.3 堆外存储的内存和磁盘占用

在ROCKS模式下，元信息被存储在堆外的RocksDB中，这样会极大地降低元信息存储对Alluxio Master进程的内存压力。与HEAP模式相比，所有的元信息读写从内存速度降低到了硬盘速度，这将会很大程度上影响Alluxio Master的性能和吞吐量。因此Alluxio Master在内存中加入了一个缓存来加速对RocksDB的访问。换言之，在ROCKS模式下，元信息存储的内存占用变成了这部分缓存的内存占用。与HEAP模式下的内存占用估算类似，缓存中每一个文件的元信息存储占用同样的2KB~4KB。

缓存的大小alluxio.master.metastore.inode.cache.max.size 控制。这个配置项的值根据Alluxio版本可能有所不同。Alluxio Master会先写入缓存，当缓存达到一定使用量之后才开始写入RocksDB（磁盘）。RocksDB的磁盘占用情况如下：大约100万个文件的元信息占用约4GB的硬盘空间。值得注意的是，当Alluxio命名空间内文件数量未触发基于 alluxio.master.metastore.inode.cache.max.size 的驱逐时，所有文件元信息都在基于内存的缓存内，未写入RocksDB，此时这些文件的元信息磁盘占用接近于0。

2.4 对堆外存储的缓存加速和调优

当内存空间充足时，适当调大 alluxio.master.metastore.inode.cache.max.size 可以将更多文件元信息缓存在内存中来提升性能。同时需注意，Alluxio Master上的RPC操作也会消耗内存。即使没有进行中的RPC操作，Alluxio Master上仍然会有一些定期的文件扫描等内部管理逻辑会消耗内存。在估算Alluxio Master进程中内存时，需要一定要预留足够内存给这些操作，不要让元信息存储占用了所有的内存。这和在服务器上不能把100%的内存都分配给应用而不给操作系统预留内存空间的道理是一样的。元信息缓存的管理是基于水位机制的，用户配置一个高水位参数和一个低水位参数，比如以下是默认配置：

alluxio.master.metastore.inode.cache.high.water.mark.ratio=0.85

alluxio.master.metastore.inode.cache.low.water.mark.ratio=0.8

在缓存使用达到 0.85 * alluxio.master.metastore.inode.cache.max.size时，缓存数据会开始驱逐，将缓存中的数据内容写入RocksDB存储。在缓存占用率降低到0.8时停止驱逐。

2.5在HEAP和ROCKS模式间切换

使用HEAP模式和ROCKS模式下Journal日志的格式不同，因此从一种模式切换到另一种不能通过简单的更改配置并重启Alluxio Master进程来完成。元数据存储模式的切换可以通过从备份中启动集群完成，见4.5章节。

本文以Alluxio为例，简要介绍了分布式文件系统的元数据基本类型及其管理和优化方法，更多的数据访问优化细节可以进一步参考查阅Alluxio开源社区代码，也欢迎阅读最近机械工业出版社出版的技术书籍《分布式统一大数据虚拟文件系统——Alluxio原理、技术与实践》：

本书以广泛使用的Alluxio 2.8.0开源版本为基础编写，深入介绍Alluxio相关分布式统一大数据文件系统的技术原理与实践案例，主要内容包括系统入门与使用、内核组件设计实现原理，同时详细介绍了大型企业应用案例与实践，并附有Alluxio的开源社区开发者指南。本书为Alluxio开源社区用户、高校大数据系统课程师生以及潜在企业用户提供了较为完整的技术指南和实用教程，既可作为大数据专业方向的专业教材，也可作为大数据从业者和研究者的重要专业资料。

03特别预告：

9月21日晚20:00，本书三位作者顾荣，刘嘉承，毛宝龙老师将为大家带来“Alluxio: 加速新一代大数据与AI变革”的精彩直播。欢迎关注视频号“IT阅读排行榜”订阅直播提醒。

敬请期待！

阅读原文猿哥学编程

04参与方式

抽奖方式：评论区随机抽取5位小伙伴免费送出！！
参与方式：关注博主、点赞、收藏、评论区评论“人生苦短，我爱Python！”
（切记要点赞+收藏，否则抽奖无效，每个人最多评论三次！）
活动截止时间：2023-09-12 20:00:00

05往期赠书回顾

【山河赠书第一期】:《Python从入门到精通（微课精编版》三本
【山河赠书第二期】:《零基础学会Python编程（ChatGPT版》一本
【山河赠书第三期】:《Python机器学习:基于PyTorch和Scikit-Learn 》四本
【山河送书第四期】:《Python之光：Python编程入门与实战》五本
【山河送书第五期】:《码上行动：利用Python与ChatGPT高效搞定Excel数据分析》三本
【山河送书第六期】:《码上行动:零基础学会Python编程( ChatGPT版)》两本
【山河送书第七期】:《强化学习：原理与Python实战》五本
【山河送书第八期】:《用ChatGPT轻松玩转机器学习与深度学习》两本

文章末尾扫码加入粉丝群，不定期发放粉丝福利，各种专业书籍免费赠送！

MySQL优化系列9-MySQL控制查询优化器Hints 只是甲 MySQL从小工到专家之路 #MySQL优化 mysql hints MySQL调整执行计划
备注:测试数据库版本为MySQL8.0文章目录一.控制查询计划评估二.可切换的优化三.优化器的Hints3.1优化器Hints概述3.2优化器Hints语法3.3连接顺序优化器Hints3.4表级别的优化器Hints3.5索引级别优化器Hints3.6子查询相关优化器的Hints3.7语句执行时间优化器Hints3.8可变设定Hints语法3.9资源组Hint语法3.10命名查询块的优化器Hint
python中单，双引号和三个双引号的区别 tycoon1988
先说1双引号与3个双引号的区别，双引号所表示的字符串通常要写成一行如：s1="hello,world"如果要写成多行，那么就要使用/(“连行符”)吧，如s2="hello,/world"s2与s1是一样的。如果你用3个双引号的话，就可以直接写了，如下：s3="""hello,world,hahaha."""，那么s3实际上就是"hello,/nworld,/nhahaha.",注意“/n”，所以，
02 SpringBoot初体验：统一响应和异常处理 theskyzero #SpringBoot初体验 spring boot java
文章目录背景目标准备工作基础知识统一响应定义统一响应`Response`使用统一响应`Response.success``ResponseBodyAdvice`测试异常处理全局异常处理`@ExceptionHandler``BizException`测试异常替代错误处理`ErrorController`01SpringBoot初体验：初始化web项目02SpringBoot初体验：统一响应和异常处
python+selenium定位网页动态元素 + 定位非select（即input）的下拉列表 + 返回上一个函数进行保存操作心田婷 python 定位 selenium python
1、python+selenium定位网页动态元素这个折磨我快一天的小东西，磨的我都快想睡觉了网上大佬门的经验啥的都看遍了，或许是看到不够多，找了一天都没解决，然后现在终于找到了解决的办法！！！报错：selenium.common.exceptions.NoSuchElementException:Message:nosuchelement:Unabletolocateelement:{“meth
深入理解Java泛型 wh柒八九核心知识点 java相关 java 面试
作为一个Java程序员，日常编程早就离不开泛型。泛型自从JDK1.5引进之后，真的非常提高生产力。一个简单的泛型T，寥寥几行代码，就可以让我们在使用过程中动态替换成任何想要的类型，再也不用实现繁琐的类型转换方法。文章目录概述Java泛型实现方式类型擦除带来的缺陷不支持基本数据类型运行效率运行期间无法获取泛型实际类型Java泛型历史背景本文小结概述泛型虽然我们每天都在用，但是还有很多同学可能并不了解
Python Django ORM qq_15654157 Python python
一、ORM介绍1.什么是ORM?ORM全拼Object-RelationMapping.中文意为对象-关系映射.在MVC/MVT设计模式中的Model模块中都包括ORM2.ORM优势（1）只需要面向对象编程,不需要面向数据库编写代码.对数据库的操作都转化成对类属性和方法的操作.不用编写各种数据库的sql语句.（2）实现了数据模型与数据库的解耦,屏蔽了不同数据库操作上的差异.不在关注用的是mysql
【Oracle篇】使用impdp导入报错ORA-39001:ORA-39000:ORA-39142:incompatible version number xxx in dump file的问题解决奈斯DB Oracle专栏 oracle 数据库
《博主介绍》：✨又是一天没白过，我是奈斯，从事IT领域✨《擅长领域》：✌️擅长阿里云AnalyticDBforMySQL(分布式数据仓库)、Oracle、MySQL、Linux、prometheus监控；并对SQLserver、NoSQL(MongoDB)有了解✌️大佬们都喜欢静静的看文章，并且也会默默的点赞收藏加关注如标题所示这篇文章是记录并分享一下使用数据泵导入时的报错，这个报错是博主在一年之
泷羽sec:蓝队基础之企业网络架构菜鸟小白：长岛icetea 泷羽sec红队全栈课程网络架构
声明：学习视频来自B站up主泷羽sec有兴趣的师傅可以关注一下，如涉及侵权马上删除文章，笔记只是方便各位师傅的学习和探讨，文章所提到的网站以及内容，只做学习交流，其他均与本人以及泷羽sec团队无关，切勿触碰法律底线，否则后果自负!!!!有兴趣的小伙伴可以点击下面连接进入b站主页B站泷羽sec泷羽sec的个人空间-泷羽sec个人主页-哔哩哔哩视频————————————————企业网络架构：全面解析
大数据分析案例-基于逻辑回归算法构建抑郁非抑郁推文识别模型艾派森大数据分析案例合集机器学习人工智能 python 数据挖掘回归
‍♂️个人主页：@艾派森的个人主页✍作者简介：Python学习者希望大家多多支持，我们一起进步！如果文章对你有帮助的话，欢迎评论点赞收藏加关注+喜欢大数据分析项目的小伙伴，希望可以多多支持该系列的其他文章大数据分析案例合集
oracle通过pid查找执行SQL two_rain oracle oracle sql 数据库
通过TOP命令查看PID:1560PIDUSERPRNIVIRTRESSHRS%CPU%MEMTIME+COMMAND1560oracle20038.978g0.038t16296R100.015.31069:13python3Main_Mem.pyProcessLog1config.ini通过spid查找对应SQL:1、SELECTaddrFROMv$processcWHEREc.spid=15
掌握Python Selenium：网页元素自动化定位实战指南 jardonwang1 python selenium 自动化
一、Selenium框架介绍Selenium是一个用于自动化web应用程序测试的工具，它直接运行在浏览器中，就像真实用户在操作一样。这个框架支持多种浏览器（包括Chrome、Firefox、Safari等），并且可以在多种操作系统（Windows、Linux、macOS等）上运行。Selenium的主要目标是使自动化测试变得简单，以支持开发人员和测试人员快速编写测试用例。以下是Selenium框架
【python中级】安装nuitka打包工具 jn10010537 python 服务器开发语言
【python中级】安装nuitka打包工具1.背景2.nuitka简介3.nuitka安装4.nuitka文档1.背景最近发程序执行包，被人说程序包很大。比如python通过pyinstaller打包的可执行程序有30M，然而有同事通过C#编译的程序只有几百K；一度让领导觉得C#这个开发者在忽悠或者摸鱼。我感觉到有点尴尬，但是如果都需要解释一遍，显得苍白无力。虽然python开发效率是快，但是执
Python 的打包神器 — Nuitka LinkSLA 云计算 python 开发语言
一.pyinstaller和Nuitka使用感受1.1使用需求这次也是由于项目需要，要将python的代码转成exe的程序，在找了许久后，发现了2个都能对python项目打包的工具——pyintaller和nuitka。这2个工具同时都能满足项目的需要：隐藏源码。这里的pyinstaller是通过设置key来对源码进行加密的；而nuitka则是将python源码转成C++（这里得到的是二进制的py
Python中selenium的玩法，小朋友看了都说学会了 2401_87361571 python selenium 开发语言
2.selenium的作用和工作原理利用浏览器原生的API，封装成一套更加面向对象的SeleniumWebDriverAPI，直接操作浏览器页面里的元素，甚至操作浏览器本身（截屏，窗口大小，启动，关闭，安装插件，配置证书之类的）webdriver本质是一个web-server，对外提供webapi，其中封装了浏览器的各种功能不同的浏览器使用各自不同的webdriver3.selenium的安装以及
实验四 XML 无尽罚坐的人生 #Java Web xml
实验四XML目的：1、安装和使用XML的开发环境2、认识XML的不同类型3、掌握XML文档的基本语法4、了解DTD的作用5、掌握DTD的语法6、掌握Schema的语法实验过程：1、安装XML的编辑器，可以选择以下之一a)XMLSpyb)VScode，Vscode中安装XML插件2、给定一个XML文档test.xmltom24Python1861111111118622222222sammy25C+
第七章 C - D 开头的术语 yaoxin521123 IRIS相关术语 oracle 数据库
文章目录第七章C-D开头的术语当前设备(currentdevice)当前目录(currentdirectory)基于游标的SQL(cursor-basedSQL)游标(cursor)自定义存储(customstorage)以D开头的术语数据库(database)数据库缓存(databasecache)数据库加密(databaseencryption)数据库加密密钥(database-encrypt
C#如何通过使用XpsToPdf库来转换xps为pdf文件 SunkingYang #C#入门级知识 c#pdf xps XpsToPdf 使用方法转换
文章目录英文描述中文描述XpsToPdf库地址调用方法：英文描述OutputtoPDFinWPF(forfree!)TherearetwogeneralstrategiestooutputtingtoaPDFinWPF.OneistooutputdirectlytoaPDFwhichrequiresyoutraverseavisualorflowdocumentandtranslatetoaPDF
Java重要面试名词整理（二十三）：DDD架构正在绘制中 Java面试 java 面试架构
文章目录DDD如何应对软件核心复杂性？技术主动理解业务“刚刚好”解决问题。概念通用语言-定义上下文的含义领域和子域-确定逻辑边界领域子域限界上下文（BoundedContext）-定义领域边界的利器上下文映射图（ContextMapping）-集成三种集成方式上下文映射的种类DDD的战术设计实体和值对象实体（Entity）值对象（ValueObject）聚合和聚合根聚合聚合根领域事件（Domain
为你「量身打造」的Python快速入门到实战和“图文双杀”（第1期）创文工作室 Python基础教程 python
Hello，大家好，欢迎来到创文工作室，这里是为你量身打造的Python快速入门到实战第1期。相信各位python学子一定愁于没有合适的教材而心急如焚吧，不用担心，这里是创文工作室为你良心打造的Python入门到实战,请大家先看目录目录0.写在前面0.1作者感言0.2Python介绍0.3Python安装1.注释1.1单行注释1.2多行注释2.输入与输出1.1输出1.1.1单行输出1.1.2多行输
python期末复习——python知识要点敲代码痛苦吗？ Python 其他 python
1、Python语言的特点及书写规范。特点：Python语言是一种面向对象的解释型语言1、解释型，开源，简单，易学，免费2.可扩展性，丰富的库，可移植性，面向对象3.规范的代码，可读性较强书写规范：缩进；注释；每个import只导入一个模块，尽量避免一次导入多个模块；语句太长可以在行尾使用续行符’’’’，来表示下面紧接的一行仍然属于当前的语句，也可以使用括号来包含多行内容；使用必要的空格和空行增强
python系列：如何在FastAPI中使用Pydantic的BaseModel上传文件和字典列表？坦笑&&life #python python fastapi windows
如何在FastAPI中使用Pydantic的BaseModel上传文件和字典列表？如何在FastAPI中使用Pydantic的BaseModel上传文件和字典列表？问题：回答：虽然`Pydantic模型`过去不允许使用`Query字段`，并且必须在单独的依赖类中实现查询`parameter-parsing`，如本答案和本答案所示，但这一点最近发生了变化，因此，可以使用`BaseModel类`将`Q
Python使用FastApi开发接口冉成未来 python fastapi 开发语言
文章目录python开发web框架简介FastApi安装安装依赖包代码编写创建数据库连接模块database.py创建数据库实体模块model.py创建实体类模型模块schemas.py创建操作数据库模块curd.py创建接收请求模块main.py创建运行模块run.py项目运行编写完以上代码，通过以下命令进行项目启动查看项目接口pyinstalle打包FastApi项目项目通过uvicorn运行
python力扣刷题记录——349. 两个数组的交集钟灵毓秀M 数据结构与算法 leetcode python
题目：349.两个数组的交集给定两个数组，编写一个函数来计算它们的交集。方法一：执行用时:52ms内存消耗:15.1MBclassSolution:defintersection(self,nums1:List[int],nums2:List[int])->List[int]:returnlist(set(nums1)&set(nums2))方法二：执行用时:68ms内存消耗:14.9MBclas
适合win7的python版本_Python 3.9 发布，不再支持 Win7！ weixin_39928818 适合win7的python版本
Python3.9正式发布Python3.9和之后的版本将不再支持Windows7，还没用上Windows10的可以考虑换系统了。而且这里默认下载的是64位，不再是32位。版本亮点新的语法特性>>>x={"key1":"value1fromx","key2":"value2fromx"}>>>y={"key2":"value2fromy","key3":"value3fromy"}>>>x|y{'
笨办法学python3进阶篇_笨办法学Python 3 进阶篇 weixin_39959298 笨办法学python3进阶篇
第一部分准备知识1如果不喜欢作者的个人流程怎么办2如果发现自己太糟糕怎么办2习题0准备工作3程序员用的编辑器3Python3.63工作终端4pip和virtualenv的配置4实验笔记4GitHub账号5git5可选：录屏软件5进一步研究5习题1论流程7习题挑战8巩固练习9进一步研究9习题2论创新11习题挑战11巩固练习12习题3论质量13习题挑战14巩固学习14第二部分快速实现15如何练习创新1
Python FastAPI 多参数传递大数据东哥(Aidon) python fastapi python fastapi 参数传递 FastAPI参数传递路径/POST/GET参数传递
PythonFastAPI请求参数传递FastAPI多参数传递类型FastAPI通过模板来匹配URL中的参数列表，大致有如下三类方式传递参数：路径参数传递：获取自定义的构造URL中的参数GET参数传递：获取一个URL后面带的?param1=1¶m2=2这种类型参数POST参数传递：获取POST请求中的参数，因为POST是加密的，因此更加安全，但有额外开销，测试API使用额外工具或插件或者自
【手写数据库内核组件】0301 缓存模型介绍，缓存分层架构与缓存映射算法，以及缓存淘汰替换算法，同步一致的策略韩楚风 C语言实战-手写数据库内核组件数据库缓存架构 c语言数据结构
0301缓存介绍专栏内容：postgresql使用入门基础手写数据库toadb并发编程个人主页：我的主页管理社区：开源数据库座右铭：天行健，君子以自强不息；地势坤，君子以厚德载物.文章目录0301缓存介绍一、概述二、多样的数据造就各异的缓存三、缓存的架构四、缓存算法4.1缓存组织算法4.2缓存映射算法4.3缓存替换算法4.4缓存同步算法五、总结结尾
Go语言学习笔记——gin实现验证码 PPPsych Go精进学习 gin
文章目录Golang验证码知识结构下载包导包配置session创建中间件生成图片生成验证码验证前端页面测试Golang验证码知识结构ginsession中间件表单处理路由下载包gogetgithub.com/dchest/captcha导包import("bytes""net/http""time""github.com/dchest/captcha""github.com/gin-contrib
Golang程序性能分析（二）在Echo和Gin框架中使用pprof kevin_tech java python vue linux go
前言今天继续分享使用Go官方库pprof做性能分析相关的内容，上一篇文章：Golang程序性能分析（一）pprof和go-torch中我花了很大的篇幅介绍了如何使用pprof采集Go应用程序的性能指标，如何找到运行缓慢的函数，以及函数中每一部的性能消耗细节。这一节的重点会放在如何在Echo和Gin这两个框架中增加对pprofHTTP请求的支持，因为pprof只是提供了对net/http包的Serv
VUE项目使用高德地图进行精准定位高德地图API HhhDreamof_ 定位
提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录前言一、高德地图API二、使用步骤1.引入key2.创建方法总结前言提示：以下是本篇文章正文内容，下面案例可供参考一、高德地图的准备工作1.注册高德地图管理者账号https://developer.amap.com/准备好key2.在index.htmlbody中引入高德地图定位二、创建方法1.methods代码如下（示例）：
ASM系列六利用TreeApi 添加和移除类成员 lijingyao8206 jvm 动态代理 ASM 字节码技术 TreeAPI
同生成的做法一样，添加和移除类成员只要去修改fields和methods中的元素即可。这里我们拿一个简单的类做例子，下面这个Task类，我们来移除isNeedRemove方法，并且添加一个int 类型的addedField属性。 package asm.core; /** * Created by yunshen.ljy on 2015/6/
Springmvc-权限设计 bee1314 spring Web jsp
万丈高楼平地起。权限管理对于管理系统而言已经是标配中的标配了吧，对于我等俗人更是不能免俗。同时就目前的项目状况而言，我们还不需要那么高大上的开源的解决方案，如Spring Security，Shiro。小伙伴一致决定我们还是从基本的功能迭代起来吧。目标： 1.实现权限的管理（CRUD） 2.实现部门管理（CRUD) 3.实现人员的管理（CRUD） 4.实现部门和权限
算法竞赛入门经典（第二版）第2章习题 CrazyMizzz c 算法
2.4.1 输出技巧 #include <stdio.h> int main() { int i, n; scanf("%d", &n); for (i = 1; i <= n; i++) printf("%d\n", i); return 0; } 习题2-2 水仙花数(daffodil
struts2中jsp自动跳转到Action 麦田的设计者 jsp webxml struts2 自动跳转
1、在struts2的开发中，经常需要用户点击网页后就直接跳转到一个Action，执行Action里面的方法，利用mvc分层思想执行相应操作在界面上得到动态数据。毕竟用户不可能在地址栏里输入一个Action（不是专业人士） 2、＜jsp:forward page="xxx.action" /＞，这个标签可以实现跳转，page的路径是相对地址,不同与jsp和j
php 操作webservice实例 IT独行者 PHP webservice
首先大家要简单了解了何谓webservice，接下来就做两个非常简单的例子，webservice还是逃不开server端与client端。我测试的环境为：apache2.2.11 php5.2.10做这个测试之前，要确认你的php配置文件中已经将soap扩展打开，即extension=php_soap.dll; OK 现在我们来体验webservice //server端 serve
Windows下使用Vagrant安装linux系统 _wy_ windows vagrant
准备工作：下载安装 VirtualBox ：https://www.virtualbox.org/ 下载安装 Vagrant ：http://www.vagrantup.com/ 下载需要使用的 box ：官方提供的范例：http://files.vagrantup.com/precise32.box 还可以在 http://www.vagrantbox.es/
更改linux的文件拥有者及用户组(chown和chgrp) 无量 c linux chgrp chown
本文（转） http://blog.163.com/yanenshun@126/blog/static/128388169201203011157308/ http://ydlmlh.iteye.com/blog/1435157 一、基本使用：使用chown命令可以修改文件或目录所属的用户：命令
linux下抓包工具矮蛋蛋 linux
原文地址： http://blog.chinaunix.net/uid-23670869-id-2610683.html tcpdump -nn -vv -X udp port 8888 上面命令是抓取udp包、端口为8888 netstat -tln 命令是用来查看linux的端口使用情况 13 . 列出所有的网络连接 lsof -i 14. 列出所有tcp 网络连接信息 l
我觉得mybatis是垃圾！：“每一个用mybatis的男纸，你伤不起” alafqq mybatis
最近看了每一个用mybatis的男纸，你伤不起原文地址：http://www.iteye.com/topic/1073938 发表一下个人看法。欢迎大神拍砖；个人一直使用的是Ibatis框架，公司对其进行过小小的改良；最近换了公司，要使用新的框架。听说mybatis不错；就对其进行了部分的研究；发现多了一个mapper层；个人感觉就是个dao；
解决java数据交换之谜百合不是茶数据交换
交换两个数字的方法有以下三种，其中第一种最常用 /* 输出最小的一个数 */ public class jiaohuan1 { public static void main(String[] args) { int a =4; int b = 3; if(a<b){ // 第一种交换方式 int tmep =
渐变显示 bijian1013 JavaScript
<style type="text/css"> #wxf { FILTER: progid:DXImageTransform.Microsoft.Gradient(GradientType=0, StartColorStr=#ffffff, EndColorStr=#97FF98); height: 25px; } </style>
探索JUnit4扩展：断言语法assertThat bijian1013 java 单元测试 assertThat
一.概述 JUnit 设计的目的就是有效地抓住编程人员写代码的意图，然后快速检查他们的代码是否与他们的意图相匹配。 JUnit 发展至今，版本不停的翻新，但是所有版本都一致致力于解决一个问题，那就是如何发现编程人员的代码意图，并且如何使得编程人员更加容易地表达他们的代码意图。JUnit 4.4 也是为了如何能够
【Gson三】Gson解析{"data":{"IM":["MSN","QQ","Gtalk"]}} bit1129 gson
如何把如下简单的JSON字符串反序列化为Java的POJO对象? {"data":{"IM":["MSN","QQ","Gtalk"]}} 下面的POJO类Model无法完成正确的解析： import com.google.gson.Gson;
【Kafka九】Kafka High Level API vs. Low Level API bit1129 kafka
1. Kafka提供了两种Consumer API High Level Consumer API Low Level Consumer API(Kafka诡异的称之为Simple Consumer API，实际上非常复杂) 在选用哪种Consumer API时，首先要弄清楚这两种API的工作原理，能做什么不能做什么，能做的话怎么做的以及用的时候，有哪些可能的问题
在nginx中集成lua脚本：添加自定义Http头，封IP等 ronin47 nginx lua
Lua是一个可以嵌入到Nginx配置文件中的动态脚本语言，从而可以在Nginx请求处理的任何阶段执行各种Lua代码。刚开始我们只是用Lua 把请求路由到后端服务器，但是它对我们架构的作用超出了我们的预期。下面就讲讲我们所做的工作。强制搜索引擎只索引mixlr.com Google把子域名当作完全独立的网站，我们不希望爬虫抓取子域名的页面，降低我们的Page rank。 location /{
java-归并排序 bylijinnan java
import java.util.Arrays; public class MergeSort { public static void main(String[] args) { int[] a={20,1,3,8,5,9,4,25}; mergeSort(a,0,a.length-1); System.out.println(Arrays.to
Netty源码学习-CompositeChannelBuffer bylijinnan java netty
CompositeChannelBuffer体现了Netty的“Transparent Zero Copy” 查看API（ http://docs.jboss.org/netty/3.2/api/org/jboss/netty/buffer/package-summary.html#package_description）可以看到，所谓“Transparent Zero Copy”是通
Android中给Activity添加返回键 hotsunshine Activity
// this need android:minSdkVersion="11" getActionBar().setDisplayHomeAsUpEnabled(true); @Override public boolean onOptionsItemSelected(MenuItem item) {
静态页面传参 ctrain 静态
$(document).ready(function () { var request = { QueryString : function (val) { var uri = window.location.search; var re = new RegExp("" + val + "=([^&?]*)", &
Windows中查找某个目录下的所有文件中包含某个字符串的命令 daizj windows 查找某个目录下的所有文件包含某个字符串
findstr可以完成这个工作。 [html] view plain copy >findstr /s /i "string" *.* 上面的命令表示，当前目录以及当前目录的所有子目录下的所有文件中查找"string&qu
改善程序代码质量的一些技巧 dcj3sjt126com 编程 PHP 重构
有很多理由都能说明为什么我们应该写出清晰、可读性好的程序。最重要的一点，程序你只写一次，但以后会无数次的阅读。当你第二天回头来看你的代码时，你就要开始阅读它了。当你把代码拿给其他人看时，他必须阅读你的代码。因此，在编写时多花一点时间，你会在阅读它时节省大量的时间。让我们看一些基本的编程技巧：尽量保持方法简短尽管很多人都遵
SharedPreferences对数据的存储 dcj3sjt126com
SharedPreferences简介： &nbs
linux复习笔记之bash shell (2) bash基础 eksliang bash bash shell
转载请出自出处： http://eksliang.iteye.com/blog/2104329 1.影响显示结果的语系变量（locale） 1.1locale这个命令就是查看当前系统支持多少种语系，命令使用如下： [root@localhost shell]# locale LANG=en_US.UTF-8 LC_CTYPE="en_US.UTF-8"
Android零碎知识总结 gqdy365 android
1、CopyOnWriteArrayList add(E) 和remove(int index)都是对新的数组进行修改和新增。所以在多线程操作时不会出现java.util.ConcurrentModificationException错误。所以最后得出结论：CopyOnWriteArrayList适合使用在读操作远远大于写操作的场景里，比如缓存。发生修改时候做copy，新老版本分离，保证读的高
HoverTree.Model.ArticleSelect类的作用 hvt Web .net C#hovertree asp.net
ArticleSelect类在命名空间HoverTree.Model中可以认为是文章查询条件类，用于存放查询文章时的条件，例如HvtId就是文章的id。HvtIsShow就是文章的显示属性，当为-1是，该条件不产生作用，当为0时，查询不公开显示的文章，当为1时查询公开显示的文章。HvtIsHome则为是否在首页显示。HoverTree系统源码完全开放，开发环境为Visual Studio 2013
PHP 判断是否使用代理 PHP Proxy Detector 天梯梦 proxy
1. php 类 I found this class looking for something else actually but I remembered I needed some while ago something similar and I never found one. I'm sure it will help a lot of developers who try to
apache的math库中的回归——regression（翻译） lvdccyb Math apache
这个Math库，虽然不向weka那样专业的ML库，但是用户友好，易用。多元线性回归，协方差和相关性（皮尔逊和斯皮尔曼），分布测试（假设检验，t，卡方，G），统计。数学库中还包含，Cholesky，LU，SVD，QR，特征根分解，真不错。基本覆盖了：线代，统计，矩阵，最优化理论曲线拟合常微分方程遗传算法（GA），还有3维的运算。。。
基础数据结构和算法十三：Undirected Graphs (2) sunwinner Algorithm
Design pattern for graph processing. Since we consider a large number of graph-processing algorithms, our initial design goal is to decouple our implementations from the graph representation
云计算平台最重要的五项技术 sumapp 云计算云平台智城云
云计算平台最重要的五项技术 1、云服务器云服务器提供简单高效，处理能力可弹性伸缩的计算服务，支持国内领先的云计算技术和大规模分布存储技术，使您的系统更稳定、数据更安全、传输更快速、部署更灵活。特性机型丰富通过高性能服务器虚拟化为云服务器，提供丰富配置类型虚拟机，极大简化数据存储、数据库搭建、web服务器搭建等工作；仅需要几分钟，根据CP
《京东技术解密》有奖试读获奖名单公布 ITeye管理员活动
ITeye携手博文视点举办的12月技术图书有奖试读活动已圆满结束，非常感谢广大用户对本次活动的关注与参与。 12月试读活动回顾： http://webmaster.iteye.com/blog/2164754 本次技术图书试读活动获奖名单及相应作品如下：一等奖（两名） Microhardest：http://microhardest.ite