_这也太刺激了吧

An Efficient Design and Implementation of LSM-Tree based Key-Value Store on Open-Channel SSD

摘要

各种键值（KV）存储被广泛用于数据管理以支持Internet服务，因为它们提供了比关系数据库系统更高的效率，可伸缩性和可用性。基于日志结构的合并树（LSM-tree）的KV存储吸引了越来越多的关注，因为它们可以消除随机写入并保持可接受的读取性能。最近，随着NAND闪存每单位价格的下降，固态磁盘（SSD）已在企业级数据中心中广泛采用，以提供高I / O带宽和低访问延迟。但是，将基于LSM树的KV存储与SSD幼稚地组合起来效率低下，因为无法充分利用SSD内启用的高度并行性。当前基于LSM树的KV存储在设计时未假设SSD的多通道架构。

为了解决这一不足，我们建议使用LOCS系统，该系统配备了定制的SSD设计，可向应用程序公开其内部闪存通道，以与基于LSM树的KV存储（尤其是LevelDB）配合使用。我们扩展LevelDB以显式利用SSD的多个通道来利用其丰富的并行性。我们优化并发I / O请求的调度和调度策略，以进一步提高数据访问效率。与在常规SSD上运行库存LevelDB的情况相比，应用所有建议的优化技术后，存储系统的吞吐量可以提高4倍以上。

介绍

随着Web 2.0应用程序和云计算的飞速发展，大规模分布式存储系统被广泛部署以支持Internet范围的服务。为了存储超大规模数据和服务高并发访问，使用传统的关系数据库管理系统（RDBMS）作为数据存储可能不是一个有效的选择[15]。对于许多Web应用程序而言，RDBMS的许多特性和功能（例如事务一致性保证和支持复杂的SQL查询）不是必需的。因此，在大数据时代出现了一种新的存储架构，即键值（KV）存储。

键值存储将一组键映射到关联的值，可以将其视为分布式哈希表。与传统的RDBMS [37] [29]相比，无需提供数据库系统通常所需的特性和功能，KV存储可以提供更高的性能，更好的可伸缩性和更高的可用性。他们在数据中心中起着至关重要的作用，以支持许多Internet服务，包括Google的BigTable [18]，Facebook的Cassandra [28]，亚马逊的Dynamo [22]和Github的Redis [4]。

B +树是传统数据库和某些KV store中使用的通用结构。因为它的高扇出有助于减少查询操作的I / O操作数量。但是，使用数据结构支持随机插入和更新的效率非常低。当需要对数据存储进行大量更改时，使用B +树将导致大量昂贵的磁盘搜索并显着降低性能。日志结构的合并树（LSM-tree）[32]是一种针对写入进行优化的数据结构，包括插入，修改和删除。基本思想是通过聚合内存中的多个更新并将它们作为批处理转储到存储中，从而将随机写入转换为顺序写入。传入的数据项被存储在主存储器中保留的缓冲区中，并根据它们的键进行排序。当缓冲区已满时，其所有数据将整体写入到存储中。有很多流行的KV商店都采用基于LSM树的数据管理，包括BigTable [18]，Cassandra [28]，Hbase [9]和LevelDB [10]。

最初提出KV商店时，硬盘驱动器（HDD）被视为其主要目标存储设备。近年来，随着NAND闪存技术的发展，基于闪存的固态磁盘（SSD）的单位容量价格一直在下降。因此，SSD在当今的数据中心中变得越来越流行。与HDD相比，SSD提供更高的吞吐量和更低的延迟，特别是对于随机操作。但是，SSD也有其自身的局限性：随机写入的性能大大落后于顺序写入操作和读取操作的性能，这主要是由于产生了昂贵的垃圾回收[31]。如前所述，由于基于LSM树的KV存储可以有效地消除随机写入，因此，将基于LSM树的KV存储与基于NAND闪存的SSD集成在一起，从而实现读写I的高吞吐量被证明是有希望的/ O操作。

尽管研究人员已经意识到将基于LSM树的KV商店与SSD结合起来的潜在优势[11]，但据我们所知，在以前的工作中尚未对该主题进行很好的研究。实际上，这两种技术的简单集成效率不高。一方面，基于LSM树的KV存储中的数据移动过程最初是为HDD（而非SSD）设计的。由于硬盘驱动器只有一个磁盘头，因此KV存储将向硬盘驱动器串行发出I / O请求。我们需要提高并发级别，以便利用SSD的随机读取性能优势。另一方面，SSD丰富的内部并行性尚未得到充分利用。尽管现代的SSD通常包含多个通道，但SSD控制器硬件仅提供与操作系统的一个块设备接口，并且内部通道之间的I / O请求的调度和分派对于软件层而言是隐藏的。这使得基于LSM树的KV商店不知道SSD的多通道体系结构，并且根据基于LSM树的KV商店的数据访问模式，未优化SSD控制器做出的调度和调度决策。

为了解决这些问题，我们建议使用一种定制的SSD（称为SDF [33]），该SSD仅在最近才可用，以便与基于LSM的流行KV商店LevelDB一起使用[10]。 SDF最初是在百度的数据中心设计和采用的，而百度是中国最大的互联网搜索公司。它提供了独特的功能，其中对内部闪存通道的访问是开放的，并且可以由应用程序管理以充分利用SSD的高带宽。为了利用此独特功能，我们修改了LevelDB以应用许多优化。同时，我们观察到在这种新颖的系统中，调度策略对I / O性能具有至关重要的影响。因此，我们研究如何通过优化的调度和调度策略来提高吞吐量，并考虑使用LevelDB的访问模式的特征。我们的系统称为LOCS，是“ Open Channel SSD上基于LSM树的KV存储”的缩写。

这是将基于LSM树的KVstore与可在应用程序中直接访问其内部通道的开放通道SSD集成的第一项工作。
我们扩展了LevelDB以支持多线程I / O访问，以利用SDF中丰富的并行性此外，我们优化了LevelDB的写请求流量控制机制，以利用设备内并行性来提高吞吐量。
我们研究了I / O请求调度和调度策略的影响，并提出了相应的优化技术以进一步改进
我们提供了广泛的实验结果，表明LOCS可以胜过原始LevelDB与具有类似硬件组织的传统SSD设计的原始集成。结果还表明，使用我们的请求调度和调度优化技术可以进一步提高I / O性能。

本文的其余部分安排如下。第2节介绍了LevelDB，并简要描述了开放通道SSD设计（SDF）。在第3节中，我们描述如何扩展LevelDB，以便它可以与SDF一起有效地工作。此外，我们提出了几种用于调度和调度策略的优化技术，以提高I / O性能。我们还演示了LOCS提供的灵活性。第4节提供了广泛的实验和比较。我们将在第5节中介绍相关文献，然后在第6节中得出结论。

背景

levelDB

当用户在LevelDB中插入键值对时，它将首先保存在日志文件中。然后将其插入到内存中的分类结构中，该结构称为MemTable，用于保存最新更新。当传入数据项的大小达到最大容量时，MemTable将转换为只读的不可变MemTable。将创建一个新的MemTable来累积新的更新。同时，后台线程开始将Immutable MemTable转储到磁盘中并生成新的Sorted String Table文件（SSTable）。删除是其中存储删除标记的更新的特例。

SSTable存储一系列按其键排序的数据项。 SSTable的集合被组织为一系列级别，如图1所示。最年轻的级别Level 0是通过将Immutable MemTable从主内存写入磁盘而产生的。因此，级别0中的SSTables可以包含重叠键。但是，在其他级别，SSTable的关键范围是不重叠的。每个级别对SSTable的最大数量有限制，或者等效地，对数据总量也有限制，因为每个SSTable在级别中具有固定的大小。限制随着级别数以指数速率增长。例如，级别1的最大数据量将不超过10 MB，级别2的最大数据量将不超过100 MB。

为了将存储的数据保持在优化的布局中，将执行压缩过程。后台压缩线程将监视SSTable文件。当级别L的总大小超过其限制时，压缩线程将从级别L中选择一个SSTable，并从下一个级别L + 1中选择所有重叠的SSTable。这些文件用作压缩的输入，并合并在一起以生成一系列新的L + 1级文件。当输出文件达到预定义的大小（默认为2 MB）时，将创建另一个新的SSTable。压缩后将丢弃所有输入。请注意，从级别0到级别1的压缩与其他级别之间的处理不同。当级别0的SSTables的数量超过上限（默认为4）时，将触发压缩。如果某些压缩文件相互重叠，则压缩可能涉及多个0级文件。

通过执行压缩，LevelDB消除了覆盖的值并删除了已删除的标记。压缩操作还确保最新数据驻留在最低级别。过时的数据将逐渐移到更高的级别。与插入相比，数据的检索或读取操作更加复杂。当LevelDB收到Get（Key，Value）请求时，它将首先在MemTable中进行查找，然后在Immutable MemTable中进行查找，最后按顺序从Level 0到更高级别搜索SSTable，直到匹配的KV数据项被发现。 LevelDB一旦找到特定级别的密钥，它将停止搜索。如前所述，较低级别包含较新的数据项。将比旧数据更早地搜索新数据。与压缩类似，由于数据重叠，可以搜索多个0级文件。通常采用布隆滤波器[14]来减少读取不包含请求的KV项目的数据块的I / O成本。

Open-Channel SSD
我们在这项工作中使用的开放通道SSD（SDF）是定制的SSD，广泛部署在百度的存储基础架构中，以支持各种Internet规模的服务[33]。目前，在生产系统中已部署了3000多个SDF。在SDF中，硬件通过定制的控制器向应用程序公开其内部通道。此外，它还通过简化的I / O堆栈来实现大粒度访问并提供轻量级基本功能。

SDF设备包含44个独立通道。每个闪存通道都有专用的通道引擎来提供FTL功能，包括块级地址映射，动态损耗均衡，不良块管理以及闪存数据路径的逻辑。从软件层的抽象角度来看，SDF表现出以下功能。

首先，SDF向用户应用程序公开了SSD的内部并行性。如前所述，SDF的每个通道都有其专用的数据控制引擎。与将整个设备视为单个块设备（例如/ dev / sda）的常规SSD相比，SDF将每个通道作为独立的设备呈现给应用程序（例如，从/ dev / ssd0到/ dev / ssd43）。通过直接访问SDF上的各个闪存通道的功能，用户应用程序可以有效地组织其数据并安排其数据访问，以充分利用原始闪存的性能。

其次，SDF提供了一个非对称的I / O接口。读取单位大小与写入单位大小不同。 SDF积极将写入单元的大小增加到闪存块的大小（2 MB），并要求将写地址进行块对齐。因此，几乎消除了写放大，因为在垃圾回收时，没有闪存块将同时包含有效和无效页面。最小读取单位设置为闪存页的大小（8 KB），这保留了SSD固有的随机读取功能。换句话说，SDF放弃了对小的随机写入的支持，同时保持了随机读取的能力，这与基于LSM树的KV存储的访问模式非常匹配。

第三，将擦除操作作为对设备的新命令公开给软件。与读取或写入相比，擦除是一项昂贵的操作。例如，擦除2 MB的块大约需要3毫秒。当通道中正在进行擦除操作时，它会大大延迟发布给该通道的常规请求的服务。常规SSD控制器计划的擦除操作对应用程序是隐藏的。它们可能导致不可预测的服务质量波动，这对于性能至关重要的工作负载尤其有害。使用此擦除命令，软件可在覆盖块之前负责执行擦除操作。但它也使软件能够安排擦除操作，以最大程度地减少延迟，提高吞吐量并减轻与高优先级请求服务的冲突。

第四，专门为SDF设计了一个简化的I / O堆栈。 Linux构建了一个复杂的I / O堆栈，该堆栈主要是为传统的低速磁盘设计的。 I / O堆栈层（例如块层）已成为当今高性能SSD的瓶颈[16] [17]。实验表明，由软件层引入的额外延迟在我们的服务器上可能高达12 µs。对于高速闪存数据访问，此开销非常大。由于SDF是为基于LSM树的KV存储量身定制的，因此文件系统的大多数功能都变得不必要。为了提高效率，我们绕过了内核中的大多数I / O层，并使用ioctl接口直接与SDF驱动程序进行通信。 SDF的I / O堆栈的等待时间仅为2 µs至4 µs。 SDF为应用程序提供了用户空间存储API库，以利用此处所述的功能。

设计实现

在本节中，我们首先介绍LOCS系统的体系结构概述。然后，我们描述如何扩展原始的LevelDB设计，以便于同时访问SDF中的多个通道。接下来，我们分析了在LevelDB中进行请求调度以及将其调度到SDF通道的影响，并提出了提高访问效率的策略。

用软件和硬件级别说明了LOCS系统。软件级别由四个主要层组成：LevelDB，拟议的调度程序，存储API层和SSD驱动程序。如上一节所述，LevelDB是一种流行的基于LSM树的KV存储，并在此工作中用作案例研究。为了使LevelDB能够与开放通道SDF一起使用并提高其对SSD的高并发访问的效率，我们对LevelDB进行了一些必要的修改。有关详细信息，请参见第3.2节。注意，这项工作中提出的技术也可以应用于其他基于LSM树的KV store。

与传统的系统设计不同，在LevelDB和存储API层之间添加了调度程序。调度程序专门用于将来自LevelDB的请求调度和调度到SDF的各个通道。请注意，该调度程序与传统I / O堆栈中的OS调度程序不同。如第2.2节所述，使用SDF时，传统I / O堆栈中的大多数功能已被删除。此外，OS调度程序还负责所有进程的I / O请求。相反，图2中的调度程序仅考虑了LevelDB的请求。此外，用于垃圾回收的擦除操作也由调度程序管理。详细的设计和请求管理策略将在第3.3节中描述。

在调度和调度之后，来自LevDB的请求将针对不同的操作（包括读取，写入和擦除）调用相应的API。然后，调用SSD驱动程序以将这些请求发送到硬件设备中的SSD控制器。由于调度程序已由软件级别的调度程序接管，因此减少了传统硬件SSD控制器中的相应单元。 SSD控制器仅负责根据软件调度程序的指令将请求发送到相应的通道。另外，由于擦除操作也是由调度程序在软件级别上明确发出的，因此也不需要进行垃圾收集功能。其他基本功能（例如损耗平衡，ECC和DRAM缓存控制）仍保留在SSD控制器中。

延展LevelDB

启用对多个通道的并发访问

尽管LevelDB支持多个并发用户查询，但是只有一个后台线程将MemTables转储到存储设备并处理压缩过程。对于具有HDD的传统系统来说，这种设计是合理的，因为HDD中只有一个访问端口。由于移动磁盘头的延迟，使用多个线程进行SSTable写入和压缩会在不同线程的请求之间引入干扰，并降低I / O性能。但是，对于基于SSD的存储系统，可以删除查找时间。对于这项工作中使用的SDF，由于内部闪存通道已暴露于软件级别，因此有必要扩展LevelDB设计以允许并发访问这些通道。

首先，我们增加内存中不可变MemTable的数量，以充分利用SDF的44个通道。正如第2节中介绍的那样，在股票LevelDB中只有两个Memtable：一个工作的MemTable和一个不可变的MemTable。整个不可变内存表在单个写入请求中被刷新到SSD。如果在不可变的MemTable仍被刷新的同时工作的MemTable已满，则LevelDB将等待直到转储结束。由于一个写请求无法填满所有通道，因此我们增加了不可变内存表的数量上限，以存储更多传入数据。当工作的MemTable已累积足够的更新并达到大小阈值（此工作中为2 MB）时，它将生成一个不可变的MemTable，将其设置为可写入，然后将其发送到调度程序。通过这种修改，可以同时发出由多个不可变MemTables产生的写请求。我们将在第4节中展示不可变MemTables数量的影响。

当调度程序接收到写请求时，它将根据调度策略将写请求插入适当的请求队列中。如图2所示，每个闪存通道都有一个I / O请求队列。这意味着队列中的所有请求都由单个闪存通道独占服务。使用适当的调度策略，可以有效利用对多个通道的访问并发。对于读取和擦除请求，将根据要访问的数据的位置将它们插入相应的队列。对于写请求，将根据分派策略将它们插入合适的队列中。应该解决的是，如果将多个压缩过程应用于分布在不同通道上的SSTable，则也可以并行执行多个压缩过程。

编写流量控制策略

LevelDB的第二个修改与写流量控制策略有关。流量控制意味着LevelDB具有在Level 0 SSTables数量达到阈值时限制来自用户的写请求速率的机制。该机制的目的是限制0级SSTable的数量，从而减少与多个重叠的0级SSTable相关的搜索成本。换句话说，写吞吐量被交换为读性能。

（如何控制写流量, 牛皮）
有几个阈值可控制0级SSTable的数量。当达到阈值kL0压缩触发器（默认为4）时，将触发压缩过程。如果在压缩过程中不能有效地减少Level-0 SSTable的数量并达到第二个阈值kL0 SlowdownWritesTrigger（在库存LevelDB中设置为8），则LevelDB将进入睡眠模式一毫秒以减少接收到的数据。写请求的速率。但是，如果Level-0 SSTable的数量持续增加并超过了第三个阈值kL0 StopWritesTrigger（默认值为12），则所有写请求都将被阻止，直到后台压缩完成为止。

写流量控制策略会严重影响写吞吐量。当KV对的插入被阻止时，写入吞吐量将大大降低。考虑到SDF的多通道体系结构，我们调整了写流量控制策略以提高吞吐量。首先，我们增加这些阈值的值，这些阈值最初是为HDD优化的。当有多个MemTables同时刷新到SSD时，不应过于频繁地触发阈值。通过增加阈值，我们可以扩大暂停之间的间隔。其次，当触发减速条件时，我们引入了一个额外的后台线程加粗样式。在传统HDD中，所有读写I / O请求共享唯一的磁盘头。同时运行多个压缩将导致随机的I / O问题。但是，SDF中的多个通道使同时触发多个压缩变得可行。当用户请求被阻止时，单个压缩线程无法有效利用所有通道，即某些通道将处于空闲状态。通过创建一个额外的线程在暂停期间进行压缩，我们可以更快地减少0级文件的数量，并减轻暂停带来的吞吐量损失。值得一提的是，如果引入太多用于压缩的线程，它们将干扰正常的数据访问。我们的实验表明，附加的压实线足以降低吞吐量波动。此外，在所有0级SSTable被压缩之前，我们不需要阻止写请求。相反，我们修改LevelDB以确保当Level 0 SSTables的数量小于kL0 CompactionTrigger的一半时，它将再次接受用户写入请求。

3.预写式日志

当发生断电等事故时，LevelDB维护一个单一的日志文件以恢复主存储器中的存储器。在原始LevelDB设计中，使用内存映射文件将日志写入HDD。新的更新作为连续的I / O请求附加到当前日志文件中。当存在大量并发写入请求时，使用单个日志文件的这种日志策略会严重影响写入吞吐量。在这项工作中，我们假设我们有一小部分高性能非易失性存储器（NVM）（例如PCM或备用电池DRAM）来保存这些日志。由于只要将MemTable转储到SSD即可丢弃日志，因此对非易失性存储器上存储空间的需求适中。例如，使用带有44个通道的SDF，我们只需要大约100 MB

调度和调度策略

通过上一部分中介绍的扩展，LevelDB现在可以与SDF一起使用。在LOCS中，我们发现写请求的调度策略会影响SSD的吞吐量和工作效率。例如，如果一个通道中有大量I / O请求而其他通道则处于空闲状态，则性能将严重下降。但是，由于我们可以直接控制对SDF多个通道的访问，因此可以利用LevelDB的指导信息来优化调度和调度。因此，在本小节中，我们研究了几种不同的策略，并讨论了如何提高系统性能。

循环调度

我们的基准调度策略是简单的循环（RR）调度，它可以将写入请求均匀地分配到SSD中的所有通道。来自LevelDB的写请求采用SSTable的粒度，其大小为2 MB。我们以循环顺序将所有写请求分配到每个通道。

这类似于传统的基于硬件的SSD控制器中的设计。例如，在我们的实验中使用的华为SSD中，来自LevelDB的每个大写请求都被剥离到多个通道上，以受益于并行访问。在我们的系统中，使用多个请求队列，情况有所不同。来自LevelDB的大型写请求被发布到一个通道，并且其数据不会被分割。因此，请求以2MB的粒度分配到通道。

循环调度具有简单性的优点。由于每个写请求的大小是固定的，因此在写请求占主导的情况下，它可以有效地工作。但是，当队列中有密集的读取和擦除请求时，循环调度的效率就会降低。这是因为两种类型的请求的分发都是固定的。特别是在同一队列中有多个读取/擦除请求等待的情况下，这可能导致队列长度不平衡。

图3（a）给出了循环调度的示例。假设SSD中有三个通道。图3（c）中显示了11个I / O请求的踪迹，包括6个写请求和5个读请求。第三行显示读取请求的通道地址。请注意，读取请求的通道地址已经确定并且不能更改，但是我们可以灵活地决定应在哪个通道上服务每个写入请求。应用循环调度时，所有写请求均以循环顺序均匀地调度到通道。但是，循环调度使通道2的请求队列比其他两个通道长得多，因为四个连续的读取请求全部落入通道2。因此，请求队列不平衡，这意味着通道2将与通道1和通道3相比，处理I / O请求所花的时间更长，并且通道2和2仍很忙时，通道1和3可能处于空闲状态。在这种情况下，不能充分利用多个通道启用的并行性。实际上，我们已经观察到，这种不平衡的队列会严重影响性能。详细的实验结果在第4节中显示和讨论。

2. 最小加权队列长度WriteDispatching

为了缓解循环调度的不平衡队列问题，我们提出了基于请求队列长度的调度策略。基本思想是维护一个加权队列长度表，以预测处理这些队列中所有请求的延迟。由于存在三种不同类型的请求（读，写和擦除），因此我们应该为这三种类型的请求分配不同的权重。然后，可以如下表示队列的加权长度，

注意，N表示队列中请求的总数，Wi和Sizei分别表示每个请求的权重和大小。权重是根据每种请求的相应延迟确定的。写入和擦除请求的大小都是固定的，只有读取请求的大小可能有所不同。然后，我们选择一个加权队列长度值最小的通道，并将当前来自LevelDB的写请求插入该通道。与循环调度策略不同，最小加权队列长度（表示为LWQL）调度策略考虑了所有三种I / O请求。图3（b）是使用LWQL调度的示例。

压缩的调度优化

LevelDB生成两种类型的写请求。除了将内存转储到级别0的写入请求外，其他写入请求都是通过压缩生成的。我们注意到压缩的数据访问模式是可预测的。因此，我们提出用于压缩的调度优化。如第2.1节所述，压缩将在特定键范围内合并SSTable。该过程包括读取和写入请求。由于读取请求的通道地址是固定的，因此，如果将用于一次压缩的某些输入SSTable分配在同一通道中，则必须按顺序读取它们，从而增加了压缩的等待时间。图4（a）显示了这种情况的示例。首先，在执行压缩过程时，将三个SSTable分别表示为级别0“ b〜d”（即，级别0的键范围为“ b〜d”的SSTable），级别1“ a〜b”和级别1如步骤1所示，将从SDF中读取“ c〜d”到主存储器。然后对这些SSTable执行多路合并排序，以生成两个新的SSTable，分别为Level 1“ a〜b”和Level 1 “ c〜d。”合并操作之后，它们将被写回到SDF，如步骤2所示。如果我们不仔细分配这些SS表，则可能会将级别1“ a〜b”分配给通道1。，其中包含2级“ a〜b” SSTable。这意味着我们必须在下一次压缩中从同一通道读取这两个SSTable，如步骤3所示。因此，压缩效率受到影响。

显然，在当前压缩中生成的新SSTables的分配将影响未来压缩的效率。因此，需要针对压缩的写调度优化来提高压缩效率。目的是确保精心分配SSTable，以使具有相邻键范围的SSTable不会分配在同一通道中。因此，我们提出了一种技术，用于优化从压缩生成的SSTable的调度。调度策略基于LWQL策略，描述如下。

我们在清单文件中记录每个SSTable的通道位置。清单文件还包含构成每个级别的SSTable的集合以及相应的键范围。
对于从压缩生成的每个SSTable，我们首先寻找加权队列长度最短的队列作为候选项。如果下一个级别中有任何SSTable，其关键字位于四个最接近的SSTable的范围内，则将跳过此候选队列。
然后，我们在其余队列中找到加权队列长度最短的队列，并且与上一步一样，检查键范围的条件。重复该步骤，直到满足条件为止。

图4（b）显示了此策略的示例。步骤1与4（a）相同。在步骤1之后，压缩线程在步骤2中为新生成的SSTable选择候选队列。假设根据LWQL策略为1级“ a〜b” SSTable选择了通道1，则该线程将搜索四个2级的最近邻居。因此，它将找到2级“ a〜b”，这意味着它们可能会在以后的压实中合并。因此，通道1被跳过，它将找到另一个加权队列长度最小的候选队列。然后选择第2通道，在第2层不存在相邻的SSTable。如前所述，压缩操作会将所有涉及的相邻SSTable读入内存。因此，如图4（b）的步骤3所示，避免将具有相邻关键字范围的SSTable留在同一通道中可以有效地提高读取性能。类似地，内存中的级别1“ c〜d” SSTable将逃避级别2“ a〜b”，“ c〜d”，“ e〜f”和“ g〜h” SSTable。一项统计实验表明，在我们的工作负载中，超过93％的压缩操作涉及不超过五个SSTable，这意味着在大多数情况下，一个SSTable将与下一个级别的四个或更少的SSTable合并。考虑到这一事实，我们在左右两个方向上将搜索范围设置为四个最近的SSTable。请注意，这种技术无法应用于传统的基于硬件的SSD控制器，因为它没有足够的来自软件级别的信息。它展示了LOCS中调度程序提供的软件-硬件协同优化的灵活性。

擦除的调度优化

到目前为止，调度策略仅针对写请求进行了优化。除了调度之外，请求的调度还可能影响系统的性能。在本小节中，我们将讨论如何安排擦除请求以提高吞吐量。

如前几小节所述，擦除请求的分派无法适应。但是，由于擦除过程不在关键路径上，因此可以动态调整调度。对于基于LSM树的KV存储，仅在压缩后才执行擦除操作。用作压实输入的SS表无用，应删除。一种简单的方法是在压缩后立即擦除SSTable，以回收这些存储空间。但是，这种擦除策略可能会降低性能，尤其是在进行大量读取操作时。首先，由于长的擦除等待时间，读取操作可能会长时间被擦除阻止。其次，由于擦除和读取请求的分配策略都是固定的，因此队列可能变得不平衡。图5（a）中显示了一个示例。通道1的请求队列中只有一个擦除操作会导致随后的两个读取操作的长时间延迟。

解决此问题的方法是延迟擦除请求，并在有足够的写请求时安排它们。这是因为写请求可以帮助平衡队列长度。该解决方案的关键是确定是否有足够的写请求。在LOCS中，我们为写请求的比率设置了阈值THw。当写请求的比例达到阈值时，将安排擦除请求。注意，当空闲块的百分比低于阈值时，将强制安排擦除请求。此设计类似于传统的基于硬件的SSD控制器中的垃圾回收策略。

图5（b）显示，通过从通道1的请求队列中删除此擦除操作，可以大大降低总读取延迟。图5（c）显示了一个队列包含七个写操作的情况。每个队列由LWQL策略调度。处理请求需要12个时隙。如图5（d）所示，将延迟的擦除操作插入到请求队列中时，LWQL策略确保将在擦除请求之后到达的四个写请求插入到最短的队列中，从而使队列达到平衡而不增加处理量时间。我们可以看到，在没有擦除调度的情况下，完成图5（a）和5（c）中所有操作的总时间为19，而在优化时，它减少为图5（b）和5（d）中的15。被申请;被应用。因此，提高了整体吞吐量。【妙啊】

实验

我们比较了华为SSD上运行的库存LevelDB和SDF上运行的优化LevelDB的性能。图6（a）显示了I / O吞吐量的比较。循环调度策略用于SDF。华为SSD的通道调度是在其固件中实现的，LevelDB生成的SSTable被剥离并统一调度到所有通道。结果表明，针对不同的基准和不同的吞吐量请求比率，使用优化的LevelDB，可以在SDF上显着提高I / O吞吐量。平均而言，I / O吞吐量可以提高约2.98倍。它表明，即使不对调度策略进行任何优化，LOCS也可以利用高访问并行度。在华为SSD中，来自LevelDB的每个大写入请求（2MB）都会通过其44个通道进行剥离，剥离单元大小为8 KB，并分配到不同的通道中，从而受益于对多个通道的并行访问。在SDF中，多个请求队列的情况有所不同。来自LevelDB的大写请求被发布到通道而不会剥离。因此，请求以2MB的粒度均匀地分布到通道。大型请求在华为SSD中分为多个子请求，并通过不同的渠道提供服务。因此，在请求服务中必须拆分（用于写）或合并（用于读）请求的数据，并且每个通道服务于更大数量的较小请求。这增加了开销并降低了吞吐量。此外，华为SSD中的垃圾回收会导致额外的写入放大开销。昂贵的垃圾回收会损害性能稳定性。

图6（b）在每秒操作数（OP）方面比较了LevelDB的性能。该趋势类似于I / O吞吐量。平均提高了约2.84倍，比I / O吞吐量要低一点。原因是由于压缩而产生的写入被计入I / O吞吐量，但在LevelDB的OP的计算中并未考虑。请注意，由于空间限制，我们只显示大小为100字节的数据的结果。实际上，我们的LOCS系统始终在不同数据值大小上实现性能提升。

在图7中，我们研究了主存储器中不可变内存对SDF I / O吞吐量的影响。在此实验中，将吞吐量数据比率设置为1：1，并且密钥值大小为8 KB。由于不可变内存表的数量决定了对SDF的并发写入请求的数量，因此I / O吞吐量与内存表的数量成比例地增加。结果表明，当MemTables计数达到闪存通道数时，I / O吞吐量达到饱和。实际上，如果我们进一步增加计数，则由于每个闪存通道上过多的并发写入请求而导致服务竞争，因此SDF的I / O吞吐量可能会降低。因此，我们总是将MemTables的数量设置为闪存通道的数量。其他配置的结果显示相同的趋势。

在图8中，说明了I / O吞吐量的波动，并将其与将阈值kL0 Slowdown WritesTrigger分别设置为8和68时的两种情况进行了比较。阈值kL0 StopWritesTrigger设置为1.5·kL0 Slowdown WritesTrigger。周期性波动和明显的吞吐量下降是由对写请求的流量控制引起的。显然，波动周期随着阈值的增大而变大。它从30秒增加到大约70秒，因此，平均吞吐量从221 MB / s增加到349 MB / s。这表明阈值应在SDF中设置为更大的值，以适应其更高的访问并行性。

请注意，阈值增加时，吞吐量并不会始终得到提高。这是因为较高的阈值会导致级别0的更多SSTable。由于级别0的SSTable中搜索数据的等待时间增加，因此，如果阈值太大，则可能会降低总体吞吐量。为了证实这一发现，我们用不同的阈值测量吞吐量，并在图9中进行比较。我们发现最有效点出现在68左右。

我们在图10中研究了引入额外的压缩线程的影响。我们发现，使用该额外的线程可以减轻吞吐量的波动。这是因为可以以更高的速率压缩级别0中的SSTable，从而可以减轻写请求的速度。平均而言，吞吐量可以从221 MB / s增加到大约361 MB / s。注意，kL0 Slowdown WritesTrigger阈值仍设置为8，以突出显示添加一个额外线程的影响。将这两种技术结合在一起的结果如图11所示。吞吐量平均可提高到375 MB / s。

在接下来的几组实验中，我们研究了调度策略对SDF吞吐量和LevelDB性能的影响。值大小为8 KB，吞吐量为1：1。如图12所示，为了证明平衡加权队列长度的重要性，我们首先说明了暂时空队列与I / O吞吐量之间的关系。空队列的平均数目是通过在LevelDB的较长执行周期内对队列长度进行采样而获得的。我们发现，SDF的吞吐量有很大的波动，并且与空队列的数量成反比。不难理解，暂时空的队列是由不平衡的请求分发引起的。平均而言，空队列可能导致大约14 MB / s的I / O吞吐量损失。

为了解决此问题，我们提出了LWQL调度策略。在图13中，我们比较了LevelDB长时间执行期间所有44个通道的队列长度的标准偏差。不难看出，与基线轮询策略相比，使用LWQL调度策略后，队列长度的偏差显着减小。这表明针对写请求的优化调度策略可以有效地帮助平衡通道之间的I / O强度。

图13中的第三组结果显示了当应用压缩的优化分配时队列长度的偏差。如第3.3.3节所述，该技术可以帮助解决将多个SSTable分发到同一通道的问题，这些SSTable可能会在以后的压缩中读取。换句话说，它可以帮助平衡不同通道之间的读取请求强度。因此，与LWQL策略相比，使用这种技术后可以进一步减少队列长度的偏差。请注意，由于优化只能应用于队列长度最短的通道，因此改进不是很明显。

我们在图14中评估了LOCS系统的性能。为了获得持续的性能结果，每个工作负载中写入的数据总量至少为1500 GB，是SDF容量的两倍。图14（a）-（d）中显示了不同值大小，吞吐量数据比率和各种基准的I / O吞吐量结果。所有这些结果证明了相似的趋势，并支持了有关平衡队列长度的调度优化的先前讨论。例如，与使用循环调度策略的基准情况相比，使用LWQL策略后，SDF的I / O吞吐量平均提高了30％。对于相同的设置，在应用优化技术进行压实后，SDF的生产率提高了39％。注意，这种改进不仅来自平衡队列长度，还得益于更有效的压缩操作。另一个观察结果是，随着吞吐量请求比率的降低，改进程度会降低。正如我们在第3节中提到的，这是因为在写入强度较高时，循环策略效果很好。与仅在SSD上运行库存LevelDB的基准相比，吞吐量提高了4倍以上。

在图14（e）-（h）中，我们比较了三种具有不同值大小，吞吐量数据比率和基准的调度策略在LevelDB OP方面的LevelDB性能。我们发现吞吐量趋势类似于SSD吞吐量。平均而言，使用LWQL调度策略后，OP的数量提高了21％，而采用优化技术进行压实后，OP的数量进一步提高到31％。这意味着我们的优化技术不仅可以提高SSD的吞吐量，而且可以提高LevelDB的性能。

在图14（i）中，我们说明了擦除调度操作对两个具有不同读/写比率的工作负载的影响。第一个工作负载（工作负载1）可以分为两个阶段：读写请求比率为1的均等读写阶段和读写请求比率为1/4的写主导阶段。第二个工作负载（工作负载2）的读取-修改-写入模式的吞吐率约为1。基线策略是在压缩后立即擦除块，而无需进行智能擦除调度。这与第3.3.4节中描述的擦除调度策略进行了比较，其中写入请求的比率具有各种阈值T Hw。我们可以看到，当使用T Hw小于4的调度策略时，工作负载1的吞吐量得到了提高。这是因为读写比率的显着变化为策略提供了机会，以明确标识执行以下操作的时间段：更高的吞吐量。但是，对于Workload 2，我们的调度策略会降低吞吐量，因为写入强度很少达到执行擦除操作的阈值。因此，大多数擦除操作将推迟到可用块用完，并且必须在请求服务的关键路径上执行。

总结

基于LSM树的KV存储和SSD的结合具有改善存储系统I / O性能的潜力。但是，两者的直接集成无法完全利用SSD中多个通道支持的高并行性。我们发现，如果可以将对SSD内部通道的访问暴露给KV商店，则I / O吞吐量可以得到显着提高。实验结果表明，I / O吞吐量最多可以提高2.98倍。有了这样的存储系统，来自KV商店的请求的调度策略将对吞吐量产生重要影响。因此，我们提出了几种在软件级别上用于调度程序的调度和调度策略的优化技术。利用这些技术，LOCS的I / O吞吐量可以平均平均提高约39％。

你可能感兴趣的:(笔记)

10月|愿你的青春不负梦想-读书笔记-01 Tracy的小书斋
本书的作者是俞敏洪，大家都很熟悉他了吧。俞敏洪老师是我行业的领头羊吧，也是我事业上的偶像。本日摘录他书中第一章中的金句：『一个人如果什么目标都没有，就会浑浑噩噩，感觉生命中缺少能量。能给我们能量的，是对未来的期待。第一件事，我始终为了进步而努力。与其追寻全世界的骏马，不如种植丰美的草原，到时骏马自然会来。第二件事，我始终有阶段性的目标。什么东西能给我能量？答案是对未来的期待。』读到这里的时候，我便
《投行人生》读书笔记小蘑菇的树洞
《投行人生》----作者詹姆斯-A-朗德摩根斯坦利副主席40年的职业洞见-很短小精悍的篇幅，比较适合初入职场的新人。第一部分成功的职业生涯需要规划1.情商归为适应能力分享与协作同理心适应能力，更多的是自我意识，你有能力识别自己的情并分辨这些情绪如何影响你的思想和行为。2.对于初入职场的人的建议，细节，截止日期和数据很重要截止日期，一种有效的方法是请老板为你所有的任务进行优先级排序。和老板喝咖啡的好
【一起学Rust | 设计模式】习惯语法——使用借用类型作为参数、格式化拼接字符串、构造函数广龙宇一起学Rust #Rust设计模式 rust 设计模式开发语言
提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录前言一、使用借用类型作为参数二、格式化拼接字符串三、使用构造函数总结前言Rust不是传统的面向对象编程语言，它的所有特性，使其独一无二。因此，学习特定于Rust的设计模式是必要的。本系列文章为作者学习《Rust设计模式》的学习笔记以及自己的见解。因此，本系列文章的结构也与此书的结构相同（后续可能会调成结构），基本上分为三个部分
git常用命令笔记咩酱-小羊 git 笔记
###用习惯了idea总是不记得git的一些常见命令，需要用到的时候总是担心旁边站了人~~~记个笔记@_@，告诉自己看笔记不丢人初始化初始化一个新的Git仓库gitinit配置配置用户信息gitconfig--globaluser.name"YourName"gitconfig--globaluser.email"[email protected]"基本操作克隆远程仓库gitclone查看
509. 斐波那契数(每日一题) lzyprime
lzyprime博客(github)创建时间：2021.01.04qq及邮箱：2383518170leetcode笔记题目描述斐波那契数，通常用F(n)表示，形成的序列称为斐波那契数列。该数列由0和1开始，后面的每一项数字都是前面两项数字的和。也就是：F(0)=0，F(1)=1F(n)=F(n-1)+F(n-2)，其中n>1给你n，请计算F(n)。示例1：输入：2输出：1解释：F(2)=F(1)+
拥有断舍离的心态，过精简生活--《断舍离》读书笔记爱吃丸子的小樱桃
不知不觉间房间里的东西越来越多，虽然摆放整齐，但也时常会觉得空间逼仄，令人心生烦闷。抱着断舍离的态度，我开始阅读《断舍离》这本书，希望从书中能找到一些有效的方法，帮助我实现空间、物品上的断舍离。《断舍离》是日本作家山下英子通过自己的经历、思考和实践总结而成的，整体内涵也从刚开始的私人生活哲学的“断舍离”升华成了“人生实践哲学”，接着又成为每个人都能实行的“改变人生的断舍离”，从“哲学”逐渐升华成“
四章-32-点要素的聚合彩云飘过
本文基于腾讯课堂老胡的课《跟我学Openlayers--基础实例详解》做的学习笔记，使用的openlayers5.3.xapi。源码见1032.html，对应的官网示例https://openlayers.org/en/latest/examples/cluster.htmlhttps://openlayers.org/en/latest/examples/earthquake-clusters.
高端密码学院笔记285 柚子_b4b4
高端幸福密码学院（高级班）幸福使者：李华第（598）期《幸福》之回归内在深层生命原动力基础篇——揭秘“激励”成长的喜悦心理案例分析主讲：刘莉一，知识扩充:成功=艰苦劳动+正确方法+少说空话。贪图省力的船夫，目标永远下游。智者的梦再美，也不如愚人实干的脚印。幸福早课堂2020.10.16星期五一笔记:1，重视和珍惜的前提是知道它的价值非常重要，当你珍惜了，你就真正定下来，真正的学到身上。2，大家需要
Day17笔记-高阶函数 ~在杰难逃~ Python 笔记 python 开发语言 pycharm 数据分析
高阶函数【重点掌握】函数的本质：函数是一个变量，函数名是一个变量名，一个函数可以作为另一个函数的参数或返回值使用如果A函数作为B函数的参数，B函数调用完成之后，会得到一个结果，则B函数被称为高阶函数常用的高阶函数：map(),reduce(),filter(),sorted()1.map()map(func,iterable)，返回值是一个iterator【容器，迭代器】func:函数iterab
Day1笔记-Python简介&标识符和关键字&输入输出 ~在杰难逃~ Python python 开发语言大数据数据分析数据挖掘
大家好，从今天开始呢，杰哥开展一个新的专栏，当然，数据分析部分也会不定时更新的，这个新的专栏主要是讲解一些Python的基础语法和知识，帮助0基础的小伙伴入门和学习Python，感兴趣的小伙伴可以开始认真学习啦！一、Python简介【了解】1.计算机工作原理编程语言就是用来定义计算机程序的形式语言。我们通过编程语言来编写程序代码，再通过语言处理程序执行向计算机发送指令，让计算机完成对应的工作，编程
node.js学习小猿L node.js node.js 学习 vim
node.js学习实操及笔记温故node.js，node.js学习实操过程及笔记~node.js学习视频node.js官网node.js中文网实操笔记githubcsdn笔记为什么学node.js可以让别人访问我们编写的网页为后续的框架学习打下基础，三大框架vuereactangular离不开node.jsnode.js是什么官网：node.js是一个开源的、跨平台的运行JavaScript的运行
数据仓库——维度表一致性墨染丶eye 背诵数据仓库
数据仓库基础笔记思维导图已经整理完毕，完整连接为：数据仓库基础知识笔记思维导图维度一致性问题从逻辑层面来看，当一系列星型模型共享一组公共维度时，所涉及的维度称为一致性维度。当维度表存在不一致时，短期的成功难以弥补长期的错误。维度时确保不同过程中信息集成起来实现横向钻取货活动的关键。造成横向钻取失败的原因维度结构的差别，因为维度的差别，分析工作涉及的领域从简单到复杂，但是都是通过复杂的报表来弥补设计
【Git】常见命令(仅笔记) 好想有猫猫 Git Linux学习笔记 git 笔记 elasticsearch linux c++
文章目录创建/初始化本地仓库添加本地仓库配置项提交文件查看仓库状态回退仓库查看日志分支删除文件暂存工作区代码远程仓库使用`.gitigore`文件让git不追踪一些文件标签创建/初始化本地仓库gitinit添加本地仓库配置项gitconfig-l#以列表形式显示配置项gitconfiguser.name"ljh"#配置user.namegitconfiguser.email"[email protected]
为什么你总是对下属不满意? ZhaoWu1050
【ZhaoWu的听课笔记】大多数公司，都存在两种问题。我创业四年，更是体会深切。这两种问题就是：老板经常不满意下属的表现；下属总是不知道老板想要什么；虽然这两种问题普遍存在，其实解决方法并不复杂。这节课，我们再聊聊第一个问题：为什么老板经常不满意下属表现?其实，这背后也是一条管理常识。管理学家德鲁克先生早就说过：管理者的任务，不是去改变人。*来自《卓有成效的管理者》只是大多数老板和我一样，都是一边
母亲节如何做小红书营销美橙传媒
小红书的一举一动引起了外界的高度关注。通过爆款笔记和流行话题，我们可以看到“干货”类型的内容在小红书中偏向实用的生活经验共享和生活指南非常受欢迎。根据运营社的分析，这种现象是由小红书用户心智和内容社区背后机制共同决定的。首先，小红书将使用“强搜索”逻辑为用户提供特定的“搜索场景”。在“我必须这样生活”中，大量使用了满足小红书站用户喜好和需求的内容。内容社区自制的高质量内容也吸引了寻找营销新途径的品
读书笔记|《遇见孩子，遇见更好的自己》5 抹茶社长
为人父母意味着放弃自己的过去，不要对以往没有实现的心愿耿耿于怀，只有这样，孩子们才能做回自己。985909803.jpg孩子在与父母保持亲密的同时更需要独立，唯有这样，孩子才会成为孩子，父母才会成其为父母。有耐心的人生往往更幸福，给孩子留点余地。认识到养儿育女是对耐心的考验。为失败做好心理准备，教会孩子控制情绪。了解自己的底线，说到底线，有一点很重要，父母之所以发脾气，真正的原因往往在于他们自己，
基于Python给出的PDF文档转Markdown文档的方法程序媛了了 python pdf 开发语言
注：网上有很多将Markdown文档转为PDF文档的方法，但是却很少有将PDF文档转为Markdown文档的方法。就算有，比如某些网站声称可以将PDF文档转为Markdown文档，尝试过，不太符合自己的要求，而且无法保证文档没有泄露风险。于是本人为了解决这个问题，借助GPT（能使用GPT镜像或者有条件直接使用GPT的，反正能调用GPT接口就行）生成Python代码来完成这个功能。笔记、代码难免存在
语文主题教学学习笔记之87 东哥杂谈
“语文主题教学”学习笔记之八十七（0125）今天继续学习小学语文主题教学的实践样态。板块三：教学中体现“书艺”味道。作为四大名著之一的《水浒传》，堪称我国文学宝库之经典。对从《水浒传》中摘选的单元，教师就要了解其原生态，即评书体特点。这也要求教师要了解一些常用的评书行话术语，然后在教学时适时地加入一些，让学生体味其文本中原有的特色。学生也要尽可能地通过朗读的方式，而不单是分析讲解的方式进行学习。细
Armv8.3 体系结构扩展--原文版代码改变世界ctw ARM-TEE-Android armv8 嵌入式 arm架构安全架构芯片 Trustzone Secureboot
快速链接:.ARMv8/ARMv9架构入门到精通-[目录]付费专栏-付费课程【购买须知】:个人博客笔记导读目录(全部)TheArmv8.3architectureextensionTheArmv8.3architectureextensionisanextensiontoArmv8.2.Itaddsmandatoryandoptionalarchitecturalfeatures.Somefeat
springboot+vue项目实战一-创建SpringBoot简单项目苹果酱0567 面试题汇总与解析 spring boot 后端 java 中间件开发语言
这段时间抽空给女朋友搭建一个个人博客，想着记录一下建站的过程，就当做笔记吧。虽然复制zjblog只要一个小时就可以搞定一个网站，或者用cms系统，三四个小时就可以做出一个前后台都有的网站，而且想做成啥样也都行。但是就是要从新做，自己做的意义不一样，更何况，俺就是专门干这个的，嘿嘿嘿要做一个网站，而且从零开始，首先呢就是技术选型了，经过一番思量决定选择-SpringBoot做后端，前端使用Vue做一
阅读《认知觉醒》读书笔记就看看书
本周阅读了周岭的《认知觉醒开启自我改变的原动力》，启发较多，故做读书笔记一则，留待学习。全书共八章，讲述了大脑、潜意识、元认知、专注力、学习力、行动力、情绪力及成本最低的成长之道。具体描述了大脑、焦虑、耐心、模糊、感性、元认知、自控力、专注力、情绪专注、学习专注、匹配、深度、关联、体系、打卡、反馈、休息、清晰、傻瓜、行动、心智宽带、单一视角、游戏心态、早起、冥想、阅读、写作、运动等相关知识点。大脑
阅读笔记：阅读方法中的逻辑和转念施吉涛
聊聊一些阅读的方法论吧，别人家的读书方法刚开始想写，然后就不知道写什么了，因为作者写的非常的“精致”我有一种乡巴佬进城的感觉，看到精美的摆盘，精致的食材不知道该如何下口也就是《阅读的方法》，我们姑且来试一下强劲的大脑篇，第一节：逻辑通俗的来讲，也就是表达的排列和顺序，再进一步就是因果关系和关联实际上书已经看了大概一遍，但直到打算写一下笔记的时候，才发现作者讲的推理更多的是阅读的对象中呈现出的逻辑也
《转介绍方法论》学习笔记小可乐的妈妈
一、高效转介绍的流程：价值观---执行----方案一）转介绍发生的背景：1、对象：谁向谁转介绍？全员营销，人人参与。①员工的激励政策、客户的转介绍诱因制作客户画像：a信任；支付能力；意愿度；便利度（根据家长具备四个特征的个数分为四类）B性格分类C职业分类D年龄性别②执行：套路，策略，方法，流程2、诱因：为什么要转介绍？认同信任；多方共赢；传递美好；零风险承诺打动人心，超越期待。选择做教育，就是选择
JAVA学习笔记之23种设计模式学习 victorfreedom Java技术设计模式 android java 常用设计模式
博主最近买了《设计模式》这本书来学习，无奈这本书是以C++语言为基础进行说明，整个学习流程下来效率不是很高，虽然有的设计模式通俗易懂，但感觉还是没有充分的掌握了所有的设计模式。于是博主百度了一番，发现有大神写过了这方面的问题，于是博主迅速拿来学习。一、设计模式的分类总体来说设计模式分为三大类：创建型模式，共五种：工厂方法模式、抽象工厂模式、单例模式、建造者模式、原型模式。结构型模式，共七种：适配器
解决Obsidian写笔记中的＜img＞标签无法显示图片的问题全能全知者笔记
Obsidian中写md笔记如果使用标签会显示不出图案，后来才知道因为Obsidian的问题导致只能用绝对路径定位。所以我本人写了一个py插件，将md笔记里的img标签批量替换成Obsidian能够读取的形式。安装FixObsImgDpy:pipinstallFixObsImgDpy安装完成后在需要修复的md文件的父目录下运行命令:FixObsImgDpy就会自动修复父目录以下的全部md文件仓库
2021年周总结 03 Ruby之家
这周的生活过得也是比较快，因为暂时住的离公司有点距离，所以通勤时间相对较长一点，而在地铁上的一个半小时如何充分利用起来，则是我最近一直在思考的问题，2021年想让自己的生活都运行在计划中。(有时候自己想干一件事情就总是给自己找很多借口，想着以后怎么怎么样？然而哪有那么多的以后，能够方便当下的工作生活就立马执行就OK，这仅仅只是我此时想到背的很重的老人机笔记本电脑，也算是陪伴我快8年的—当时买的时候
2021-12-11 人生导演
今天读到佛学书籍的一段话：初学者很难直接体验到无我，但可以经常提醒自己：一切事物都是无我的。不断强化这个观念，也会相当有帮助。比如生病了我们一般会说：“我不舒服！我很痛！我很惨！”这时候如果我们提醒自己：没有我，只是这个肉体的某些部分、某些功能出了问题，不舒服、疼痛也只是一时的感受，而感受随时在变化。仅仅是知道没有一个实存的我在生病、在受苦。然后把“一切事物都是无我的”这句话，记到笔记上，并且朗读
新能源汽车 BMS 学习笔记篇—BMS 基本定义及分类 WPG大大通其他笔记汽车 BMS 经验分享新能源电池
一、BMS定义1、概念：BMS（BatteryManagementSystem）即电池管理系统，其管理对象是二次电池（充电电池或蓄电池），其主要目的是电池的利用率，防止电池出现过度充电和过度放电，可应用于电动汽车、电瓶车、机器人、无人机等图片来源：腾讯网https://new.qq.com《标准普尔警告，电动汽车电池生产面临供应链和地缘政治风险》2、四大功能①感知和测量：检测电池的电压、电流、温度
机器学习-聚类算法不良人龍木木机器学习机器学习算法聚类
机器学习-聚类算法1.AHC2.K-means3.SC4.MCL仅个人笔记，感谢点赞关注！1.AHC2.K-means3.SC传统谱聚类：个人对谱聚类算法的理解以及改进4.MCL目前仅专注于NLP的技术学习和分享感谢大家的关注与支持！
LeetCode github集合，附CMU大神整理笔记 Wesley@ LeetCode github
GithubLeetCode集合本人所有做过的题目都写在一个java项目中，同步到github中了，算是见证自己的进步。github目前同步的题目是2020-09-17日之后写的题。之前写过的题会陆续跟新到github中。目前大概400个题目Github项目链接：https://github.com/sunliancheng/leetcode_github附上一份优秀的教材整合：这是卡内基梅隆(C
springmvc 下 freemarker页面枚举的遍历输出杨白白 enum freemarker
spring mvc freemarker 中遍历枚举 1枚举类型有一个本地方法叫values（），这个方法可以直接返回枚举数组。所以可以利用这个遍历。 enum public enum BooleanEnum { TRUE(Boolean.TRUE, "是"), FALSE(Boolean.FALSE, "否");
实习简要总结 byalias 工作
来白虹不知不觉中已经一个多月了，因为项目还在需求分析及项目架构阶段，自己在这段时间都是在学习相关技术知识，现在对这段时间的工作及学习情况做一个总结：（1）工作技能方面大体分为两个阶段，Java Web 基础阶段和Java EE阶段 1）Java Web阶段在这个阶段，自己主要着重学习了 JSP, Servlet, JDBC, MySQL，这些知识的核心点都过了一遍，也
Quartz——DateIntervalTrigger触发器 eksliang quartz
转载请出自出处：http://eksliang.iteye.com/blog/2208559 一.概述 simpleTrigger 内部实现机制是通过计算间隔时间来计算下次的执行时间，这就导致他有不适合调度的定时任务。例如我们想每天的 1：00AM 执行任务，如果使用 SimpleTrigger，间隔时间就是一天。注意这里就会有一个问题，即当有 misfired 的任务并且恢复执行时，该执行时间
Unix快捷键 18289753290 unix Unix；快捷键;
复制，删除，粘贴： dd:删除光标所在的行 &nbs
获取Android设备屏幕的相关参数酷的飞上天空 android
包含屏幕的分辨率以及屏幕宽度的最大dp 高度最大dp TextView text = (TextView)findViewById(R.id.text); DisplayMetrics dm = new DisplayMetrics(); text.append("getResources().ge
要做物联网？先保护好你的数据蓝儿唯美数据
根据Beecham Research的说法，那些在行业中希望利用物联网的关键领域需要提供更好的安全性。在Beecham的物联网安全威胁图谱上，展示了那些可能产生内外部攻击并且需要通过快速发展的物联网行业加以解决的关键领域。 Beecham Research的技术主管Jon Howes说：“之所以我们目前还没有看到与物联网相关的严重安全事件，是因为目前还没有在大型客户和企业应用中进行部署，也就
Java取模（求余）运算随便小屋 java
整数之间的取模求余运算很好求，但几乎没有遇到过对负数进行取模求余，直接看下面代码： /** * * @author Logic * */ public class Test { public static void main(String[] args) { // TODO A
SQL注入介绍 aijuans sql注入
二、SQL注入范例这里我们根据用户登录页面 <form action="" > 用户名：<input type="text" name="username"><br/> 密码：<input type="password" name="passwor
优雅代码风格 aoyouzi 代码
总结了几点关于优雅代码风格的描述：代码简单：不隐藏设计者的意图，抽象干净利落，控制语句直截了当。接口清晰：类型接口表现力直白，字面表达含义，API 相互呼应以增强可测试性。依赖项少：依赖关系越少越好，依赖少证明内聚程度高，低耦合利于自动测试，便于重构。没有重复：重复代码意味着某些概念或想法没有在代码中良好的体现，及时重构消除重复。战术分层：代码分层清晰，隔离明确，
布尔数组百合不是茶 java 布尔数组
androi中提到了布尔数组; 布尔数组默认的是false, 并且只会打印false或者是true 布尔数组的例子; 根据字符数组创建布尔数组 char[] c = {'p','u','b','l','i','c'}; //根据字符数组的长度创建布尔数组的个数 boolean[] b = new bool
web.xml之welcome-file-list、error-page bijian1013 java web.xml servlet error-page
welcome-file-list 1.定义： <welcome-file-list> <welcome-file>login.jsp</welcome> </welcome-file-list> 2.作用：用来指定WEB应用首页名称。 error-page1.定义： <error-page&g
richfaces 4 fileUpload组件删除上传的文件 sunjing clear Richfaces 4 fileupload
页面代码 <h:form id="fileForm"> <rich:
技术文章备忘 bit1129 技术文章
Zookeeper http://wenku.baidu.com/view/bab171ffaef8941ea76e05b8.html http://wenku.baidu.com/link?url=8thAIwFTnPh2KL2b0p1V7XSgmF9ZEFgw4V_MkIpA9j8BX2rDQMPgK5l3wcs9oBTxeekOnm5P3BK8c6K2DWynq9nfUCkRlTt9uV
org.hibernate.hql.ast.QuerySyntaxException: unexpected token: on near line 1解决方案白糖_ Hibernate
文章摘自：http://blog.csdn.net/yangwawa19870921/article/details/7553181 在编写HQL时，可能会出现这种代码： select a.name,b.age from TableA a left join TableB b on a.id=b.id 如果这是HQL，那么这段代码就是错误的，因为HQL不支持
sqlserver按照字段内容进行排序 bozch 按照内容排序
在做项目的时候，遇到了这样的一个需求：从数据库中取出的数据集，首先要将某个数据或者多个数据按照地段内容放到前面显示，例如:从学生表中取出姓李的放到数据集的前面； select * fro
编程珠玑-第一章-位图排序 bylijinnan java 编程珠玑
import java.io.BufferedWriter; import java.io.File; import java.io.FileWriter; import java.io.IOException; import java.io.Writer; import java.util.Random; public class BitMapSearch {
Java关于==和equals chenbowen00 java
关于==和equals概念其实很简单，一个是比较内存地址是否相同，一个比较的是值内容是否相同。虽然理解上不难，但是有时存在一些理解误区，如下情况： 1、 String a = "aaa"; a=="aaa"; ==> true 2、 new String("aaa")==new String("aaa
[IT与资本]软件行业需对外界投资热情保持警惕 comsci it
我还是那个看法,软件行业需要增强内生动力,尽量依靠自有资金和营业收入来进行经营,避免在资本市场上经受各种不同类型的风险,为企业自主研发核心技术和产品提供稳定,温和的外部环境... 如果我们在自己尚未掌握核心技术之前,企图依靠上市来筹集资金,然后使劲往某个领域砸钱,然
oracle 数据块结构 daizj oracle 块数据块块结构行目录
oracle 数据块是数据库存储的最小单位，一般为操作系统块的N倍。其结构为：块头－－〉空行－－〉数据，其实际为纵行结构。块的标准大小由初始化参数DB_BLOCK_SIZE指定。具有标准大小的块称为标准块（Standard Block）。块的大小和标准块的大小不同的块叫非标准块（Nonstandard Block）。同一数据库中，Oracle9i及以上版本支持同一数据库中同时使用标
github上一些觉得对自己工作有用的项目收集 dengkane github
github上一些觉得对自己工作有用的项目收集技能类 markdown语法中文说明回到顶部全文检索 elasticsearch bigdesk elasticsearch管理插件回到顶部 nosql mapdb 支持亿级别map, list, 支持事务. 可考虑做为缓存使用 C
初二上学期难记单词二 dcj3sjt126com english word
dangerous 危险的 panda 熊猫 lion 狮子 elephant 象 monkey 猴子 tiger 老虎 deer 鹿 snake 蛇 rabbit 兔子 duck 鸭 horse 马 forest 森林 fall 跌倒；落下 climb 爬；攀登 finish 完成；结束 cinema 电影院；电影 seafood 海鲜；海产食品 bank 银行
8、mysql外键(FOREIGN KEY)的简单使用 dcj3sjt126com mysql
一、基本概念 1、MySQL中“键”和“索引”的定义相同，所以外键和主键一样也是索引的一种。不同的是MySQL会自动为所有表的主键进行索引，但是外键字段必须由用户进行明确的索引。用于外键关系的字段必须在所有的参照表中进行明确地索引，InnoDB不能自动地创建索引。 2、外键可以是一对一的，一个表的记录只能与另一个表的一条记录连接，或者是一对多的，一个表的记录与另一个表的多条记录连接。 3、如
java循环标签 Foreach shuizhaosi888 标签 java循环 foreach
1. 简单的for循环 public static void main(String[] args) { for (int i = 1, y = i + 10; i < 5 && y < 12; i++, y = i * 2) { System.err.println("i=" + i + " y="
Spring Security（05）——异常信息本地化 234390216 exception Spring Security 异常信息本地化
异常信息本地化 Spring Security支持将展现给终端用户看的异常信息本地化，这些信息包括认证失败、访问被拒绝等。而对于展现给开发者看的异常信息和日志信息（如配置错误）则是不能够进行本地化的，它们是以英文硬编码在Spring Security的代码中的。在Spring-Security-core-x
DUBBO架构服务端告警Failed to send message Response javamingtingzhao 架构 DUBBO
废话不多说，警告日志如下，不知道有哪位遇到过，此异常在服务端抛出(服务器启动第一次运行会有这个警告)，后续运行没问题，找了好久真心不知道哪里错了。 WARN 2015-07-18 22:31:15,272 com.alibaba.dubbo.remoting.transport.dispatcher.ChannelEventRunnable.run(84)
JS中Date对象中几个用法 leeqq JavaScript Date 最后一天
近来工作中遇到这样的两个需求 1. 给个Date对象，找出该时间所在月的第一天和最后一天 2. 给个Date对象，找出该时间所在周的第一天和最后一天需求1中的找月第一天很简单，我记得api中有setDate方法可以使用使用setDate方法前，先看看getDate var date = new Date(); console.log(date); // Sat J
MFC中使用ado技术操作数据库你不认识的休道人 sql mfc
1.在stdafx.h中导入ado动态链接库 #import"C:\Program Files\Common Files\System\ado\msado15.dll" no_namespace rename("EOF","end")2.在CTestApp文件的InitInstance()函数中domodal之前写::CoIniti
Android Studio加速 rensanning android studio
Android Studio慢、吃内存！启动时后会立即通过Gradle来sync & build工程。（1）设置Android Studio a) 禁用插件 File -> Settings... Plugins 去掉一些没有用的插件。比如：Git Integration、GitHub、Google Cloud Testing、Google Cloud
各数据库的批量Update操作 tomcat_oracle java oracle sql mysql sqlite
MyBatis的update元素的用法与insert元素基本相同，因此本篇不打算重复了。本篇仅记录批量update操作的 sql语句，懂得SQL语句，那么MyBatis部分的操作就简单了。　　注意：下列批量更新语句都是作为一个事务整体执行，要不全部成功，要不全部回滚。 MSSQL的SQL语句　WITH R AS（　　SELECT 'John' as name, 18 as
html禁止清除input文本输入缓存 xp9802 input
多数浏览器默认会缓存input的值，只有使用ctl+F5强制刷新的才可以清除缓存记录。如果不想让浏览器缓存input的值，有2种方法：方法一：在不想使用缓存的input中添加 autocomplete="off"; eg: <input type="text" autocomplete="off" name