豆沙睡不醒

【Golang开源项目】Golang高性能内存缓存库BigCache设计与分析

项目地址

BigCache 是一个快速，支持并发访问，自淘汰的内存型缓存，可以在存储大量元素时依然保持高性能。BigCache将元素保存在堆上却避免了GC的开销。

背景介绍

BigCache的作者在项目里遇到了如下的需求：

支持http协议
支持 $10 k$ RPS ，其中读写各占一半
cache缓存至少 $10$ 分钟
平均 $r t = 5 m s, p 99 < = 10 m s, p 999 < = 400 m s$
开发的缓存库需要保证：
即使有百万的缓存对象速度也要很快
支持高并发访问
支持过期自动删除

简单入门

func Test_BigCache(t *testing.T) {
	cache, _ := bigcache.New(context.Background(), bigcache.DefaultConfig(10*time.Minute)) //定义cache
	cache.Set("my-unique-key", []byte("value")) //设置k,v键值对
	entry, _ := cache.Get("my-unique-key") //获取k,v键值对
	t.Log(string(entry))
}

配置文件

config字段说明

字段名	类型	含义
Shards	int	缓存分片数，值必须是 2 的幂
LifeWindow	time.Duration	条目可以被逐出的时间，近似可以理解为缓存时间
CleanWindow	time.Duration	删除过期条目（清理）之间的间隔。如果设置为 <= 0，则不执行任何操作。设置为 < 1 秒会适得其反，因为 bigcache 的分辨率为 1 秒。
MaxEntriesInWindow	int	生命周期窗口中的最大条目数。仅用于计算缓存分片的初始大小。如果设置了适当的值，则不会发生额外的内存分配。
MaxEntrySize	int	条目的最大大小（以字节为单位）。仅用于计算缓存分片的初始大小。
StatsEnabled	bool	StatsEnabled如果为true，则计算请求缓存资源的次数。
Verbose	bool	是否以详细模式打印有关新内存分配的信息
Hasher	Hasher	哈希程序用于在字符串键和无符号 64 位整数之间进行映射，默认情况下使用 fnv64 哈希。
HardMaxCacheSize	int	是BytesQueue 大小的限制 MB。它可以防止应用程序占用计算机上的所有可用内存，从而防止运行 OOM Killer。
OnRemove	func(key string, entry []byte)	OnRemove 是当最旧的条目由于过期时间或没有为新条目留出空间或调用 delete 而被删除时触发的回调。如果指定了 OnRemoveWithMetadata，则忽略。
OnRemoveWithMetadata	func(key string, entry []byte, keyMetadata Metadata)	OnRemoveWithMetadata 是当最旧的条目由于过期时间或没有为新条目留出空间或调用 delete 而被删除时触发的回调，携带有关该特定条目的详细信息的结构。
OnRemoveWithReason	func(key string, entry []byte, reason RemoveReason)	OnRemoveWithReason 是当最旧的条目由于过期时间或没有为新条目留出空间或调用了 delete 而被删除时触发的回调，将传递一个表示原因的常量。如果指定了 OnRemove，则忽略。
onRemoveFilter	int	和OnRemoveWithReason一起使用，阻止 bigcache 解包它们，从而节省 CPU。
Logger	Logger	日志记录接口

说明：

LifeWindow 是一个时间。在此之后，条目可以称为死条目，但不能删除。
CleanWindow 是一个时间。在此之后，将删除所有无效条目，但不会删除仍具有生命的条目。
HardMaxCacheSize 默认值为 0，表示大小不受限制。当限制高于 0 并达到时，新条目将覆盖最旧的条目。由于 Shards 的额外内存，最大内存消耗将大于 HardMaxCacheSize。每个分片都会消耗额外的内存来映射键和统计信息（map[uint64]uint32），此映射的大小等于缓存中的条目数 ~ 2×（64+32）×n 位 + 开销或映射本身。
OnRemove，OnRemoveWithMetadata ，OnRemoveWithReason 这三个跟删除有关的属性默认值为 nil，表示没有回调，并且会阻止解开最早的条目。

配置代码文件


// Config for BigCache
type Config struct {
	// Number of cache shards, value must be a power of two
	Shards int
	// Time after which entry can be evicted
	LifeWindow time.Duration
	// Interval between removing expired entries (clean up).
	// If set to <= 0 then no action is performed. Setting to < 1 second is counterproductive — bigcache has a one second resolution.
	CleanWindow time.Duration
	// Max number of entries in life window. Used only to calculate initial size for cache shards.
	// When proper value is set then additional memory allocation does not occur.
	MaxEntriesInWindow int
	// Max size of entry in bytes. Used only to calculate initial size for cache shards.
	MaxEntrySize int
	// StatsEnabled if true calculate the number of times a cached resource was requested.
	StatsEnabled bool
	// Verbose mode prints information about new memory allocation
	Verbose bool
	// Hasher used to map between string keys and unsigned 64bit integers, by default fnv64 hashing is used.
	Hasher Hasher
	// HardMaxCacheSize is a limit for BytesQueue size in MB.
	// It can protect application from consuming all available memory on machine, therefore from running OOM Killer.
	// Default value is 0 which means unlimited size. When the limit is higher than 0 and reached then
	// the oldest entries are overridden for the new ones. The max memory consumption will be bigger than
	// HardMaxCacheSize due to Shards' s additional memory. Every Shard consumes additional memory for map of keys
	// and statistics (map[uint64]uint32) the size of this map is equal to number of entries in
	// cache ~ 2×(64+32)×n bits + overhead or map itself.
	HardMaxCacheSize int
	// OnRemove is a callback fired when the oldest entry is removed because of its expiration time or no space left
	// for the new entry, or because delete was called.
	// Default value is nil which means no callback and it prevents from unwrapping the oldest entry.
	// ignored if OnRemoveWithMetadata is specified.
	OnRemove func(key string, entry []byte)
	// OnRemoveWithMetadata is a callback fired when the oldest entry is removed because of its expiration time or no space left
	// for the new entry, or because delete was called. A structure representing details about that specific entry.
	// Default value is nil which means no callback and it prevents from unwrapping the oldest entry.
	OnRemoveWithMetadata func(key string, entry []byte, keyMetadata Metadata)
	// OnRemoveWithReason is a callback fired when the oldest entry is removed because of its expiration time or no space left
	// for the new entry, or because delete was called. A constant representing the reason will be passed through.
	// Default value is nil which means no callback and it prevents from unwrapping the oldest entry.
	// Ignored if OnRemove is specified.
	OnRemoveWithReason func(key string, entry []byte, reason RemoveReason)

	onRemoveFilter int

	// Logger is a logging interface and used in combination with `Verbose`
	// Defaults to `DefaultLogger()`
	Logger Logger
}

默认配置

DefaultConfig 使用默认值初始化配置。当可以提前预测 BigCache 的负载时，最好使用自定义配置。

字段名	值	含义
Shards	1024	缓存分片数是1024
LifeWindow	eviction	自定义过期时间
CleanWindow	1 * time.Second	每隔1秒就清理失效数据
MaxEntriesInWindow	1000 * 10 * 60	生命周期窗口中的最大条目数为6e5
MaxEntrySize	500	条目的最大大小为500字节
StatsEnabled	false	不计算请求缓存资源的次数
Verbose	true	以详细模式打印有关新内存分配的信息
Hasher	fnv64	哈希程序，fnv64 哈希
HardMaxCacheSize	0	BytesQueue 大小无限制
Logger	DefaultLogger	日志记录接口

优点：支持自定义过期时间，清理失效数据的间隔为最小间隔、效率高
缺点：BytesQueue 大小无限制，容易造成内存占用过高
默认配置代码：

func DefaultConfig(eviction time.Duration) Config {
	return Config{
		Shards:             1024,
		LifeWindow:         eviction,
		CleanWindow:        1 * time.Second,
		MaxEntriesInWindow: 1000 * 10 * 60,
		MaxEntrySize:       500,
		StatsEnabled:       false,
		Verbose:            true,
		Hasher:             newDefaultHasher(),
		HardMaxCacheSize:   0,
		Logger:             DefaultLogger(),
	}
}

数据结构

前提说明：BigCache 是快速、并发、逐出缓存，旨在保留大量条目而不影响性能。它将条目保留在堆上，但省略了它们的 GC。为了实现这一点，操作发生在字节数组上，因此在大多数用例中，都需要在缓存前面进行条目**（反序列化）**。

BigCache数据结构

字段名	类型	含义
shards	[]*cacheShard	缓存分片数据
lifeWindow	uint64	缓存时间，对应配置里的LifeWindow
clock	clock	时间计算函数
hash	Hasher	哈希函数
config	Config	配置文件
shardMask	uint64	值为(config.Shards-1)，寻找分片位置时使用的参数，可以理解为对config.Shards取余后的最大值
close	chan struct{}	关闭通道

type BigCache struct {
	shards     []*cacheShard
	lifeWindow uint64
	clock      clock
	hash       Hasher
	config     Config
	shardMask  uint64
	close      chan struct{}
}

cacheShard数据结构

字段名	类型	含义
hashmap	map[uint64]uint32	索引列表，key为存储的key，value为该key在entries里的位置
entries	queue.BytesQueue	实际数据存储的地方
lock	sync.RWMutex	互斥锁，用于并发读写
entryBuffer	[]byte	入口缓冲区
onRemove	onRemoveCallback	删除回调函数
isVerbose	bool	是否详细模式打印有关新内存分配的信息
statsEnabled	bool	是否计算请求缓存资源的次数
logger	Logger	日志记录函数
clock	clock	时间计算函数
lifeWindow	uint64	缓存时间，对应配置里的LifeWindow
hashmapStats	map[uint64]uint32	存储缓存请求次数
stats	Stats	存储缓存统计信息
cleanEnabled	bool	是否可清理，由config.CleanWindow决定

type cacheShard struct {
	hashmap     map[uint64]uint32
	entries     queue.BytesQueue
	lock        sync.RWMutex
	entryBuffer []byte
	onRemove    onRemoveCallback

	isVerbose    bool
	statsEnabled bool
	logger       Logger
	clock        clock
	lifeWindow   uint64

	hashmapStats map[uint64]uint32
	stats        Stats
	cleanEnabled bool
}

BytesQueue数据结构

BytesQueue 是一种基于 bytes 数组的 fifo 非线程安全队列类型。对于每个推送操作，都会返回条目的索引。它可用于稍后读取条目。

字段名	类型	含义
full	bool	队列是否已满
array	[]byte	实际数据存储的地方
capacity	int	容量
maxCapacity	int	最大容量
head	int	队首位置
tail	int	下次可以插入的元素位置
count	int	当前存在的元素数量
rightMargin	int	右边界
headerBuffer	[]byte	插入时的临时缓冲区
verbose	bool	是否详细模式打印有关新内存分配的信息

type BytesQueue struct {
	full         bool
	array        []byte
	capacity     int
	maxCapacity  int
	head         int
	tail         int
	count        int
	rightMargin  int
	headerBuffer []byte
	verbose      bool
}

优秀设计

处理并发访问

设计点1：将数据打散后存储

通用解法： 缓存支持并发访问是很基本的要求，比较常见的解决访问是对缓存整体加读写锁，在同一时间只允许一个协程修改缓存内容。这样的缺点是锁可能会阻塞后续的操作，而且高频的加锁、解锁操作会导致缓存性能降低。

设计点： $B i g C a c h e$ 使用一个 $s h a r d$ 数组来存储数据，将数据打散到不同的 $s h a r d$ 里，每个 $s h a r d$ 里都有一个小的 $l o c k$ ，从而减小了锁的粒度，提高访问性能。

设计点2：打散数据过程中借助位运算加快计算速度

接下来看一下将某个数据放到缓存的过程的源代码：

// Set saves entry under the key
func (c *BigCache) Set(key string, entry []byte) error {
	hashedKey := c.hash.Sum64(key)
	shard := c.getShard(hashedKey)
	return shard.set(key, hashedKey, entry)
}
func (c *BigCache) getShard(hashedKey uint64) (shard *cacheShard) {
	return c.shards[hashedKey&c.shardMask]
}

可以得到 $s e t$ 的过程如下：

进行 $h a s h$ 操作，将 $s t r i n g$ 类型 $k e y$ 哈希为一个 $u i n t 64$ 类型的 $h a s h e d K e y$
根据 $h a s h e d K e y$ 做 $s h a r d i n g$ ，最后落到的 $s h a r d$ 的下标为 $hashedKey\%n$ ,其中 $n$ 是分片数量。理想情况下，每次请求会均匀地落在各自的分片上，单个 $s h a r d$ 的压力就会很小。
调用对应 $s h a r d$ 的set方法来设置缓存

设计点：
当 $n$ 为 $2$ 的幂次方的时候，对于任意的 $x$ ，下面的公式都成立的。
$x\ mod\ N = (x \& (N − 1))$
所以可以借助位运算快速计算余数，因此倒推回去 缓存分片数必须要设置为 $2$ 的幂次方。

设计点3 避免栈上的内存分配

默认的哈希算法为 $f n v 64$ 算法，该算法采用位运算的方式在栈上运算，避免了在堆上分配内存

package bigcache

// newDefaultHasher returns a new 64-bit FNV-1a Hasher which makes no memory allocations.
// Its Sum64 method will lay the value out in big-endian byte order.
// See https://en.wikipedia.org/wiki/Fowler–Noll–Vo_hash_function
func newDefaultHasher() Hasher {
	return fnv64a{}
}

type fnv64a struct{}

const (
	// offset64 FNVa offset basis. See https://en.wikipedia.org/wiki/Fowler–Noll–Vo_hash_function#FNV-1a_hash
	offset64 = 14695981039346656037
	// prime64 FNVa prime value. See https://en.wikipedia.org/wiki/Fowler–Noll–Vo_hash_function#FNV-1a_hash
	prime64 = 1099511628211
)

// Sum64 gets the string and returns its uint64 hash value.
func (f fnv64a) Sum64(key string) uint64 {
	var hash uint64 = offset64
	for i := 0; i < len(key); i++ {
		hash ^= uint64(key[i])
		hash *= prime64
	}

	return hash
}

减少GC开销

设计点1：利用go1.5+特性，减少GC扫描

$g o l a n g$ 里实现缓存最简单的方式是 $m a p$ 来存储元素，比如 $m a p [s t r i n g] I t e m$ 。
使用 $m a p$ 的缺点为垃圾回收器 $G C$ 会在标记阶段访问 $m a p$ 里的每一个元素，当 $m a p$ 里存储了大量数据的时候会降低程序性能。

$B i g C a c h e$ 使用了 $g o 1.5$ 版本以后的特性：如果使用的map的key和value中都不包含指针，那么GC会忽略这个map
具体而言， $B i g C a c h e$ 使用 $m a p [u i n t 64] u i n t 32$
来存储数据，不包含指针， $G C$ 就会自动忽略这个 $m a p$ 。

$m a p$ 的 $k e y$ 存储的是缓存的 $k e y$ 经过 $h a s h$ 函数后得到的值
$m a p$ 的 $v a l u e$ 存储的是序列化后的数据在全局 $[] b y t e$ 中的下标。
因为 $B i g C a c h e$ 是将存入缓存的 $v a l u e$ 序列化为 $b y t e$ 数组，然后将该数组追加到全局的 $b y t e$ 数组里（说明：结合前面的打散思想可以得知一个 $s h a r d$ 对应一个全局的 $b y t e$ 数组）
这样做的缺点是删除元素的开销会很大，因此 $B i g C a c h e$ 里也没有提供删除指定 $k e y$ 的接口，删除元素靠的是全局的过期时间或是缓存的容量上限，是先进先出的队列类型的过期。

性能测试

项目开发者给出了项目和主流缓存方案的 $B e n c h m a r k s$ 结果和 $G C$ 测试结果
测试文件链接

参考
妙到颠毫: bigcache优化技巧
[译] Go开源项目BigCache如何加速并发访问以及避免高额的GC开销

「前端工具」postman接口测试工具详解吴维炜前端就那么回事 postman 前端工具 API开发工具 RESTful API postman自动化测试
Postman是一款流行的API开发工具，用于构建和测试RESTfulAPI。以下是Postman的一些关键特性和使用方法的详解：1.界面和基本操作工作区：Postman的主界面，用于显示集合、环境和全局变量。请求构建器：用于输入请求的URL、HTTP方法、请求头、请求体等。响应区：显示服务器的响应，包括状态码、响应头和响应体。2.创建请求GET请求：获取资源。POST请求：提交新资源。PUT请求
redis从安装到三主三从集群敲代码的旺财架构进阶分布式 redis 集群 redis主从 redis哨兵
文章目录一、为什么要使用Redis1、读写的二八原则2、信息的统一管理二、常见缓存方案的对比三、安装redis1、下载redis安装包、上传linux服务器2、安装依赖3、解压安装包4、进入文件夹、编译并安装5、修改redis的核心配置文件6、修改redis的启动脚本7、配置开机启动8、运行reids四、redis各数据类型的基本命令1、通用的命令2、String的命令3、hash的命令4、lis
python在线编辑器-在线编译或编辑Python的5个最佳工具编程大乐趣
离线Python编辑器和编译器都具有许多功能，但是在线编译器通常在功能上受到限制，并试图满足特定需求而不是满足所有需求，其中在线编译大多数是免费的，所以也受到开发者的热爱。在本文中，我们将浏览各种狂野的在线Python编译器，其中大多数是免费的，我们还列出了一些，它们是有价的，主要用于大型项目开发。在线Python编译器的功能和使用？通常提供的功能范围从简单的外壳到功能齐全的PythonIDE。在
poetry使用经验汇总 enjoy编程程序员实用工具集合 python poetry virtualenv 依赖
什么是poetryPoetry是一个Python依赖管理和打包工具，它旨在解决Python项目中常见的依赖问题，提供更简洁、更可靠的依赖管理方式。以下是Poetry的一些主要功能和特点的总结：依赖解析：Poetry使用pyproject.toml文件来管理项目依赖，它能够自动解析依赖关系，确保依赖的一致性和可重复性。虚拟环境：Poetry为每个项目创建独立的虚拟环境，避免了不同项目之间的依赖冲突。
Nginx--日志（介绍、配置、日志轮转） m0_74825466 nginx 运维
前言：本博客仅作记录学习使用，部分图片出自网络，如有侵犯您的权益，请联系删除一、Nginx日志介绍nginx有一个非常灵活的日志记录模式，每个级别的配置可以有各自独立的访问日志,所需日志模块ngx_http_log_module的支持，日志格式通过log_format命令来定义，日志对于统计和排错是非常有利的，下面总结了nginx日志相关的配置包括access_log、log_format、ope
FreeRTOS深入教程（任务创建的深入和任务调度机制分析）花落已飘 FreeRTOS全系列教程嵌入式 FreeRTOS ARM 入门 STM32
文章目录前言一、深入理解任务的创建二、任务的调度机制1.FreeRTOS中任务调度的策略2.FreeRTOS任务调度策略实现的核心3.FreeRTOS内部链表源码解析4.如何通过就绪链表管理任务的执行顺序三、一个任务能够运行多久1.高优先级任务可抢占低优先级任务一直运行2.相同优先级的任务遵循时间片轮转四、FreeRTOS中任务如何释放CPU总结前言本篇文章将带大家深入学习任务的创建和分析任务调度
XML Schema 数值数据类型 froginwe11 开发语言
XMLSchema数值数据类型引言XMLSchema是一种用于描述XML文档结构的语言。它定义了XML文档中数据的有效性和结构。在XMLSchema中，数值数据类型是非常重要的一部分，它定义了XML文档中可以包含的数值类型。本文将详细介绍XMLSchema中常用的数值数据类型，以及它们的应用场景。数值数据类型概述XMLSchema提供了多种数值数据类型，包括整数、浮点数和日期时间等。这些数据类型遵
MVC 模型：架构与原理 froginwe11 开发语言
MVC模型：架构与原理MVC（Model-View-Controller）模型是一种广泛应用于软件工程的架构模式，主要用于分离应用程序的逻辑层，以提高其可维护性和可扩展性。MVC模型将应用程序分为三个核心组件：模型（Model）、视图（View）和控制器（Controller）。本文将深入探讨MVC模型的概念、工作原理及其在软件开发中的应用。1.模型（Model）模型是MVC架构中的核心组件，负责
postman接口测试工具详解 109702008 编程 postman 人工智能学习
GPT-4o(OpenAI)Postman是一个广泛使用的API测试工具，用于开发人员和测试人员执行API测试和调试。它提供了一个用户友好的界面，并支持多种HTTP方法和各种类型的请求和响应数据格式。以下是Postman的一些核心功能和用法详解：1.安装和设置-下载与安装：从Postman的官方网站(https://www.postman.com/downloads/)下载适用于不同操作系统的安装
大模型蒸馏与大模型微调技术有啥差别? kcarly 大模型知识乱炖杂谈大模型蒸馏大模型微调大模型 AI
大模型蒸馏与大模型微调是当前人工智能领域中两种重要的技术手段，它们在模型优化、性能提升和资源利用方面各有特点。以下将从定义、技术原理、应用场景及优缺点等方面对这两种技术进行深入对比。一、定义与基本概念大模型蒸馏（KnowledgeDistillation）蒸馏是一种将大型复杂模型（教师模型）的知识迁移到小型模型（学生模型）的技术。通过训练学生模型模仿教师模型的行为，实现模型压缩和性能保留的目标。蒸
DeepSeek大模型技术深度解析：揭开Transformer架构的神秘面纱不一样的信息安全网络杂烩 AI DeepSeek
摘要DeepSeek大模型由北京深度求索人工智能基础技术研究有限公司开发，基于Transformer架构，具备卓越的自然语言理解和生成能力。该模型能够高效处理智能对话、文本生成和语义理解等复杂任务，标志着人工智能在自然语言处理领域的重大进展。关键词DeepSeek模型,Transformer架构,自然语言,智能对话,文本生成,语义理解一、DeepSeek大模型的架构解析1.1DeepSeek大模型
大模型情况 Stestack python
一、从百模大战到十模共生，再到价格战总体来看，迄今为止大模型行业的发展经历了以下3个阶段：第一个阶段，百模大战；当初OpenAI横空出世，很多企业竞相涌入大模型赛道，出现了蔚为壮观的“百模大战”的景象.有数据统计，高峰时期，国内完成备案并上线的AI大模型数量接近200个之多。第二阶段，十模共生；随着市场的筛选和对实力考验的加剧，“百模”中的很多“模”，开始掉队。有实力继续坐在牌桌上的成了少数，整个
各个互联网厂和央国企招聘地址 Future_yzx 大厂求职招聘企微
一、互联网厂招聘地址腾讯：【社招】腾讯社招【校招】腾讯校招阿里巴巴：阿里巴巴招聘字节跳动：字节跳动招聘美团：【校招】美团校招【社招】美团社招拼多多：拼多多招聘快手：【社招】快手社招【校招】快手校招百度：【社招】百度社招【校招】百度校招网易：【社招】网易社招【校招】网易校招携程：【社招】携程社招【校招】携程校招小米：【社招】小米社招【校招】小米校招哔哩哔哩：【校招】哔哩哔哩校招【社招】哔哩哔哩社招京
室内家具检测数据集VOC+YOLO格式7928张10类别 FL1623863129 数据集深度学习机器学习人工智能
数据集格式：PascalVOC格式+YOLO格式(不包含分割路径的txt文件，仅仅包含jpg图片以及对应的VOC格式xml文件和yolo格式txt文件)图片数量(jpg文件个数)：7928标注数量(xml文件个数)：7928标注数量(txt文件个数)：7928标注类别数：10标注类别名称(注意yolo格式类别顺序不和这个对应，而以labels文件夹classes.txt为准):["Bed","Bo
遥感图像建筑房屋树木水体分割数据集labelme格式2026张5类别 FL1623863129 数据集计算机视觉人工智能深度学习
数据集格式：labelme格式(不包含mask文件，仅仅包含jpg图片和对应的json文件)图片数量(jpg文件个数)：2026标注数量(json文件个数)：2026标注类别数：5标注类别名称:["Tree","building","Tin_Shade","farmland","water"]每个类别标注的框数：Treecount=64782buildingcount=52980Tin_Shade
Python Poetry 的使用 YOUFDJ python linux 服务器 Python
PythonPoetry的使用PythonPoetry是一个用于管理Python项目依赖的工具。它提供了一个简洁的界面，使得创建、发布和管理Python包变得更加容易。本文将介绍如何安装Poetry，并使用它来创建一个新的Python项目并管理其依赖关系。安装Poetry首先，我们需要安装Poetry。可以通过在命令行中运行以下命令来安装Poetry：curl-sSLhttps://install
LLM主要类别架构大模型微调实战人工智能 langchain 自然语言处理神经网络深度学习
LLM主要类别架构介绍LLM主要类别LLM本身基于transformer架构。自2017年，attentionisallyouneed诞生起，transformer模型为不同领域的模型提供了灵感和启发。基于原始的Transformer框架，衍生出了一系列模型，一些模型仅仅使用encoder或decoder，有些模型同时使encoder+decoder。LLM分类一般分为三种：自编码模型（encod
计算机网络之计算机网络的分类 DKPT #计算机网络计算机网络笔记学习开发语言算法
计算机网络可以根据不同的角度进行分类，以下是几种常见的分类方式：1.按照规模和范围：局域网（LAN，LocalAreaNetwork）：覆盖较小范围（例如一个建筑物或校园），通常使用以太网技术。城域网（MAN，MetropolitanAreaNetwork）：覆盖城市范围，通常由多个局域网组成，通过高速光纤连接。广域网（WAN，WideAreaNetwork）：覆盖较大范围，可以跨越城市、国家甚至
手把手教你搭建 Android MVI架构 MVI + kotlin + Flow m0_74825466 android 架构 kotlin
一、什么是MVIAndroidMVI是一种用于构建Android应用程序的架构模式，其核心思想在于实现单向数据流和唯一可信数据源。在MVI架构中，应用程序的状态管理得到简化，并且用户界面与业务逻辑之间的交互更加清晰和规范。二、MVI组成MVI由Model、View和Intent三个核心组件组成：Model：代表数据模型，负责存储应用程序的状态。它是唯一可信的数据源，意味着应用程序的所有状态都集中在
分布式系统架构7：本地缓存快乐非自愿架构缓存
1.引入缓存的影响我们在开发时，用到缓存的情况，无非就是为了减少客户端对相同资源的重复请求，降低服务器的负载压力。引入缓存后，既有好处也有坏处引入缓存负面影响：开发角度，增加了系统复杂度，需考虑缓存失效、更新、一致性问题运维角度，缓存会掩盖一些缺陷问题安全角度，缓存可能泄密某些保密数据引入缓存的理由：为了缓解CPU压力，将实时计算运行结果存储起来，节省CPU压力为了缓解I/O压力，将原本对网络、磁
几款语言python在线编辑器 Stestack python 编辑器开发语言
在当今数字化时代，编程已成为一项不可或缺的技能。Python作为一种简单易学且功能强大的编程语言，受到了广大编程爱好者和专业开发人员的青睐。为了方便大家随时随地编写和运行Python代码，市面上涌现了许多优秀的在线Python编辑器。本文将为您推荐几款目前非常火爆的Python在线编辑器。1、LightlyPythonIDE支持在线编辑、编译、运行Python代码。它适用于任何操作系统，用户只需打
[python]poetry安装和使用 FL1623863129 Pytorch python
Python新建Poetry环境一、安装Poetry：1、windows直接安装：(Invoke-WebRequest-Urihttps://install.python-poetry.org-UseBasicParsing).Content|python-2、pip安装pipinstallpoetry二、创建项目1、指定虚拟环境存放目录poetryconfigvirtualenvs.pathD:
Spring MVC 框架：构建高效 Java Web 应用的利器来恩1003 Java 从入门到精通 java spring mvc
Java学习资料Java学习资料Java学习资料一、引言在JavaWeb开发领域，SpringMVC框架是一颗耀眼的明星。它作为Spring框架家族的重要成员，为开发者提供了一套强大而灵活的解决方案，用于构建Web应用程序。SpringMVC遵循模型-视图-控制器（MVC）设计模式，将业务逻辑、数据展示和用户交互进行了有效的分离，使得代码结构清晰、易于维护和扩展。二、MVC设计模式概述2.1基本概
学技术学英文：elasticsearch部署架构-容错设计学会了没 elasticsearch 架构全文检索容错
Unlessyou'rerunningElasticsearchonasinglenode,preparetodesignforfailure.Designingforfailuremeansrunningyourclusterinmultiplelocationsandbereadytoloseawholedatacenterwithoutserviceinterruption.It'snott
在Ubuntu 24上优雅地安装VMware Tools的终极指南黑金IT 服务器运维
在Ubuntu24上优雅地安装VMwareTools的终极指南摘要：VMwareTools的安装对于虚拟机的性能和稳定性至关重要。本文将指导您如何在Ubuntu24系统上通过命令行优雅地安装VMwareTools，解决常见的安装问题，并确保系统的最优性能。正文：引言在虚拟化的世界里，VMwareTools是连接虚拟机与主机操作系统的桥梁，它提供了更好的性能和更多的功能。然而，安装过程中可能会遇到一
【腾讯云HAI域探秘】通过ControlNet实现二维码美化应用 yahasakiii 腾讯云人工智能云计算
文章目录背景一、前言二、HAI主要功能和应用场景三、HAI实验前期准备3.1.打开官网-申请资格3.2.创建SD实例3.3ControlNet介绍3.3下载QRCodeMonsterModel3.4测试QRCodeMonsterModel3.5测试文生图ControlNetAPI四、构建二维码美化应用4.1.项目中技术栈4.2.通过gitee管理代码并在CloudStudio上初始化环境4.3运行
Python连接MinIO进阶教程：文件类型指定、上传与获取预览链接北海yy python 前端服务器
文章目录概要1.指定文件内容类型2.获取文件的预览链接（PresignedURL）使用fput_object上传文件4.完整示例与总结概要在上一篇文章中，我们介绍了如何使用Python连接MinIO服务器，并进行了基本的文件上传和下载操作。这次，我们将深入探讨一些进阶功能，包括在上传文件时指定内容类型（Content-Type）、获取文件的预览链接（PresignedURL），以及处理文件类型猜测
【ProxyBroker】用Python打破网络限制的利器山河不见老 python python 开发语言
ProxyBroker1.什么是ProxyBroker2.ProxyBroker的功能3.ProxyBroker的优势4.ProxyBroker的使用方法5.ProxyBroker的应用场景6.结语项目地址：1.什么是ProxyBrokerProxyBroker是一个开源工具，它可以异步地从多个来源找到公共代理，并同时对它们进行检查。在当今互联网世界中，隐私保护和访问限制已经成为了许多人关注的焦点
【Healpix】python一种用于将球面划分为均匀区域的技术山河不见老 python python 开发语言
Healpix1、简介2、Healpix的基本原理3、Healpix的优点4、安装及使用4.1安装healpy4.2创建Healpix地图4.3读取和写入Healpix数据4.4数据插值5、案例5.1案例一：宇宙微波背景辐射（CMB）分析5.2案例二：星系分布分析5.3案例三：天文图像处理6、结论1、简介在天文学和宇宙学中，Healpix（HierarchicalEqualAreaisoLatit
ajax实现动态及时刷新表格数据_如何利用Python3和PyQt5来实现控件数据动态刷新... weixin_39904116
最近笔者在做一个pyqt5的界面，由于在日常生活中，一些实际运用的场合都需要对数据进行实时的刷新，例如对某个数值的监控，水温，室温的监控等等，都需要实时的刷新控件显示的数据。对于实现这样的一种功能，pyqt5在面板生成的同时就固定住了UI中的数据，例如我们产生一个QLineEdit控件，然后布局在面板上，但是控件中的数据是固定的，如果这个数据是实时更新的，想要改变空间中的数据时，就要去刷新面板，p
SAX解析xml文件小猪猪08 xml
1.创建SAXParserFactory实例 2.通过SAXParserFactory对象获取SAXParser实例 3.创建一个类SAXParserHander继续DefaultHandler，并且实例化这个类 4.SAXParser实例的parse来获取文件 public static void main(String[] args) { //
为什么mysql里的ibdata1文件不断的增长？ brotherlamp linux linux运维 linux资料 linux视频 linux运维自学
我们在 Percona 支持栏目经常收到关于 MySQL 的 ibdata1 文件的这个问题。当监控服务器发送一个关于 MySQL 服务器存储的报警时，恐慌就开始了 —— 就是说磁盘快要满了。一番调查后你意识到大多数地盘空间被 InnoDB 的共享表空间 ibdata1 使用。而你已经启用了 innodbfileper_table，所以问题是： ibdata1存了什么？当你启用了 i
Quartz-quartz.properties配置 eksliang quartz
其实Quartz JAR文件的org.quartz包下就包含了一个quartz.properties属性配置文件并提供了默认设置。如果需要调整默认配置，可以在类路径下建立一个新的quartz.properties，它将自动被Quartz加载并覆盖默认的设置。下面是这些默认值的解释 #-----集群的配置 org.quartz.scheduler.instanceName =
informatica session的使用 18289753290 workflow session log Informatica
如果希望workflow存储最近20次的log，在session里的Config Object设置，log options做配置，save session log :sessions run ;savesessio log for these runs:20 session下面的source 里面有个tracing
Scrapy抓取网页时出现CRC check failed 0x471e6e9a != 0x7c07b839L的错误酷的飞上天空 scrapy
Scrapy版本0.14.4 出现问题现象： ERROR: Error downloading <GET http://xxxxx CRC check failed 解决方法 1.设置网络请求时的header中的属性'Accept-Encoding': '*;q=0' 明确表示不支持任何形式的压缩格式，避免程序的解压
java Swing小集锦永夜-极光 java swing
1.关闭窗体弹出确认对话框 1.1 this.setDefaultCloseOperation (JFrame.DO_NOTHING_ON_CLOSE); 1.2 this.addWindowListener ( new WindowAdapter () { public void windo
强制删除.svn文件夹随便小屋 java
在windows上，从别处复制的项目中可能带有.svn文件夹，手动删除太麻烦，并且每个文件夹下都有。所以写了个程序进行删除。因为.svn文件夹在windows上是只读的，所以用File中的delete()和deleteOnExist()方法都不能将其删除，所以只能采用windows命令方式进行删除
GET和POST有什么区别？及为什么网上的多数答案都是错的。 aijuans get post
如果有人问你，GET和POST，有什么区别？你会如何回答？我的经历前几天有人问我这个问题。我说GET是用于获取数据的，POST，一般用于将数据发给服务器之用。这个答案好像并不是他想要的。于是他继续追问有没有别的区别？我说这就是个名字而已，如果服务器支持，他完全可以把G
谈谈新浪微博背后的那些算法 aoyouzi 谈谈新浪微博背后的那些算法
本文对微博中常见的问题的对应算法进行了简单的介绍，在实际应用中的算法比介绍的要复杂的多。当然，本文覆盖的主题并不全，比如好友推荐、热点跟踪等就没有涉及到。但古人云“窥一斑而见全豹”，希望本文的介绍能帮助大家更好的理解微博这样的社交网络应用。微博是一个很多人都在用的社交应用。天天刷微博的人每天都会进行着这样几个操作：原创、转发、回复、阅读、关注、@等。其中，前四个是针对短博文，最后的关注和@则针
Connection reset 连接被重置的解决方法百合不是茶 java 字符流连接被重置
流是java的核心部分,,昨天在做android服务器连接服务器的时候出了问题,就将代码放到java中执行,结果还是一样连接被重置被重置的代码如下; 客户端代码; package 通信软件服务器; import java.io.BufferedWriter; import java.io.OutputStream; import java.io.O
web.xml配置详解之filter bijian1013 java web.xml filter
一.定义 <filter> <filter-name>encodingfilter</filter-name> <filter-class>com.my.app.EncodingFilter</filter-class> <init-param> <param-name>encoding<
Heritrix Bill_chen 多线程 xml 算法制造配置管理
作为纯Java语言开发的、功能强大的网络爬虫Heritrix，其功能极其强大，且扩展性良好，深受热爱搜索技术的盆友们的喜爱，但它配置较为复杂，且源码不好理解，最近又使劲看了下，结合自己的学习和理解，跟大家分享Heritrix的点点滴滴。 Heritrix的下载（http://sourceforge.net/projects/archive-crawler/）安装、配置，就不罗嗦了，可以自己找找资
【Zookeeper】FAQ bit1129 zookeeper
1.脱离IDE，运行简单的Java客户端程序 #ZkClient是简单的Zookeeper~$ java -cp "./:zookeeper-3.4.6.jar:./lib/*" ZKClient 1. Zookeeper是的Watcher回调是同步操作，需要添加异步处理的代码 2. 如果Zookeeper集群跨越多个机房，那么Leader/
The user specified as a definer ('aaa'@'localhost') does not exist 白糖_ localhost
今天遇到一个客户BUG，当前的jdbc连接用户是root，然后部分删除操作都会报下面这个错误：The user specified as a definer ('aaa'@'localhost') does not exist 最后找原因发现删除操作做了触发器，而触发器里面有这样一句 /*!50017 DEFINER = ''aaa@'localhost' */ 原来最初
javascript中showModelDialog刷新父页面 bozch JavaScript 刷新父页面 showModalDialog
在页面中使用showModalDialog打开模式子页面窗口的时候，如果想在子页面中操作父页面中的某个节点，可以通过如下的进行： window.showModalDialog('url',self,‘status...’); // 首先中间参数使用self 在子页面使用w
编程之美-买书折扣 bylijinnan 编程之美
import java.util.Arrays; public class BookDiscount { /**编程之美买书折扣书上的贪心算法的分析很有意思，我看了半天看不懂，结果作者说，贪心算法在这个问题上是不适用的。。下面用动态规划实现。哈利波特这本书一共有五卷，每卷都是8欧元，如果读者一次购买不同的两卷可扣除5%的折扣，三卷10%，四卷20%，五卷
关于struts2.3.4项目跨站执行脚本以及远程执行漏洞修复概要 chenbowen00 struts WEB安全
因为近期负责的几个银行系统软件，需要交付客户，因此客户专门请了安全公司对系统进行了安全评测，结果发现了诸如跨站执行脚本，远程执行漏洞以及弱口令等问题。下面记录下本次解决的过程以便后续 1、首先从最简单的开始处理，服务器的弱口令问题，首先根据安全工具提供的测试描述中发现应用服务器中存在一个匿名用户，默认是不需要密码的，经过分析发现服务器使用了FTP协议，而使用ftp协议默认会产生一个匿名用
[电力与暖气]煤炭燃烧与电力加温 comsci
在宇宙中,用贝塔射线观测地球某个部分,看上去,好像一个个马蜂窝,又像珊瑚礁一样,原来是某个国家的采煤区..... 不过,这个采煤区的煤炭看来是要用完了.....那么依赖将起燃烧并取暖的城市,在极度严寒的季节中...该怎么办呢? &nbs
oracle O7_DICTIONARY_ACCESSIBILITY参数 daizj oracle
O7_DICTIONARY_ACCESSIBILITY参数控制对数据字典的访问.设置为true,如果用户被授予了如select any table等any table权限,用户即使不是dba或sysdba用户也可以访问数据字典.在9i及以上版本默认为false,8i及以前版本默认为true.如果设置为true就可能会带来安全上的一些问题.这也就为什么O7_DICTIONARY_ACCESSIBIL
比较全面的MySQL优化参考 dengkane mysql
本文整理了一些MySQL的通用优化方法，做个简单的总结分享，旨在帮助那些没有专职MySQL DBA的企业做好基本的优化工作，至于具体的SQL优化，大部分通过加适当的索引即可达到效果，更复杂的就需要具体分析了，可以参考本站的一些优化案例或者联系我，下方有我的联系方式。这是上篇。 1、硬件层相关优化 1.1、CPU相关在服务器的BIOS设置中，可
C语言homework2，有一个逆序打印数字的小算法 dcj3sjt126com c
#h1# 0、完成课堂例子 1、将一个四位数逆序打印 1234 ==> 4321 实现方法一： # include <stdio.h> int main(void) { int i = 1234; int one = i%10; int two = i / 10 % 10; int three = i / 100 % 10;
apacheBench对网站进行压力测试 dcj3sjt126com apachebench
ab 的全称是 ApacheBench ，是 Apache 附带的一个小工具，专门用于 HTTP Server 的 benchmark testing ，可以同时模拟多个并发请求。前段时间看到公司的开发人员也在用它作一些测试，看起来也不错，很简单，也很容易使用，所以今天花一点时间看了一下。通过下面的一个简单的例子和注释，相信大家可以更容易理解这个工具的使用。
2种办法让HashMap线程安全 flyfoxs java jdk jni
多线程之--2种办法让HashMap线程安全多线程之--synchronized 和reentrantlock的优缺点多线程之--2种JAVA乐观锁的比较( NonfairSync VS. FairSync) HashMap不是线程安全的,往往在写程序时需要通过一些方法来回避.其实JDK原生的提供了2种方法让HashMap支持线程安全.
Spring Security（04）——认证简介 234390216 Spring Security 认证过程
认证简介目录 1.1 认证过程 1.2 Web应用的认证过程 1.2.1 ExceptionTranslationFilter 1.2.2 在request之间共享SecurityContext 1
Java 位运算 Javahuhui java 位运算
// 左移( << ) 低位补0 // 0000 0000 0000 0000 0000 0000 0000 0110 然后左移2位后，低位补0： // 0000 0000 0000 0000 0000 0000 0001 1000 System.out.println(6 << 2);// 运行结果是24 // 右移( >> ) 高位补"
mysql免安装版配置 ldzyz007 mysql
1、my-small.ini是为了小型数据库而设计的。不应该把这个模型用于含有一些常用项目的数据库。 2、my-medium.ini是为中等规模的数据库而设计的。如果你正在企业中使用RHEL,可能会比这个操作系统的最小RAM需求(256MB)明显多得多的物理内存。由此可见，如果有那么多RAM内存可以使用，自然可以在同一台机器上运行其它服务。 3、my-large.ini是为专用于一个SQL数据
MFC和ado数据库使用时遇到的问题你不认识的休道人 sql C++mfc
=================================================================== 第一个 =================================================================== try{ CString sql; sql.Format("select * from p
表单重复提交Double Submits rensanning double
可能发生的场景： *多次点击提交按钮 *刷新页面 *点击浏览器回退按钮 *直接访问收藏夹中的地址 *重复发送HTTP请求（Ajax）（1）点击按钮后disable该按钮一会儿，这样能避免急躁的用户频繁点击按钮。这种方法确实有些粗暴，友好一点的可以把按钮的文字变一下做个提示，比如Bootstrap的做法： http://getbootstrap.co
Java String 十大常见问题 tomcat_oracle java 正则表达式
　1.字符串比较，使用“==”还是equals()? 　　"=="判断两个引用的是不是同一个内存地址(同一个物理对象)。　　equals()判断两个字符串的值是否相等。　　除非你想判断两个string引用是否同一个对象，否则应该总是使用equals()方法。　　如果你了解字符串的驻留(String Interning)则会更好地理解这个问题。　　
SpringMVC 登陆拦截器实现登陆控制 xp9802 springMVC
思路，先登陆后，将登陆信息存储在session中，然后通过拦截器，对系统中的页面和资源进行访问拦截，同时对于登陆本身相关的页面和资源不拦截。实现方法： 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23