Generalzy

七天实现一个分布式缓存

教程来源
目的
思路
缓存淘汰(失效)算法：FIFO，LFU 和 LRU
- FIFO(First In First Out)
- LFU(Least Frequently Used)
- LRU(Least Recently Used)
- 实现Lru
- - - 查找功能
  - 删除
  - 新增/修改
  - 测试
- 单机并发缓存
- - 主体结构 Group
  - - 回调 Getter
  - Group 的定义
  - - Group 的 Get 方法
- HTTP 服务端
- - 自测
- 一致性哈希(hash)
- - Why一致性哈希
  - - 我该访问谁？
    - 节点数量变化了怎么办？
  - 一致性哈希
  - - 什么是一致性 hash 算法
    - 算法原理
    - 数据倾斜问题
    - Go语言实现
- 分布式节点
- - 抽象 PeerPicker
  - 节点选择与 HTTP 客户端
  - 实现主流程
  - 测试
- 防止缓存击穿
- - 缓存雪崩、缓存击穿与缓存穿透
  - singleflight 的实现
  - 应用到请求中
总结

教程来源

极客兔兔——7天用Go从零实现分布式缓存GeeCache

目的

模仿groupcache(Go 语言版的 memcached)实现一个分布式缓存中间件。

思路

设计一个分布式缓存系统，需要考虑资源控制、淘汰策略、并发、分布式节点通信等各个方面的问题。而且，针对不同的应用场景，还需要在不同的特性之间权衡，例如，是否需要支持缓存更新？还是假定缓存在淘汰之前是不允许改变的。不同的权衡对应着不同的实现。
groupcache 是 Go 语言版的 memcached，目的是在某些特定场合替代 memcached。groupcache 的作者也是 memcached 的作者。无论是了解单机缓存还是分布式缓存，深入学习这个库的实现都是非常有意义的。
支持特性有：
1. 单机缓存和基于 HTTP 的分布式缓存
2. 最近最少访问(Least Recently Used, LRU) 缓存策略
3. 使用 Go 锁机制防止缓存击穿
4. 使用一致性哈希选择节点，实现负载均衡
5. 使用 protobuf 优化节点间二进制通信
  …

缓存淘汰(失效)算法：FIFO，LFU 和 LRU

FIFO(First In First Out)

先进先出，也就是淘汰缓存中最老(最早添加)的记录。
FIFO 认为，最早添加的记录，其不再被使用的可能性比刚添加的可能性大。
这种算法的实现也非常简单，创建一个队列，新增记录添加到队尾，每次内存不够时，淘汰队首。但是很多场景下，部分记录虽然是最早添加但也最常被访问，而不得不因为呆的时间太长而被淘汰。这类数据会被频繁地添加进缓存，又被淘汰出去，导致缓存命中率降低。

LFU(Least Frequently Used)

最少使用，也就是淘汰缓存中访问频率最低的记录。
LFU 认为，如果数据过去被访问多次，那么将来被访问的频率也更高。
LFU 的实现需要维护一个按照访问次数排序的队列，每次访问，访问次数加1，队列重新排序，淘汰时选择访问次数最少的即可。
LFU 算法的命中率是比较高的，但缺点也非常明显，维护每个记录的访问次数，对内存的消耗是很高的；另外，如果数据的访问模式发生变化，LFU 需要较长的时间去适应，也就是说 LFU 算法受历史数据的影响比较大。例如某个数据历史上访问次数奇高，但在某个时间点之后几乎不再被访问，但因为历史访问次数过高，而迟迟不能被淘汰。

LRU(Least Recently Used)

最近最少使用，相对于仅考虑时间因素的 FIFO 和仅考虑访问频率的 LFU，LRU 算法可以认为是相对平衡的一种淘汰算法。
LRU 认为，如果数据最近被访问过，那么将来被访问的概率也会更高。
LRU 算法的实现非常简单，维护一个队列，如果某条记录被访问了，则移动到队尾，那么队首则是最近最少访问的数据，淘汰该条记录即可。

这张图很好地表示了 LRU 算法最核心的 2 个数据结构：

蓝色的是字典(map)，存储键和值的映射关系。这样根据某个键(key)查找对应的值(value)的复杂是O(1)，在字典中插入一条记录的复杂度也是O(1)。
红色的是双向链表(double linked list)实现的队列。将所有的值放到双向链表中，这样，当访问到某个值时，将其移动到队尾的复杂度是O(1)，在队尾新增一条记录以及删除一条记录的复杂度均为O(1)。

实现Lru

接下来创建一个包含字典和双向链表的结构体类型 Cache，方便实现后续的增删查改操作。

package Cache

import "container/list"

// Callback 回调函数
type Callback func(key string, value Value)

// Cache LRU缓存
type Cache struct {
	// maxBytes 最大允许使用内存
	maxBytes int64
	// currentBytes 当前使用内存
	currentBytes int64

	// linker 底层链表
	linker *list.List
	// cache 底层缓存
	cache map[string]*list.Element

	// onEvicted 某个key被移除后的回调函数
	onEvicted Callback
}

// Value 返回值所占用的内存大小
type Value interface {
	Len() int
}

// entry linker的node
type entry struct {
	key   string
	value Value
}

func NewCache(maxBytes int64, onEvicted Callback) *Cache {
	return &Cache{
		maxBytes:  maxBytes,
		linker:    list.New(),
		cache:     make(map[string]*list.Element),
		onEvicted: onEvicted,
	}
}

直接使用 Go 语言标准库实现的双向链表list.List。
字典的定义是 map[string]*list.Element，键是字符串，值是双向链表中对应节点的指针。
maxBytes 是允许使用的最大内存，nbytes 是当前已使用的内存，OnEvicted 是某条记录被移除时的回调函数，可以为 nil。
键值对 entry 是双向链表节点的数据类型，在链表中仍保存每个值对应的 key 的好处在于，淘汰队首节点时，需要用 key 从字典中删除对应的映射。
为了通用性，允许值是实现了 Value 接口的任意类型，该接口只包含了一个方法 Len() int，用于返回值所占用的内存大小。（只要可以调用len函数的类型，都实现了len接口)
方便实例化 Cache，实现 New() 函数。

查找功能

查找主要有 2 个步骤，第一步是从字典中找到对应的双向链表的节点，第二步，将该节点移动到队尾。

// Get 查询key
func (c *Cache) Get(key string) (Value, bool) {
	if val, ok := c.cache[key]; ok {
		// 移到队尾部
		c.linker.MoveToBack(val)
		// 将list.Element.Value类型断言为entry
		kv := val.Value.(*entry)
		return kv.value, true
	}
	return nil, false
}

如果键对应的链表节点存在，则将对应节点移动到队尾，并返回查找到的值。
c.ll.MoveToBack，即将链表中的节点 ele 移动到队尾。

删除

这里的删除，实际上是缓存淘汰。即移除最近最少访问的节点（队首）。

// RemoveOldest OnEvicted: onEvicted
func (c *Cache) RemoveOldest() {
	// 返回队首
	ele := c.linker.Front()
	if ele != nil {
		// 从链表中删除元素
		c.linker.Remove(ele)
		kv := ele.Value.(*entry)

		// 从cache中将key淘汰
		delete(c.cache, kv.key)

		// 修改当前cache占用大小
		// 即减去一个k,一个v的大小
		c.currentBytes -= int64(len(kv.key)) + int64(kv.value.Len())

		// 如果用户定义的回调函数不为空则执行一下
		if c.onEvicted != nil {
			c.onEvicted(kv.key, kv.value)
		}
	}
}

新增/修改

// Add adds a value to the cache.
func (c *Cache) Add(key string, value Value) {
	if ele, ok := c.cache[key]; ok {
		// 修改节点

		// 移动到队尾
		c.linker.MoveToBack(ele)
		// 获取entry(key,val)
		kv := ele.Value.(*entry)
		// 当前内存占用为旧val长度-新val长度
		c.currentBytes += int64(value.Len()) - int64(kv.value.Len())
		// 覆盖旧value
		kv.value = value
	} else {
		// 从队尾加入
		ele := c.linker.PushBack(&entry{key, value})
		c.cache[key] = ele
		// 增加一个key和一个val的长度
		c.currentBytes += int64(len(key)) + int64(value.Len())
	}

	// 如果超过限制,则进行内存淘汰
	for c.maxBytes != 0 && c.maxBytes < c.currentBytes {
		c.RemoveOldest()
	}
}

最后，为了方便测试，实现 Len() 用来获取添加了多少条数据。

// Len the number of cache entries
func (c *Cache) Len()int {
	return c.linker.Len()
}

测试

type String string

func (s String) Len() int {
	return len(s)
}

func main() {
	c := Cache.NewCache(16, func(key string, value Cache.Value) {
		fmt.Println(key, value)
	})

	for i := 0; i < 10; i++ {
		s := String("德玛西亚")
		c.Add(fmt.Sprintf("name_%d", i), s)
		fmt.Println(c)
	}
}

单机并发缓存

使用 sync.Mutex 封装 LRU 的几个方法，使之支持并发的读写。
在这之前，抽象了一个只读数据结构 ByteView 用来表示缓存值，是 GeeCache 主要的数据结构之一。

// ByteView 保存字节的不可变视图。
type ByteView struct {
	b []byte
}

// Len returns the view's length
func (v ByteView) Len() int {
	return len(v.b)
}

// clone 拷贝功能
func clone(b []byte) []byte {
	c := make([]byte, len(b))
	copy(c, b)
	return c
}

// CloneViewToSlice 返回ByteView的一份拷贝
func (v ByteView) CloneViewToSlice() []byte {
	return clone(v.b)
}

// String 实现string接口
func (v ByteView) String() string {
	return string(v.b)
}

ByteView 只有一个数据成员，b []byte，b 将会存储真实的缓存值。选择 byte 类型是为了能够支持任意的数据类型的存储，例如字符串、图片等。
实现 Len() int 方法，我们在 lru.Cache 的实现中，要求被缓存对象必须实现 Value 接口，即 Len() int 方法，返回其所占的内存大小。
b 是只读的，使用 CloneViewToSlice() 方法返回一个拷贝，防止缓存值被外部程序修改。

接下来就可以为 lru.Cache 添加并发特性了。

// cache 封装lru
type cache struct {
	// 互斥锁
	mu sync.RWMutex
	// lru 封装的lru缓存
	lru *lru.Cache
	// cacheBytes 等价于maxBytes最大允许使用内存
	cacheBytes int64
}

// add 封装了Add方法
func (c *cache) add(key string, value ByteView) {
	c.mu.Lock()
	defer c.mu.Unlock()
	// 懒加载lru.Cache
	if c.lru == nil {
		c.lru = lru.NewCache(c.cacheBytes, nil)
	}
	c.lru.Add(key, value)
}

// get 封装了Get方法
func (c *cache) get(key string) (ByteView, bool) {
	c.mu.RLock()
	defer c.mu.RUnlock()
	// 若未初始化就获取值则返回nil
	if c.lru == nil {
		return ByteView{}, false
	}

	if v, ok := c.lru.Get(key); ok {
		// ByteView实现了Len接口
		// 因此v类型断言为ByteView
		return v.(ByteView), ok
	}

	return ByteView{}, false
}

cache.go 的实现非常简单，实例化 lru，封装 get 和 add 方法，并添加互斥锁 mu。
在 add 方法中，判断了 c.lru 是否为 nil，如果等于 nil 再创建实例。这种方法称之为延迟初始化(Lazy Initialization)，一个对象的延迟初始化意味着该对象的创建将会延迟至第一次使用该对象时。主要用于提高性能，并减少程序内存要求。

主体结构 Group

Group 是 GeeCache 最核心的数据结构，负责与用户的交互，并且控制缓存值存储和获取的流程。

                            是
接收 key --> 检查是否被缓存 -----> 返回缓存值 ⑴
                |  否                         是
                |-----> 是否应当从远程节点获取 -----> 与远程节点交互 --> 返回缓存值 ⑵
                            |  否
                            |-----> 调用`回调函数`，获取值并添加到缓存 --> 返回缓存值 ⑶

|--lru/
    |--lru.go  // lru 缓存淘汰策略
|--byteview.go // 缓存值的抽象与封装
|--cache.go    // 并发控制
|--generalcache.go // 负责与外部交互，控制缓存存储和获取的主流程

回调 Getter

思考一下，如果缓存不存在，应从数据源（文件，数据库等）获取数据并添加到缓存中。GeeCache 是否应该支持多种数据源的配置呢？不应该，一是数据源的种类太多，没办法一一实现；二是扩展性不好。
如何从源头获取数据，应该是用户决定的事情，我们就把这件事交给用户好了。因此，我们设计了一个回调函数(callback)，在缓存不存在时，调用这个函数，得到源数据。

// A Getter loads data for a key.
type Getter interface {
	Get(key string) ([]byte, error)
}

// A GetterFunc implements Getter with a function.
type GetterFunc func(key string) ([]byte, error)

// Get implements Getter interface function
// 调用该接口的方法 f.Get(key string)，实际上就是在调用匿名回调函数
func (f GetterFunc) Get(key string) ([]byte, error) {
	return f(key)
}

定义接口 Getter 和回调函数 Get(key string)([]byte, error)，参数是 key，返回值是 []byte。
定义函数类型 GetterFunc，并实现 Getter 接口的 Get 方法。
函数类型实现某一个接口，称之为接口型函数，方便使用者在调用时既能够传入函数作为参数，也能够传入实现了该接口的结构体作为参数。（借助 GetterFunc 的类型转换，将一个匿名回调函数转换成了接口 f Getter。）

Group 的定义

一个 Group 可以认为是一个缓存的命名空间，每个 Group 拥有一个唯一的名称 name。比如可以创建三个 Group，缓存学生的成绩命名为 scores，缓存学生信息的命名为 info，缓存学生课程的命名为 courses。
第二个属性是 getter Getter，即缓存未命中时获取源数据的回调(callback)。
第三个属性是 mainCache cache，即一开始实现的并发缓存。
构建函数 NewGroup 用来实例化 Group，并且将 group 存储在全局变量 groups 中。
GetGroup 用来特定名称的 Group，这里使用了只读锁 RLock()，因为不涉及任何冲突变量的写操作。

// Group 对cache封装
type Group struct {
	// 当前组的名称
	name   string
	getter Getter
	// mainCache 底层缓存
	mainCache cache
}

var (
	mu     sync.RWMutex
	groups = make(map[string]*Group)
)

// NewGroup create a new instance of Group
func NewGroup(name string, cacheBytes int64, getter Getter) *Group {
	if getter == nil {
		panic("nil Getter")
	}
	mu.Lock()
	defer mu.Unlock()
	g := &Group{
		name:   name,
		getter: getter,
		// 使用封装后的cache
		mainCache: cache{cacheBytes: cacheBytes},
	}
	groups[name] = g
	return g
}

// GetGroup returns the named group previously created with NewGroup, or
// nil if there's no such group.
func GetGroup(name string) *Group {
	mu.RLock()
	defer mu.RUnlock()
	g := groups[name]
	return g
}

Group 的 Get 方法

// Get value for a key from cache
func (g *Group) Get(key string) (ByteView, error) {
	if key == "" {
		return ByteView{}, fmt.Errorf("key is required")
	}

	if v, ok := g.mainCache.get(key); ok {
		log.Println("[GeeCache] hit")
		return v, nil
	}
	// 从getter中获取数据
	return g.loadFromGetter(key)
}

func (g *Group) loadFromGetter(key string) (ByteView, error) {
	// 从getter中获取数据
	bytes, err := g.getter.Get(key)
	if err != nil {
		return ByteView{}, err

	}
	// 返回获取到数据的copy
	value := ByteView{b: clone(bytes)}
	// 加入缓存
	g.mainCache.add(key, value)
	return value, nil
}

Get 方法实现了上述所说的流程 ⑴ 和 ⑶。
流程 ⑴ ：从 mainCache 中查找缓存，如果存在则返回缓存值。
流程 ⑶ ：缓存不存在，则调用loadFromGetter 方法，loadFromGetter 调用用户回调函数 g.getter.Get() 获取源数据，并且将源数据添加到缓存 mainCache 中（通过 populateCache 方法）

HTTP 服务端

分布式缓存需要实现节点间通信，建立基于 HTTP 的通信机制是比较常见和简单的做法。
如果一个节点启动了 HTTP 服务，那么这个节点就可以被其他节点访问。

首先创建一个结构体 HTTPPool，作为承载节点间 HTTP 通信的核心数据结构。

const defaultBasePath = "/_generalcache/"

// HTTPPool implements PeerPicker for a pool of HTTP peers.
type HTTPPool struct {
	// this peer's base URL, e.g. "https://example.net:8000"
	self     string
	basePath string
}

// NewHTTPPool initializes an HTTP pool of peers.
func NewHTTPPool(self string) *HTTPPool {
	return &HTTPPool{
		self:     self,
		basePath: defaultBasePath,
	}
}

HTTPPool 只有 2 个参数，一个是 self，用来记录自己的地址，包括主机名/IP 和端口。
另一个是 basePath，作为节点间通讯地址的前缀，默认是 /_geecache/，那么 http://example.com/_geecache/ 开头的请求，就用于节点间的访问。因为一个主机上还可能承载其他的服务，加一段 Path 是一个好习惯。比如，大部分网站的 API 接口，一般以 /api 作为前缀。

接下来，实现最为核心的 ServeHTTP 方法：

// Log info with server name
func (p *HTTPPool) Log(format string, v ...interface{}) {
	log.Printf("[Server %s] %s", p.self, fmt.Sprintf(format, v...))
}

// ServeHTTP handle all http requests
func (p *HTTPPool) ServeHTTP(w http.ResponseWriter, r *http.Request) {
	if !strings.HasPrefix(r.URL.Path, p.basePath) {
		panic("HTTPPool serving unexpected path: " + r.URL.Path)
	}
	p.Log("%s %s", r.Method, r.URL.Path)
	// /// required
	parts := strings.SplitN(r.URL.Path[len(p.basePath):], "/", 2)
	if len(parts) != 2 {
		http.Error(w, "bad request", http.StatusBadRequest)
		return
	}

	// 根据切片获取group和key信息
	groupName := parts[0]
	key := parts[1]

	// 获取group
	group := GetGroup(groupName)
	if group == nil {
		http.Error(w, "no such group: "+groupName, http.StatusNotFound)
		return
	}

	// 获取val
	view, err := group.Get(key)
	if err != nil {
		http.Error(w, err.Error(), http.StatusInternalServerError)
		return
	}

	// 返回响应
	w.Header().Set("Content-Type", "application/octet-stream")
	// 写入val
	_, _ = w.Write(view.ByteSlice())
}

ServeHTTP 的实现逻辑是比较简单的，首先判断访问路径的前缀是否是 basePath，不是返回错误。
我们约定访问路径格式为 ///，通过 groupname 得到 group 实例，再使用 group.Get(key) 获取缓存数据。
最终使用 w.Write() 将缓存值作为 httpResponse 的 body 返回。

自测

var db = map[string]string{
	"Tom":  "630",
	"Jack": "589",
	"Sam":  "567",
}

func main() {
	// 初始化一个group
	// 并绑定getter函数
	Cache.NewGroup("test", 1<<10, Cache.GetterFunc(
		func(key string) ([]byte, error) {
			log.Println("[SlowDB] search key", key)
			if v, ok := db[key]; ok {
				return []byte(v), nil
			}
			return nil, fmt.Errorf("%s not exist", key)
		}))

	addr := "localhost:9999"
	peers := Cache.NewHTTPPool(addr)
	log.Println("geecache is running at", addr)
	log.Fatal(http.ListenAndServe(addr, peers))
}

访问：http://127.0.0.1:9999/_generalcache/test/1
响应：1 not exist

访问：http://127.0.0.1:9999/_generalcache/test/Tom
响应：630

一致性哈希(hash)

Why一致性哈希

我该访问谁？

对于分布式缓存来说，当一个节点接收到请求，如果该节点并没有存储缓存值，那么它面临的难题是，从谁那获取数据？自己，还是节点1, 2, 3, 4… 。假设包括自己在内一共有 10 个节点，当一个节点接收到请求时，随机选择一个节点，由该节点从数据源获取数据。
假设第一次随机选取了节点 1 ，节点 1 从数据源获取到数据的同时缓存该数据；那第二次，只有 1/10 的可能性再次选择节点 1, 有 9/10 的概率选择了其他节点，如果选择了其他节点，就意味着需要再一次从数据源获取数据，一般来说，这个操作是很耗时的。这样做，一是缓存效率低，二是各个节点上存储着相同的数据，浪费了大量的存储空间。

那有什么办法，对于给定的 key，每一次都选择同一个节点呢？使用 hash 算法也能够做到这一点。那把 key 的每一个字符的 ASCII 码加起来，再除以 10 取余数可以吗？当然可以，这可以认为是自定义的 hash 算法。

从上面的图可以看到，任意一个节点任意时刻请求查找键 Tom 对应的值，都会分配给节点 2，有效地解决了上述的问题。

节点数量变化了怎么办？

简单求取 Hash 值解决了缓存性能的问题，但是没有考虑节点数量变化的场景。假设，移除了其中一台节点，只剩下 9 个，那么之前 hash(key) % 10 变成了 hash(key) % 9，也就意味着几乎缓存值对应的节点都发生了改变。即几乎所有的缓存值都失效了。节点在接收到对应的请求时，均需要重新去数据源获取数据，容易引起 缓存雪崩。
```
缓存雪崩：缓存在同一时刻全部失效，造成瞬时DB请求量大、压力骤增，引起雪崩。常因为缓存服务器宕机，或缓存设置了相同的过期时间引起。
```
一致性哈希算法可以解决上述问题。

一致性哈希

什么是一致性 hash 算法

一致性哈希算法也是使用取模的方法，但是取模算法是对服务器的数量进行取模，而一致性哈希算法是对 2^32 取模，具体步骤如下：

步骤一：一致性哈希算法将整个哈希值空间按照顺时针方向组织成一个虚拟的圆环，称为 Hash 环；
步骤二：接着将各个服务器使用 Hash 函数进行哈希，具体可以选择服务器的IP或主机名作为关键字进行哈希，从而确定每台机器在哈希环上的位置
步骤三：最后使用算法定位数据访问到相应服务器：将数据key使用相同的函数Hash计算出哈希值，并确定此数据在环上的位置，从此位置沿环顺时针寻找，第一台遇到的服务器就是其应该定位到的服务器

算法原理

一致性哈希算法将 key 映射到 2^32 的空间中，将这个数字首尾相连，形成一个环。

计算节点/机器(通常使用节点的名称、编号和 IP 地址)的哈希值，放置在环上，哈希算法：hash（服务器的IP） % 2^32。
计算 key 的哈希值，放置在环上，顺时针寻找到的第一个节点，就是应选取的节点/机器。

环上有 peer2，peer4，peer6 三个节点，key11，key2，key27 均映射到 peer2，key23 映射到 peer4。此时，如果新增节点/机器 peer8，假设它新增位置如图所示，那么只有 key27 从 peer2 调整到 peer8，其余的映射均没有发生改变。

也就是说，一致性哈希算法，在新增/删除节点时，只需要重新定位该节点附近的一小部分数据，而不需要重新定位所有的节点，这就解决了上述的问题。

数据倾斜问题

如果服务器的节点过少，容易引起 key 的倾斜。例如上面例子中的 peer2，peer4，peer6 分布在环的上半部分，下半部分是空的。那么映射到环下半部分的 key 都会被分配给 peer2，key 过度向 peer2 倾斜，缓存节点间负载不均。

为了解决这个问题，引入了虚拟节点的概念，一个真实节点对应多个虚拟节点。

假设 1 个真实节点对应 3 个虚拟节点，那么 peer1 对应的虚拟节点是 peer1-1、 peer1-2、 peer1-3（通常以添加编号的方式实现），其余节点也以相同的方式操作。

第一步，计算虚拟节点的 Hash 值，放置在环上。
第二步，计算 key 的 Hash 值，在环上顺时针寻找到应选取的虚拟节点，例如是 peer2-1，那么就对应真实节点 peer2。

如上图，(A-1,A-2)，（B-1,B-2)，（C-1,C-2），
虚拟节点扩充了节点的数量，解决了节点较少的情况下数据容易倾斜的问题。而且代价非常小，只需要增加一个字典(map)维护真实节点与虚拟节点的映射关系即可。

Go语言实现

定义了函数类型 Hash，采取依赖注入的方式，允许用于替换成自定义的 Hash 函数，也方便测试时替换，默认为 crc32.ChecksumIEEE 算法。
Map 是一致性哈希算法的主数据结构，包含 4 个成员变量：Hash 函数 hash；虚拟节点倍数 replicas；哈希环 keys；虚拟节点与真实节点的映射表 hashMap，键是虚拟节点的哈希值，值是真实节点的名称。
构造函数 New() 允许自定义虚拟节点倍数和 Hash 函数。

// Hash maps bytes to uint32
type Hash func(data []byte) uint32

// Map constains all hashed keys
type Map struct {
	hash     Hash
	// 虚拟节点倍数
	replicas int
	keys     []int // Sorted
	hashMap  map[int]string
}

// New creates a Map instance
func New(replicas int, fn Hash) *Map {
	m := &Map{
		replicas: replicas,
		hash:     fn,
		hashMap:  make(map[int]string),
	}
	if m.hash == nil {
		// CRC32:CRC本身是“冗余校验码”的意思，CRC32则表示会产生一个32bit（8位十六进制数）的校验值。由于CRC32产生校验值时源数据块的每一个bit（位）都参与了计算，所以数据块中即使只有一位发生了变化，也会得到不同的CRC32值.
		m.hash = crc32.ChecksumIEEE
	}
	return m
}

接下来，实现添加真实节点/机器的 Add() 方法。

// Add adds some keys to the hash.
func (m *Map) Add(keys ...string) {
	for _, key := range keys {
		// 根据虚拟节点倍数添加虚拟节点
		// key: host1:6379 host2:6379 host3:6379
		for i := 0; i < m.replicas; i++ {
			hash := int(m.hash([]byte(strconv.Itoa(i) + key)))
			// 加入hash环
			m.keys = append(m.keys, hash)
			// 添加虚拟节点和真实节点的映射
			m.hashMap[hash] = key
		}
	}
	// 排序
	sort.Ints(m.keys)
}

Add 函数允许传入 0 或多个真实节点的名称。
对每一个真实节点 key，对应创建 m.replicas 个虚拟节点，虚拟节点的名称是：strconv.Itoa(i) + key，即通过添加编号的方式区分不同虚拟节点。
使用 m.hash() 计算虚拟节点的哈希值，使用 append(m.keys, hash) 添加到环上。
在 hashMap 中增加虚拟节点和真实节点的映射关系。
最后一步，环上的哈希值排序。

最后一步，实现选择节点的 Get() 方法：

// Get gets the closest item in the hash to the provided key.
func (m *Map) Get(key string) string {
	if len(m.keys) == 0 {
		return ""
	}
	// 求key的哈希值
	hash := int(m.hash([]byte(key)))
	// Binary search for appropriate replica.
	idx := sort.Search(len(m.keys), func(i int) bool {
		return m.keys[i] >= hash
	})

	return m.hashMap[m.keys[idx%len(m.keys)]]
}

选择节点就非常简单了，第一步，计算 key 的哈希值。
第二步，顺时针找到第一个匹配的虚拟节点的下标 idx，从 m.keys 中获取到对应的哈希值。如果 idx == len(m.keys)，说明应选择 m.keys[0]，因为 m.keys 是一个环状结构，所以用取余数的方式来处理这种情况。
第三步，通过 hashMap 映射得到真实的节点。

至此，整个一致性哈希算法就实现完成了。

分布式节点

                            是
接收 key --> 检查是否被缓存 -----> 返回缓存值 ⑴
                |  否                         是
                |-----> 是否应当从远程节点获取 -----> 与远程节点交互 --> 返回缓存值 ⑵
                            |  否
                            |-----> 调用`回调函数`，获取值并添加到缓存 --> 返回缓存值 ⑶

对于cache的流程如上所示，在这之前已经实现了流程 ⑴ 和 ⑶，今天实现流程 ⑵，从远程节点获取缓存值。

进一步细化流程 ⑵：

使用一致性哈希选择节点        是                                    是
    |-----> 是否是远程节点 -----> HTTP 客户端访问远程节点 --> 成功？-----> 服务端返回返回值
                    |  否                                    ↓  否
                    |----------------------------> 回退到本地节点处理。

抽象 PeerPicker

// PeerPicker is the interface that must be implemented to locate
// the peer that owns a specific key.
type PeerPicker interface {
	PickPeer(key string) (peer PeerGetter, ok bool)
}

// PeerGetter is the interface that must be implemented by a peer.
type PeerGetter interface {
	Get(group string, key string) ([]byte, error)
}

在这里，抽象出 2 个接口，PeerPicker 的 PickPeer() 方法用于根据传入的 key 选择相应节点 PeerGetter。
接口 PeerGetter 的 Get() 方法用于从对应 group 查找缓存值。PeerGetter 就对应于上述流程中的 HTTP 客户端。

节点选择与 HTTP 客户端

通信不仅需要服务端还需要客户端，因此，接下来要为 HTTPPool 实现客户端的功能。

首先创建具体的 HTTP 客户端类 httpGetter，实现 PeerGetter 接口：

type httpGetter struct {
	baseURL string
}

func (h *httpGetter) Get(group string, key string) ([]byte, error) {
	// 拼接请求group和key的url
	u := fmt.Sprintf(
		"%v%v/%v",
		h.baseURL,
		url.QueryEscape(group),
		url.QueryEscape(key),
	)
	// 发送请求
	res, err := http.Get(u)
	if err != nil {
		return nil, err
	}

	_ = res.Body.Close()

	if res.StatusCode != http.StatusOK {
		return nil, fmt.Errorf("server returned: %v", res.Status)
	}
	// 获取对应key的其他节点的响应
	bytes, err := io.ReadAll(res.Body)
	if err != nil {
		return nil, fmt.Errorf("reading response body: %v", err)
	}

	return bytes, nil
}

var _ PeerGetter = (*httpGetter)(nil)

baseURL 表示将要访问的远程节点的地址，例如 http://example.com/_geecache/。
使用 http.Get() 方式获取返回值，并转换为 []bytes 类型。

为 HTTPPool 添加节点选择的功能：

// 比较特殊的url前缀
// 举例: host:port/_general_cache/groupName/key 来获取某一个group的key
const (
	defaultReplicas = 50
	defaultBasePath = "/_general_cache/"
)

type HTTPPool struct {
	// self 记录节点的ip和端口
	self string
	// http的url前缀
	basePath string
	mu       sync.Mutex // guards peers and httpGetters

	peers       *consistenthash.Map
	httpGetters map[string]*httpGetter // keyed by e.g. "http://10.0.0.2:8008"
}

新增成员变量 peers，类型是一致性哈希算法的 Map，用来根据具体的 key 选择节点。
新增成员变量 httpGetters，映射远程节点与对应的 httpGetter。每一个远程节点对应一个 httpGetter，因为 httpGetter 与远程节点的地址 baseURL 有关。

实现 PeerPicker 接口：

// Set updates the pool's list of peers.
func (p *HTTPPool) Set(peers ...string) {
	p.mu.Lock()
	defer p.mu.Unlock()
	p.peers = consistenthash.New(defaultReplicas, nil)
	p.peers.Add(peers...)
	p.httpGetters = make(map[string]*httpGetter, len(peers))
	for _, peer := range peers {
		p.httpGetters[peer] = &httpGetter{baseURL: peer + p.basePath}
	}
}

// PickPeer picks a peer according to key
func (p *HTTPPool) PickPeer(key string) (PeerGetter, bool) {
	p.mu.Lock()
	defer p.mu.Unlock()
	if peer := p.peers.Get(key); peer != "" && peer != p.self {
		p.Log("Pick peer %s", peer)
		return p.httpGetters[peer], true
	}
	return nil, false
}

var _ PeerPicker = (*HTTPPool)(nil)

Set() 方法实例化了一致性哈希算法，并且添加了传入的节点。
并为每一个节点创建了一个 HTTP 客户端 httpGetter。
PickerPeer() 包装了一致性哈希算法的 Get() 方法，根据具体的 key，选择节点，返回节点对应的 HTTP 客户端。

至此，HTTPPool 既具备了提供 HTTP 服务的能力，也具备了根据具体的 key，创建 HTTP 客户端从远程节点获取缓存值的能力。

实现主流程

// CacheGroup 对cache封装
type CacheGroup struct {
	// 当前组的名称
	groupName string
	// cacheGetter 外部加载key接口
	cacheGetter Getter
	// baseCache 底层缓存
	baseCache cache

	picker NodePicker
}


// RegisterPickerToCacheGroup registers a NodePicker for choosing remote peer
func (g *CacheGroup) RegisterPickerToCacheGroup(picker NodePicker) {
	if g.picker != nil {
		panic("RegisterPeerPicker called more than once")
	}
	g.picker = picker
}

func (g *CacheGroup) getKeyFromLocal(key string) (ReadOnlyByteView, error) {
	// 从getter中获取数据
	bytes, err := g.cacheGetter.Get(key)
	log.Printf(`[LOCAL INFO] get "%s" from getter %s`, key, "\n")

	if err != nil {
		return ReadOnlyByteView{}, err
	}
	// 返回获取到数据的copy
	value := ReadOnlyByteView{b: clone(bytes)}
	// 加入缓存
	g.baseCache.addKeyToCache(key, value)
	return value, nil
}

func (g *CacheGroup) getKeyFromNode(getter NodeGetter, key string) (ReadOnlyByteView, error) {
	bytes, err := getter.GetKeyFromGetter(g.groupName, key)
	if err != nil {
		return ReadOnlyByteView{}, err
	}
	return ReadOnlyByteView{b: bytes}, nil
}

修改 loadKeyFromGetter 方法，使用 NodePicker方法选择节点，若非本机节点，则调用 getKeyFromNode 从远程获取。若是本机节点或失败，则回退到 getKeyFromLocal。

func (g *CacheGroup) loadKeyFromGetter(key string) (ReadOnlyByteView, error) {
	if g.picker != nil {
		if node, ok := g.picker.GetNode(key); ok {
			if value, err := g.getKeyFromNode(node, key); err == nil {
				return value, err
			}
		}
	}

	return g.getKeyFromLocal(key)
}

测试

指定三个节点，并用命令行启动。
我们只在7777节点返回Tom，其他节点则需要http通信去获取Tom的信息。

func main() {
	var port int
	var hasTom int

	flag.IntVar(&port, "port", 7777, "server port")
	flag.IntVar(&hasTom, "hasTom", 0, "是否含有tom")
	flag.Parse()

	server := cachehttp.NewHTTPServerPool(fmt.Sprintf("127.0.0.1:%d", port))
	server.AddNode("127.0.0.1:7777", "127.0.0.1:8888", "127.0.0.1:9999")

	var c *Cache.CacheGroup
	if hasTom == 1 {
		c = Cache.NewCacheGroup("score", 1<<10, Cache.GetterFunc(func(key string) ([]byte, error) {
			if key == "Tom" {
				return []byte("看你爹做什么"), nil
			}
			return []byte(""), fmt.Errorf("%s not found", key)
		}))
	} else {
		c = Cache.NewCacheGroup("score", 1<<10, Cache.GetterFunc(func(key string) ([]byte, error) {
			return []byte(""), fmt.Errorf("%s not found", key)
		}))
	}
	c.RegisterPickerToCacheGroup(server)
	log.Println(http.ListenAndServe(fmt.Sprintf("127.0.0.1:%d", port), server))
}

防止缓存击穿

缓存雪崩、缓存击穿与缓存穿透

缓存雪崩：缓存在同一时刻全部失效，造成瞬时DB请求量大、压力骤增，引起雪崩。缓存雪崩通常因为缓存服务器宕机、缓存的 key 设置了相同的过期时间等引起。
缓存击穿：一个存在的key，在缓存过期的一刻，同时有大量的请求，这些请求都会击穿到 DB ，造成瞬时DB请求量大、压力骤增。
缓存穿透：查询一个不存在的数据，因为不存在则不会写到缓存中，所以每次都会去请求 DB，如果瞬间流量过大，穿透到 DB，导致宕机。

singleflight 的实现

之前并发了 N 个请求，key=Tom，其他节点向 7777 同时发起了 N 次请求。假设对数据库的访问没有做任何限制的，很可能向数据库也发起 N 次请求，容易导致缓存击穿和穿透。即使对数据库做了防护，HTTP 请求是非常耗费资源的操作，针对相同的 key，其他节点向 7777 发起三次请求也是没有必要的。那这种情况下，我们如何做到只向远端节点发起一次请求呢？

generalcache 实现了一个名为 singleflight 的 package 来解决这个问题：

首先创建 call 和 Group 类型：

package singleflight

import "sync"

// request 一次请求
type request struct {
	wg  sync.WaitGroup
	val any
	err error
}

// RequestGroup 管理不同 key 的请求request
type RequestGroup struct {
	mu sync.RWMutex
	m  map[string]*request
}

call 代表正在进行中，或已经结束的请求。使用 sync.WaitGroup 锁避免重入。
Group 是 singleflight 的主数据结构，管理不同 key 的请求(call)。

实现 Do 方法：

func (g *RequestGroup) Do(key string, fn func() (interface{}, error)) (interface{}, error) {
	// 加锁:map不是线程安全的
	g.mu.Lock()
	if g.m == nil {
		g.m = make(map[string]*request)
	}

	if req, ok := g.m[key]; ok {
		// 如果request存在,则等待执行完成
		g.mu.Unlock()
		req.wg.Wait()
		return req.val, req.err
	}
	
	// new一个request
	// 此处为指针变量,便于后续修改request的值
	req := new(request)
	// wg计数器加一
	req.wg.Add(1)
	// 将当前key的request存入group
	g.m[key] = req
	// 操作结束解锁
	g.mu.Unlock()
	
	// 调用fn获取结果
	req.val, req.err = fn()
	// 计数器减一
	req.wg.Done()
	
	// 加锁处理map
	g.mu.Lock()
	delete(g.m, key)
	g.mu.Unlock()

	return req.val, req.err
}

Do 方法，接收 2 个参数，第一个参数是 key，第二个参数是一个函数 fn。Do 的作用就是，针对相同的 key，无论 Do 被调用多少次，函数 fn 都只会被调用一次，等待 fn 调用结束了，返回返回值或错误。
g.mu 是保护 Group 的成员变量 m 不被并发读写而加上的锁。
并发协程之间不需要消息传递，非常适合 sync.WaitGroup。
- wg.Add(1) 锁加1。
- wg.Wait() 阻塞，直到锁被释放。
- wg.Done() 锁减1。

应用到请求中

修改 geecache.go 中的 Group，添加成员变量 loader，并更新构建函数 NewGroup。
修改 load 函数，将原来的 load 的逻辑，使用 g.loader.Do 包裹起来即可，这样确保了并发场景下针对相同的 key，load 过程只会调用一次。

// CacheGroup 对cache封装
type CacheGroup struct {
	// 当前组的名称
	groupName string
	// cacheGetter 外部加载key接口
	cacheGetter Getter
	// baseCache 底层缓存
	baseCache cache

	picker NodePicker
	// 请求组
	requestGroup *singleflight.RequestGroup
}

var (
	mu     sync.RWMutex
	groups = make(map[string]*CacheGroup)
)

// NewCacheGroup 创建一个CacheGroup
func NewCacheGroup(groupName string, maxBytes int64, getter Getter) *CacheGroup {
	if getter == nil {
		panic("nil Getter")
	}
	mu.Lock()
	defer mu.Unlock()
	g := &CacheGroup{
		groupName:   groupName,
		cacheGetter: getter,
		// 使用封装后的cache
		baseCache: cache{maxBytes: maxBytes},
		requestGroup: new(singleflight.RequestGroup),
	}
	groups[groupName] = g
	return g
}

func (g *CacheGroup) loadKeyFromGetter(key string) (ReadOnlyByteView, error) {

	view, err := g.requestGroup.Do(key, func() (interface{}, error) {
		if g.picker != nil {
			if node, ok := g.picker.GetNode(key); ok {
				if value, err := g.getKeyFromNode(node, key); err == nil {
					return value, err
				}
			}
		}

		return g.getKeyFromLocal(key)
	})

	if err != nil {
		return ReadOnlyByteView{}, err
	}

	return view.(ReadOnlyByteView), nil
}

我使用python更方便实现并发：

import requests
from concurrent.futures import ThreadPoolExecutor

def call():
    url = "http://127.0.0.1:8888/_general_cache/score/Tom"
    response = requests.get(url)
    print(response.text.encode("utf-8"))

with ThreadPoolExecutor() as pool:
    for i in range(10):
        pool.submit(call)

总结

github地址：https://github.com/Generalzy/GeneralCache
学到了一致性哈希，Lru算法

你可能感兴趣的:(7天系列——Go实战从0到1,缓存,分布式,memcached)

基于python+mysql+vue的医院门诊管理系统自不量力的A同学 mysql
主要使用技术环境需要1.运行环境：python3.82.IDE环境：pycharm+mysql5.73.数据库工具：Navicat154.硬件环境：windows10/118G内存以上；或者MacOS；5.数据库：MySql5.7版本；技术栈后端：python+django前端：vue+CSS+JavaScript+jQuery+antdesign代码结构server目录是后端代码web目录是前端
linux系统安全 IT小饕餮 linux基础 linux 系统安全运维
管理终端登录[root@localhost~]#grep"/sbin/nologin$"/etc/passwd表示禁止终端登录，应确保不被人改动输出结果：bin：x:1:1:bin:/bin:/sbin/nologindaemon：x:2:2:daemon:/sbin:/sbin/nologinadm：x:3:4:adm:/var/adm:/sbin/nologinlp：x:4:7:lp:/var
基于python+django+vue.js开发的健身房管理系统源码+运行步骤冷琴1996 Python系统设计 python django vue.js
功能介绍平台采用B/S结构，后端采用主流的Python语言进行开发，前端采用主流的Vue.js进行开发。技术学习中的问题可以留言。功能包括：教练管理、会员管理、场地管理、设备管理、用户管理、日志管理、系统信息模块。源码地址https://github.com/geeeeeeeek/python_fitness演示地址http://fitness.gitapp.cn演示帐号：用户名：admin123
侍魂2出招表小魚資源大雜燴游戏
霸王丸奥义旋风烈斩：↓↘→+斩奥伪旋风烈斩：↓↘→+踢奥义弧月斩：→↙↓↘+斩奥义烈震斩：→↓↘+踢酒壶攻击：↓↙←+A（破）天霸凄煌斩：→↘↓↙←→+A秘奥义天霸封神斩：↘←↙↓↘→←↓↙+B+C（变）Q版变身：→↘↓↙←→←+B娜可露露风之刃：↓↘→+斩流风斩：↓↙←+斩胜利之刃：←↙↓+斩飞鹰攻击：→↘↓↙←+斩飞鹰吊挂：↓↙←+C吊挂攻击：吊挂状态下任意键飞鹰急袭：吊挂状态下↙、↓或↘+任
Adobe Premiere Pro2023配置要求小魚資源大雜燴 adobe windows
Windows系统最低配置处理器：Intel®第六代或更新版本的CPU，或AMDRyzen™1000系列或更新版本的CPU，需要支持AdvancedVectorExtensions2（AVX2）。操作系统：Windows10（64位）v20H2或更高版本。内存：8GB的RAM。GPU：2GB的GPU内存。存储：8GB可用硬盘空间用于安装，安装期间所需的额外可用空间，不能安装在可移动闪存存储器上，还
QML界面卡死分析--01 --Canvas与QRasterPaintEngine 香油哥 Qml qt
QML界面卡死分析--01现象—Canvas与QRasterPaintEngine相关前置条件：渲染循环使用多线程方式；发现界面假死，无响应;拷贝dump分析，主线程堆栈如下：#0SyncSemWait()#10x000000007b4f8784inQMutexPrivate::wait(int)()fromqt_engine/qt-engine/lib/libQt6Core.so.6.5.0#2
【商城实战(23)】筑牢安全防线，防范常见漏洞奔跑吧邓邓子商城实战安全商城实战 uniapp SpringBoot Element plus SQL注入 CSRF
【商城实战】专栏重磅来袭！这是一份专为开发者与电商从业者打造的超详细指南。从项目基础搭建，运用uniapp、ElementPlus、SpringBoot搭建商城框架，到用户、商品、订单等核心模块开发，再到性能优化、安全加固、多端适配，乃至运营推广策略，102章内容层层递进。无论是想深入钻研技术细节，还是探寻商城运营之道，本专栏都能提供从0到1的系统讲解，助力你打造独具竞争力的电商平台，开启电商实战
数据分析面试全攻略：项目经验篇代码CC 数据分析（包括各种面试题）数据分析面试 python
引言：为什么项目经验是数据分析面试的“敲门砖”？在数据分析岗位的面试中，项目经验是最核心的竞争力证明。HR视角：80%的面试官会通过项目细节判断候选人的真实能力技术视角：项目是数据清洗、建模分析、业务落地的综合体现误区警示：单纯罗列工具名称（如Python/SQL）≠具备实战能力本文将系统讲解如何用STAR法则包装项目、如何选择高含金量数据集、以及如何通过和鲸社区快速积累实战经验。文末提供10个可
Rpm安装Docker 星光落入你灰蒙蒙的眼 Docker docker linux 运维容器 kubernetes
如果您不能使用Docker的存储库来安装Docker，您可以下载.rpm文件并手动安装。每次要升级Docker引擎时，都需要下载一个新文件。官方文档1、登录https://download.docker.com/linux/centos/并选择您的CentOS版本。然后浏览到x86_64/stable/Packages/，下载您想要安装的Docker版本的.rpm文件#已Centos7.9为例mk
HarmonyOS第21天：解锁分布式技术，开启跨设备协同新体验老三不说话、 HarmonyOS开发 harmonyos 分布式华为
一、HarmonyOS分布式技术：开启万物互联新时代在物联网蓬勃发展的今天，设备之间的互联互通不再是遥不可及的梦想，而是真切融入日常生活的现实。从智能家居设备的联动控制，到智能办公场景中的高效协作，再到智能出行中的无缝体验，我们越来越依赖设备之间的协同工作。HarmonyOS的分布式技术，正是这股万物互联浪潮中的关键力量，它打破了设备之间的界限，为用户带来了前所未有的跨设备协同体验，让多设备联动从
HarmonyOS第24天:鸿蒙应用安全秘籍：如何为用户数据筑牢防线？老三不说话、 HarmonyOS开发 harmonyos 华为
开篇引入在数字化时代，我们的生活越来越依赖各种应用程序。从社交娱乐到移动支付，从健康管理到工作学习，应用已经渗透到生活的方方面面。然而，随着应用使用的日益频繁，用户隐私数据泄露的风险也在不断增加。前几年，某知名社交平台被曝光数百万用户数据泄露事件，用户的个人信息、聊天记录等敏感数据被非法获取并在暗网上出售。这一事件引发了轩然大波，让人们深刻意识到应用安全与隐私保护的重要性。类似的案例还有很多，如某
Python-Django毕业设计医院门诊管理信息系统（程序+Lw) Python计算机毕设程序源码_ python django 课程设计
该项目含有源码、文档、程序、数据库、配套开发软件、软件安装教程项目运行环境配置：Pychram社区版+python3.7.7+Mysql5.7+HBuilderX+listpip+Navicat11+Django+nodejs。项目技术：django+python+Vue等等组成，B/S模式+pychram管理等等。环境需要1.运行环境：最好是python3.7.7，我们在这个版本上开发的。其他版
centos 8 安装docker（RPM离线）——k8s和docker系列名栩 #容器 docker linux centos
如果无法使用Docker的存储库来安装Docker，可以下载.rpm版本的文件并手动安装。每次要升级DockerEngine时都需要下载一个新文件。前往https://download.docker.com/linux/centos/并选择CentOS版本。然后浏览x86_64/stable/Packages/并下载.rpm要安装的Docker版本的文件。笔记要安装每晚或测试（预发布）包，stab
matlab代码通过一系列的计算和绘图操作，将ZHLY空域的3D结构、跑道、中心点以及地形以可视化的方式展示出来神经网络15044 MATLAB专栏 matlab 3d 数据库
%完整版ZHLY空域3D可视化代码%定义中心点ZHLY的坐标lat_ZHLY=34+44/60+29/3600;%转换为十进制度数lon_ZHLY=112+23
清华大学《DeepSeek赋能家庭教育》深度解析：AI如何重塑现代家庭教育模式硅基打工人 AI 人工智能经验分享大数据开源语言模型
引言：家庭教育的困境与AI的破局在数字化与智能化浪潮下，家庭教育面临多重挑战：家长教育能力不足、教育资源分配不均、亲子沟通效率低下、个性化需求难以满足等。清华大学发布的《DeepSeek赋能家庭教育》系列报告（共56页）提出了一种基于人工智能的解决方案，通过深度学习平台DeepSeek，为家庭教育注入科技动能。本文将从技术原理、核心功能、应用场景、伦理安全及未来展望等多维度展开分析。一、DeepS
python+django+vue医院门诊挂号预约管理系统57wsx QQ_402205496 django pycharm python
开发语言：Python框架：django/flaskPython版本：python3.7.7数据库：mysql数据库工具：Navicat开发软件：PyCharm主要功能有：管理员功能：系统首页、个人中心、用户管理、医生管理、疫情公告管理、行动轨迹管理、异样报告管理、科室信息管理、异常报告管理、系统管理、医院信息管理、预约信息管理、在线聊天管理、聊天回复管理、我的收藏管理。用户功能模块：系统首页、个
“震惊！这个小小改变，竟让无数人生活大不同！你绝对想不到！” 山峰999 人工智能计算机视觉
在这个快节奏的时代，每一天都有无数的信息冲击着我们的眼球，但真正能让我们眼前一亮、心头一动的却寥寥无几。今天，我要揭秘的，正是一个看似微不足道，实则威力无穷的“生活小妙招”。它不仅在网络上引起了轩然大波，更让无数实践者惊叹：“原来，幸福和便捷，真的可以如此触手可及！”你准备好迎接这份惊喜，让自己的生活也来个大变身了吗？那就继续往下读，保证让你大开眼界！在数字时代，照片已成为我们记录生活、分享美好瞬
【蓝桥杯速成】| 4.递归最好的药物是乌梅算法 leetcode 数据结构
递归题目一：最大公约数问题描述1979.找出数组的最大公约数-力扣（LeetCode）给你一个整数数组nums，返回数组中最大数和最小数的最大公约数。两个数的最大公约数是能够被两个数整除的最大正整数。解题步骤需要返回数组中最大最小值的最大公约数那么首先需要求出最大最小值可以使用for循环遍历得到intminnum=INT_MAX,maxnum=INT_MIN;for(inti=0;imaxnum)
超详细小白做题思路全解LeetCode989.组形式的整数加法最好的药物是乌梅算法 leetcode c++
989.数组形式的整数加法题目整数的数组形式num是按照从左到右的顺序表示其数字的数组。例如，对于num=1321，数组形式是[1,3,2,1]。给定num，整数的数组形式，和整数k，返回整数num+k的数组形式。示例1：输入：num=[1,2,0,0],k=34输出：[1,2,3,4]解释：1200+34=1234示例2：输入：num=[2,7,4],k=181输出：[4,5,5]解释：274+
Kubernetes 认证授权实验总结 π大星星️ kubernetes 容器云原生
实验目标通过一系列实验步骤，深入理解Kubernetes中的认证和授权机制，包括用户账户和服务账户的创建、RBAC（基于角色的访问控制）的配置与应用，以及如何通过这些机制实现对Kubernetes资源的安全访问控制。实验环境Kubernetes集群（已部署并运行）kubectl命令行工具（已配置并连接到集群）一台具有管理员权限的主机（用于执行命令）实验一：创建用户账户并进行认证实验目的创建一个用户
深入了解 Kafka：应用场景、架构和GO代码示例 spiker_ kafka 架构 golang
深入了解Kafka：应用场景、架构和GO代码示例ApacheKafka是一个分布式流平台，用于实时数据处理和流处理。在这篇博客中，我们将介绍Kafka的主要应用场景、架构及主要组件，并展示如何使用Go语言操作Kafka，包括Kafka生产者、消费者的示例代码，以及如何通过KafkaConnectRESTAPI配置连接器。Kafka的主要应用场景实时数据流处理：Kafka用于处理实时数据流，如用户行
【CodeMirror】系列（一）官网文档学习（一）系统指南一棵开花的树，枝芽无限靠近你 CodeMirror 学习 CodeMirror 前端编辑器
这个系列来学习一下CodeMirror编辑器。这篇文章主要是记录一下官方文档的学习，先把官方文档大致浏览一遍。CodeMirror是一个Web端的代码编辑器，和前面学习的MonacoEditor一样。应该比MonacoEditor轻便一些，而且有Vue版本，对Vue用户友好。另外可以将代码显示成DOM元素，对于代码和DOM元素的转换这块比较简单，在MonacoEditor中就没有这么方便，Mona
区块链和大模型的结合 hanyongyi 1531 区块链
大模型@区块链（4个应用）_哔哩哔哩_bilibilihttps://www.bilibili.com/video/BV1mu4y1W7bY/?spm_id_from=333.337.search-card.all.click&vd_source=8d683f22b43d55b6630d3bec03cfdb6d通过使用自然语言询问有关Aptos区块链生态系统的任何问题，使用户能够无缝地进入web3
SpringBoot实战系列之发送短信验证码 m0_67401660 面试学习路线阿里巴巴 android 前端后端
大家好，我是??大二在读作业侠系列最新文章??Java实现聊天程序SpringBoot实战系列??SpringBoot实战系列之发送短信验证码一起刷算法与数据结构最新文章??一起刷算法与数据结构-树篇1环境搭建大集合环境搭建大集合(持续更新）内容速览:1.短信验证码平台选择考虑点2.短信平台3.实战发送短信验证码1.短信验证码平台选择考虑点各个类型短信价格短信到达率、到达时间短信内容变量灵活，便持
Java对接DeepSeek全攻略：从0到1小白无忧古龙飞扬 java 开发语言 ai
本文将带你从零开始，详细讲解如何在Java中对接DeepSeekAPI，适合小白用户。我们将从环境搭建、API调用、数据处理等方面逐步展开，并提供完整的代码示例。目录准备工作获取DeepSeekAPI密钥创建Java项目添加依赖使用Maven引入HTTP和JSON库编写代码创建请求和响应类发送HTTP请求处理API响应完整代码示例运行与测试常见问题与解决方案1.准备工作1.1获取DeepSeekA
Spring Security 6.4登录全览：机制、特性、实战与优化古龙飞扬 java 前端数据库
一、登录机制SpringSecurity的登录机制是其安全框架的核心部分，它提供了一种灵活且强大的方式来保护应用程序的资源。在SpringSecurity6.4中，登录机制主要包括以下几个方面：认证流程：用户通过登录表单提交用户名和密码。SpringSecurity的UsernamePasswordAuthenticationFilter拦截该请求，并从中提取用户名和密码。创建一个Username
7、基于osg引擎实现读取vtk数据通过着色器实现简单体渲染(1) 不收藏找不到我着色器着色器
1、顶点着色器代码#version110/*GLSL1.10需要显式声明精度(OpenGLES要求)*/#ifdefGL_ESprecisionhighpfloat;#endif//体数据采样步长uniformfloatxStepSize,yStepSize,zStepSize;//体数据纹理和颜色纹理uniformsampler3DbaseTexture;uniformsampler1DtfTe
CE 451/551 Computer-Aided Research 后端
CE451/551–Computer-AidedResearchintheChemicalandMaterialsSciences:Homework#11(Graded#3)(Due:Tuesday,11MarchTuesday2025,5:00pm)Thegoalofthisassignmentistopracticetheuseofcookbooks,templates,andcodesnip
MIE 1622H Risk-Based and Robust 后端
MIE1622H:Assignment2–Risk-BasedandRobustPortfolioSelectionStrategiesDr.OleksandrRomanko,MohammadrezaMohammadiFebruary10,2025Due:Friday,March7,2025,notlaterthan11:59p.m.UsePythonforallMIE1622Hassignmen
Java - 自定义Key-Value读写工具花追雨 Java java 开发语言
Java-自定义Key-Value读写工具本地k-v缓存工具类1.注释行以#开头；2.=左右不要留空格；3.案例仅String类型，其他类型转换即可；使用：//读取StringsyncTime=PropertiesUtil.getInstance().getSyncTime();CommonUtil.printLog("syncTime:"+syncTime);//写入PropertiesUtil
LeetCode[位运算] - #137 Single Number II Cwind java Algorithm LeetCode 题解位运算
原题链接：#137 Single Number II 要求：给定一个整型数组，其中除了一个元素之外，每个元素都出现三次。找出这个元素注意：算法的时间复杂度应为O(n)，最好不使用额外的内存空间难度：中等分析：与#136类似，都是考察位运算。不过出现两次的可以使用异或运算的特性 n XOR n = 0, n XOR 0 = n，即某一
《JavaScript语言精粹》笔记 aijuans JavaScript
0、JavaScript的简单数据类型包括数字、字符创、布尔值（true/false）、null和undefined值，其它值都是对象。 1、JavaScript只有一个数字类型，它在内部被表示为64位的浮点数。没有分离出整数，所以1和1.0的值相同。 2、NaN是一个数值，表示一个不能产生正常结果的运算结果。NaN不等于任何值，包括它本身。可以用函数isNaN(number)检测NaN,但是
你应该更新的Java知识之常用程序库 Kai_Ge java
在很多人眼中，Java 已经是一门垂垂老矣的语言，但并不妨碍 Java 世界依然在前进。如果你曾离开 Java，云游于其它世界，或是每日只在遗留代码中挣扎，或许是时候抬起头，看看老 Java 中的新东西。 Guava Guava[gwɑ:və]，一句话，只要你做Java项目，就应该用Guava（Github）。 guava 是 Google 出品的一套 Java 核心库，在我看来，它甚至应该
HttpClient 120153216 httpclient
/** * 可以传对象的请求转发，对象已流形式放入HTTP中 */ public static Object doPost(Map<String,Object> parmMap,String url) { Object object = null; HttpClient hc = new HttpClient(); String fullURL
Django model字段类型清单 2002wmj django
Django 通过 models 实现数据库的创建、修改、删除等操作，本文为模型中一般常用的类型的清单，便于查询和使用： AutoField：一个自动递增的整型字段，添加记录时它会自动增长。你通常不需要直接使用这个字段；如果你不指定主键的话，系统会自动添加一个主键字段到你的model。(参阅自动主键字段) BooleanField：布尔字段,管理工具里会自动将其描述为checkbox。 Cha
在SQLSERVER中查找消耗CPU最多的SQL 357029540 SQL Server
返回消耗CPU数目最多的10条语句 SELECT TOP 10 total_worker_time/execution_count AS avg_cpu_cost, plan_handle, execution_count, (SELECT SUBSTRING(text, statement_start_of
Myeclipse项目无法部署，Undefined exploded archive location 7454103 eclipse MyEclipse
做个备忘！错误信息为： Undefined exploded archive location 原因：在工程转移过程中，导致工程的配置文件出错；解决方法：
GMT时间格式转换 adminjun GMT 时间转换
普通的时间转换问题我这里就不再罗嗦了，我想大家应该都会那种低级的转换问题吧，现在我向大家总结一下如何转换GMT时间格式，这种格式的转换方法网上还不是很多，所以有必要总结一下，也算给有需要的朋友一个小小的帮助啦。 1、可以使用 SimpleDateFormat SimpleDateFormat EEE-三位星期 d-天 MMM-月 yyyy-四位年
Oracle数据库新装连接串问题 aijuans oracle数据库
割接新装了数据库，客户端登陆无问题，apache/cgi-bin程序有问题，sqlnet.log日志如下： Fatal NI connect error 12170. VERSION INFORMATION: TNS for Linux: Version 10.2.0.4.0 - Product
回顾java数组复制 ayaoxinchao java 数组
在写这篇文章之前，也看了一些别人写的，基本上都是大同小异。文章是对java数组复制基础知识的回顾，算是作为学习笔记，供以后自己翻阅。首先，简单想一下这个问题：为什么要复制数组？我的个人理解：在我们在利用一个数组时，在每一次使用，我们都希望它的值是初始值。这时我们就要对数组进行复制，以达到原始数组值的安全性。java数组复制大致分为3种方式：①for循环方式 ②clone方式 ③arrayCopy方
java web会话监听并使用spring注入 bewithme Java Web
在java web应用中，当你想在建立会话或移除会话时，让系统做某些事情，比如说，统计在线用户，每当有用户登录时，或退出时，那么可以用下面这个监听器来监听。 import java.util.ArrayList; import java.ut
NoSQL数据库之Redis数据库管理(Redis的常用命令及高级应用) bijian1013 redis 数据库 NoSQL
一 .Redis常用命令 Redis提供了丰富的命令对数据库和各种数据库类型进行操作，这些命令可以在Linux终端使用。 a.键值相关命令 b.服务器相关命令 1.键值相关命令 &
java枚举序列化问题 bingyingao java 枚举序列化
对象在网络中传输离不开序列化和反序列化。而如果序列化的对象中有枚举值就要特别注意一些发布兼容问题: 1.加一个枚举值新机器代码读分布式缓存中老对象，没有问题，不会抛异常。老机器代码读分布式缓存中新对像，反序列化会中断，所以在所有机器发布完成之前要避免出现新对象，或者提前让老机器拥有新增枚举的jar。 2.删一个枚举值新机器代码读分布式缓存中老对象，反序列
【Spark七十八】Spark Kyro序列化 bit1129 spark
当使用SparkContext的saveAsObjectFile方法将对象序列化到文件，以及通过objectFile方法将对象从文件反序列出来的时候，Spark默认使用Java的序列化以及反序列化机制，通常情况下，这种序列化机制是很低效的，Spark支持使用Kyro作为对象的序列化和反序列化机制，序列化的速度比java更快，但是使用Kyro时要注意，Kyro目前还是有些bug。 Spark
Hybridizing OO and Functional Design bookjovi erlang haskell
推荐博文： Tell Above, and Ask Below - Hybridizing OO and Functional Design 文章中把OO和FP讲的深入透彻，里面把smalltalk和haskell作为典型的两种编程范式代表语言，此点本人极为同意，smalltalk可以说是最能体现OO设计的面向对象语言，smalltalk的作者Alan kay也是OO的最早先驱，
Java-Collections Framework学习与总结-HashMap BrokenDreams Collections
开发中常常会用到这样一种数据结构，根据一个关键字，找到所需的信息。这个过程有点像查字典，拿到一个key，去字典表中查找对应的value。Java1.0版本提供了这样的类java.util.Dictionary(抽象类)，基本上支持字典表的操作。后来引入了Map接口，更好的描述的这种数据结构。 &nb
读《研磨设计模式》-代码笔记-职责链模式-Chain Of Responsibility bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /** * 业务逻辑：项目经理只能处理500以下的费用申请，部门经理是1000，总经理不设限。简单起见，只同意“Tom”的申请 * bylijinnan */ abstract class Handler { /*
Android中启动外部程序 cherishLC android
1、启动外部程序引用自： http://blog.csdn.net/linxcool/article/details/7692374 //方法一 Intent intent=new Intent(); //包名包名+类名（全路径） intent.setClassName("com.linxcool", "com.linxcool.PlaneActi
summary_keep_rate coollyj SUM
BEGIN /*DECLARE minDate varchar(20) ; DECLARE maxDate varchar(20) ;*/ DECLARE stkDate varchar(20) ; DECLARE done int default -1; /* 游标中注册服务器地址 */ DE
hadoop hdfs 添加数据目录出错 daizj hadoop hdfs 扩容
由于原来配置的hadoop data目录快要用满了，故准备修改配置文件增加数据目录，以便扩容，但由于疏忽，把core-site.xml, hdfs-site.xml配置文件dfs.datanode.data.dir 配置项增加了配置目录，但未创建实际目录，重启datanode服务时，报如下错误： 2014-11-18 08:51:39,128 WARN org.apache.hadoop.h
grep 目录级联查找 dongwei_6688 grep
在Mac或者Linux下使用grep进行文件内容查找时，如果给定的目标搜索路径是当前目录，那么它默认只搜索当前目录下的文件，而不会搜索其下面子目录中的文件内容，如果想级联搜索下级目录，需要使用一个“-r”参数： grep -n -r "GET" . 上面的命令将会找出当前目录“.”及当前目录中所有下级目录
yii 修改模块使用的布局文件 dcj3sjt126com yii layouts
方法一：yii模块默认使用系统当前的主题布局文件，如果在主配置文件中配置了主题比如: 'theme'=>'mythm', 那么yii的模块就使用 protected/themes/mythm/views/layouts 下的布局文件；如果未配置主题，那么 yii的模块就使用 protected/views/layouts 下的布局文件，总之默认不是使用自身目录 pr
设计模式之单例模式 come_for_dream 设计模式单例模式懒汉式饿汉式双重检验锁失败无序写入
今天该来的面试还没来，这个店估计不会来电话了，安静下来写写博客也不错，没事翻了翻小易哥的博客甚至与大牛们之间的差距，基础知识不扎实建起来的楼再高也只能是危楼罢了，陈下心回归基础把以前学过的东西总结一下。 *********************************
8、数组豆豆咖啡二维数组数组一维数组
一、概念数组是同一种类型数据的集合。其实数组就是一个容器。二、好处可以自动给数组中的元素从0开始编号，方便操作这些元素三、格式 //一维数组 1,元素类型[] 变量名 = new 元素类型[元素的个数] int[] arr =
Decode Ways hcx2013 decode
A message containing letters from A-Z is being encoded to numbers using the following mapping: 'A' -> 1 'B' -> 2 ... 'Z' -> 26 Given an encoded message containing digits, det
Spring4.1新特性——异步调度和事件机制的异常处理 jinnianshilongnian spring 4.1
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
squid3(高命中率)缓存服务器配置 liyonghui160com
系统:centos 5.x 需要的软件:squid-3.0.STABLE25.tar.gz 1.下载squid wget http://www.squid-cache.org/Versions/v3/3.0/squid-3.0.STABLE25.tar.gz tar zxf squid-3.0.STABLE25.tar.gz &&
避免Java应用中NullPointerException的技巧和最佳实践 pda158 java
1) 从已知的String对象中调用equals()和equalsIgnoreCase()方法，而非未知对象。　　总是从已知的非空String对象中调用equals()方法。因为equals()方法是对称的，调用a.equals(b)和调用b.equals(a)是完全相同的，这也是为什么程序员对于对象a和b这么不上心。如果调用者是空指针，这种调用可能导致一个空指针异常 Object unk
如何在Swift语言中创建http请求 shoothao http swift
概述：本文通过实例从同步和异步两种方式上回答了”如何在Swift语言中创建http请求“的问题。如果你对Objective-C比较了解的话，对于如何创建http请求你一定驾轻就熟了，而新语言Swift与其相比只有语法上的区别。但是，对才接触到这个崭新平台的初学者来说，他们仍然想知道“如何在Swift语言中创建http请求？”。在这里,我将作出一些建议来回答上述问题。常见的
Spring事务的传播方式 uule spring事务
传播方式：新建事务 required required_new - 挂起当前非事务方式运行 supports &nbs