sbp810050504

理解Lucene/Solr的缓存

缓存对于提高搜索引擎的吞吐量，降低CPU占用率极为重要。Lucene/Solr在这块做了很多的工作。Lucene/Solr中默认提供了5种缓存，同时solr还提供扩展缓存接口，允许开发者自定义缓存。

1 缓存的基本原理

Solr实现了两种策略的缓存：LRU(Leatest Recently Used)和LFU(Least Frequently Used)。这两种策略也用于操作系统的内存管理(页面置换)。当然缓存还有其它的策略，比如FIFO、Rand等。无论是基于什么样的策略，在应用中命中率高且实现简单的策略才是好策略。

1.1 LRU策略

LRU，又称最近最少使用。假如缓存的容量为10，那么把缓存中的对象按访问(插入)的时间先后排序，当容量不足时，***时间最早的。(当然，真正的实现是通过链表维护时间先后顺序)

1.1.1 LRUCache

Solr中LRUCache是通过LinkedHashMap来实现的。通过LRUCache的init方法就可以发现，其代码如下：

  map = new LinkedHashMap<K,V>(initialSize, 0.75f, true) {
        @Override
        protected boolean removeEldestEntry(Map.Entry eldest) {
          if (size() > limit) {
            // increment evictions regardless of state.
            // this doesn't need to be synchronized because it will
            // only be called in the context of a higher level synchronized block.
            evictions++;
            stats.evictions.incrementAndGet();
            return true;
          }
          return false;
        }
      };

需要注意的是其构造参数的最后一个accessOrder。这里accessOrder=true，表明map.get()方法会改变链表的结构，如果accessOrder为false，则map.get()方法不对改变LinkedHashMap中链表的结构，就无法体现最近最小使用这个特点了。

由于LRUCache其本质是LinkedHashMap,而HashMap不是线程安全的，所以就需要在get和put时进行同步，锁住整个map，所以在高并发条件下，其性能会有所影响。因此Solr用另外一种方式实现了LRUCache，即FastLRUCache。

1.1.2 FastLRUCache

FastLRUCache内部采用了ConcurrentLRUCache实现，而ConcurrentLRUCache内部又采用ConcurrentHashMap实现，所以是线程安全的。缓存通过CacheEntry中的访问标记lastAccessed来维护CacheEntry被访问的先后顺序。即每当Cache有get或者put操作，则当前CacheEntry的lastAccessed都会变成最大的(state.accessCounter)。当FastLRUCache容量已满时，通过markAndSweep方式来剔除缓存中lastAccessed最小的N个项以保证缓存的大小达到一个acceptable的值。

markAndSweep分两个阶段执行：第一阶段收回最近最少使用的项；如果经过第一阶段缓存的大小依然大于acceptable，那么第二阶段将会开始。第二阶段会更加严格地把缓存的大小降下来。

在第一阶段，一个数轴就可以把运行原理解释清楚。

对应代码如下(见ConcurrentLRUCache.markAndSweep方法)

// since the wantToKeep group is likely to be bigger than wantToRemove, check it first
        if (thisEntry > newestEntry - wantToKeep) {
          // this entry is guaranteed not to be in the bottom
          // group, so do nothing.
          numKept++;
          newOldestEntry = Math.min(thisEntry, newOldestEntry);
        } else if (thisEntry < oldestEntry + wantToRemove) { // entry in bottom group?
          // this entry is guaranteed to be in the bottom group
          // so immediately remove it from the map.
          evictEntry(ce.key);
          numRemoved++;
        } else {
          // This entry *could* be in the bottom group.
          // Collect these entries to avoid another full pass... this is wasted
          // effort if enough entries are normally removed in this first pass.
          // An alternate impl could make a full second pass.
          if (eSize < eset.length-1) {
            eset[eSize++] = ce;
            newNewestEntry = Math.max(thisEntry, newNewestEntry);
            newOldestEntry = Math.min(thisEntry, newOldestEntry);
          }
        }
      }

看代码可知，第一阶段会按相同的逻辑运行两次。一般来说，经过第一阶段，缓存的大小应该控制下来了。如果依然控制不下来，那么就把上图中的待定Entry直接扔到指定大小的优先队列中。最后把优先队列中的Entry全部***。这样，就能够保证缓存的Size降下来。其实如果一开始就直接上优先队列，代码会少很多。但是程序的性能会降低好多。

通过分析可以看到，如果缓存中put操作频繁，很容易触发markAndSweep方法的执行。而markAndSweep操作比较耗时。所以这部分的操作可以通过设置newThreadForCleanup=true来优化。即新开一个线程执行。这样就不会阻塞put方法。在solrconfig.xml中配置，是这样的cleanupThread=true。Cache在构造的时候就会开启一个线程。通过线程的wait/nofity来控制markAndSweep。从而避免了newThreadForCleanup=true这样的不停开线程的开销，总而言之，缓存是通过markAndSweep来控制容量。

1.2 LFU策略

LFU策略即【最近最少使用】策略。当缓存已满时，设定时间段内使用次数最少的缓存将被剔除出去。通过前面的描述，容易看出LFU策略实现时，必须有一个计数器来记录Cache的Entry被访问的次数。Solr也正是这么干的。(看CacheEntry结构)

 private static class CacheEntry<K, V> implements Comparable<CacheEntry<K, V>> {
    K key;
    V value;
    volatile AtomicLong hits = new AtomicLong(0);
    long hitsCopy = 0;
    volatile long lastAccessed = 0;
    long lastAccessedCopy = 0;

    public CacheEntry(K key, V value, long lastAccessed) {
      this.key = key;
      this.value = value;
      this.lastAccessed = lastAccessed;
    }

很清楚地看到CacheEntry用hits 来记录访问次数。lastAccessed 存在则是为了应付控制缓存容量时，如果在待***队列中出现hits相同的CacheEntry，那么***lastAccessed 较小的一个。hitsCopy 和lastAccessedCopy的存在则是基于性能的考虑。避免多线程时内存跨越内存栅栏。

LFUCache通过ConcurrentLFUCache来实现，而ConcurrentLFUCache内部又是ConcurrentHashMap。我们关注的重点放在ConcurrentLFUCache。

ConcurrentLFUCache对容量的控制依然是markAndSweep,我猜想这是为了在代码可读性上与ConcurrentLRUCache保持一致。

相对ConcurrentLRUCache的markAndSweep实现而言，ConcurrentLFUCache的markAndSweep就比较简单了。用一个TreeSet来维护待***队列。TreeSet排序则是基于hits 和lastAccessed 。(可参看CacheEntry的comparTo方法)

markAndSweep方法的核心代码如下：

TreeSet<CacheEntry> tree = new TreeSet<CacheEntry>();

      for (CacheEntry<K, V> ce : map.values()) {
        // set hitsCopy to avoid later Atomic reads
        ce.hitsCopy = ce.hits.get();
        ce.lastAccessedCopy = ce.lastAccessed;
        if (timeDecay) {
          ce.hits.set(ce.hitsCopy >>> 1);
        }

        if (tree.size() < wantToRemove) {
          tree.add(ce);
        } else {
          // If the hits are not equal, we can remove before adding
          // which is slightly faster
          if (ce.hitsCopy < tree.first().hitsCopy) {
            tree.remove(tree.first());
            tree.add(ce);
          } else if (ce.hitsCopy == tree.first().hitsCopy) {
            tree.add(ce);
            tree.remove(tree.first());
          }
        }
      }

      for (CacheEntry<K, V> e : tree) {
        evictEntry(e.key);
      }

Solr实现了LFUCache，却没有再来一个FastLFUCache。因为LFUCache的实现用的是ConcurrentHashMap。能够很好的支持并发。如果非要来一个FastLFUCache，那么就得用上非阻塞数据结构了。

2 缓存在Solr的中应用

前面已经提到过，Solr实现了各种层次的缓存。缓存由SolrIndexSearcher集中控制。分别应用在query、fact等查询相关的操作上。

2.1 filterCache

filterCache在SolrIndexSearcher的定义如下：

SolrCache<Query,DocSet> filterCache;

filterCache的key是Query,value是DocSet对象。而DocSet的基本功能就是过滤。filter在英语中的解释是"过滤器"。那么哪些地方有可能用到过滤功能呢?

filterCache在solr中的应用包含以下场景：

1、查询参数facet.method=enum

2、如果solrconfig.xml中配置<useFilterForSortedQuery/> 为true

3、查询参数含Facet.query或者group.query

4、查询参数含fq

2.2 fieldvalueCache

fieldValueCache在SolrIdexSearcher的定义如下：

SolrCache<String,UnInvertedField> fieldValueCache;

其中key代表FieldName，value是一种数据结构UnInvertedField。

fieldValueCache在solr中只用于multivalued Field。一般用到它的就是facet操作。关于这个缓存需要注意的是，如果没有在solrconfig.xml中配置，那么它是默认存在的(初始大小10，最大10000，不会autowarm) 会有内存溢出的隐患。

由于该cache的key为FieldName，而一般一个solrCore中的字段最多也不过几百。在这么多字段中，multivalued 字段会更少，会用到facet操作的则少之又少。所以该在solrconfig.xml中的配置不必过大，大了也是浪费。

该缓存存储排序好的docIds，一般是topN。这个缓存占用内存会比filterCache 小。因为它存储的是topN。但是如果QueryCommand中带有filter(DocSet类型)，那么该缓存不会起作用。原因是：DocSet在执行hashcode和equals方法时比较耗时。

2.4 documentCache

该缓存映射docId->Document。没有什么值得多说的。

2.5 自定义缓存

如果solr中实现的缓存不满足需求。那么可以在SolrConfig.xml中自定义缓存。

<cache name="c"
              class="solr.FastLRUCache"
              size="4096"
              initialSize="1024"
              autowarmCount="1024"
  regenerator="com.mycompany.cache.CacheRegenerator"
              />

需要写代码的地方就是 regenerator="com.mycompany.cache.CacheRegenerator"这里了。Regenerator在SolrIndexSearcher执行warm方法时会被调用。假如solr的索引2分钟更新一次，为了保证更新的索引能够被搜索到，那么就需要重新打开一个SolrIndexSearcher，这时候就有一个问题：SolrIndexSearcher里面的缓存怎么办？

如果把旧的缓存全部抛弃，那么搜索的性能势必下降。Solr的做法是通过warm方法来预热缓存。即把通过原有缓存里面的Key值，重新获取一次value。warm完毕后再切换到新的Searcher。regenrator里面的regenerateItem方法就是用来更新缓存。关注一下regenerateItem的参数：

public boolean regenerateItem(SolrIndexSearcher newSearcher, SolrCache newCache, SolrCache oldCache, Object oldKey, Object oldVal) throws IOException;

有SolrIndexSearcher,有oldCache,有oldKey，有oldVal想查询结果很容易就能得到了。这样做的话已经入侵到Solr内部了，不推荐。如果以后想要升级的话，可能得重新改代码。升级维护不太方便。

2.6 fieldCache

我们知道lucene保存了正向索引(docId-->field)和反向索引(field-->docId)。反向索引是搜索的核心，检索速度很快。但是如果我们需要快速由docId得到Field信息(比如按照某个字段排序，字段值的信息统计<solr facet功能>)，由于需要磁盘读取，速度会比较慢。因此Lucene实现了fieldCache。

Lucene实现了各种类型Field的缓存：Byte,Short,Int,Float,Long……

fieldCache是Lucene内部的缓存，主要用于缓存Lucene搜索结果排序，比如按时间排序等。由于fieldCache内部利用数组来存储数据(可以参看FieldCacheImpl源码)，而且数组的大小开的都是maxDoc，所以当数据量较大时，fieldCache是相当消耗内存的，所以很容易出现内存溢出问题。

fieldCache使用的样例可可参看如下的源代码。

package com.vancl.cache;

import java.io.IOException;

import org.apache.lucene.analysis.Analyzer;
import org.apache.lucene.analysis.core.WhitespaceAnalyzer;
import org.apache.lucene.document.Document;
import org.apache.lucene.document.Field.Store;
import org.apache.lucene.document.IntField;
import org.apache.lucene.document.StringField;
import org.apache.lucene.index.DirectoryReader;
import org.apache.lucene.index.IndexReader;
import org.apache.lucene.index.IndexWriter;
import org.apache.lucene.index.IndexWriterConfig;
import org.apache.lucene.search.IndexSearcher;
import org.apache.lucene.search.MatchAllDocsQuery;
import org.apache.lucene.search.ScoreDoc;
import org.apache.lucene.search.Sort;
import org.apache.lucene.search.SortField;
import org.apache.lucene.search.TopDocs;
import org.apache.lucene.search.TopFieldCollector;
import org.apache.lucene.store.Directory;
import org.apache.lucene.store.RAMDirectory;
import org.apache.lucene.util.Version;

public class TestFieldCache {
	Directory d= new RAMDirectory();
	Analyzer analyzer =new WhitespaceAnalyzer(Version.LUCENE_42);
	IndexWriterConfig conf = null;
	IndexWriter iw = null;
	
	public void index() throws IOException{
		conf = new IndexWriterConfig(Version.LUCENE_42,analyzer);
		iw = new IndexWriter(d, conf);
		Document doc = null;
		int[] ids ={1,5,3,2,4,8,6,7,9,10};
		String[] addTimes={
				"2012-12-12 12:12:12","2012-12-12 12:12:13",
				"2012-12-12 12:12:14","2012-12-12 12:12:15",
				"2012-12-12 12:12:11","2012-12-12 12:12:10",
				"2012-12-12 12:12:09","2012-12-12 12:12:08",
				"2012-12-12 12:12:07","2012-12-12 12:12:06"}	;
		for(int i=1;i<=10;i++){
			doc=new Document();
			doc.add(new StringField("addTime",addTimes[i-1], Store.YES));
			doc.add(new IntField("id",ids[i-1], Store.YES));
			iw.addDocument(doc);
		}
		iw.commit();
		iw.close();
	}
	
	public void query() throws IOException{
		IndexReader ir = DirectoryReader.open(d);
		IndexSearcher is = new IndexSearcher(ir);
		//按addTime逆序排序
		//Sort sort = new Sort(new SortField("addTime", SortField.Type.STRING,true));
		Sort sort = new Sort(new SortField("addTime", SortField.Type.STRING,true));
		//按id逆序排序
		//Sort sort = new Sort(new SortField("id", SortField.Type.INT,true));
		
		TopFieldCollector collector =	TopFieldCollector.create(sort, 5, false, false, false, false);
		is.search(new MatchAllDocsQuery(),collector);
		 
		TopDocs top= collector.topDocs();
		for (ScoreDoc doc : top.scoreDocs) {
		//	System.out.println(ir.document(doc.doc).get("id"));
			System.out.println(ir.document(doc.doc).get("addTime"));
		}
	}
	
	public static void main(String[] args) throws IOException {
		TestFieldCache c = new TestFieldCache();
		c.index();
		c.query();
	}
}

【问题记录】npm create vue@latest报错菜鸟级后端问题记录 npm vue.js 前端
1，错误日志npmerrorcodeEPERMnpmerrorsyscallmkdirnpmerrorpathD:\ProgramFiles\nodejs\node_cache\_cacachenpmerrorerrnoEPERMnpmerrorFetchError:Invalidresponsebodywhiletryingtofetchhttps://registry.npmjs.org/cr
【NodeJs】【npm】npm安装electron报错果壳~ npm electron 前端
解决问题npm安装electron报错一般来说是镜像源的问题。electron的镜像源与一般的vue之类的镜像源地址不一样需要单独配置。npm读取的全局配置一般是在C:\Users\{用户}\.npmrc这个配置文件中。如果你找不到你的配置文件可以执行如下命令,#执行后会直接用txt打开你的配置文件进行修改保存即可npmconfigeditcache=D:\Develop\nodeJs\node_
【AI成长会】针对高并发场景下基于用户ID的聊天接口优化方案，包含5个核心方法
以下是针对高并发场景下基于用户ID的聊天接口优化方案，包含5个核心方法、对比表格及权威来源：5大优化方案1.索引优化机制：对user_id字段添加B+树索引，联合查询字段使用覆盖索引（如(user_id,timestamp)）优化点：减少全表扫描，提升索引命中率适用场景：基础优化，所有规模均需2.缓存层引入（Redis/Memcached）机制：使用Redis存储用户最近聊天记录（Key:user
力扣 Hot 100 刷题记录 - LRU 缓存 a李兆洋 leetcode 缓存算法
力扣Hot100刷题记录-LRU缓存题目描述LRU缓存是力扣Hot100中的一道经典题目，题目要求如下：请你设计并实现一个满足LRU(最近最少使用)缓存约束的数据结构。实现LRUCache类：LRUCache(intcapacity)：以正整数作为容量capacity初始化LRU缓存。intget(intkey)：如果关键字key存在于缓存中，则返回关键字的值，否则返回-1。voidput(int
Ehcache、Caffeine、Spring Cache、Redis、J2Cache、Memcached 和 Guava Cache 的主要区别 MonkeyKing.sun spring redis memcached
主流缓存技术Ehcache、Caffeine、SpringCache、Redis、J2Cache、Memcached和GuavaCache的主要区别，涵盖其架构、功能、适用场景和优缺点等方面：Ehcache类型:本地缓存（JVM内存缓存）特点:轻量级，运行在JVM内部，易于集成到Java应用中。支持堆内、堆外和磁盘缓存，适合处理中小型数据集。提供丰富的缓存配置，如TTL（生存时间）、TTI（空闲时
使用Guava Cache做缓存 randy.lou guava 缓存 spring
文章目录1.概述1.1适用场景1.2Helloworld2.数据加载使用2.1CacheLoader.load(Kkey)2.2CacheLoader.loadAll(keys)批量加载2.3Callable.call2.4手工写入3.缓存清除3.1基于maximumSize的清除3.2基于maximumWeight的清除3.3基于时间的清除3.4使用WeakReferenct、SoftRefer
本地缓存之Guava Cache 一介布衣+ 中间件缓存 guava spring
1.GuavaCache是什么简介Guavacache是一个支持高并发的线程安全的本地缓存。多线程情况下也可以安全的访问或者更新Cache。这些都是借鉴了ConcurrentHashMap的结果。不过，guavacache又有自己的特性当cache中不存在要查找的entry的时候，它会自动执行用户自定义的加载逻辑，加载成功后再将entry存入缓存并返回给用户未过期的entry，如果不存在或者已过期
SpringBoot 整合 Guava Cache 实现本地缓存 m0_74824170 spring boot guava 缓存
目录1、背景2、手写一个简单的本地缓存3、GuavaCache简介4、GuavaCache使用4.1、创建LoadingCache缓存4.2、创建CallableCache缓存4.3、可选配置分析4.3.1、缓存的并发级别4.3.2、缓存的初始容量设置4.3.3、缓存失效回收策略4.3.3.1、基于容量/权重回收4.3.3.2、定时回收4.3.3.3、基于引用回收4.3.3.4、显式清除4.3.4
LRU缓存C++ monicaaaaan 乐扣刷题缓存 c++spring
请你设计并实现一个满足LRU(最近最少使用)缓存约束的数据结构。实现LRUCache类：LRUCache(intcapacity)以正整数作为容量capacity初始化LRU缓存intget(intkey)如果关键字key存在于缓存中，则返回关键字的值，否则返回-1。voidput(intkey,intvalue)如果关键字key已经存在，则变更其数据值value；如果不存在，则向缓存中插入该组k
Google Guava Cache高效本地缓存 boonya 架构师 Guava 高效缓存策略
目录GuavaCache使用需求和场景需求场景缓存设置缓存的并发级别缓存的初始容量设置设置最大存储缓存清除策略基于存活时间的清除策略基于容量的清除策略基于权重的清除策略显式清除基于引用的清除策略数据内存加载CacheLoadingCacheGuavaCache使用需求和场景GuavaCache是GoogleFuava中的一个内存缓存模块，用于将数据缓存到JVM内存中。需求提供了get、put封装操
探秘阿里云Tair KVCache：大模型推理的加速引擎云资源服务商阿里云云计算人工智能
一、引言近年来，人工智能领域发展迅猛，大语言模型（LLM）不断取得突破，其应用场景也日益广泛。从智能客服到内容生成，从智能写作到智能翻译，大语言模型正在深刻地改变着我们的生活和工作方式。随着模型规模的不断扩大和推理需求的日益增长，大模型推理过程中的显存瓶颈问题逐渐凸显，成为制约其发展和应用的关键因素。在大模型推理中，KVCache技术作为一种优化手段，通过缓存历史Token的Key/Value向量
python实现读取文件的指定某行内容 Fitz1318 Python3学习 python
python实现读取文件的指定某行内容最近有一个需求就是读取一个文件中的指定某行的内容，现将方法记录如下importlinecache#这里填写你自己的文件位置和行号text=linecache.getline("../TestFile/test_C1.json",2)print(text)
宝塔服务器调优工具 1.1（Opcache优化）拍客圈服务器运维
第一步：宝塔服务器调优工具1.1（按照下面的参数填写）第二步：路径/www/server/php/80/etc/php.ini搜索jit=jit=1235其中1235根据服务器情况修改第三步：路径/www/server/php/80/etc/php-cli.ini搜索jit=1235其中1235必须和宝塔服务器调优工具jit里面填写的数字一样注意：必须临时关掉宝塔系统加固和企业防篡改（不然修改不成
cydia软件路径_在Cydia中提取Deb格式安装包文件
大家都知道越狱后可以安装deb格式的文件包了，并且我们经常看到一些大神在论坛分享一些deb格式的文件或插件，他们是如何提取出来的呢？本文就给大家介绍一下在Cydia中提取Deb格式安装包文件教程。Cydia下载的deb文件在哪，怎么提取出来？cydia下载的deb在/private/var/cache/apt/archives目录下，提取方式：1、用cydia安装软件后，系统提示“重新启动设备”或
如何解决本地DNS解析失败问题？以连接AWS ElastiCache Redis为例 ivwdcwso 运维与云原生 aws redis 云计算 ElastiCache DNS解析网络故障异常处理
在云服务开发中，DNS解析问题常常成为困扰开发者的隐形障碍。本文将通过AWSElastiCacheRedis连接失败的实际案例，详细介绍如何诊断和解决DNS解析问题，帮助你快速恢复服务连接。引言在使用telnet或redis-cli连接AWSElastiCacheRedis时，有时会遇到类似以下错误：telnettest.pi9121.ng.0001.use1.cache.amazonaws.co
HTTP请求与前端资源未优化的系统性风险与高性能优化方案编程实战派-李工《Java 前端性能优化 HTTP请求管理 GZIP压缩浏览器缓存策略 CDN加速实践全栈性能优化 Webpack配置技巧
目录前言一、未合并静态资源：HTTP请求的隐形杀手1.1多文件拆分的代价1.2合并策略与工具链实践二、未启用GZIP压缩：传输流量的浪费2.1文本资源的压缩潜力2.2服务端配置与压缩算法选择三、未配置浏览器缓存：重复请求的根源3.1缓存失效的性能损耗3.2Cache-Control策略分级应用四、CDN加速：全局性能优化的关键4.1静态资源分发的地理优化4.2实施CDN的最佳实践五、系统化提升网站
八股文——JAVA基础：包装类型的缓存机制了解么？ Hellyc java 开发语言
对于包装类中的整形包装类，Byte、Short、Integer、Long等，对于数值在-128到127的内容会在堆中创建缓存，比如拿Integer举例，Integera=10，Integerb=10，10对应在缓存数组CACHE[138]，所以a==b是比较的就是CACHE[138]对应的地址，显然两者地址是相同的。对应源码如下publicstaticIntegervalueOf(inti){if
生成1个token，需要多少KV Cache开销？ JasonLiu1919 人工智能 kv-cache LLM 推理加速
引言本文将对比使用MHA(Multi-HeadAttention)、MQA(Multi-QueryAttention)、GQA(Grouped-QueryAttention)和MLA(Multi-HeadLatentAttention)这4种注意力机制时，在decoder阶段使用KVcache生成单个token所需的额外缓存空间。假设在具有L层、nhn_hnh个注意头和key维度dhd_hdh（即
npm ERR! code CERT_HAS_EXPIRED问题解决不吃葱的胖虎前端
这个错误表示npm在尝试通过HTTPS连接到一个资源时，遇到了SSL证书已经过期的问题。这通常意味着你的计算机的日期和时间设置不正确，或者是npm缓存中有一个过期的证书。解决方法：检查计算机的日期和时间设置是否准确，如果不正确，请将其更新为当前的日期和时间。清除npm缓存。可以使用以下命令：npmcacheclean--force如果问题依旧存在，可能是因为npm配置了错误的或者过期的SSL证书。
crawl4ai实操7 人工智能我来了网络爬虫 python 开发语言
importasyncioimporttimefromcrawl4aiimportCrawlerRunConfig,AsyncWebCrawler,CacheModefromcrawl4ai.content_scraping_strategyimportLXMLWebScrapingStrategyfromcrawl4ai.deep_crawlingimportBFSDeepCrawlStrate
crawl4ai实操8 人工智能我来了网络爬虫网络爬虫
importosimportsysimportasynciofromcrawl4aiimportAsyncWebCrawler,CacheMode,CrawlerRunConfig#Adjustpathsasneededparent_dir=os.path.dirname(os.path.dirname(os.path.abspath(__file__)))sys.path.append(pare
《Vue3+ECharts 大屏性能优化全攻略：从加载到交互的极致体验》前端极客探险家 vue 数据可视化性能优化大屏端 echarts
1.大屏项目痛点分析与优化目标典型性能问题：首屏白屏时间过长大数据量下的渲染卡顿复杂动画导致的掉帧优化目标设定：首屏加载{config.splitChunks({chunks:'all',minSize:20000,maxSize:250000,minChunks:1,automaticNameDelimiter:'~',cacheGroups:{echarts:{test:/[\\/]node_
从零开始手写redis（18）缓存淘汰算法 FIFO 优化老马啸西风 cache 缓存 redis 算法 cache memcache guava caffine
项目简介大家好，我是老马。Cache用于实现一个可拓展的高性能本地缓存。有人的地方，就有江湖。有高性能的地方，就有cache。v1.0.0版本以前的FIFO实现比较简单，但是queue循环一遍删除的话，性能实在是太差。于是想到引入一个Set存储有哪些key，改成下面的方式：packagecom.github.houbb.cache.core.support.evict.impl;importcom
CentOS 上安装snmp 一心092 linux centos snmp centos linux 运维 snmp 服务器
Centos上安装snmp一、yum安装1.安装snmpyumcleanallyummakecacheyum-yinstallnet-snmpnet-snmp-utils2.配置snmpvi/etc/snmp/snmpd.conf#根据需求指定ip段可以访问，也可以不指定iprocommunitypublic10.28.0.0/163.启动并启用SNMP服务systemctlstartsnmpds
详解Redis缓存击穿、缓存穿透、缓存雪崩码上库利南 redis 缓存 redis 数据库
一、缓存穿透（CachePenetration）1.1问题描述定义：查询数据库中根本不存在的数据，导致请求每次都绕过缓存直接访问数据库。特点：恶意攻击常见手段（如请求id=-1或随机乱码）。缓存和数据库均无数据，导致无效查询压垮数据库。1.2原因恶意攻击、业务逻辑漏洞（如参数校验缺失）。1.3解决方案缓存空对象（NullCaching）对数据库查询结果为null的Key，缓存一个空值（如"NULL
操作系统多级存储模型 Cxzzzzzzzzzz 操作系统
操作系统存储模型操作系统中的多级存储模型目标：在速度和成本之间做平衡，通过“分级+动态切换”，实现大容量+高效率的存储系统。操作系统如何动态切换不同层级？操作系统通过缓存机制、虚拟内存、分页调度等策略，自动完成不同层级间的数据切换，下面是关键机制：1️⃣CPU缓存机制（由硬件主导）Cache命中（Hit）：CPU直接从Cache读；Cache不命中（Miss）：CPU从内存读，并加载到Cache；
分布式下mybatis二级缓存数据一致性解决办法 anthony4515 mybatis 缓存
背景：实际项目中，很多地方需要把数据缓存起来，以加快数据访问速度。比如字典表，比如数据机房表等等，缓存的实现有很多方式，如果项目中有用到mybatis，可以使用二级缓存来解决数据的缓存问题。现状：一般mybatis通过oscache来实现他的二级缓存，然而这种方式存在如下几个问题：1、oscache可以用来缓存页面和数据对象，但数据通常存放在内存中，项目多实例环境下无法解决缓存更新和过期的问题。2
OSError: We couldn‘t connect to ‘https://huggingface.co‘ to load this file, couldn‘t find it in the 是纯一呀 NLP AI DeepLearning deep learning NLP
OSError:Wecouldn'tconnectto'https://huggingface.co'toloadthisfile,couldn'tfinditinthecachedfilesanditlookslikeroberta-baseisnotthepathtoadirectorycontainingafilenamedconfig.json.Checkoutyourinternetco
Android14 app被冻结导致进程间通信失败凯文的内存 Android activitymanager OomAdjuster freezapp 进程保活 Android
软件平台：Android14硬件平台：QCS6115问题：设备开机阶段，由于系统资源紧张，触发了非前台进程的freez机制，导致前台进程与之交互出现binder交互异常，而展示白屏。先从异常日志着手吧：行11804:05-1912:00:00.01557321022153DOomAdjuster:Appadjchangefrompreviousstatetocachedstate:4077com.
从零开始手写redis（18）缓存淘汰算法 FIFO 优化后端java
项目简介大家好，我是老马。Cache用于实现一个可拓展的高性能本地缓存。有人的地方，就有江湖。有高性能的地方，就有cache。v1.0.0版本以前的FIFO实现比较简单，但是queue循环一遍删除的话，性能实在是太差。于是想到引入一个Set存储有哪些key，改成下面的方式：packagecom.github.houbb.cache.core.support.evict.impl;importcom
Spring的注解积累 yijiesuifeng spring 注解
用注解来向Spring容器注册Bean。需要在applicationContext.xml中注册： <context:component-scan base-package=”pagkage1[,pagkage2,…,pagkageN]”/>。如：在base-package指明一个包 <context:component-sc
传感器百合不是茶 android 传感器
android传感器的作用主要就是来获取数据,根据得到的数据来触发某种事件下面就以重力传感器为例; 1,在onCreate中获得传感器服务 private SensorManager sm;// 获得系统的服务 private Sensor sensor;// 创建传感器实例 @Override protected void
[光磁与探测]金吕玉衣的意义 comsci
这是一个古代人的秘密:现在告诉大家信不信由你们: 穿上金律玉衣的人,如果处于灵魂出窍的状态,可以飞到宇宙中去看星星这就是为什么古代
精简的反序打印某个数沐刃青蛟打印
以前看到一些让求反序打印某个数的程序。比如：输入123，输出321。记得以前是告诉你是几位数的，当时就抓耳挠腮，完全没有思路。似乎最后是用到%和/方法解决的。而今突然想到一个简短的方法，就可以实现任意位数的反序打印（但是如果是首位数或者尾位数为0时就没有打印出来了）代码如下： long num, num1=0;
PHP：6种方法获取文件的扩展名 IT独行者 PHP 扩展名
PHP：6种方法获取文件的扩展名 1、字符串查找和截取的方法 1 $extension = substr ( strrchr ( $file , '.' ), 1); 2、字符串查找和截取的方法二 1 $extension = substr
面试111 文强chu 面试
1事务隔离级别有那些，事务特性是什么（问到一次） 2 spring aop 如何管理事务的，如何实现的。动态代理如何实现，jdk怎么实现动态代理的，ioc是怎么实现的，spring是单例还是多例，有那些初始化bean的方式，各有什么区别（经常问） 3 struts默认提供了那些拦截器（一次） 4 过滤器和拦截器的区别（频率也挺高） 5 final，finally final
XML的四种解析方式小桔子 dom jdom dom4j sax
在平时工作中，难免会遇到把 XML 作为数据存储格式。面对目前种类繁多的解决方案，哪个最适合我们呢？在这篇文章中，我对这四种主流方案做一个不完全评测，仅仅针对遍历 XML 这块来测试，因为遍历 XML 是工作中使用最多的（至少我认为）。　　预备　　测试环境：　　AMD 毒龙1.4G OC 1.5G、256M DDR333、Windows2000 Server
wordpress中常见的操作 aichenglong 中文注册 wordpress 移除菜单
1 wordpress中使用中文名注册解决办法 1)使用插件 2)修改wp源代码进入到wp-include/formatting.php文件中找到 function sanitize_user( $username, $strict = false
小飞飞学管理-1 alafqq 管理
项目管理的下午题，其实就在提出问题（挑刺），分析问题，解决问题。今天我随意看下10年上半年的第一题。主要就是项目经理的提拨和培养。结合我自己经历写下心得对于公司选拔和培养项目经理的制度有什么毛病呢？ 1，公司考察，选拔项目经理，只关注技术能力，而很少或没有关注管理方面的经验，能力。 2，公司对项目经理缺乏必要的项目管理知识和技能方面的培训。 3，公司对项目经理的工作缺乏进行指
IO输入输出部分探讨百合不是茶 IO
//文件处理在处理文件输入输出时要引入java.IO这个包； /* 1，运用File类对文件目录和属性进行操作 2，理解流，理解输入输出流的概念 3，使用字节/符流对文件进行读/写操作 4，了解标准的I/O 5，了解对象序列化 */ //1，运用File类对文件目录和属性进行操作 //在工程中线创建一个text.txt
getElementById的用法 bijian1013 element
getElementById是通过Id来设置/返回HTML标签的属性及调用其事件与方法。用这个方法基本上可以控制页面所有标签，条件很简单，就是给每个标签分配一个ID号。返回具有指定ID属性值的第一个对象的一个引用。语法： &n
励志经典语录 bijian1013 励志人生
经典语录1: 哈佛有一个著名的理论：人的差别在于业余时间，而一个人的命运决定于晚上8点到10点之间。每晚抽出2个小时的时间用来阅读、进修、思考或参加有意的演讲、讨论，你会发现，你的人生正在发生改变，坚持数年之后，成功会向你招手。不要每天抱着QQ/MSN/游戏/电影/肥皂剧……奋斗到12点都舍不得休息，看就看一些励志的影视或者文章，不要当作消遣；学会思考人生，学会感悟人生
[MongoDB学习笔记三]MongoDB分片 bit1129 mongodb
MongoDB的副本集(Replica Set)一方面解决了数据的备份和数据的可靠性问题，另一方面也提升了数据的读写性能。MongoDB分片(Sharding)则解决了数据的扩容问题，MongoDB作为云计算时代的分布式数据库，大容量数据存储，高效并发的数据存取，自动容错等是MongoDB的关键指标。本篇介绍MongoDB的切片(Sharding) 1.何时需要分片 &nbs
【Spark八十三】BlockManager在Spark中的使用场景 bit1129 manager
1. Broadcast变量的存储，在HttpBroadcast类中可以知道 2. RDD通过CacheManager存储RDD中的数据，CacheManager也是通过BlockManager进行存储的 3. ShuffleMapTask得到的结果数据，是通过FileShuffleBlockManager进行管理的，而FileShuffleBlockManager最终也是使用BlockMan
yum方式部署zabbix ronin47 yum方式部署zabbix
安装网络yum库#rpm -ivh http://repo.zabbix.com/zabbix/2.4/rhel/6/x86_64/zabbix-release-2.4-1.el6.noarch.rpm 通过yum装mysql和zabbix调用的插件还有agent代理#yum install zabbix-server-mysql zabbix-web-mysql mysql-
Hibernate4和MySQL5.5自动创建表失败问题解决方法 byalias J2EE Hibernate4
今天初学Hibernate4，了解了使用Hibernate的过程。大体分为4个步骤： ①创建hibernate.cfg.xml文件 ②创建持久化对象 ③创建*.hbm.xml映射文件 ④编写hibernate相应代码在第四步中，进行了单元测试，测试预期结果是hibernate自动帮助在数据库中创建数据表，结果JUnit单元测试没有问题，在控制台打印了创建数据表的SQL语句，但在数据库中
Netty源码学习-FrameDecoder bylijinnan java netty
Netty 3.x的user guide里FrameDecoder的例子，有几个疑问： 1.文档说：FrameDecoder calls decode method with an internally maintained cumulative buffer whenever new data is received. 为什么每次有新数据到达时，都会调用decode方法？ 2.Dec
SQL行列转换方法 chicony 行列转换
create table tb(终端名称 varchar(10) , CEI分值 varchar(10) , 终端数量 int) insert into tb values('三星' , '0-5' , 74) insert into tb values('三星' , '10-15' , 83) insert into tb values('苹果' , '0-5' , 93)
中文编码测试 ctrain 编码
循环打印转换编码 String[] codes = { "iso-8859-1", "utf-8", "gbk", "unicode" }; for (int i = 0; i < codes.length; i++) { for (int j
hive 客户端查询报堆内存溢出解决方法 daizj hive 堆内存溢出
hive> select * from t_test where ds=20150323 limit 2; OK Exception in thread "main" java.lang.OutOfMemoryError: Java heap space 问题原因： hive堆内存默认为256M 这个问题的解决方法为：修改/us
人有多大懒，才有多大闲 (评论『卓有成效的程序员』) dcj3sjt126com 程序员
卓有成效的程序员给我的震撼很大，程序员作为特殊的群体，有的人可以这么懒，懒到事情都交给机器去做，而有的人又可以那么勤奋，每天都孜孜不倦得做着重复单调的工作。在看这本书之前，我属于勤奋的人，而看完这本书以后，我要努力变成懒惰的人。不要在去庞大的开始菜单里面一项一项搜索自己的应用程序，也不要在自己的桌面上放置眼花缭乱的快捷图标
Eclipse简单有用的配置 dcj3sjt126com eclipse
1、显示行号 Window -- Prefences -- General -- Editors -- Text Editors -- show line numbers 2、代码提示字符 Window ->Perferences，并依次展开 Java -> Editor -> Content Assist，最下面一栏 auto-Activation
在tomcat上面安装solr4.8.0全过程 eksliang Solr solr4.0后的版本安装 solr4.8.0安装
转载请出自出处： http://eksliang.iteye.com/blog/2096478 首先solr是一个基于java的web的应用，所以安装solr之前必须先安装JDK和tomcat，我这里就先省略安装tomcat和jdk了第一步：当然是下载去官网上下载最新的solr版本，下载地址
Android APP通用型拒绝服务、漏洞分析报告 gg163 漏洞 android APP 分析
点评：记得曾经有段时间很多SRC平台被刷了大量APP本地拒绝服务漏洞，移动安全团队爱内测（ineice.com）发现了一个安卓客户端的通用型拒绝服务漏洞，来看看他们的详细分析吧。 0xr0ot和Xbalien交流所有可能导致应用拒绝服务的异常类型时，发现了一处通用的本地拒绝服务漏洞。该通用型本地拒绝服务可以造成大面积的app拒绝服务。针对序列化对象而出现的拒绝服务主要
HoverTree项目已经实现分层 hvt 编程 .net Web C#ASP.ENT
HoverTree项目已经初步实现分层，源代码已经上传到 http://hovertree.codeplex.com请到SOURCE CODE查看。在本地用SQL Server 2008 数据库测试成功。数据库和表请参考：http://keleyi.com/a/bjae/ue6stb42.htmHoverTree是一个ASP.NET 开源项目，希望对你学习ASP.NET或者C#语言有帮助，如果你对
Google Maps API v3: Remove Markers 移除标记天梯梦 google maps api
Simply do the following: I. Declare a global variable: var markersArray = []; II. Define a function: function clearOverlays() { for (var i = 0; i < markersArray.length; i++ )
jQuery选择器总结 lq38366 jquery 选择器
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40
基础数据结构和算法六：Quick sort sunwinner Algorithm Quicksort
Quick sort is probably used more widely than any other. It is popular because it is not difficult to implement, works well for a variety of different kinds of input data, and is substantially faster t
如何让Flash不遮挡HTML div元素的技巧_HTML/Xhtml_网页制作刘星宇 html Web
今天在写一个flash广告代码的时候，因为flash自带的链接，容易被当成弹出广告，所以做了一个div层放到flash上面，这样链接都是a触发的不会被拦截，但发现flash一直处于div层上面，原来flash需要加个参数才可以。让flash置于DIV层之下的方法，让flash不挡住飘浮层或下拉菜单，让Flash不档住浮动对象或层的关键参数：wmode=opaque。方法如下：
Mybatis实用Mapper SQL汇总示例 wdmcygah sql mysql mybatis 实用
Mybatis作为一个非常好用的持久层框架，相关资料真的是少得可怜，所幸的是官方文档还算详细。本博文主要列举一些个人感觉比较常用的场景及相应的Mapper SQL写法，希望能够对大家有所帮助。不少持久层框架对动态SQL的支持不足，在SQL需要动态拼接时非常苦恼，而Mybatis很好地解决了这个问题，算是框架的一大亮点。对于常见的场景，例如：批量插入/更新/删除，模糊查询，多条件查询，联表查询，