TKE_kolento.

大数据实时检索场景化解决方案---HBase

HBase简介
• HBase是一个分布式的NoSQL数据库，其特点高可靠、高性能、面向列、可伸缩。
• 适合存储大表数据，并且可实时读写大表数据。
• 表结构稀疏。
• 数据底层存储于Hadoop HDFS分布式文件系统。
• 利用ZooKeeper作为协同服务。
• 大表：表的规模可以达到数十亿行以及数百万列，
• 稀疏：对于为空的列，并不占用存储空间
• 列存储，面向列族，无模式。
• KV模型
• 大表：例如网页URL的存储，数十亿的互联网网页url。
• zookeeper：主备选举与监控；管理元数据，root表或mete表。

HBase应用场景
• HBase适合具有如下需求的应用：
• 海量数据 (TB、PB) 。
• 不需要完全拥有传统关系型数据库所具备的ACID特性。
• 高吞吐量。
• 需要在海量数据中实现高效的随机读取。
• 需要很好的性能伸缩能力。
• 能够同时处理结构化和非结构化的数据。
• ACID原则是数据库事务正常执行的四个特性，分别指原子性、一致性、独立性及持久性。
• 事务的原子性(Atomicity)：指一个事务要么全部执行,要么不执行。也就是说一个事务不可能只执行了一半就停止了。比如你从取款机取钱,这个事务可以分成两个步骤：1划卡，2出钱，不可能划了卡，而钱却没出来.这两步必须同时完成，要么就不完成。
• 事务的一致性(Consistency)：指事务的运行并不改变数据库中数据的一致性.例如,完整性约束了a+b=10,一个事务改变了a,那么b也应该随之改变。
• 独立性(Isolation）：事务的独立性也有称作隔离性,是指两个以上的事务不会出现交错执行的状态.因为这样可能会导致数据不一致。
• 持久性(Durability）：事务的持久性是指事务执行成功以后,该事务所对数据库所作的更改便是持久的保存在数据库之中，不会无缘无故的回滚。

HBase系统架构

• ZooKeeper为HBase集群中各进程提供分布式协作服务。各RegionServer将自己的信息注册到Zookeeper中，主用Master据此感知各个RegionServer的健康状态。
• Client使用HBase的RPC机制与Master、RegionServer进行通信。Client与Master进行管理类通信，与RegionServer进行数据操作类通信。
• RegionServer负责提供表数据读写等服务，是HBase的数据处理和计算单元。RegionServer一般与HDFS集群的DataNode部署在一起，实现数据的存储功能。
• HMaster，在HA模式下，包含主用Master和备用Master。
• 主用Master：负责HBase中RegionServer的管理，包括表的增删改查；RegionServer的负载均衡，Region分布调整；Region分裂以及分裂后的Region分配；RegionServer失效后的Region迁移等。
• 备用Master：当主用Master故障时，备用Master将取代主用Master对外提供服务。故障恢复后，原主用Master降为备用。
• HDFS为HBase提供高可靠的文件存储服务，HBase的数据全部存储在HDFS中。
• Store：一个Region由一个或多个Store组成，每个Store对应图中的一个Column Family。
• MemStore：一个Store包含一个MemStore，MemStore缓存客户端向Region插入的数据。
• StoreFile：MemStore的数据flush到HDFS后成为StoreFile。
• Hfile：HFile定义了StoreFile在文件系统中的存储格式，它是当前HBase系统中StoreFile的具体实现。
• Hlog：HLog日志保证了当RegionServer故障的情况下用户写入的数据不丢失，RegionServer的多个Region共享一个相同的Hlog。

HBase存储模型
• HBase的底层数据以KeyValue的形式存在，KeyValue具有特定的格式。
• KeyValue中拥有时间戳、类型等关键信息。
• 同一个Key值可以关联多个Value，每一个KeyValue都拥有一个Qualifier标识。
• 即使是Key值相同，Qualifier也相同的多个KeyValue，也可能有多个版本，此时使用时间戳来区分，这就是同一条数据记录的多版本。

• KeyValue具有特定的结构。Key部分被用来快速的检索一条数据记录，Value部分用来存储实际的用户数据信息。
• KeyValue作为承载用户数据的基本单元，需要保存一些对自身的描述信息，例如，时间戳，类型等等。那么势必会有一定的结构化空间开销。
• 支持动态增加列，容易适应数据类型和结构的变化。以块为单元操作数据，列间、表间并无关联关系。
• KeyValue型数据库数据分区方式—按Key值连续范围分区。
• 数据按照RowKey的范围 (按RowKey的字典顺序)，划分为一个个的子区间。每一个子区间都是一个分布式存储的基本单元。

HBase缓存机制
• HBase提供2种类型的缓存结构：MemStore和BlockCache。
• MemStore：HBase数据先写入HLog 之中，并同时写入MemStore，待满足一定条件后将MemStore中数据刷到磁盘，能提升HBase的写性能和读性能。
• BlockCache：HBase会将一次文件查找的Block块缓存到Cache中，以便后续同一请求或者相邻数据查找请求，可以直接从内存中获取，避免IO操作。
• 其中MemStore是写缓存，BlockCache是读缓存。
• 一个HRegionServer只有一个BlockCache，在HRegionServer启动的时候完成BlockCache的初始化，常用的BlockCache包括LruBlockCache，以及 CombinedBlockCache（LruBlockCache + BucketCache）。
• LRUBlockCache 是HBase默认的BlockCache实现方案。实际上就是一个ConcurrentHashMap管理BlockKey到Block的映射关系，缓存Block只需要将BlockKey和对应的Block放入该HashMap中，查询缓存就根据BlockKey从HashMap中获取即可。
• LRUBlockCache 分层策略：Block的数据存储在JVM 堆中，由JVM进行管理。它在逻辑上分为三个区：Single-Access、Multi-Access、In-Memory，分别占整个BlockCache的25%、50%、25%。一次随机读中，一个Block块从HDFS中加载出来之后首先放入Single-Access区，后续如果有多次请求访问到这块数据的话，就会将这块数据移到Multi-Access s区。而In-Memory区表示数据可以常驻内存，一般用来存放访问频繁、数据量小的数据，比如元数据，用户也可以在建表的时候通过设置列族属性IN-MEMORY= true将此列族放入In-Memory区。因此设置数据属性InMemory= true需要非常谨慎，确保此列族数据量很小且访问频繁，否则有可能会将hbase.meta元数据挤出内存，严重影响所有业务性能。无论哪个区，系统都会采用严格的Least-Recently-Used算法，当BlockCache总量达到一定阈值之后就会启动淘汰机制，最少使用的Block会被置换出来，为新加载的Block预留空间。
• LRU淘汰算法实现：系统在每次cache block时将BlockKey和Block放入HashMap后都会检查BlockCache总量是否达到阈值，如果达到阈值，就会唤醒淘汰线程对Map中的Block进行淘汰。系统设置三个MinMaxPriorityQueue队列，分别对应上述三个分层，每个队列中的元素按照最近最少被使用排列，系统会优先poll出最近最少使用的元素，将其对应的内存释放。
• CombinedBlockCache：是一个LRUBlockCache和BucketCache的混合体。LRUBlockCache中主要存储Index Block和Bloom Block，而将Data Block存储在BucketCache中。故一次随机读需要先在LRUBlockCache中查到对应的Index Block，然后再到BucketCache查找对应数据块。BucketCache有三种工作模式：heap、offheap、file。heap模式表示这些Bucket是从JVM Heap中申请，offheap模式使用DirectByteBuffer技术实现堆外内存存储管理，而file模式使用类似SSD的高速缓存文件存储数据块。无论在哪一种工作模式，BucketCache都会申请许多带有固定大小标签的Bucket,一种Bucket只是一种指定的BlockSize的数据块，初始化的时候申请14个不同大小的Bucket，而且即使在某一种Bucket空间不足的情况下，系统也会从其他Bucket空间借用内存使用，不会出现内存使用率低下的情况。
• BucketCache内存组织形式：HBase启动时，会在内存申请大量bucket，每一个bucket默认大小是2MB,每一个Bucket都有一个offsetBase属性和size标签，其中offsetBase表示这个bucket在实际物理空间的offset, 故可以根据offsetBase的属性，和block在该bucket的offset确定block实际物理存储地址；size标签表示这个bucket可以存放的block块的大小，比如size 标签是9k, 那么他只能存储8k的block，如果size标签是129k，那么bucket只能存储128k的block；HBase使用BucketAllocator对bucket进行管理, HBase会根据size进行分组，相同size的标签由同一个BucketSizeInfo来管理，如64k的block的由size 标签是65k的BucketSizeInfo来管理, 如128k的block的由size 标签是129k的BucketSizeInfo来管理；默认标签有(4+1)K、(8+1)K、(16+1)K … (48+1)K、(56+1)K、(64+1)K、(96+1)K … (512+1)K,且系统会先从小到大遍历一次所有size标签，为每种size标签分配一个bucket，最后剩余的bucket都分配最大的size标签，默认分配 (512+1)K；bucket size标签，可以动态调整。比如64K的block数目比较多，65K的bucket被用完了以后，其他size标签的完全空闲的bucket可以转换成为65K的bucket，但是至少保留一个该size的bucket。

HBase BloomFilter
• BloomFilter用来优化一些随机读取的场景，即Get场景。它可以被用来快速的判断一条数据在一个大的数据集合中是否存在。
• BloomFilter在判断一个数据是否存在时，拥有一定的误判率。但对于“该条数据不存在”的判断结果是可信的。
• HBase的BloomFilter的相关数据，被保存在HFile中。

• Bloom Filter的数据存在StoreFile的meta中，一旦写入无法更新，因为StoreFile是不可变的。Bloomfilter是一个列族（cf）级别的配置属性，如果你在表中设置了Bloomfilter，那么HBase会在生成StoreFile时包含一份bloomfilter结构的数据，称其为MetaBlock；MetaBlock与DataBlock（真实的KeyValue数据）一起由LRUBlockCache维护。所以，开启bloomfilter会有一定的存储及内存cache开销。
• Bloom filter 是由 Howard Bloom 在 1970 年提出的二进制向量数据结构，它具有很好的空间和时间效率，被用来检测一个元素是不是集合中的一个成员。
• Bloom Filter用k个hash function将它hash得到bloom filter中k个bit位，将这k个bit位置1。若这k bits全为1，则此元素在集合中。
• 误判率：在万分之一以下由哈希函数个数k、位数组大小m、数据量n共同确定。

HBase客户端
• HBase提供客户端命令的方式供使用人员对数据库进行各种操作。
• 提供表的增删改查，表快照备份等。

SQL On Hbase
• Apache Phoenix将SQL查询编译为一系列HBase扫描。可以为小型查询提供毫秒级的性能，或者为数千万行提供数秒的性能。
• 其他SQL使用方式还有：Hive、Spark SQL等
• Phoenix SQL支持的部分语法:

• Phoenix：Apache基金的顶级项目，完全使用Java编写，作为HBase内嵌的JDBC驱动，与其他Hadoop产品完美集成，如Spark，Hive，Pig，Flume和Map Reduce。Phoenix查询引擎将SQL查询转换为一个或多个HBase扫描，并编排执行以生成标准的JDBC结果集。直接使用HBase API、协同处理器与自定义过滤器实现SQL编译。
• Phoenix在Hadoop中为低延迟应用程序启用OLTP和运营分析。
• Phoenix通过以下方式使我们可以少写代码，并且性能比我们自己写代码更好：
• 将SQL编译成原生的HBase scans。
• 确定scan关键字的最佳开始和结束
• 让scan并行执行
• Phoenix SQL的两种使用方式：命令行和JDBC连接
• 其他的SQL使用方式还有：Impala
• HiveSQL（建表时指定HBase数据）：
CREATE TABLE lwb_test1(key string,xm string,nl int)
STORED BY ‘org.apache.hadoop.hive.hbase.HBaseStorageHandler’
WITH SERDEPROPERTIES (“hbase.columns.mapping” = “:key,data:xm,data:nl”)
TBLPROPERTIES (“hbase.table.name” = “tbtest1”);
• 进入spark-sql,使用如下语句建表：
CREATE EXTERNAL TABLE tbtest1 (rowkey string,
f1 map,
f2 map,
f3 map)
STORED BY ‘org.apache.hadoop.hive.hbase.HBaseStorageHandler’
WITH SERDEPROPERTIES (“hbase.columns.mapping” = “:key,f1:,f2:,f3:”)
TBLPROPERTIES (“hbase.table.name” = “tbtest1”);

API使用 - 创建删除表
• 通过org.apache.hadoop.hbase.client.Admin实例的createTable方法来创建表，并指定表名、列族名。

• 通过org.apache.hadoop.hbase.client.Admin实例的deleteTable方法来删除表。

• 创建表有两种方式（强烈建议采用预分Region建表方式）：
• 快速建表，即创建表后整张表只有一个Region，随着数据量的增加会自动分裂成多个Region。
• 预分Region建表，即创建表时预先分配多个Region，此种方法建表可以提高写入大量数据初期的数据写入速度。
• Connection的获取方法：
//创建配置对象
Configuration conf = HBaseConfiguration.create();
//zkServer指zk的地址
conf.set(“hbase.zookeeper.quorum”, zkServer);
//通过连接池获取连接
Connection conn = ConnectionFactory.createConnection(conf);

API使用 - 插入删除数据
• HBase通过Table实例的put方法来插入数据，可以是一行数据也可以是数据集。

• HBase通过Table实例的delete方法来Delete数据，可以是一行数据也可以是数据集。

• 插入数据代码含义：
• tableName是字符串形式的表名称，用Connection实例的getTable方法获取Table实例
• Put实例传入的参数是RowKey的字节形式
• Put实例addColumn方法传入的列族，列，value都是字节形式

API使用 - Get 读取数据
• 要从表中读取一条数据，首先需要实例化该表对应的Table实例，然后创建一个Get对象。也可以为Get对象设定参数值，如列族的名称和列的名称。查询到的行数据存储在Result对象中，Result中可以存储多个Cell。

• HBase数据查询操作，get命令
• 代码涵义如下：
• 将列族，列，rowkey全部转成字节形式
• Connection实例的getTable获取Table实例，传入参数为表名称
• 用rowkey 获取get示例
• Get实例添加列族和列
• Table实例的get方法传入get实例获取查询结果result实例，用循环依据表结构解析result实例

API使用 - Scan 读取数据
• 要从表中读取数据，首先需要实例化该表对应的Table实例，然后创建一个Scan对象，并针对查询条件设置Scan对象的参数值，为了提高查询效率，最好指定StartRow和StopRow。查询结果的多行数据保存在ResultScanner对象中，每行数据以Result对象形式存储，Result中存储了多个Cell。

API使用 - 过滤器 Filter
• HBase Filter主要在Scan和Get过程中进行数据过滤，通过设置一些过滤条件来实现，如设置RowKey，列名或者列值的过滤条件。

• HBase数据查询过滤器Filter介绍，如何过滤数据。
• 比较器：
• RegexStringComparator，支持正则表达式的值比较
• SubStringComparator，用于监测一个子串是否存在于值中，并且不区分大小写
• BinaryPrefixComparator前缀二进制比较器。与二进制比较器不同的是，只比较前缀是否相同
• BinaryComparator二进制比较器，用于按字典顺序比较 Byte 数据值。
• 列值过滤器：
• SingleColumnValueFilter SingleColumnValueFilter 用于测试值的情况（相等，不等，范围、、、）
• SingleColumnValueExcludeFilter跟 SingleColumnValueFilter 功能一样，只是不查询出该列的值。
• FamilyFilter用于过滤列族（通常在 Scan 过程中通过设定某些列族来实现该功能，而不是直接使用该过滤器）。
• QualifierFilter用于列名（Qualifier）过滤。
• ColumnPrefixFilter 用于列名（Qualifier）前缀过滤，即包含某个前缀的所有列名。
• 行键过滤器：
• RowFilter ：行键过滤器，一般来讲，执行 Scan 使用 startRow/stopRow 方式比较好，而 RowFilter 过滤器也可以完成对某一行的过滤。
• ColumnPrefixFilter ：用于列名（Qualifier）前缀过滤，即包含某个前缀的所有列名。
• 功能过滤器：PageFilter用于按行分页。

HBase性能优化 - 表设计
• Region：区域。预先创建多个Region，当数据写入HBase时，会按照RowKey对应Region分区情况，在集群内做数据的负载均衡。
• RowKey：行键。满足实际业务需求情况下，长度越小越好，考虑散列性（连续的Row Key易导致负载不均衡）。散列存储可采用取反或Hash来实现。
• Column Family：列簇。一张表里不要定义太多的列簇，因为某个列簇在flush的时候，它邻近的列簇也会因关联效应被触发flush，最终导致系统产生更多的I/O。
• Max Version：最大版本数量。如果只需要保存最新版本的数据，那么可以设置最大版本数为1。
• Time To Live：数据存活时间（秒）。例如只需要存储最近两天的数据，那么可以设置存活时间为2 * 24 * 60 * 60。
• 预分Region：创建HBase表的时候会自动创建一个region分区，直到这个region足够大了才进行切分，当导入数据的时候，所有的HBase客户端都向这一个region写数据。
• RowKey：可以是任意字符串，最大长度64KB，实际应用中一般为10~100bytes，存为byte[]字节数组，一般设计成定长的。RowKey是按照字典序存储，因此，设计RowKey时，要充分利用这个排序特点，将经常一起读取的数据存储到一块，将最近可能会被访问的数据放在一块。
• 取反：将指连续的id等，倒排作为HBase RowKey设计。如 10000,10001,10002 --> 00001,10001,20001
• Hash：连续的id可根据集群节点数由Hash计算出结果，再将hash值放到id前面拼接成RowKey。如 id --> 0-id1 , 3-id2
• Max Version：HColumnDescriptor.setMaxVersions(int maxVersions)
• Time To Live：setTimeToLive(2 * 24 * 60 * 60)

HBase性能优化 - 写表操作
• Table参数
• Write Buffer：实际写入数据量的多少来设置Table客户端的写buffer大小。
• WAL Flag：对于相对不太重要的数据，（谨慎使用）放弃写WAL日志，从而提高数据写入的性能。
• 批量写：通过调用Table实例的put(List)批量写入多行记录，只需一次网络I/O开销，可以明显的提升写性能。

• 多Table并发写：创建多个Table实例。new Table(conf, table_log_name);
• Auto Flush ：BufferedMutator替换了HTable的setAutoFlush(false)的作用。
• Write Buffer：调用Table.setWriteBufferSize(writeBufferSize)来设置，新设置的buffer小于当前写buffer中的数据时，buffer将会被flush到服务端。writeBufferSize的单位是byte字节数。
BufferedMutatorParams b = new BufferedMutatorParams(conn.getTable("")).writeBufferSize(“1000”);
conn.getBufferedMutator(b);
• WAL Flag（即HLog）：Put.setWriteToWAL(false)或Delete.setWriteToWAL(false)函数，这RegionServer宕机后的数据无法恢复。
• 批量写：通过调用Table.put(List) 而非Table.put(Put)方法可以将记录写入HBase，批量写入在数据实时性要求高，网络传输RTT高的情景下可能带来明显的性能提升。
HBase性能优化 - 读表操作
• Scanner Caching配置：
• Scan时指定需要的列簇或者列，可以减少网络传输数据量。
• 在HBase的conf配置扫描器缓存；
• 通过调用Scan实例的setCaching(int caching)进行配置；
• 批量读：通过调用Table实例的get(List)批量读取多行记录，只需一次网络I/O开销，可以明显的提升读性能。

某个业务采用【规则引擎】重构大幅降低耗时 sunnyboy_4 java 规则引擎
需求分析需求：由于业务的计算规则比较复杂，经过几年的规则迭代。后续维护维护起来比较麻烦，所以花了2周时间进行重构。本次采用Liteflow规则引擎进行重构，好处在于规则配置在xml配置文件中可以清晰的梳理业务的流向，在每个规则节点只负责各自的业务。将复杂的业务对象化，方便后续的维护与更新。项目已经经过生产数据验证。2、业务流程图，这是根据规则引擎编写的，方便后续定位3、这个方案的优点可以动态组合模
《Java线程池深度解析：从核心参数到饱和策略实战》云之兕 java基础入门到精通 java 开发语言
"线程池核心数设置多少合适？为什么任务队列满了会导致OOM？如何设计可降级的异步任务系统？"本文通过电商秒杀场景贯穿线程池参数调优全过程，结合ThreadPoolExecutor源码解析核心机制，并给出动态线程池与监控报警的最佳实践。一、线程池核心参数关系图解graphLRA[提交任务]-->B{核心线程是否已满?}B-->|否|C[创建核心线程执行]B-->|是|D{队列是否已满?}D-->|否
Spring Boot 与 Couchbase 整合教程嘵奇提升自己 spring boot 后端 java
精心整理了最新的面试资料和简历模板，有需要的可以自行获取点击前往百度网盘获取点击前往夸克网盘获取SpringBoot与Couchbase整合教程环境要求JDK8+SpringBoot2.7.xCouchbaseServer7.xMaven/Gradle步骤1：创建SpringBoot项目使用start.spring.io创建项目，添加以下依赖：SpringWeb（可选，用于RESTAPI）Spri
如何加快制造业数字化转型九河智造云制造云计算
加速制造业数字化转型的五大战略支点制造业数字化转型已进入深水区。工信部数据显示，2025年我国规模以上工业企业数字化研发工具普及率达88%，但全流程数字化覆盖率不足35%。破解转型困局需要构建“政策引导-技术突破-场景落地-生态协同”的加速机制，通过五大核心战略实现质效突破。一、强化顶层设计：构建转型制度保障体系政策创新需突破三大瓶颈：专项资金引导：设立2000亿元制造业数字化专项基金，对智能工厂
QEMU 中 x86_cpu_realizefn 到 ept_emulation_fault 的调用流程解析（macos） inquisiter 数据库服务器 linux
QEMU中x86_cpu_realizefn到ept_emulation_fault的调用流程解析在QEMU的x86虚拟化实现中，CPU的初始化与执行流程涉及多个关键函数，从CPU设备的最终初始化（x86_cpu_realizefn）到虚拟机监控程序（HVF）中处理EPT（扩展页表）缺页异常（ept_emulation_fault），以下是完整调用链的详细分析：1.x86_cpu_realizef
Kotlin代码示例及详细解析（Kotlin 1.3.11）淮山2 kotlin
//Kotlin1.3.11编译器版本//无包声明//1.基础变量声明//声明实例变量AAA1，类型为Int，初始值为0，类似C语言先声明后初始化的习惯varAAA1:Int=0//声明实例变量AAA2，类型为Double，初始值为0.0varAAA2:Double=0.0//声明实例变量AAA3，类型为String，初始值为空字符串varAAA3:String=""//2.静态变量声明//声明静
Python实战：开发经典猜拳游戏（石头剪刀布）藍海琴泉游戏
目录引言：为什么选择猜拳游戏作为入门项目？第一部分：基础知识点与代码实现1.游戏逻辑与流程2.代码分步实现2.1导入必要模块2.2定义游戏规则函数2.3生成计算机选择2.4判断胜负逻辑2.5主循环与交互3.代码运行效果示例第二部分：功能扩展与优化1.添加计分系统2.支持多轮游戏与退出选择3.增加图形化界面（可选）第三部分：进一步学习方向1.深化游戏功能2.学习相关知识3.书籍与资源推荐适合人群：编
微软Data Formulator：用AI重塑数据可视化的未来几道之旅人工智能智能体及数字员工人工智能信息可视化
在数据驱动的时代，如何快速将复杂数据转化为直观的图表是每个分析师面临的挑战。微软研究院推出的开源工具DataFormulator，通过结合AI与交互式界面，重新定义了数据可视化的工作流。本文将深入解析这一工具的核心功能、安装方法及使用技巧，助你轻松驾驭数据之美。一、DataFormulator是什么？DataFormulator是一款基于大语言模型（LLM）的AI工具，旨在帮助用户通过自然语言和界
本地部署deepseek-r1:14b 批量调用 Python调用本地deepseek-r1:14b实现对本地数据库的AI管理朴拙Python交易猿 python 数据库开发语言
这篇文章主要为大家详细介绍了Python如何基于DeepSeek模型，调用本地deepseek-r1:14b实现对本地数据库的AI管理场景描述基于DeepSeek模型，实现对本地数据库的AI管理。实现思路1、本地python+flask搭建个WEB，配置数据源。2、通过DeepSeek模型根据用户输入的文字需求，自动生成SQL语句。3、通过SQL执行按钮，实现对数据库的增删改查。模型服务方法1启动
【职业规划】分享003 -- 什么是职业规划师？杏子 | 职位规划师职业与个人发展经验分享
【职业规划】分享003–重新认识职业规划师最近常被问起职业，我说自己在做独立职业规划师。可能很多职场朋友对这个角色还不太熟悉，今天想和大家聊聊这份工作的价值。就像心理咨询服务心理健康，职业规划师专注解决职业困惑。如果你：▷每天重复机械工作却看不到成长▷想转型却不知从何下手▷面对职业选择总是犹豫不决那么就需要专业的职业规划师来帮你诊断问题，为你提供定制化的解决方案。拿我自己的职业历程来举例：2014
使用Wolfram Alpha API在LangChain中的应用 shuoac langchain python
在AI技术应用中，WolframAlpha以其强大的计算能力和信息检索功能，被广泛应用于各类智能系统中。本文将为您介绍如何结合LangChain使用WolframAlphaAPI，以实现功能强大的计算和信息查询服务。技术背景介绍WolframAlpha是由WolframResearch开发的问答引擎，它通过计算从外部数据源中获取答案，实现对事实性问题的解答。在开发智能应用时，我们可以利用Wolfr
策略模式详解：实现灵活多样的支付方式 Dong雨策略模式 java
多支付方式的实现：策略模式详解策略模式（StrategyPattern）是一种行为设计模式，它定义了一系列算法，并将每个算法封装起来，使它们可以互换使用。策略模式使得算法可以独立于使用它的客户端变化。本文将通过一个具体的业务场景来介绍策略模式，并给出相应的代码实现。业务场景我们以一个电商平台为例，该平台支持多种支付方式，包括信用卡支付、PayPal支付和比特币支付。我们希望在不修改客户端代码的情况
原创LabVIEW与台达EtherCAT运动控制卡完整测试程序代码 LabVIEW热爱者 labview
利用LabVIEW调用台达提供的库函数，控制台达EtherCAT运动控制卡，实现初始化、IO、运动控制、模拟量读取等功能。LabVIEW2013以上版本可以打开。可实现单轴、多轴运动控制。
el-select多选选择器（在懒加载的基础上）重磅：实现模糊搜索+多选+未加载数据的正确回显！！ SerendipityM javascript 前端开发语言 vue.js html5
项目需求：由于表单中的一个el-select中的数据过多，下拉框用户体验不好，因此需要做成有懒加载且分页的下拉框。后又因为该功能需要多选，并且打开表单要能够正确回显。这些需求加起来，导致问题变得复杂起来。我在网上也看了许多文章，没有找到好的解决方案。因此我将自己的记录下来，还望各位指点！！！（本项目请求后端需要传id，page，size，name）(name的格式为JSON形式的[id:1,nam
java面向对象基础 miehamiha java 开发语言
引入三大特征封装核心思想就是“隐藏细节”、“数据安全”，将对象不需要让外界访问的成员变量和方法私有化，只提供符合开发者意愿的公有方法来访问这些数据和逻辑，保证了数据的安全和程序的稳定。所有的内容对外部不可见。继承子类可以继承父类的属性和方法，并对其进行拓展。将其他的功能继承下来继续发展。多态同一种类型的对象执行同一个方法时可以表现出不同的行为特征。通过继承的上下转型、接口的回调以及方法的重写和重载
uni-app 设置背景图在手机中无效 catino uni-app
如下写法在微信开发者工具中显示正常，但在真机调试下，手机端背景图并未显示内容文字exportdefault{data(){return{imageBgURL:'../../static/imageBg.png'};}}解决方案如下：1，将图片转为base64编码2，将图片文件上传至服务器，使用网络地址3，使用image标签替代，如文本内容.textBg{height:114rpx;width:62
Matplotlib 柱形图 lly202406 开发语言
Matplotlib柱形图引言在数据可视化领域，柱形图是一种非常常见且强大的图表类型。它能够帮助我们直观地比较不同类别或组之间的数据大小。Matplotlib，作为Python中最受欢迎的数据可视化库之一，提供了丰富的绘图功能，其中包括创建柱形图。本文将详细介绍Matplotlib中的柱形图，包括其基本用法、高级特性以及如何进行优化。基本用法安装Matplotlib在开始使用Matplotlib之
OSGB编辑复杂又困难？试试这款免费GIS工具箱，高效实现场景编辑 GISBox GISBox vue.js webgl node.js edge 数据分析科技经验分享
在当今的地理信息科学（GIS）领域，数据的精确处理与直观展示无疑扮演着核心角色。无论是城市规划的精细布局、环境保护的科学决策，还是灾害预警的迅速响应，都离不开准确、实时的地理信息基石。然而，面对庞大的GIS数据，许多软件在处理、编辑和转换上都显得力不从心，尤其是对于倾斜摄影模型、地形和影像的编辑，更是成为了许多用户的棘手难题。1.GISBox简介GISBox作为一款免费的GIS工具箱，支持OSGB
Ollama 本地部署 FuWen_Hao ai
文章目录前言一、Ollama是什么？二、使用步骤1.安装OllamaWindows检验是否安装成功2.运行ollama模型库运行模型提问修改配置（可选）如果有个性化需求，需要修改默认配置：参考前言Ollama是一个易于使用的本地大模型运行框架，支持Mac、Windows和WSL2环境。文章介绍了如何在Widows上安装Ollama。一、Ollama是什么？Ollama是一个简明易用的本地大模型运行
Matplotlib如何创建交互式图表？ EdgarBertram matplotlib
Matplotlib是一个强大的Python绘图库，它可以用于生成高质量的静态图像。然而，Matplotlib同样支持创建交互式图表，这对于数据分析和可视化非常有用。交互式图表允许用户通过交互方式探索数据，例如缩放、平移或者查询数据点。下面我们将详细介绍如何使用Matplotlib创建交互式图表。一、安装与配置首先，确保你已经安装了Matplotlib库。你可以使用pip来安装：bash复制代码p
C++中函数模板与类模板的简单使用 CoderIsArt C++11 c++函数模板类模板
在C++中，模板是实现泛型编程的核心机制，允许开发者编写与类型无关的代码。以下是函数模板和类模板的详细介绍及实际示例。一、函数模板定义函数模板通过参数化类型实现泛型操作，只需编写一次代码即可处理多种数据类型，避免重复。语法template返回类型函数名(参数列表){...}typenameT表示类型占位符，编译时根据实参类型自动实例化。真实示例‌交换两个值（swap）templatevoidswa
Deepseek-r1:14b+ScraperAPI实现联网本地大模型回答 FuWen_Hao python 人工智能
文章目录前言一、Deekseek本地部署二、SerpAPI1.什么是SerpAPI？2.如何使用SerpAPI进行Web搜索三、实现Deepseek-r1:14b+ScraperAPI实现联网本地大模型回答1.Code前言我需要对本地的Deepseek-r1:14b进行提问，我发现它对于实时的问题，或者不知道的问题，会不回答或者乱回答。基于这点我想通过WebAPI传输更多的信息给到Deekseek
如何用PHP开发一个api数据接口幽蓝计划 php
对于一个iOS开发者来说，我一直觉得会写接口是一件很酷的事情，因为它可以实时修改前台数据，而不像App一样需要更新版本和接受审核。更重要的是，它意味着你的技术完成了一个闭环，可以独自完成一整个项目的开发。PHP是我接触的第一个脚本语言，使用之后更是感觉PHP功能强大，开发过程非常友好方便，虽然之后也学习过Python、JavaScript等语言，但现在还是习惯使用PHP，下面就来介绍一下如何用PH
向量检索、检索增强生成（RAG）、大语言模型及相关系统架构——典型面试问题及简要答案快撑死的鱼算法工程师宝典（面试学习最新技术必备）语言模型系统架构面试
1.什么是向量检索？它与传统基于关键字的检索相比有什么不同？答案要点：向量检索是将文本、图像、音频等数据映射为向量，在高维向量空间中基于相似度或距离进行搜索。与传统基于关键字的检索（如倒排索引）相比，向量检索更关注“语义”或“特征”，能找出语义上相似但未必包含相同关键词的内容。向量检索非常适合多模态场景（例如“以图搜图”）或自然语言问答（同义词、上下文关联等）。2.什么是检索增强生成（RAG）？核
HarmonyOS Next 企业级分布式办公应用实战：构建高效协同的办公新生态 lyc233333 harmonyos 分布式华为
在数字化办公浪潮汹涌的当下，企业对于高效、便捷且协同性强的办公应用需求愈发迫切。华为鸿蒙HarmonyOSNext系统凭借其先进的分布式技术，为打造创新型企业级分布式办公应用提供了坚实的基础。本文将基于实际开发经验，深入剖析如何利用HarmonyOSNext构建企业级分布式办公应用，涵盖从需求分析到系统架构搭建，再到核心功能实现以及性能优化等关键环节。一、办公应用需求与系统架构搭建（一）企业级分布
【HarmonyOS】鸿蒙中防止截屏和录屏（设置窗口为隐私模式） m0_5南风 harmonyos 华为
防止截屏和录屏（设置窗口为隐私模式）手机应用防止截屏和录屏功能（开启隐私模式）能够有效防止敏感信息被恶意传播，减少盗版行为，确保合规性，增强用户对应用的信任感，并维护公平性，尤其在涉及个人信息和付费内容的场景中显得尤为重要。版本:API9以上主要方法:使用setWindowPrivacyMode设置窗口为隐私模式,注意:设置窗口而不是某一个页面,相当于整个应用设置了防截屏主要代码exportcla
探索Astra DB与LangChain的集成：从向量存储到对话历史 eahba 数据库 langchain python
技术背景介绍AstraDB是DataStax推出的一款无服务器的向量数据库，基于ApacheCassandra®构建，并通过易于使用的JSONAPI提供服务。AstraDB的独特之处在于其强大的向量存储能力，这在处理自然语言处理任务时尤为突出。LangChain与AstraDB的集成为开发者提供了强大的工具链，从数据存储到语义缓存，再到自查询检索，帮助简化复杂的数据操作。核心原理解析LangCha
Java 环境配置与 JAR 文件问题解决全攻略不羁。。杂记丨每天亿点小知识 java jar 开发语言
目录一、Java环境配置指南1.Windows系统配置步骤1.1下载安装JDK1.2配置环境变量2.Linux/macOS系统配置2.1终端命令配置二、JAR文件问题诊断与修复1.检查JAR文件完整性1.1命令行验证1.2哈希值校验2.依赖库管理方案2.1Maven依赖配置示例2.2命令行指定依赖三、常见问题解决方案1.环境变量不生效处理1.1清除系统缓存1.2路径优先级调整2.旧版本残留处理2.
一步到位！7大模型部署框架深度测评：从理论到DeepSeek R1:7B落地实战人肉推土机人工智能 python
本文在掘金同步发布：文章地址更多优质文章，请关注本人掘金账号：人肉推土机的掘金账号随着大语言模型（LLM）的广泛应用，如何高效部署和推理模型成为开发者关注的核心问题。本文深入解析主流模型部署框架（Transformers、ModelScope、vLLM、LMDeploy、Ollama、SGLang、DeepSpeed），结合其技术原理、优缺点及适用场景，并提供DeepSeekR1:7B的详细部署实
【论文阅读】PERSONALIZE SEGMENT ANYTHING MODEL WITH ONE SHOT s1ckrain 计算机视觉论文阅读计算机视觉人工智能
PERSONALIZESEGMENTANYTHINGMODELWITHONESHOT原文摘要研究背景与问题：SAM是一个基于大规模数据预训练的强大提示框架，推动了分割领域的发展。尽管SAM具有通用性，但在无需人工提示的情况下，针对特定视觉概念（如自动分割用户宠物狗）的定制化研究尚不充分。方法提出：提出了一种无需训练的SAM个性化方法，称为PerSAM。仅需单次数据（一张带参考掩码的图像），即可在新
web前段跨域nginx代理配置刘正强 nginx cms Web
nginx代理配置可参考server部分 server { listen 80; server_name localhost;
spring学习笔记 caoyong spring
一、概述 a>、核心技术 : IOC与AOP b>、开发为什么需要面向接口而不是实现接口降低一个组件与整个系统的藕合程度，当该组件不满足系统需求时，可以很容易的将该组件从系统中替换掉，而不会对整个系统产生大的影响 c>、面向接口编口编程的难点在于如何对接口进行初始化,(使用工厂设计模式)
Eclipse打开workspace提示工作空间不可用 0624chenhong eclipse
做项目的时候，难免会用到整个团队的代码，或者上一任同事创建的workspace， 1.电脑切换账号后，Eclipse打开时，会提示Eclipse对应的目录锁定，无法访问，根据提示，找到对应目录，G:\eclipse\configuration\org.eclipse.osgi\.manager，其中文件.fileTableLock提示被锁定。解决办法，删掉.fileTableLock文件，重
Javascript 面向对面写法的必要性？一炮送你回车库 JavaScript
现在Javascript面向对象的方式来写页面很流行，什么纯javascript的mvc框架都出来了：ember 这是javascript层的mvc框架哦,不是j2ee的mvc框架我想说的是，javascript本来就不是一门面向对象的语言，用它写出来的面向对象的程序，本身就有些别扭，很多人提到js的面向对象首先提的是：复用性。那么我请问你写的js里有多少是可以复用的，用fu
js array对象的迭代方法换个号韩国红果果 array
1.forEach 该方法接受一个函数作为参数，对数组中的每个元素使用该函数 return 语句失效 function square(num) { print(num, num * num); } var nums = [1,2,3,4,5,6,7,8,9,10]; nums.forEach(square); 2.every 该方法接受一个返回值为布尔类型
对Hibernate缓存机制的理解归来朝歌 session 一级缓存对象持久化
在hibernate中session一级缓存机制中，有这么一种情况：问题描述：我需要new一个对象，对它的几个字段赋值，但是有一些属性并没有进行赋值，然后调用 session.save()方法，在提交事务后，会出现这样的情况： 1：在数据库中有默认属性的字段的值为空 2：既然是持久化对象，为什么在最后对象拿不到默认属性的值？通过调试后解决方案如下：对于问题一，如你在数据库里设置了
WebService调用错误合集 darkranger webservice
Java.Lang.NoClassDefFoundError: Org/Apache/Commons/Discovery/Tools/DiscoverSingleton 调用接口出错，一个简单的WebService import org.apache.axis.client.Call;import org.apache.axis.client.Service; 首先必不可
JSP和Servlet的中文乱码处理 aijuans Java Web
JSP和Servlet的中文乱码处理前几天学习了JSP和Servlet中有关中文乱码的一些问题，写成了博客，今天进行更新一下。应该是可以解决日常的乱码问题了。现在作以下总结希望对需要的人有所帮助。我也是刚学，所以有不足之处希望谅解。一、表单提交时出现乱码：在进行表单提交的时候，经常提交一些中文，自然就避免不了出现中文乱码的情况，对于表单来说有两种提交方式：get和post提交方式。所以
面试经典六问 atongyeye 工作面试
题记：因为我不善沟通，所以在面试中经常碰壁，看了网上太多面试宝典，基本上不太靠谱。只好自己总结，并试着根据最近工作情况完成个人答案。以备不时之需。以下是人事了解应聘者情况的最典型的六个问题： 1 简单自我介绍关于这个问题，主要为了弄清两件事，一是了解应聘者的背景，二是应聘者将这些背景信息组织成合适语言的能力。我的回答：(针对技术面试回答，如果是人事面试，可以就掌
contentResolver.query()参数详解百合不是茶 android query()详解
收藏csdn的博客,介绍的比较详细,新手值得一看 1.获取联系人姓名一个简单的例子，这个函数获取设备上所有的联系人ID和联系人NAME。 [java] view plain copy public void fetchAllContacts() {
ora-00054:resource busy and acquire with nowait specified解决方法 bijian1013 oracle 数据库 kill nowait
当某个数据库用户在数据库中插入、更新、删除一个表的数据，或者增加一个表的主键时或者表的索引时，常常会出现ora-00054:resource busy and acquire with nowait specified这样的错误。主要是因为有事务正在执行（或者事务已经被锁），所有导致执行不成功。 1.下面的语句
web 开发乱码征客丶 spring Web
以下前端都是 utf-8 字符集编码一、后台接收 1.1、 get 请求乱码 get 请求中，请求参数在请求头中；乱码解决方法： a、通过在web 服务器中配置编码格式：tomcat 中，在 Connector 中添加URIEncoding="UTF-8"； 1.2、post 请求乱码 post 请求中，请求参数分两部份， 1.2.1、url？参数，
【Spark十六】： Spark SQL第二部分数据源和注册表的几种方式 bit1129 spark
Spark SQL数据源和表的Schema case class apply schema parquet json JSON数据源准备源数据 {"name":"Jack", "age": 12, "addr":{"city":"beijing&
JVM学习之:调优总结 -Xms -Xmx -Xmn -Xss BlueSkator -Xss -Xmn -Xms -Xmx
堆大小设置JVM 中最大堆大小有三方面限制：相关操作系统的数据模型（32-bt还是64-bit）限制；系统的可用虚拟内存限制；系统的可用物理内存限制。32位系统下，一般限制在1.5G~2G；64为操作系统对内存无限制。我在Windows Server 2003 系统，3.5G物理内存，JDK5.0下测试，最大可设置为1478m。典型设置： java -Xmx355
jqGrid 各种参数详解(转帖) BreakingBad jqGrid
jqGrid 各种参数详解分类：源代码分享个人随笔请勿参考解决开发问题 2012-05-09 20:29 84282人阅读评论(22) 收藏举报 jquery 服务器 parameters function ajax string
读《研磨设计模式》-代码笔记-代理模式-Proxy bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.lang.reflect.InvocationHandler; import java.lang.reflect.Method; import java.lang.reflect.Proxy; /* * 下面
应用升级iOS8中遇到的一些问题 chenhbc ios8 升级iOS8
1、很奇怪的问题，登录界面，有一个判断，如果不存在某个值，则跳转到设置界面，ios8之前的系统都可以正常跳转，iOS8中代码已经执行到下一个界面了，但界面并没有跳转过去，而且这个值如果设置过的话，也是可以正常跳转过去的，这个问题纠结了两天多，之前的判断我是在 -(void)viewWillAppear:(BOOL)animated 中写的，最终的解决办法是把判断写在 -(void
工作流与自组织的关系？ comsci 设计模式工作
目前的工作流系统中的节点及其相互之间的连接是事先根据管理的实际需要而绘制好的，这种固定的模式在实际的运用中会受到很多限制，特别是节点之间的依存关系是固定的，节点的处理不考虑到流程整体的运行情况，细节和整体间的关系是脱节的，那么我们提出一个新的观点，一个流程是否可以通过节点的自组织运动来自动生成呢？这种流程有什么实际意义呢？这里有篇论文，摘要是：“针对网格中的服务
Oracle11.2新特性之INSERT提示IGNORE_ROW_ON_DUPKEY_INDEX daizj oracle
insert提示IGNORE_ROW_ON_DUPKEY_INDEX 转自：http://space.itpub.net/18922393/viewspace-752123 在 insert into tablea ...select * from tableb中，如果存在唯一约束，会导致整个insert操作失败。使用IGNORE_ROW_ON_DUPKEY_INDEX提示，会忽略唯一
二叉树:堆 dieslrae 二叉树
这里说的堆其实是一个完全二叉树,每个节点都不小于自己的子节点,不要跟jvm的堆搞混了.由于是完全二叉树,可以用数组来构建.用数组构建树的规则很简单: 一个节点的父节点下标为: (当前下标 - 1)/2 一个节点的左节点下标为: 当前下标 * 2 + 1 &
C语言学习八结构体 dcj3sjt126com c
为什么需要结构体，看代码 # include <stdio.h> struct Student //定义一个学生类型，里面有age, score, sex, 然后可以定义这个类型的变量 { int age; float score; char sex; } int main(void) { struct Student st = {80, 66.6,
centos安装golang dcj3sjt126com centos
#在国内镜像下载二进制包 wget -c http://www.golangtc.com/static/go/go1.4.1.linux-amd64.tar.gz tar -C /usr/local -xzf go1.4.1.linux-amd64.tar.gz #把golang的bin目录加入全局环境变量 cat >>/etc/profile<
10.性能优化-监控-MySQL慢查询 frank1234 性能优化 MySQL慢查询
1.记录慢查询配置 show variables where variable_name like 'slow%' ; --查看默认日志路径查询结果：--不用的机器可能不同 slow_query_log_file=/var/lib/mysql/centos-slow.log 修改mysqld配置文件：/usr /my.cnf[一般在/etc/my.cnf，本机在/user/my.cn
Java父类取得子类类名 happyqing java this 父类子类类名
在继承关系中，不管父类还是子类，这些类里面的this都代表了最终new出来的那个类的实例对象，所以在父类中你可以用this获取到子类的信息！ package com.urthinker.module.test; import org.junit.Test; abstract class BaseDao<T> { public void
Spring3.2新注解@ControllerAdvice jinnianshilongnian @Controller
@ControllerAdvice，是spring3.2提供的新注解，从名字上可以看出大体意思是控制器增强。让我们先看看@ControllerAdvice的实现： @Target(ElementType.TYPE) @Retention(RetentionPolicy.RUNTIME) @Documented @Component public @interface Co
Java spring mvc多数据源配置 liuxihope spring
转自：http://www.itpub.net/thread-1906608-1-1.html 1、首先配置两个数据库 <bean id="dataSourceA" class="org.apache.commons.dbcp.BasicDataSource" destroy-method="close&quo
第12章 Ajax（下） onestopweb Ajax
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
BW / Universe Mappings blueoxygen BO
BW Element OLAP Universe Element Cube Dimension Class Charateristic A class with dimension and detail objects (Detail objects for key and desription) Hi
Java开发熟手该当心的11个错误 tomcat_oracle java 多线程工作单元测试
#1、不在属性文件或XML文件中外化配置属性。比如，没有把批处理使用的线程数设置成可在属性文件中配置。你的批处理程序无论在DEV环境中，还是UAT（用户验收测试）环境中，都可以顺畅无阻地运行，但是一旦部署在PROD 上，把它作为多线程程序处理更大的数据集时，就会抛出IOException，原因可能是JDBC驱动版本不同，也可能是#2中讨论的问题。如果线程数目可以在属性文件中配置，那么使它成为
推行国产操作系统的优劣 yananay windows linux 国产操作系统
最近刮起了一股风，就是去“国外货”。从应用程序开始，到基础的系统，数据库，现在已经刮到操作系统了。原因就是“棱镜计划”，使我们终于认识到了国外货的危害，开始重视起了信息安全。操作系统是计算机的灵魂。既然是灵魂，为了信息安全，那我们就自然要使用和推行国货。可是，一味地推行，是否就一定正确呢？先说说信息安全。其实从很早以来大家就在讨论信息安全。很多年以前，就据传某世界级的网络设备制造商生产的交

大数据实时检索场景化解决方案---HBase

你可能感兴趣的:(大数据实时检索场景化解决方案---HBase)