thomas0988

【引用】Oracle全文检索方面的研究(全10)

4、操作实例

4.1 单列与多列支持中文检索

Create table mytable1(id number primary key, doc1 varchar2(400),doc2 clob,doc3 clob);

Insert into mytable1 values(1,'今天的天气很不错，我想去逛街','今天是星期天，不用上班。天天好心情','明天是星期一，要上班。心情不好');

Insert into mytable1 values(2,'天是蓝色的，万里无云。天气非常好。','天是多云的，天气看起来要下雨了。不适宜出门','天正在下雨，大雨倾盆。不能出门。');

Insert into mytable1 values(3,'this is a text','this is a word','this is a pdf');

Commit;

--先删除引用

begin

ctx_ddl.drop_preference('my_chinese_vgram_lexer');

ctx_ddl.drop_preference('my_chinese_lexer');

end;

--支持中文分词

Begin

ctx_ddl.create_preference('my_chinese_vgram_lexer', 'chinese_vgram_lexer');

ctx_ddl.create_preference('my_chinese_lexer', 'chinese_lexer');

End;

--先删除引用

begin

ctx_ddl.drop_preference('my_multi');

end;

--多列查询，如果仅仅是单列，则不用设置这个类型

Begin

Ctx_ddl.create_preference('my_multi', 'multi_column_datastore');

Ctx_ddl.set_attribute('my_multi', 'columns', 'doc1, doc2, doc3');

End;

drop index myindex;

--单列查询，支持中文的索引建立

Create index myindex on mytable(docs)

indextype is ctxsys.context

parameters ('datastore ctxsys.default_datastore lexer foo.my_chinese_lexer')

drop index idx_mytable;

--多列查询，支持中文的索引的建立

Create index idx_mytable on mytable1(doc1)indextype is ctxsys.context

parameters('datastore my_multi lexer foo.my_chinese_lexer');

--chinese_lexer词法分析器下的结果,三列都可以查询

Select * from mytable1 where contains(doc1, '今天')>0; --检索到第一条数据

Select * from mytable1 where contains(doc1, '不适宜')>0; --检索到第二条数据

Select * from mytable1 where contains(doc1, '适宜')>0; --检索不到数据，他的分词技术太简单，将‘不适宜’作为一个词了

Select * from mytable1 where contains(doc1, '出门')>0; --检索到第二条数据

Select * from mytable1 where contains(doc1, 'this is a word')>0; --检索到第三条数据，中英文适用

--chinese_vgram_lexer词法分析器下的结果,

--chinese_vgram_lexer词法分析器虽然没那么智能，但检索结果往往比较符合我们的要求，

--如：“不适宜”这个词语应该拆分为“不适宜”和“适宜”两个词语，而不是单独的作为一个词语，

--chinese_vgram_lexer可以查询的到，而chinese_lexer不可以。

drop index idx_mytable;

--多列查询，支持中文的索引的建立

Create index idx_mytable on mytable1(doc1)indextype is ctxsys.context

parameters('datastore my_multi lexer foo.my_chinese_vgram_lexer');

--chinese_vgram_lexer词法分析器下的结果,三列都可以查询

Select * from mytable1 where contains(doc1, '今天')>0; --检索到第一条数据

Select * from mytable1 where contains(doc1, '不适宜')>0; --检索到第二条数据

Select * from mytable1 where contains(doc1, '适宜')>0; --检索到第二条数据，这个分词虽然效率低点，但检索结果还可以

Select * from mytable1 where contains(doc1, '出门')>0; --检索到第二条数据

Select * from mytable1 where contains(doc1, 'this is a word')>0; --检索到第三条数据，中英文适用

--对于多列查询，更新列操作

--只更新从表，看是否能查到更新的信息

Update mytable1 set doc2='adladlhadad this datastore when your text is stored test' where id=2;

--同步更新索引

Begin

Ctx_ddl.sync_index('idx_mytable');

End;

--可见，虽然你检索是三个列，但是你更新的不是索引对应的那列（doc1），同步了索引也是不起作用的

Select * from mytable1 where contains(doc1,'adladlhadad')>0; --没有记录

--更新与doc1列原来相同内容（实际内容不变，只有操作而已）

Update mytable1 set doc1='天是蓝色的，万里无云。天气非常好。' where id=2;

--再同步更新索引

Begin

Ctx_ddl.sync_index('idx_mytable');

End;

--再查询一次

Select * from mytable1 where contains(doc1,'adladlhadad')>0; --有结果，可见，对于其他查询的列（非索引对应的列）的更新操作，可以连同索引对应的列一起更新，只是不改变索引的内容即可做到同步索引就可以出现效果了。

4.2 本地磁盘检索

create table mytable3(id number primary key, docs varchar2(2000));

insert into mytable3 values(111555,'1.txt');

insert into mytable3 values(111556,'1.doc');

insert into mytable3 values(111557,'1.xls');

insert into mytable3 values(111558,'1.pdf');

insert into mytable3 values(111559,'2.txt');

insert into mytable3 values(111560,'2.doc');

insert into mytable3 values(111561,'2.xls');

insert into mytable3 values(111562,'2.pdf');

commit;

--先删除引用

begin

ctx_ddl.drop_preference('COMMON_DIR');

end;

--建立 file datastore

begin

ctx_ddl.create_preference('COMMON_DIR','FILE_DATASTORE');

ctx_ddl.set_attribute('COMMON_DIR','PATH','D:\search');

end;

--先删除索引

drop index myindex3;

--建立索引,8个文件，内容简单，耗时1.5s

create index myindex3 on mytable3(docs) indextype is ctxsys.context parameters ('datastore COMMON_DIR lexer foo.my_chinese_lexer');

select * from mytable3 where contains(docs,'text')>0; --查询，支持txt

select * from mytable3 where contains(docs,'pdf')>0; --查询，支持pdf

select * from mytable3 where contains(docs,'excel')>0; --查询，支持excel

select * from mytable3 where contains(docs,'word')>0; --查询，支持doc

select * from mytable3 where contains(docs,'文本')>0; --查询,支持中文

select * from mytable3 where contains(docs,'文档')>0; --查询，支持中文

select * from mytable3 where contains(docs,'阅读')>0; --查询，支持中文pdf

select * from mytable3 where contains(docs,'这是Excel')>0; --查询，支持中文

--暂时测试支持doc，txt,xls,pdf

--更新了文件内容2.txt

select * from mytable3 where contains(docs,'这个测试用的文本')>0; --查询无更新好数据

--不同步索引，无效

--同步更新索引

Begin

Ctx_ddl.sync_index('myindex3');

End;

--再次查询

select * from mytable3 where contains(docs,'测试')>0; --还是无效

--用相同的值取代2.txt然后再同步索引

Update mytable3 set docs='2.txt' where id=111559;

--再同步索引

--同步更新索引

Begin

Ctx_ddl.sync_index('myindex3');

End;

--再次查询

select * from mytable3 where contains(docs,'测试')>0; --结果出现，可见，单更新文件内容，同步索引是无效的，索引认的是数据库纪录，数据库纪录改变，索引才会更新

--新增加文件，结果雷同。关键是要更新数据库纪录，即使改了文件内容，也要用相同的值update数据库纪录一次。

4.3 检索结果高亮显示

Create table my_high (id number primary key, docs varchar2(1000));

insert into my_high values (1, 'this is a oracle text example. And oracle is the key word.');

insert into my_high values (2, '<title>oracle text</title><body>this is a oracle ctx_doc hightlight example.</body>');

commit;

--建立索引

create index ind_m_high on my_high(docs) indextype is ctxsys.context;

--返回结果的偏移量

set serverout on

declare

v_restab ctx_doc.highlight_tab;

begin

ctx_doc.highlight('ind_m_high', 1, 'oracle', v_restab, true);

for i in 1..v_restab.count loop

dbms_output.put_line('begin with: ' || v_restab(i).offset || ' length: ' || v_restab(i).length);

end loop;

end;

begin with: 11 length: 6

begin with: 36 length: 6

ctx_doc.highlight参数说明：

ctx_doc.highlight(索引,数据库中的ID, 搜索关键字, 指明返回的偏移量是针对纯文本格式还是针对HTML格式, true);

true or false: 对比PLAINTEXT设置为FALSE和TRUE的区别可以发现，对于HTML所有的标识部分，Oracle统一认为长度等于2。

对于True: <title>oracle text</title><body>this is a oracle ctx_doc hightlight example.</body>，<title>认为是2个长度，false的话就全部纪录，认为总共有7个字符长度。

要在sqlplus执行

4.4 具体测试

4.4.1 基本的全文检索

--先删除引用

begin

ctx_ddl.drop_preference('my_chinese_vgram_lexer');

ctx_ddl.drop_preference('my_chinese_lexer');

end;

--支持中文分词

Begin

ctx_ddl.create_preference('my_chinese_vgram_lexer', 'chinese_vgram_lexer');

ctx_ddl.create_preference('my_chinese_lexer', 'chinese_lexer');

End;

Begin

Ctx_ddl.create_preference('F_DOCNEWS_Preference', 'multi_column_datastore');

Ctx_ddl.set_attribute('F_DOCNEWS_Preference', 'columns', 'F_CONTENT,F_DESCRIPTION,F_TITLE');

End;

drop index f_content_index;

Create index f_content_index on T_DOCNEWS(F_CONTENT)

indextype is ctxsys.context

parameters('datastore F_DOCNEWS_Preference lexer foo.my_chinese_lexer');

Select * from T_DOCNEWS where contains(F_CONTENT,'菲律宾')>0; --有结果，

4.4.2 带动态摘要的高亮全文检索

--先删除引用

begin

ctx_ddl.drop_preference('my_chinese_vgram_lexer');

ctx_ddl.drop_preference('my_chinese_lexer');

end;

--支持中文分词

Begin

ctx_ddl.create_preference('my_chinese_vgram_lexer', 'chinese_vgram_lexer');

ctx_ddl.create_preference('my_chinese_lexer', 'chinese_lexer');

End;

--先删除索引

drop index f_content_index;

--新建索引，默认属性，无过滤器，支持中文高级分词

Create index f_content_index on T_DOCNEWS(F_CONTENT)

indextype is ctxsys.context

parameters('datastore ctxsys.default_datastore filter ctxsys.null_filter section group

ctxsys.html_section_group lexer foo.my_chinese_lexer');

?--以下开始准备建立存储过程，先定义数组类型

CREATE or replace TYPE f_content_arr AS OBJECT(

id NUMBER ,

url varchar2(255),

title varchar2(255),

abstractcontent varchar2(255)

);

--定义数组变量

CREATE or replace type f_content_arr_re as table of f_content_arr;

--定义存储过程

create or replace procedure f_content_pro (keyword in varchar,v_cfjg out f_content_arr_re) is

v_restab ctx_doc.highlight_tab;

begin

DECLARE

i number;

s clob;

startnum number;

endnum number;

v_res_fun T_DOCNEWS%rowTYPE;

cursor c_fun is

select * from T_DOCNEWS where contains(F_CONTENT,keyword)>0;

BEGIN

i := 0;

v_cfjg := f_content_arr_re();

open c_fun;

LOOP

fetch c_fun

into v_res_fun;

EXIT WHEN c_fun%NOTFOUND;

i := i + 1;

s := v_res_fun.F_CONTENT;

v_cfjg.EXTEND;

ctx_doc.highlight('f_content_index', v_res_fun.F_ID, keyword, v_restab, false);

--只取第一个，没有loop循环

startnum:=v_restab(1).offset;

if v_restab(1).offset > 30 then

begin

startnum := v_restab(1).offset-30 ;

end;

end if;

if v_restab(1).offset <= 30 then

begin

startnum := 1 ;

end;

end if;

if length(s)-v_restab(1).offset > 30 then

begin

endnum := v_restab(1).offset+30 ;

end;

end if;

if length(s)-v_restab(1).offset <= 30 then

begin

endnum := length(s) ;

end;

end if;

v_cfjg(v_cfjg.count) := f_content_arr(v_res_fun.F_ID,v_res_fun.F_URL,v_res_fun.F_TITLE,substr(s,startnum,endnum-startnum));

dbms_output.new_line();

END LOOP;

end;

EXCEPTION

WHEN TOO_MANY_ROWS THEN

DBMS_OUTPUT.PUT_LINE('TOO_MANY_ROWS');

WHEN OTHERS THEN

DBMS_OUTPUT.PUT_LINE(sqlerrm);

end f_content_pro;

--在此，全文检索存储过程定义完毕

--以下是sqlplus调用

declare

s f_content_arr_re;

begin

f_content_pro('菲律宾',s);

END;

Java后台调用存储过程并返回参数代码：

public ArrayList<DocNews> search(String keyword) {

ArrayList<DocNews> list = new ArrayList<DocNews>();

Connection conn = null;

ResultSet rs = null;

CallableStatement stmt = null;

DocNews docnews;

try {

conn = DBPool.getConnection();

stmt = null;

String procName = new StringBuffer().append("{ call f_content_pro(?,?) } ").toString();

stmt = conn.prepareCall(procName);

stmt.setString(1, keyword);

stmt.registerOutParameter(2, Types.ARRAY, "F_CONTENT_ARR_RE");

stmt.execute();

ARRAY arr = (ARRAY) stmt.getArray(2);

rs = arr.getResultSet();

while (rs.next()) {

STRUCT struct = (STRUCT) rs.getObject(2);

Object[] obs = struct.getAttributes();

docnews = new DocNews();

docnews.setId(((BigDecimal)obs[0]).longValue());

docnews.setUrl((String)obs[1]);

docnews.setTitle((String)obs[2]);

docnews.setAbstractcontent((String)obs[3]);

list.add(docnews);

}

if (stmt != null) {

stmt.close();

}

if (conn != null) {

conn.close();

}

} catch (Exception e) {

e.printStackTrace();

}

return list;

}

注：在java中调用方法，除了在项目里加入class12.jar包以外，还需要加入Oracle自带的orai18n.jar包，如果仅仅是执行main方面，则可以，但如果是web项目，则要将orai18n.jar包加入到jdk的%jdk%\jre\lib\ext目录中才行。如果没有orai18n.jar这个包会造成检索调用存储过程返回结果是乱码（？？？三个问号）。

4.4.3 检索简单界面图

5．检索性能

执行以下索引

Create index f_content_index on T_DOCNEWS(F_CONTENT)

indextype is ctxsys.context

parameters('datastore F_DOCNEWS_Preference lexer foo.my_chinese_lexer');

总共5272条新闻，总耗时61s

合计约一分钟5000条

查询仅需200多毫秒

你可能感兴趣的:(oracle,F#,Excel,ext,全文检索)

vue路由中的next() 奔跑的蜗牛2004 JavaScript 前端 Vue vue.js 前端 javascript
在路由守卫中有三个参数；beforeEach((to,from,next)=>{to//要去的路由from//当前路由next()//放行的意思}其实在路由守卫中，只有next()是放行，其他的诸如：next('/logon')、next(to)或者next({...to,replace:true})都不是放行，而是：中断当前导航，执行新的导航在这里就要说到next有参数和无参数的区别了next(
nextjs 路由猪猪宝儿姐 react native
1.官网路由介绍nextjs路由next项目的路由默认为page下面的文件生成对应的路由。http://localhost:3000/代表的/page/index.tsx.http://localhost:3000/demo指的是page-->demo-->index.tsx文件。2.动态路由在Next.js中，您可以将括号添加到页面([param])以创建动态路由（也称为urlslugs、pre
Oracle到MySQL实时数据互通：透明网关跨库查询终极方案从不删库的DBA Oracle oracle mysql 数据库
技术架构概述节点类型IP示例Oracle数据库172.18.0.11透明网关节点192.168.5.20MySQL数据库10.10.8.100提示：透明网关支持部署在Oracle服务器实现集中式管理一、MySQL环境准备1.ODBC驱动部署从MySQL官网获取对应版本的ODBC驱动：#企业版推荐使用8.0系列驱动wgethttps://dev.mysql.com/get/Downloads/Con
HarmonyOS NEXT实战：自定义封装多种样式导航栏组件 JasonYin~ HarmonyOS NEXT harmonyos
涉及知识点和装饰器@ComponentV2，@Local，@Builder，@BuilderParam，@Extend，@Require，@Param，@Event等第三方库：ZRouter，如项目中本来就用了ZRouter路由库，案例中点返回按钮直接使用了ZRouter.pop()，没有用到的话也支持自定义返回事件。背景：在项目开发进程中，导航栏的应用场景颇为繁多。以我的页面为例，其导航栏呈现为
《探索 HarmonyOS NEXT(5.0)：开启构建模块化项目架构奇幻之旅 —— 模块化基础篇》 JasonYin~ HarmonyOS NEXT 纯血鸿蒙 1024程序员节
从无到有，打造模块化项目。构建一个开箱即用的项目，从Git上拉取下来即可直接进行开发，其中涵盖路由通信、上下拉刷新、网络请求、事件通知、顶部tab封装等功能，项目里调用API为鸿洋大佬的wanAndroidAPI。后期将持续完善，若有不足之处，诚邀各位大佬多提宝贵建议，共同进步成长。为啥要模块化在一些公司，员工可能接手几年前甚至更久远的项目，其架构常是所有代码在一个包中，导致代码混乱，降低可读性和
【Next】路由处理秀秀_heo React 及其周边生态 css javascript 服务器
概述和前端路由一样，后端路由处理也同样采用约定式路由。比如可以在/api目录下定义路由文件。但是要注意：route.ts和page.tsx不可以在同一目录下，因为难以区分是渲染页面还是请求接口。支持以下HTTP方法：GET、POST、PUT、PATCH、DELETE、HEAD和OPTIONS。如果调用了不受支持的方法，Next.js将返回405MethodNotAllowed响应。注意，在生产环境
Java基础-03-Java入门-JDK的安装和下载落榜程序员 java 开发语言
Java基础教程：JDK的安装与下载引言欢迎来到Java编程世界！在开始编写Java程序之前，你需要确保你的计算机上已经安装了Java开发工具包（JDK）。本文将指导你如何下载并安装最新的JDK版本。一、选择适合你的JDK版本随着技术的发展，Oracle定期更新JDK。截至2025年3月，推荐使用最新稳定版的JDK进行开发。你可以访问OracleJDK官网或OpenJDK来获取最新的JDK版本信息
HarmonyOS Next 侧滑返回事件拦截案例 2401_89213278 harmonyos 华为
效果预览图使用说明编辑状态侧滑返回弹出弹窗提醒用户是否保存。点击弹窗空白区域，弹窗消失，继续编辑。点击保存按钮，返回主页，保存用户编辑的数据，再次进入编辑页可在上次编辑的基础上再次编辑。实现思路因为功能是以har的形式集成在主工程中，没有@Entry修饰的组件，也无法作为入口组件，不能使用@Entry组件的onBackPress生命周期函数。在使用方面onBackPressed是NavDestin
Spring AOP 核心概念与实践指南半升酒 spring java
第一章：AOP核心概念与基础应用1.1AOP核心思想面向切面编程：通过横向抽取机制解决代码重复问题（如日志、事务、安全等）核心优势：不修改源代码增强功能，提高代码复用性和可维护性1.2基础环境搭建（Maven依赖）org.springframeworkspring-context5.0.2.RELEASEorg.aspectjaspectjweaver1.8.3junitjunit4.12test
Unity开发中KMP算法的理解和应用 unityのkiven 算法 unity
1.KMP算法简介KMP（Knuth-Morris-Pratt）算法是一种用于字符串匹配的高效算法，相比于暴力匹配，它能在O(n+m)时间复杂度下完成匹配，其中n是文本串长度，m是模式串长度。其核心思想是部分匹配表（next数组），用于在匹配失败时减少回溯，从而提升匹配效率。2.KMP算法的核心原理KMP算法主要包含两个部分：构建部分匹配表（next数组）：计算模式串自身的重复前后缀信息，减少匹配
HarmonyOS Next开发学习手册——在应用中使用前端页面JavaScript OpenHarmony_小贾移动开发 HarmonyOS 鸿蒙开发前端 harmonyos 组件化开发鸿蒙开发 javascript 深度学习移动开发
应用侧调用前端页面函数应用侧可以通过runJavaScript()方法调用前端页面的JavaScript相关函数。在下面的示例中，点击应用侧的“runJavaScript”按钮时，来触发前端页面的htmlTest()方法。前端页面代码。ClickMe!这是一个测试信息，默认字体为黑色，调用runJavaScript方法后字体为绿色，调用runJavaScriptCodePassed方法后字体为红色
HarmonyOS Next开发学习手册——XML生成、解析与转换 OpenHarmony_小贾 HarmonyOS 鸿蒙开发移动开发学习 xml harmonyos OpenHarmony 深度学习组件化鸿蒙开发
概述XML（可扩展标记语言）是一种用于描述数据的标记语言，旨在提供一种通用的方式来传输和存储数据，特别是Web应用程序中经常使用的数据。XML并不预定义标记。因此，XML更加灵活，并且可以适用于广泛的应用领域。XML文档由元素（element）、属性（attribute）和内容（content）组成。元素指的是标记对，包含文本、属性或其他元素。属性提供了有关元素的其他信息。内容则是元素包含的数据或
鸿蒙Next-一次开发多端部署-基于栅格布局Grid 试水年华 harmonyos 华为鸿蒙 Ark-TS语言
栅格组件的本质是：将组件划分为有规律的多列，通过调整【不同断点】下的【栅格组件的列数】，及【子组件所占列数】实现不同布局核心用法：//行GridRow(属性){//列GridCol(属性){}}使同一组件在不同的宽度下，例如手机，平板，电脑占不同的份数（可以理解为不同的像素点），使其布局排版更加合理和美观完整示例代码如下：@Entry@ComponentstructDemo12{@Statecur
鸿蒙HarmonyOS （开发进阶）声明式UI中实现组件动态创建取什么名字好呢~ OpenHarmony 鸿蒙开发 HarmonyOS harmonyos 华为鸿蒙 android 前端 ui
鸿蒙NEXT开发实战往期必看文章：一分钟了解”纯血版！鸿蒙HarmonyOSNext应用开发！“非常详细的”鸿蒙HarmonyOSNext应用开发学习路线！（从零基础入门到精通）HarmonyOSNEXT应用开发案例实践总结合（持续更新......）HarmonyOSNEXT应用开发性能优化实践总结（持续更新......）简介为了解决页面、组件加载缓慢的问题，ArkUI框架提供了动态操作以实现组件
HarmonyOS Next～鸿蒙系统开发类Kit深度解析与应用实践 Bruce_xiaowei 总结经验笔记 harmonyos 华为
HarmonyOSNext～鸿蒙系统开发类Kit深度解析与应用实践鸿蒙系统（HarmonyOS）凭借其分布式架构和全场景能力，为开发者提供了丰富的开发类Kit。本文将从安全、网络、基础功能、硬件及调测五大类Kit展开，深入探讨其核心技术与实践应用。一、安全类Kit开发：构建可信赖的分布式安全体系分布式安全架构基于微内核的TEE（可信执行环境）确保核心系统安全，隔离敏感操作。代码示例：设备间安全握手
【赵渝强老师】Oracle的闪回版本查询数据库oracle
Oracle数据库的闪回版本查询（FlashbackVersionQuery）提供了一个审计行改变的查询功能，通过它可以查找到所有已经提交了的行记录。视频讲解如下：https://www.bilibili.com/video/BV1RXDUYbE3E/?aid=113441478087...一、闪回版本查询简介使用闪回版本查询可以获取在给定的时间区间中，指定的行的不同版本。当commit语句被执行
Linux系统下通过RPM方式安装Oracle数据库后青春期的诗go 服务器操作系统实战资料数据库 linux oracle
操作系统版本：CentOS7.6-x86-64数据库版本：Oracle18c(18.3)数据库安装程序：oracle-database-ee-18c-1.0-1.x86_64.rpm（网盘链接地址：百度网盘请输入提取码）数据库安装依赖包：compat-libstdc++-33-3.2.3-72.el7.x86_64.rpm（网盘链接地址:https://pan.baidu.com/s/12pIS7
详解Http：在QT中使用Http协议小宋要上岸 http 网络协议网络
目录一、HTTP概述1、主要特点2、HTTP方法3、HTTP状态码4、HTTP头部5、HTTP的工作原理二、在Qt中使用HTTP1、发送简单的HTTP请求2、发送POST请求3、处理异步请求4、使用QSslConfiguration进行HTTPS5、处理JSON响应6、处理错误三、总结一、HTTP概述HTTP（HypertextTransferProtocol，超文本传输协议）是一种用于客户端和服
Elasticsearch架构原理与底层设计：深入解析分布式架构、索引结构与高并发高可用机制一碗黄焖鸡三碗米饭 elasticsearch 架构分布式搜索引擎大数据 java 后端
Elasticsearch架构原理与底层设计：深入解析分布式架构、索引结构与高并发高可用机制在现代的搜索引擎和数据存储应用中，Elasticsearch是一个广泛使用的分布式搜索引擎，它基于ApacheLucene构建，提供强大的全文检索能力以及高效的分布式存储和检索能力。作为一款开源工具，Elasticsearch不仅仅是搜索引擎，它还可以用于日志存储、实时分析、监控以及各种数据查询需求。本文将
HTTP 核心知识点整理 Yvsanf 计算机网络 http 网络协议网络
1.HTTP基础定义：HTTP（HyperTextTransferProtocol）是应用层协议，基于请求-响应模型，用于客户端（浏览器）与服务器之间的通信。特点：无状态：每次请求独立，服务器不保留客户端状态（通过Cookie/Session解决）。明文传输（HTTP）vs加密传输（HTTPS）。默认端口：HTTP（80），HTTPS（443）。2.HTTP方法（Methods）方法描述幂等性安全
Mybatis-plus 开发规范教程花海没有七里香 Java java spring boot
Mybatis-plus开发教程IService使用首先要写一个mapper类继承mybatis-plus的BaseMapper不需要写入@Mapper注解publicinterfaceUserMapperextendxBaseMapper{//以下为自定义方法可以为空IPagegetList(@Param("page")Pagepage,@Param("data")Userdata);}serv
前端直接导出excel文件库库的写代码 js 前端 excel
文章目录前言一、插件方式1.插件安装2.引入3.导出二、本地直接导出1.页面规则2.在JS中添加函数3.调用前言开发中可能会有这样的需求，本地自己生成了一个表格，此时表格并没有上传到后台服务器上，所以无法通过接口进行下载，此时就需要前端自行处理了。一、插件方式1.插件安装npmixlsxnpmifile-saver2.引入//index.vue文件importFileSaverfrom"file-
DeepSeek超长文本处理的分块策略瑾书2021 数据结构
难点：处理10万token以上文本时内存溢出，且语义连贯性下降。技术方案：递归分块算法pythondefrecursive_chunking(text,chunk_size=4096):iflen(text)<=chunk_size:return[text]mid=len(text)//2returnrecursive_chunking(text[:mid],chunk_size)+recursi
Web编辑器与Word文档的无缝对接技巧全武凌(荆门泽优) 前端编辑器 word umeditor粘贴word ueditor粘贴word ueditor复制word ueditor上传word图片
要求：开源，免费，技术支持编辑器：百度ueditor前端：vue2,vue3,vue-cli,react,html5用户体验：Ctrl+V快捷键操作功能：导入Word,导入Excel,导入PPT(PowerPoint),导入PDF,复制粘贴word,导入微信公众号内容,web截屏平台：Windows,macOS,Linux,RedHat,CentOS,Ubuntu,中标麒麟,银河麒麟,统信UOS,
Excel 单元格内存陷阱：原因分析与解决方案 pythonexcel
在使用Excel进行数据处理时，你是否遇到过这样的情况：明明表格看起来很简洁，但文件却异常庞大，甚至操作起来非常卡顿？这很可能是由于单元格内存陷阱导致的。以下是我对这一问题的一些分析和建议解决方案。原因分析单元格内存陷阱通常由以下几个原因引起：隐藏的空白单元格：Excel中可能存在大量看似空白的单元格，但实际上这些单元格可能包含格式、注释或数据验证规则，这些都会占用内存。不必要的格式：过多的单元格
针对Word文档，百度编辑器提供了哪些便捷的上传与粘贴功能？ 2501_90646449 umeditor粘贴word ueditor粘贴word ueditor复制word ueditor上传word图片 ueditor导入word ueditor导入pdf ueditor导入ppt
要求：开源，免费，技术支持编辑器：百度ueditor前端：vue2,vue3,vue-cli,react,html5用户体验：Ctrl+V快捷键操作功能：导入Word,导入Excel,导入PPT(PowerPoint),导入PDF,复制粘贴word,导入微信公众号内容,web截屏平台：Windows,macOS,Linux,RedHat,CentOS,Ubuntu,中标麒麟,银河麒麟,统信UOS,
Golang轻松实现消息模板变量替换：text/template 怪力乌龟 golang golang 开发语言后端
text/template是Go语言标准库中的一个包，用于生成文本输出。它通过解析模板并根据给定的数据执行模板来生成最终的文本。text/template提供了强大的模板引擎，支持条件判断、循环、变量替换等功能。基本概念模板：模板是一个文本文件或字符串，其中包含一些特殊的占位符或控制结构，用于动态生成内容。数据：数据是一个Go语言的结构体、映射或其他数据结构，模板引擎会根据这些数据来填充模板中的占
SYSAUX表空间WRH$_ACTIVE_SESSION_HISTORY占用空间过大的清理办法 jcsx 数据库 oracle
SYSAUX表空间WRH$_ACTIVE_SESSION_HISTORY占用空间过大的清理办法一、查看@$ORACLE_HOME/rdbms/admin/awrinfo.sql一般是truncate旧分区。查看snapshotsqlplus/assysdbasetlinesize1000;setpagesize200;colbegin_interval_timeformata30;colend_i
多模态生成｜细粒度控制+跨模态并行：创作耗时直降65%！百度突破AIGC精度瓶颈 CodePatentMaster 百度 AIGC
一、技术原理深度剖析痛点定位：当前多模态内容生成存在两大瓶颈：控制粒度粗糙：用户指令只能作用于整体素材（如整段文本/整张图片）模态协同低效：跨模态对齐耗时长（文本-图像对齐延迟>800ms）算法突破：基于专利CN202411604325.0的核心公式：C_{output}=\sum_{i=1}^n\alpha_i\cdot\text{Attn}(E_m(S_i),E_u(I_j))（其中SiS_i
Stable Diffusion 1 - 初识跑通文字生成图片知识搬运bot LLM &AIGC stable diffusion
LLM、AIGC、RAG开发交流裙：377891973文章目录关于StableDiffusionLexica代码实现安装依赖库登陆huggingface查看huggingfacetoken下载模型计算生成设置宽高测试迭代次数生成多列图片关于StableDiffusionAlatenttext-to-imagediffusionmodelStableDiffusion是一个文本到图像的潜在扩散模型，
Java开发中，spring mvc 的线程怎么调用？小麦麦子 spring mvc
今天逛知乎，看到最近很多人都在问spring mvc 的线程http://www.maiziedu.com/course/java/ 的启动问题，觉得挺有意思的，那哥们儿问的也听仔细，下面的回答也很详尽，分享出来，希望遇对遇到类似问题的Java开发程序猿有所帮助。问题：在用spring mvc架构的网站上，设一线程在虚拟机启动时运行，线程里有一全局
maven依赖范围 bitcarter maven
1.test 测试的时候才会依赖，编译和打包不依赖，如junit不被打包 2.compile 只有编译和打包时才会依赖 3.provided 编译和测试的时候依赖，打包不依赖，如：tomcat的一些公用jar包 4.runtime 运行时依赖，编译不依赖 5.默认compile 依赖范围compile是支持传递的，test不支持传递 1.传递的意思是项目A，引用
Jaxb org.xml.sax.saxparseexception : premature end of file darrenzhu xml premature JAXB
如果在使用JAXB把xml文件unmarshal成vo(XSD自动生成的vo)时碰到如下错误： org.xml.sax.saxparseexception : premature end of file 很有可能时你直接读取文件为inputstream，然后将inputstream作为构建unmarshal需要的source参数。InputSource inputSource = new In
CSS Specificity 周凡杨 html 权重 Specificity css
有时候对于页面元素设置了样式，可为什么页面的显示没有匹配上呢？ because specificity CSS 的选择符是有权重的，当不同的选择符的样式设置有冲突时，浏览器会采用权重高的选择符设置的样式。规则： HTML标签的权重是1 Class 的权重是10 Id 的权重是100
java与servlet g21121 servlet
servlet 搞java web开发的人一定不会陌生，而且大家还会时常用到它。下面是java官方网站上对servlet的介绍： java官网对于servlet的解释写道 Java Servlet Technology Overview Servlets are the Java platform technology of choice for extending and enha
eclipse中安装maven插件 510888780 eclipse maven
1.首先去官网下载 Maven： http://www.apache.org/dyn/closer.cgi/maven/binaries/apache-maven-3.2.3-bin.tar.gz 下载完成之后将其解压，我将解压后的文件夹：apache-maven-3.2.3，并将它放在 D:\tools目录下，即 maven 最终的路径是：D:\tools\apache-mave
jpa@OneToOne关联关系布衣凌宇 jpa
Nruser里的pruserid关联到Pruser的主键id，实现对一个表的增删改，另一个表的数据随之增删改。 Nruser实体类 //***************************************************************** @Entity @Table(name="nruser") @DynamicInsert @Dynam
我的spring学习笔记11-Spring中关于声明式事务的配置 aijuans spring 事务配置
这两天学到事务管理这一块，结合到之前的terasoluna框架，觉得书本上讲的还是简单阿。我就把我从书本上学到的再结合实际的项目以及网上看到的一些内容，对声明式事务管理做个整理吧。我看得Spring in Action第二版中只提到了用TransactionProxyFactoryBean和<tx:advice/>,定义注释驱动这三种，我承认后两种的内容很好，很强大。但是实际的项目当中
java 动态代理简单实现 antlove java handler proxy dynamic service
dynamicproxy.service.HelloService package dynamicproxy.service; public interface HelloService { public void sayHello(); } dynamicproxy.service.impl.HelloServiceImpl package dynamicp
JDBC连接数据库百合不是茶 JDBC编程 JAVA操作oracle数据库
如果我们要想连接oracle公司的数据库，就要首先下载oralce公司的驱动程序，将这个驱动程序的jar包导入到我们工程中; JDBC链接数据库的代码和固定写法; 1,加载oracle数据库的驱动; &nb
单例模式中的多线程分析 bijian1013 java thread 多线程 java多线程
谈到单例模式，我们立马会想到饿汉式和懒汉式加载，所谓饿汉式就是在创建类时就创建好了实例，懒汉式在获取实例时才去创建实例，即延迟加载。饿汉式： package com.bijian.study; public class Singleton { private Singleton() { } // 注意这是private 只供内部调用 private static
javascript读取和修改原型特别需要注意原型的读写不具有对等性 bijian1013 JavaScript prototype
对于从原型对象继承而来的成员，其读和写具有内在的不对等性。比如有一个对象A，假设它的原型对象是B，B的原型对象是null。如果我们需要读取A对象的name属性值，那么JS会优先在A中查找，如果找到了name属性那么就返回；如果A中没有name属性，那么就到原型B中查找name，如果找到了就返回；如果原型B中也没有
【持久化框架MyBatis3六】MyBatis3集成第三方DataSource bit1129 dataSource
MyBatis内置了数据源的支持，如： <environments default="development"> <environment id="development"> <transactionManager type="JDBC" /> <data
我程序中用到的urldecode和base64decode,MD5 bitcarter c MD5 base64decode urldecode
这里是base64decode和urldecode，Md5在附件中。因为我是在后台所以需要解码： string Base64Decode(const char* Data,int DataByte,int& OutByte) { //解码表 const char DecodeTable[] = { 0, 0, 0, 0, 0, 0
腾讯资深运维专家周小军：QQ与微信架构的惊天秘密 ronin47
社交领域一直是互联网创业的大热门，从PC到移动端，从OICQ、MSN到QQ。到了移动互联网时代，社交领域应用开始彻底爆发，直奔黄金期。腾讯在过去几年里，社交平台更是火到爆，QQ和微信坐拥几亿的粉丝，QQ空间和朋友圈各种刷屏，写心得，晒照片，秀视频，那么谁来为企鹅保驾护航呢？支撑QQ和微信海量数据背后的架构又有哪些惊天内幕呢？本期大讲堂的内容来自今年2月份ChinaUnix对腾讯社交网络运营服务中心
java-69-旋转数组的最小元素。把一个数组最开始的若干个元素搬到数组的末尾，我们称之为数组的旋转。输入一个排好序的数组的一个旋转，输出旋转数组的最小元素 bylijinnan java
public class MinOfShiftedArray { /** * Q69 旋转数组的最小元素 * 把一个数组最开始的若干个元素搬到数组的末尾，我们称之为数组的旋转。输入一个排好序的数组的一个旋转，输出旋转数组的最小元素。 * 例如数组{3, 4, 5, 1, 2}为{1, 2, 3, 4, 5}的一个旋转，该数组的最小值为1。 */ publ
看博客，应该是有方向的 Cb123456 反省看博客
看博客，应该是有方向的: 我现在就复习以前的，在补补以前不会的，现在还不会的，同时完善完善项目，也看看别人的博客. 我刚突然想到的: 1.应该看计算机组成原理，数据结构，一些算法，还有关于android,java的。 2.对于我，也快大四了，看一些职业规划的，以及一些学习的经验，看看别人的工作总结的. 为什么要写
[开源与商业]做开源项目的人生活上一定要朴素,尽量减少对官方和商业体系的依赖 comsci 开源项目
为什么这样说呢？因为科学和技术的发展有时候需要一个平缓和长期的积累过程，但是行政和商业体系本身充满各种不稳定性和不确定性，如果你希望长期从事某个科研项目，但是却又必须依赖于某种行政和商业体系，那其中的过程必定充满各种风险。。。所以，为避免这种不确定性风险，我
一个 sql优化（[精华] 一个查询优化的分析调整全过程！很值得一看） cwqcwqmax9 sql
见 http://www.itpub.net/forum.php?mod=viewthread&tid=239011 Web翻页优化实例提交时间: 2004-6-18 15:37:49 回复发消息环境： Linux ve
Hibernat and Ibatis dashuaifu Hibernate ibatis
Hibernate VS iBATIS 简介 Hibernate 是当前最流行的O/R mapping框架，当前版本是3.05。它出身于sf.net，现在已经成为Jboss的一部分了 iBATIS 是另外一种优秀的O/R mapping框架，当前版本是2.0。目前属于apache的一个子项目了。相对Hibernate“O/R”而言，iBATIS 是一种“Sql Mappi
备份MYSQL脚本 dcj3sjt126com mysql
#!/bin/sh # this shell to backup mysql #1413161683@qq.com (QQ:1413161683 DuChengJiu) _dbDir=/var/lib/mysql/ _today=`date +%w` _bakDir=/usr/backup/$_today [ ! -d $_bakDir ] && mkdir -p
iOS第三方开源库的吐槽和备忘 dcj3sjt126com ios
转自 ibireme的博客做iOS开发总会接触到一些第三方库，这里整理一下，做一些吐槽。目前比较活跃的社区仍旧是Github，除此以外也有一些不错的库散落在Google Code、SourceForge等地方。由于Github社区太过主流，这里主要介绍一下Github里面流行的iOS库。首先整理了一份 Github上排名靠
html wlwmanifest.xml eoems html xml
所谓优化wp_head()就是把从wp_head中移除不需要元素，同时也可以加快速度。步骤：加入到function.php remove_action('wp_head', 'wp_generator'); //wp-generator移除wordpress的版本号，本身blog的版本号没什么意义，但是如果让恶意玩家看到，可能会用官网公布的漏洞攻击blog remov
浅谈Java定时器发展 hacksin java 并发 timer 定时器
java在jdk1.3中推出了定时器类Timer,而后在jdk1.5后由Dou Lea从新开发出了支持多线程的ScheduleThreadPoolExecutor，从后者的表现来看，可以考虑完全替代Timer了。 Timer与ScheduleThreadPoolExecutor对比： 1. Timer始于jdk1.3,其原理是利用一个TimerTask数组当作队列
移动端页面侧边导航滑入效果 ini jquery Web html5 css javascirpt
效果体验：http://hovertree.com/texiao/mobile/2.htm可以使用移动设备浏览器查看效果。效果使用到jquery-2.1.4.min.js，该版本的jQuery库是用于支持HTML5的浏览器上，不再兼容IE8以前的浏览器，现在移动端浏览器一般都支持HTML5，所以使用该jQuery没问题。HTML文件代码： <!DOCTYPE html> <h
AspectJ+Javasist记录日志 kane_xie aspectj javasist
在项目中碰到这样一个需求，对一个服务类的每一个方法，在方法开始和结束的时候分别记录一条日志，内容包括方法名，参数名+参数值以及方法执行的时间。 @Override public String get(String key) { // long start = System.currentTimeMillis(); // System.out.println("Be
redis学习笔记 MJC410621 redis NoSQL
1)nosql数据库主要由以下特点：非关系型的、分布式的、开源的、水平可扩展的。 1，处理超大量的数据 2，运行在便宜的PC服务器集群上， 3，击碎了性能瓶颈。 1)对数据高并发读写。 2)对海量数据的高效率存储和访问。 3)对数据的高扩展性和高可用性。 redis支持的类型： Sring 类型 set name lijie get name lijie set na
使用redis实现分布式锁 qifeifei
在多节点的系统中，如何实现分布式锁机制，其中用redis来实现是很好的方法之一，我们先来看一下jedis包中，有个类名BinaryJedis,它有个方法如下： public Long setnx(final byte[] key, final byte[] value) { checkIsInMulti(); client.setnx(key, value); ret
BI并非万能，中层业务管理报表要另辟蹊径张老师的菜大数据 BI 商业智能信息化
BI是商业智能的缩写，是可以帮助企业做出明智的业务经营决策的工具，其数据来源于各个业务系统，如ERP、CRM、SCM、进销存、HER、OA等。 BI系统不同于传统的管理信息系统，他号称是一个整体应用的解决方案，是融入管理思想的强大系统：有着系统整体的设计思想，支持对所有
安装rvm后出现rvm not a function 或者ruby -v后提示没安装ruby的问题 wudixiaotie function
1.在~/.bashrc最后加入 [[ -s "$HOME/.rvm/scripts/rvm" ]] && source "$HOME/.rvm/scripts/rvm" 2.重新启动terminal输入： rvm use ruby-2.2.1 --default 把当前安装的ruby版本设为默