husn

搜索引擎面面观

搜索引擎面面观技术系列之一

因特网的迅猛发展、WEB信息的增加，用户要在信息海洋里查找信息，就像大海捞针一样，搜索引擎技术恰好解决了这一难题，它可以为用户提供信息检索服务。目前，搜索引擎技术正成为计算机工业界和学术界争相研究、开发的对象。

搜索引擎（Search Engine）是随着WEB信息的迅速增加，从1995年开始逐渐发展起来的技术。

据发表在《科学》杂志1999年7月的文章《WEB信息的可访问性》估计，全球目前的网页超过8亿，有效数据超过9TB，并且仍以每4个月翻一番的速度增长。例如，Google目前拥有10亿个网址，30亿个网页，3.9 亿张图像，Google支持66种语言接口，16种文件格式，面对如此海量的数据和如此异构的信息，用户要在里面寻找信息，必然会“大海捞针”无功而返。

搜索引擎正是为了解决这个“迷航”问题而出现的技术。搜索引擎以一定的策略在互联网中搜集、发现信息，对信息进行理解、提取、组织和处理，并为用户提供检索服务，从而起到信息导航的目的。

目前，搜索引擎技术按信息标引的方式可以分为目录式搜索引擎、机器人搜索引擎和混合式搜索引擎；按查询方式可分为浏览式搜索引擎、关键词搜索引擎、全文搜索引擎、智能搜索引擎；按语种又分为单语种搜索引擎、多语种搜索引擎和跨语言搜索引擎等。

目录式搜索引擎

目录式搜索引擎（Directory Search Engine）是最早出现的基于ＷＷＷ的搜索引擎，以雅虎为代表，我国的搜狐也属于目录式搜索引擎。

目录式搜索引擎由分类专家将网络信息按照主题分成若干个大类，每个大类再分为若干个小类，依次细分，形成了一个可浏览式等级主题索引式搜索引擎，一般的搜索引擎分类体系有五六层，有的甚至十几层。

目录式搜索引擎主要通过人工发现信息，依靠编目员的知识进行甄别和分类。由于目录式搜索引擎的信息分类和信息搜集有人的参与，因此其搜索的准确度是相当高的，但由于人工信息搜集速度较慢，不能及时地对网上信息进行实际监控，其查全率并不是很好，是一种网站级搜索引擎。

机器人搜索引擎

机器人搜索引擎通常有三大模块：信息采集、信息处理、信息查询。信息采集一般指爬行器或网络蜘蛛，是通过一个URL列表进行网页的自动分析与采集。起初的URL并不多，随着信息采集量的增加，也就是分析到网页有新的链接，就会把新的URL添加到URL列表，以便采集。

机器人搜索引擎使用多线程并发搜索技术，主要完成文档访问代理、路径选择引擎和访问控制引擎。基于机器人搜索引擎的Web页搜索模块主要由URL服务器、爬行器、存储器、URL解析器四大功能部件和资源库、锚库、链接库三大数据资源构成，另外还要借助标引器的一个辅助功能。

具体过程是，URL服务器发送要去抓取的URL，爬行器根据URL抓取WEB页并送给存储器，存储器压缩Web页并存入数据资源库，然后由标引器分析每个WEB页的所有链接并把相关的重要信息存储在锚库文件中。URL解析器读锚库文件并解析URL，然后依次转成docID。再把锚库中文本变成顺排索引，送入索引库。具体过程如图1所示。

元搜索引擎

元搜索引擎，也叫集搜索引擎，是指在统一的的用户查询界面与信息反馈的形式下，共享多个搜索引擎的资源库为用户提供信息服务的系统。元搜索引擎是对搜索引擎进行搜索的搜索引擎。

元搜索与一般搜索引擎的最大不同在于它可以没有自己的资源库和机器人，它充当一个中间代理的角色，接受用户的查询请求，将请求翻译成相应搜索引擎的查询语法。在向各个搜索引擎发送查询请求并获得反馈之后，首先进行综合相关度排序，然后将整理抽取之后的查询结果返回给用户。元搜索引擎查全率高、搜索范围更多更大，查准率也并不低。

元搜索引擎包括Web服务器、结果数据库、检索式处理、Web处理接口、结果生成等几个部分，其中用户通过Web服务器访问元搜索引擎，而元搜索引擎则通过Web处理接口访问其它外部的搜索引擎。其系统结构如图2所示。

用户通过WWW服务访问元搜索引擎，向Web服务器提交检索式。当Web服务器收到查询请求时，先访问结果数据库，查看近期是否有相同的检索，如果有则直接返回保存的结果，完成查询；如果没有相同的检索，就分析检索式并转化成与所要查找各搜索引擎相应的检索式格式，然后送至Web处理接口模块。

Web处理接口通过并行的方式同时查询多个搜索引擎，把所有的结果集中到一起。根据各搜索引擎的重要性，以及所得结果的相关度，对结果进行抽取并排序，生成最终结果返回给用户。同时，把结果存到自己的数据库里，以备下次查询参考使用。

跨语言搜索引擎

跨语言综合搜索引擎是在一般的搜索引擎基础上加了两个功能：不同语言提问之间的翻译和不同搜索引擎检索结果的集成。跨语言搜索引擎有两种情况，一种是架构在单一搜索引擎的基础上，另一种是架构在多搜索引擎的基础上。

目前研究最多的是跨语言文本检索和跨语言语音检索。跨语言检索主要涉及信息检索和机器翻译两个领域的知识，但又不是这两种技术的简单融合。跨语言检索系统的检索功能，可以利用现有的检索系统来实现，也可以重新构造新的检索系统或检索功能模块来实现。

跨语言搜索引擎的工作过程如下：用户向系统提交检索词，形成一个源语言的搜索式，系统对搜索式进行语言识别，识别出语种后，就对进行提问式的词法分析和结构分析，然后把这个分析过的搜索式翻译成各种语言的搜索式，最后把这一系列的搜索式提交给系统进行检索就可以了。

检索结果是含有多个语种的页面。如果使用多搜索引擎，转换成不同语言搜索式时还需要注意各种搜索引擎搜索式表达方法的不同。例如，新浪网搜索中文信息的结果比较好，那么就把提问词是中文的搜索式转换成新浪网的搜索式；雅虎对英文信息的搜索结果比较好，那么就向雅虎提交提问词是英文的搜索式。

关于多语种搜索有这样几种情况：检索词为不同语种，检索结果也不同，这种情况是不经过翻译的，对搜索引擎来讲是不区分的。比如在Google里输入“知识发现 knowledge”，选择所有语种，那么只要网页里既有“知识发现”又有“knowledge”就可以检索出来，不管该页面是中文的，还是英文或者是日文的，搜索引擎并不识别检索词的语种，这不是真正的跨语言搜索引擎。第二种情况是，检索词为同一语种，检索结果为不同语种。

本期我们介绍了常用的搜索引擎技术，下期，我们将介绍搜索引擎技术的发展和趋势，内容主要包括：智能搜索引擎、基于智能代理的信息过滤、并行信息检索技术、分布式搜索引擎等。

搜索引擎技术发展观系列之二

随着“眼球经济”席卷互联网，成千上万的资金迅速流向最能吸引眼球的搜索引擎市场。有大量调查显示搜索引擎市场正处在高速发展时期，成为未来几年最具发展潜力的产业之一。

当你登录某一个网站，在互联网上搜索某一类内容，希望得到最新、最全面的信息，你需要等待多长时间？

几年前，人们希望十几秒，最多30秒钟就能得到结果，而现在的期望值是1～2秒，也就是说，伴随鼠标的“咔哒”一声，显示屏的页面已经变，排在最前面的十几、二十条信息的标题已经出现在你的面前。

目前，搜索引擎技术成为仅次于门户的互联网第二大核心技术，要用到信息检索、人工智能、计算机网络、分布式处理、数据库、数据挖掘、数字图书馆、自然语言处理等多领域的理论和技术，所以具有综合性和挑战性。伴随互联网的普及和网上信息的爆炸式增长，它越来越引起人们的重视。

上期我们介绍了传统的几种搜索引擎技术，那么未来搜索引擎技术将如何发展？随着人工智能技术的进一步成熟和信息服务的多样化，搜索引擎向着智能化、个性化方向发展。

检索结果深加工

用户在使用搜索引擎进行信息搜索时，有时并不十分关注返回结果的多少，而是看检索结果是符合自己的需求。对于一次普通查询，传统的搜索引擎动辄几十万、几百万篇文档，这样的搜索结果是没有多大意义的。

解决检索结果过多过杂的问题，目前有多种方法。一是通过各种方法获得用户没有在检索式表达出来的真正目的，包括智能代理跟踪用户检索行为，分析用户操作模型，使用相关反馈机制，确定文档和用户需求的相关性，提高检索的精度。二是用文本分类技术，将结果分类，使用可视化技术显示分类结构，用户只浏览自己感兴趣的类别。三是进行站点聚类或内容聚类，减少信息的总量，从而有利于从大量返回结果中找到用户所需要的信息。

提供个性化服务

为了实现个性化服务，需要获取用户兴趣信息。获取用户的兴趣信息，有两种方法。在训练阶段，用信息论的观点对关键词分类并表示其特征程度（关键词按贡献率分为积极特征词、消极特征词和零特征词），然后定义标题的特征程度，并对各类特征词进行统计。

在测试阶段，应用兴趣描述文件（通常以XML文件格式存储），动态获取用户的兴趣从而把用户感兴趣的页面提供给用户。这种方法避免了用户描述兴趣的困难。用户很难描述兴趣，但可以判断一篇文章是否符合需要。

另一种方法是可以根据用户的书签文件以及每次检索输入的关键词、用户的反映来动态更新用户的兴趣。通过分析用户行为的意图，获取用户感兴趣的相关信息及感兴趣的感性程度。另外，用户输入的关键词也作为积极特征词来动态更新用户兴趣文件。

基于智能搜索

搜索引擎的智能化方向发展是毫无疑问的。智能搜索引擎(Smart Hunter)　是根据目前搜索引擎的发展趋势，除提供传统的全网快速检索、相关度排序等功能外，还提供用户角色登记、用户兴趣自动识别、内容的语义理解、智能化信息过滤和推送等功能，为用户提供一个真正个性化、智能化的网络信息搜集工具（见图示）。

智能搜索引擎利用神经网络、决策树、关联规则、范例推理、模糊聚类、粗糙集、隐马尔科夫模型等技术实现分布式并行检索，以数据挖掘与知识发现为主要手段，加上自然语言理解技术，对检索结果进行进一步的分析，滤掉与用户需求不相关或弱相关的信息，从而提高系统性能和检索的精度与效果。

1.自然语言检索
智能搜索引擎基于自然语言的检索形式，是建立在大规模的知识库基础上，用一个强有力的推理机，根据用户所提供的以自然语言表达的检索要求进行分析，然后形成检索策略进行搜索。用户只需把自己的要求输入计算机，就可以得到检索结果，使用户可以从繁琐的检索规则中解脱出来。

自然语言查询从用户接口上分为两种：
一种是输入自然语言的句子，把它切分并抽出多对组词，构成一个有限状态机，然后去数据库进行匹配，对每一次检索出的记录进行频率累加，经过几次检索后，按照命中频率进行排序，把最终的检索结果返回给用户。这只是对查询请求进行了自然语言分析。
另外一种是对目标文档也进行自然语言分析，这不仅涉及到分词技术、词法分析、语法分析、语义分析，还涉及到篇章结构的分析，就是要理解文章的意思，技术难度较大，目前还基本没有成功的模型。

2.移动代理技术。
移动代理(Mobile Agent)技术是一种新型分布式计算技术，是指在网络上具有移动能力的、能够自主运行的、按照用户的要求完成指定任务的程序。

移动代理技术是新一代分布式计算技术，移动代理与传统分布式计算技术完全不同。在移动代理模式下，客户机向服务器提交的不再是一些简单的请求，而是包含代码和数据的移动对象。移动对象代表用户，按照“程序靠近数据”的原则，在服务器间自主的移动，完成数据处理的任务。

基于移动代理的模式之上的应用程序可以大大节省网络带宽，有效克服网络延时带来的种种问题，可以智能化地自主异步执行。它克服了搜索引擎传统的“数据靠近程序”的运行模式，大大降低了网络的数据流量，节省了网络资源。

3．并行检索。
并行信息检索是由多个可同时工作的处理部件或处理器构成的计算机系统进行信息检索。信息检索系统可以利用的并行策略有任务并行、数据并行和它们的混合方式。并行信息检索把信息搜索过程建立在神经网络之上。

如果不用神经网络，那就主要利用现有的信息检索算法对数据和计算进行分割。

数据分割有逻辑文档分割与物理文档分割两种形式。逻辑文档分割需要对倒排文件进行扩展，让每个并行进程能够直接访问一部分索引，这些索引对应于处理器所要处理的那部分文档子集；物理文档分割把文档分割为离散的、自包含的文档子集，每个子集对应一个并行处理器，每个子集有自己的倒排档文件。

4．分布式检索。
分布式搜索引擎把信息通过网络物理的分布存储和维护，把更大范围的分布、异构文档集联合起来，形成一个逻辑整体，为用户提供分布的信息检索。

分布文档集除了大量的文本以外，还包括其它类型的数据：图形、图像、视频、音频等多媒体数据。分布信息检索的目标就是按照一致的信息描述，标识和检索分布文档集。分布信息搜集工具引导用户进入分布式的信息空间，选择合适的文档集，并进行检索。

搜索引擎涉及人工智能、计算机网络、分布式处理、并行计算、数据挖掘、知识发现、自然语言处理等多项技术，富有综合性和挑战性。随着这些技术的进一步发展，不断提高性能，更好满足用户需求的搜索引擎也必将出现。

大看台

搜索引擎使用技巧

◆ 使用逻辑词辅助查找
常用逻辑词有：AND（和）、OR（或）、NOT（否，有些是AND NOT）及NEAR（两个单词的靠近程度）。

◆ 使用双引号进行精确查找
如果查找的是一个词组或多个汉字，最好的办法就是将它们用双引号括起来。

◆ 使用加减号限定查找
在搜索词前冠以加号“+”限定搜索结果中必须包含的词汇，用减号“-”限定搜索结果不能包含的词汇。

◆ 区分字母大小写
许多搜索引擎都区分字母的大小写，应该正确使用它们的大小写字母形式。

◆ 限制查询范围
范围限制的能力越强，则越能准确地找到需要的信息。

◆ 尽量少用空格
在输入汉字作关键词的时候，不要在汉字后追加不必要的空格，因为空格将被认作特殊操作符，其作用与AND一样。

◆ 从页面上部或底部寻找作者姓名、组织机构名称或公司名称

Docker Swarm 和 docker composer 需要的yaml 文件有什么区别 come11234 docker composer eureka
DockerCompose和DockerSwarm都使用YAML文件来定义服务、网络和卷的配置，但它们的YAML文件格式和功能有一些关键区别。以下是它们的主要区别：1.文件格式DockerCompose：使用docker-compose.yml文件。支持的版本号通常为2.x或3.x。主要用于单机环境，用于快速启动和管理多个容器。支持build、ports、volumes等指令，用于开发和测试环境。
Ajax 入门级晚枫~ Ajax ajax
AJAX全称：AsynchronousJavascriptAndXML（异步JS和XML）XML可扩展标记语言AJAX优缺点优点：可以无需刷新页面而与服务器端进行通信。允许你根据用户事件来更新部分页面内容。（事件：表单事件、文档事件、鼠标事件、键盘事件）缺点：没有浏览历史，不能回退存在跨域问题（同源）SEO不友好（SEO：搜索引擎优化）Express：基于node.js平台，快速、开放、极简的we
面试的时候问到了HTML5的新特性有哪些申朝先生前端面试问题 html5 信息可视化前端
HTML5是对HTML的重要更新，它引入了许多新特性和改进，使Web开发变得更加灵活和强大。以下是一些HTML5的关键新特性：1.新的文档结构元素HTML5引入了一些新的语义化元素，帮助开发者更清晰地结构化网页内容，改善了可访问性和SEO。：定义文档的头部区域，通常包含标题、导航等。：定义文档的底部区域，通常包含版权、联系信息等。：表示一个独立的内容块，通常可以被单独分发或重用（如博客文章、新闻报
MSTP与链路聚合技术 π大星星️ 运维
MSTP（多生成树协议）简介MSTP（多生成树协议）是SpanningTreeProtocol（STP）的改进版，支持网络中使用多条生成树，并根据用户需求限制生成树间的路径。MSTP将多个VLAN映射到一棵生成树上，允许在拓扑不变的情况下使用多条路径，提高了网络的可用性和带宽利用率。核心概念实例（Instance）：一个或多个VLAN的集合。一个交换网络可针对一个实例创建一棵树，提高链路利用率，避
【揭秘】什么是AI写作？AI写作是助手还是威胁？ ychenhub AIGC AI写作 AIGC AI写作 ai写作
什么是AI写作？AI写作是指利用人工智能技术，特别是自然语言处理（NLP）和机器学习（ML）技术，结合深度学习算法，通过大规模语料库和预训练模型来模仿和生成人类语言文本内容的过程。它通过分析大量的语言数据、学习语言的模式、规律和结构，从而能够掌握语法、词汇、句子结构等语言要素，并生成与输入数据相似或符合特定需求的文本内容。AI写作可以应用于多种场景，如新闻报道、广告文案、社交媒体推文、小说创作、诗
DeepSeek混合专家架构突破AI高性价变革智能计算研究中心其他
内容概要DeepSeek近期推出的混合专家架构AI系统，通过670亿参数规模与多模态能力整合，实现了技术架构与功能应用的双重突破。该架构采用模块化设计策略，将语言模型拆分为多个专业化子网络，在保持运算效率的同时，显著提升了多语言处理与视觉语言联合理解能力。从技术参数看，系统单次推理能耗较传统稠密模型降低37%，而上下文窗口扩展至32ktokens，为复杂任务处理提供硬件级优化基础。架构特性传统架构
【C语言指南】循环嵌套的实现基础倔强的小石头_ C语言 c语言 java 前端
目录引言C语言循环嵌套基础循环嵌套的实现案例引言在编程的广袤宇宙中，C语言无疑占据着举足轻重的地位。它诞生于20世纪70年代，历经岁月的洗礼，至今依然是众多程序员的首选语言之一。C语言以其高效、灵活、可移植性强等特点，广泛应用于操作系统开发、嵌入式系统、游戏开发等众多领域。许多著名的操作系统，如Unix、Linux，其内核部分大量使用C语言编写，这充分彰显了C语言在底层系统编程中的强大优势。在C语
【C语言指南】循环嵌套的复杂度分析与优化倔强的小石头_ C语言 c语言 java 算法
循环嵌套的复杂度分析算法复杂度的概念算法复杂度是衡量算法性能的重要指标，它主要包括时间复杂度和空间复杂度。时间复杂度反映了算法执行所需的时间与输入规模之间的关系，而空间复杂度则衡量了算法在运行过程中所需的额外存储空间与输入规模的关系。在实际编程中，我们通常希望算法具有较低的时间复杂度和空间复杂度，这样可以提高程序的运行效率和资源利用率。推导大O阶的方法在计算算法的时间复杂度时，我们通常使用大O的渐
【C语言指南】深入理解C语言函数参数传递倔强的小石头_ C语言 c语言算法 java
目录引言一、值传递（PassbyValue）1.1基本概念1.2代码示例1.3内存图解二、地址传递（PassbyAddress）2.1本质解析2.2经典示例2.3内存变化三、两种方式的对比四、数组参数的秘密4.1数组传参的本质4.2典型误区五、最佳实践指南六、常见错误案例分析错误1：试图通过值传递修改外部变量错误2：空指针解引用总结引言在C语言中，函数的参数传递方式是理解程序行为的关键。许多初学者
网络运维学习笔记（DeepSeek优化版） 023 HCIP-Datacom OSPF邻居建立过程、四种网络类型、OSPF高级配置、LSA类型与管理技术小齐网络运维学习
文章目录OSPF邻居建立过程、四种网络类型、OSPF高级配置、LSA类型与管理邻居建立过程图示文字概述关键机制说明DD报文三重作用OSPF确认机制MTU协商机制四种网络类型详解网络类型邻接关系总表1.广播网络（Broadcast）核心特性组播地址说明2.点到点网络（P2P）核心特性3.NBMA网络核心特性4.点到多点网络（P2MP）核心特性实验查看邻居状态查看接口状态计时器说明OSPF高级配置CO
从以太网 II 到 VLAN 和 Jumbo Frame：数据帧格式解读光路科技网络
以太网数据帧是计算机网络通信的基本单位，在不同的应用场景中，它的格式有所不同。根据协议标准和用途，以太网数据帧主要包括以太网II帧、IEEE802.3帧、IEEE802.1QVLAN帧等七种主要类型。为了更好地理解以太网的通信机制，我们来了解这些数据帧的特点和应用。以太网II（EthernetII）帧以太网II帧是目前最广泛使用的帧格式，特别是在TCP/IP网络中占据主导地位。它最显著的特点是包含
JavaScript 学习 wgego javascript 学习开发语言
JavaScript作用JavaScript是一种轻量级的编程语言，是可插入HTML页面的编程代码，插入HTML页面后，可由所有的现代浏览器执行，可控制网页的行为。（学之前要了解一下html和css).1.直接写入HTML输出流document.write("这是一个标题");document.write("这是一个段落。");2.对事件的反应点我!3.改变HTML内容x=document.get
主备系统服务器,服务器主备模式芥末咖啡机主备系统服务器
服务器主备模式内容精选换一换虚拟IP(VirtualIPAddress，简称VIP)是一个未分配给真实弹性云服务器网卡的IP地址。弹性云服务器除了拥有私有IP地址外，还可以拥有虚拟IP地址，用户可以通过其中任意一个IP(私有IP/虚拟IP)访问此弹性云服务器。同时，虚拟IP地址拥有私有IP地址同样的网络接入能力，包括VPC内二三层通信、VPC之间对等连接访问，以虚拟IP(VirtualIPAddr
sonarqube k8s 部署模板 study_小达人 k8s devops kubernetes docker 容器代码扫描
SonarQube是一个用于代码质量管理的开源平台，用于管理源代码的质量。同时SonarQube还对大量的持续集成工具提供了接口支持，可以很方便地在持续集成中使用SonarQube。此外，SonarQube的插件还可以对Java以外的其他编程语言提供支持.sonarqube部署（注意持久化的配置）apiVersion:apps/v1kind:Deploymentmetadata:name:sona
JavaScript网页设计案例：创新与互动的融合右恩杂文 javascript
JavaScript网页设计案例：创新与互动的融合随着互联网技术的飞速发展，JavaScript作为Web前端开发的核心语言之一，已经成为创建动态、交互式网站不可或缺的一部分。通过结合HTML和CSS，JavaScript能够为用户提供更加丰富和个性化的浏览体验。本文将介绍几个基于JavaScript的网页设计案例，展示如何利用这门语言实现创意和技术的完美结合。1.动态菜单与导航一个直观且易于使用
TR－069 协议简介 lixin62001 NETWORK soap 网络测试 ssl 工作路由器
TR－069是由DSL论坛（www.dslforum.org）所开发的技术规范之一，其全称为“CPE广域网管理协议”。它提供了对下一代网络中家庭网络设备进行管理配置的通用框架和协议，用于从网络侧对家庭网络中的网关、路由器、机顶盒等设备进行远程集中管理。这些设备不论是在最开始安装的时候还是在后期运行中的业务配置变更或是出现故障需要维护的时候，都需要通过管理接口对设备进行配置或是诊断。现阶段的设备大都
DPDK概述尘世中迷途小码农 DPDK 网络
DPDK是什么DPDK（DataPlaneDevelopmentKit），是一种用户空间数据平面开发工具包，它的主要目标是为开发人员提供一个创建高性能数据平面应用程序的平台。DPDK开发者能够用C语言、汇编与新型Intel架构的linux内核进行交互，使得数据平面应用程序在高度优化的环境中运行。背景随着芯片技术与高速网络接口技术的一日千里式发展，报文吞吐需要处理10Gbps端口处理能力，世面上大量
主备模式的服务器：实现高可用性和容错性的关键 IsdCoding 服务器运维
在现代的网络环境中，服务器的高可用性和容错性变得越来越重要。在处理大量用户请求和提供持续稳定的服务时，服务器的可用性成为一项关键指标。为了确保服务器的持续可用性，主备模式是一种常见的解决方案。本文将介绍主备模式的服务器架构，并提供相应的源代码示例。主备模式服务器架构的概述主备模式是一种服务器架构，其中有两台服务器：一台主服务器和一台备份服务器。主服务器负责处理所有的用户请求和数据处理任务，而备份服
Crypto Architecture Kit简介 RZer HarmonyOS HarmonyOS
HarmonyOS5.0.3(15)版本的配套文档，该版本API能力级别为API15Release文章目录约束与限制能力范围基本概念与相关Kit的关系CryptoArchitectureKit屏蔽了第三方密码学算法库实现差异的算法框架，提供加解密、签名验签、消息验证码、哈希、安全随机数、密钥派生等相关功能。开发者可以通过调用加解密算法框架服务，忽略底层不同三方算法库的差异，实现迅捷开发。约束与限制
redis 中的 RedisJSON模块春哥的魔法书 redis redis RedisJSON
7.4.RedisJSON模块7.4.1.介绍RedisJSON模块是一个Redis社区贡献的模块，它为Redis增加了对JSON数据类型的原生支持。这个模块使得Redis能够直接存储、查询和操作JSON数据，而无需将数据序列化和反序列化成字符串或哈希表，从而提高了数据处理的效率和性能。Redis6.0版本之后支持RedisJSON模块RedisJSON允许你将整个JSON文档存储为Redis键值
Redis in Python-----redis module sys_song Python redis
Redis学习Redis是一种Key-value数据库，支持多种语言，当然，包括Python，python中包含redismodule。1）首先，我们安装redis，下载redis源代码：http://pypi.python.org/pypi?%3Aaction=search&term=redis&submit=search源码下载完成后，执行pythonsetup.pyinstall命令，完成安
redis 模块阿慕路泽 #Python 模块
Redis是一个开源的使用ANSIC语言编写、遵守BSD协议、支持网络、可基于内存亦可持久化的日志型、Key-Value数据库，并提供多种语言的API。它通常被称为数据结构服务器，因为值（value）可以是字符串(String),哈希(Map),列表(list),集合(sets)和有序集合(sortedsets)等类型。Redis与其他key-value缓存产品有以下三个特点：Redis支持数据的
orbbec 奥比中光相机单目及多目调用方式python代码一休哥※ 计算机视觉数码相机 python 开发语言
这篇文章会介绍使用orbbec相机的一些常用代码梯子orbbec奥比中光Astra相机单目及多目调用方式编译sdk调用单相机调用多相机orbbec奥比中光Astra相机单目及多目调用方式 Orbbec相机是一个专注于深度感知和计算机视觉应用的设备，通常用于3D扫描、手势识别、增强现实（AR）以及其他需要深度信息的场景。Orbbec相机的SDK（软件开发工具包）提供了丰富的API，支持多种编程语言
xESMF 项目常见问题解决方案井美婵Toby
xESMF项目常见问题解决方案xESMFUniversalRegridderforGeospatialData项目地址:https://gitcode.com/gh_mirrors/xes/xESMF1.项目基础介绍和主要编程语言xESMF是一个用于地理空间数据重投影的Python包。它使用了ESMF/ESMPy作为后端，并提供了与xarray兼容的高级API，使得在处理不同类型的网格数据时更加高
栈的数组实现（c语言) 61u3 数据结构
目录（一）栈的数组结构体（二）创建一个空栈（三）入栈（四）出栈（五）打印栈元素（六）调用的主函数全部的组合代码（一）栈的数组结构体typedefstructstack{chardata[MaxSize];//数组实现栈内元素定位inttop;//作为数组下标intbuttom;}stack;（二）创建一个空栈stack*CreateStack(){stack*st=(stack*)malloc(s
51单片机的五类指令（二）——算术运算类指令二年级程序员 51单片机嵌入式硬件单片机
目录一、加法指令（一）不带进位加法指令（ADD）（二）带进位加法指令（ADDC）（三）加1指令（INC）（四）十进制调整指令（DA）二、减法指令（一）带借位减法指令（SUBB）（二）减1指令（DEC）三、乘法指令四、除法指令单片中寻址是为了找到操作数，而各类指令则是为了对操作数进行操作。本篇文章将介绍51单片机中的第二类指令——算术运算类指令。51单片机的算术运算类指令是汇编语言编程里极为重要的一
关于我对接了deepseek之后部署到本地将数据存储到mysql的过程麦秸垛的守望者 mysql 数据库
写在前面今天写一下使用nodejs作为服务端，vue作为客户端，mysql的数据库，对接deepseek的全过程，要实现一个很简单的效果就是，可以自由的询问，然后可以将询问的过程存储到mysql的数据库中。文档对接deepseek对接文档效果图服务端代码这里避免你们看的时候费劲，所以这里不做任何封装，正常你们如果用代码，可以将连接数据、输出答案的过程封装起来。下面的代码为不封装的，仅供参考！别说我
计算机网络（13）以太网 co0t 计算机网络计算机网络 arm开发
以太网详解以太网（Ethernet）是一种常见的局域网（LAN）技术，广泛用于企业网络、家庭网络以及数据中心。它定义了有线通信的物理层和数据链路层技术标准，提供了高效、可靠的通信机制。1.以太网的起源和发展诞生：以太网最初由罗伯特·梅特卡夫（RobertMetcalfe）于1973年提出，用于连接一组计算机。标准化：1983年，IEEE802.3标准正式将以太网定义为局域网通信协议。发展历程：10
c语言标准库菜鸟教程,C 标准库 – | 菜鸟教程 weixin_40007548 c语言标准库菜鸟教程
C标准库-简介locale.h头文件定义了特定地域的设置，比如日期格式和货币符号。接下来我们将介绍一些宏，以及一个重要的结构structlconv和两个重要的函数。库宏下面列出了头文件locale.h中定义的宏，这些宏将在下列的两个函数中使用：序号宏&描述1LC_ALL设置下面的所有选项。2LC_COLLATE影响strcoll和strxfrm函数。3LC_CTYPE影响所有字符函数。4LC_MO
C语言——标准库思考的意义 c语言
目录断言字符类测试（部分）库函数抛出的错误代码浮点数运算检测整型数据类型值范围本土化数学函数“非局部跳转”信号可变参数列表一些常数，类型和变量输入和输出实用功能字符串函数时间和日期函数一、assert.h头文件唯一的目的是提供宏assert的定义。如果断言非真（expression==0），则程序会在标准错误流输出提示信息，并使程序异常中止调用abort()。定义：voidassert(intex
Hadoop(一) 朱辉辉33 hadoop linux
今天在诺基亚第一天开始培训大数据，因为之前没接触过Linux，所以这次一起学了，任务量还是蛮大的。首先下载安装了Xshell软件，然后公司给了账号密码连接上了河南郑州那边的服务器，接下来开始按照给的资料学习，全英文的，头也不讲解，说锻炼我们的学习能力，然后就开始跌跌撞撞的自学。这里写部分已经运行成功的代码吧. 在hdfs下，运行hadoop fs -mkdir /u
maven An error occurred while filtering resources blackproof maven 报错
转：http://stackoverflow.com/questions/18145774/eclipse-an-error-occurred-while-filtering-resources maven报错： maven An error occurred while filtering resources Maven -> Update Proje
jdk常用故障排查命令 daysinsun jvm
linux下常见定位命令： 1、jps 输出Java进程 -q 只输出进程ID的名称，省略主类的名称； -m 输出进程启动时传递给main函数的参数； &nb
java 位移运算与乘法运算周凡杨 java 位移运算乘法
对于 JAVA 编程中，适当的采用位移运算，会减少代码的运行时间，提高项目的运行效率。这个可以从一道面试题说起：问题：用最有效率的方法算出2 乘以8 等於几?” 答案：2 << 3 由此就引发了我的思考，为什么位移运算会比乘法运算更快呢？其实简单的想想，计算机的内存是用由 0 和 1 组成的二
java中的枚举(enmu) g21121 java
从jdk1.5开始，java增加了enum(枚举)这个类型，但是大家在平时运用中还是比较少用到枚举的，而且很多人和我一样对枚举一知半解，下面就跟大家一起学习下enmu枚举。先看一个最简单的枚举类型，一个返回类型的枚举： public enum ResultType { /** * 成功 */ SUCCESS, /** * 失败 */ FAIL,
MQ初级学习 510888780 activemq
1.下载ActiveMQ 去官方网站下载：http://activemq.apache.org/ 2.运行ActiveMQ 解压缩apache-activemq-5.9.0-bin.zip到C盘，然后双击apache-activemq-5.9.0-\bin\activemq-admin.bat运行ActiveMQ程序。启动ActiveMQ以后，登陆：http://localhos
Spring_Transactional_Propagation 布衣凌宇 spring transactional
//事务传播属性 @Transactional(propagation=Propagation.REQUIRED)//如果有事务，那么加入事务，没有的话新创建一个 @Transactional(propagation=Propagation.NOT_SUPPORTED)//这个方法不开启事务 @Transactional(propagation=Propagation.REQUIREDS_N
我的spring学习笔记12-idref与ref的区别 aijuans spring
idref用来将容器内其他bean的id传给<constructor-arg>/<property>元素，同时提供错误验证功能。例如： <bean id ="theTargetBean" class="..." /> <bean id ="theClientBean" class=&quo
Jqplot之折线图 antlove js jquery Web timeseries jqplot
timeseriesChart.html <script type="text/javascript" src="jslib/jquery.min.js"></script> <script type="text/javascript" src="jslib/excanvas.min.js&
JDBC中事务处理应用百合不是茶 java JDBC编程事务控制语句
解释事务的概念; 事务控制是sql语句中的核心之一;事务控制的作用就是保证数据的正常执行与异常之后可以恢复事务常用命令: Commit提交
[转]ConcurrentHashMap Collections.synchronizedMap和Hashtable讨论 bijian1013 java 多线程线程安全 HashMap
在Java类库中出现的第一个关联的集合类是Hashtable，它是JDK1.0的一部分。 Hashtable提供了一种易于使用的、线程安全的、关联的map功能，这当然也是方便的。然而，线程安全性是凭代价换来的――Hashtable的所有方法都是同步的。此时，无竞争的同步会导致可观的性能代价。Hashtable的后继者HashMap是作为JDK1.2中的集合框架的一部分出现的，它通过提供一个不同步的
ng-if与ng-show、ng-hide指令的区别和注意事项 bijian1013 JavaScript AngularJS
angularJS中的ng-show、ng-hide、ng-if指令都可以用来控制dom元素的显示或隐藏。ng-show和ng-hide根据所给表达式的值来显示或隐藏HTML元素。当赋值给ng-show指令的值为false时元素会被隐藏，值为true时元素会显示。ng-hide功能类似，使用方式相反。元素的显示或
【持久化框架MyBatis3七】MyBatis3定义typeHandler bit1129 TypeHandler
什么是typeHandler? typeHandler用于将某个类型的数据映射到表的某一列上，以完成MyBatis列跟某个属性的映射内置typeHandler MyBatis内置了很多typeHandler，这写typeHandler通过org.apache.ibatis.type.TypeHandlerRegistry进行注册，比如对于日期型数据的typeHandler，
上传下载文件rz,sz命令 bitcarter linux命令rz
刚开始使用rz上传和sz下载命令：因为我们是通过secureCRT终端工具进行使用的所以会有上传下载这样的需求：我遇到的问题： sz下载A文件10M左右，没有问题但是将这个文件A再传到另一天服务器上时就出现传不上去，甚至出现乱码，死掉现象，具体问题解决方法：上传命令改为;rz -ybe 下载命令改为：sz -be filename 如果还是有问题：那就是文
通过ngx-lua来统计nginx上的虚拟主机性能数据 ronin47 ngx-lua　统计解禁ip
介绍以前我们为nginx做统计,都是通过对日志的分析来完成.比较麻烦,现在基于ngx_lua插件,开发了实时统计站点状态的脚本,解放生产力.项目主页: https://github.com/skyeydemon/ngx-lua-stats 功能支持分不同虚拟主机统计, 同一个虚拟主机下可以分不同的location统计. 可以统计与query-times request-time
java-68-把数组排成最小的数。一个正整数数组，将它们连接起来排成一个数，输出能排出的所有数字中最小的。例如输入数组{32, 321}，则输出32132 bylijinnan java
import java.util.Arrays; import java.util.Comparator; public class MinNumFromIntArray { /** * Q68输入一个正整数数组，将它们连接起来排成一个数，输出能排出的所有数字中最小的一个。 * 例如输入数组{32, 321}，则输出这两个能排成的最小数字32132。请给出解决问题
Oracle基本操作 ccii Oracle SQL总结 Oracle SQL语法 Oracle基本操作 Oracle SQL
一、表操作 1. 常用数据类型 NUMBER(p,s)：可变长度的数字。p表示整数加小数的最大位数，s为最大小数位数。支持最大精度为38位 NVARCHAR2(size)：变长字符串，最大长度为4000字节（以字符数为单位） VARCHAR2(size)：变长字符串，最大长度为4000字节（以字节数为单位） CHAR(size)：定长字符串，最大长度为2000字节，最小为1字节，默认
[强人工智能]实现强人工智能的路线图 comsci 人工智能
1：创建一个用于记录拓扑网络连接的矩阵数据表 2:自动构造或者人工复制一个包含10万个连接(1000*1000)的流程图 3：将这个流程图导入到矩阵数据表中 4：在矩阵的每个有意义的节点中嵌入一段简单的
给Tomcat，Apache配置gzip压缩(HTTP压缩)功能 cwqcwqmax9 apache
背景： HTTP 压缩可以大大提高浏览网站的速度，它的原理是，在客户端请求网页后，从服务器端将网页文件压缩，再下载到客户端，由客户端的浏览器负责解压缩并浏览。相对于普通的浏览过程HTML ,CSS,Javascript , Text ，它可以节省40%左右的流量。更为重要的是，它可以对动态生成的，包括CGI、PHP , JSP , ASP , Servlet,SHTML等输出的网页也能进行压缩，
SpringMVC and Struts2 dashuaifu struts2 springMVC
SpringMVC VS Struts2 1: spring3开发效率高于struts 2: spring3 mvc可以认为已经100%零配置 3: struts2是类级别的拦截，一个类对应一个request上下文， springmvc是方法级别的拦截，一个方法对应一个request上下文，而方法同时又跟一个url对应所以说从架构本身上 spring3 mvc就容易实现r
windows常用命令行命令 dcj3sjt126com windows cmd command
在windows系统中，点击开始－运行，可以直接输入命令行，快速打开一些原本需要多次点击图标才能打开的界面，如常用的输入cmd打开dos命令行，输入taskmgr打开任务管理器。此处列出了网上搜集到的一些常用命令。winver 检查windows版本 wmimgmt.msc 打开windows管理体系结构(wmi) wupdmgr windows更新程序 wscrip
再看知名应用背后的第三方开源项目 dcj3sjt126com ios
知名应用程序的设计和技术一直都是开发者需要学习的，同样这些应用所使用的开源框架也是不可忽视的一部分。此前《 iOS第三方开源库的吐槽和备忘》中作者ibireme列举了国内多款知名应用所使用的开源框架，并对其中一些框架进行了分析，同样国外开发者 @iOSCowboy也在博客中给我们列出了国外多款知名应用使用的开源框架。另外txx's blog中详细介绍了 Facebook Paper使用的第三
Objective-c单例模式的正确写法 jsntghf 单例 ios iPhone
一般情况下，可能我们写的单例模式是这样的： #import <Foundation/Foundation.h> @interface Downloader : NSObject + (instancetype)sharedDownloader; @end #import "Downloader.h" @implementation
jquery easyui datagrid 加载成功，选中某一行 hae jquery easyui datagrid 数据加载
1.首先你需要设置datagrid的onLoadSuccess $( '#dg' ).datagrid({onLoadSuccess : function (data){ $( '#dg' ).datagrid( 'selectRow' ,3); }}); 2.onL
jQuery用户数字打分评价效果 ini JavaScript html jquery Web css
效果体验：http://hovertree.com/texiao/jquery/5.htmHTML文件代码： <!DOCTYPE html> <html xmlns="http://www.w3.org/1999/xhtml"> <head> <title>jQuery用户数字打分评分代码 - HoverTree</
mybatis的paramType kerryg DAO sql
MyBatis传多个参数： 1、采用#{0},#{1}获得参数： Dao层函数方法： public User selectUser(String name,String area); 对应的Mapper.xml <select id="selectUser" result
centos 7安装mysql5.5 MrLee23 centos
首先centos7 已经不支持mysql，因为收费了你懂得，所以内部集成了mariadb，而安装mysql的话会和mariadb的文件冲突，所以需要先卸载掉mariadb，以下为卸载mariadb，安装mysql的步骤。 #列出所有被安装的rpm package rpm -qa | grep mariadb #卸载 rpm -e mariadb-libs-5.
利用thrift来实现消息群发 qifeifei thrift
Thrift项目一般用来做内部项目接偶用的，还有能跨不同语言的功能，非常方便，一般前端系统和后台server线上都是3个节点，然后前端通过获取client来访问后台server，那么如果是多太server，就是有一个负载均衡的方法，然后最后访问其中一个节点。那么换个思路，能不能发送给所有节点的server呢，如果能就
实现一个sizeof获取Java对象大小 teasp java HotSpot 内存对象大小 sizeof
由于Java的设计者不想让程序员管理和了解内存的使用，我们想要知道一个对象在内存中的大小变得比较困难了。本文提供了可以获取对象的大小的方法，但是由于各个虚拟机在内存使用上可能存在不同，因此该方法不能在各虚拟机上都适用，而是仅在hotspot 32位虚拟机上，或者其它内存管理方式与hotspot 32位虚拟机相同的虚拟机上适用。
SVN错误及处理 xiangqian0505 SVN提交文件时服务器强行关闭
在SVN服务控制台打开资源库“SVN无法读取current” ---摘自网络写道 SVN无法读取current修复方法 Can't read file : End of file found 文件：repository/db/txn_current、repository/db/current 其中current记录当前最新版本号，txn_current记录版本库中版本

搜索引擎面面观

你可能感兴趣的:(搜索引擎,网络,分布式计算,文档,自然语言处理,语言)