babydavic

Solr4 Wiki 翻译 - 分布式搜索

概述

　　这篇文档涵盖了使用示例schema和一些示例数据运行Solr的基础。

必备

　　为更好follow这个手册，您需要...

　　　　1. Java1.6或更高版本。您可以从Oracle, Open JDK, 或者 IBM获取.

　　　　　　在命令行运行java -version以确认java版本号大于等于1.6.

　　　　　　不支持Gnu的GCJ，因此它不对Solr起作用。

　　　　2. Solr版本Solr release .

开始

在运行Solr服务的同一台机器的显示手册的浏览器上的示例链接会正确的指向您的Solr服务器。

解压缩Solr版本，将目录切换到“example”.(注意基准目录会随着下载版本不同而不同)，如下例，在UNIX、Cygwin或MacOS：

user:~solr$ ls
solr-nightly.zip
user:~solr$ unzip -q solr-nightly.zip
user:~solr$ cd solr-nightly/example/

Solr可以运行在任何你选择的Java Servlet容器内，为简单起见，本手册的实例索引包含一个小的Jetty安装。

使用Solr WAR和示例配置启动Jetty，运行start.jar...

user:~/solr/example$ java -jar start.jar
2012-06-06 15:25:59.815:INFO:oejs.Server:jetty-8.1.2.v20120308
2012-06-06 15:25:59.834:INFO:oejdp.ScanningAppProvider:Deployment monitor .../solr/example/webapps at interval 0
2012-06-06 15:25:59.839:INFO:oejd.DeploymentManager:Deployable added: .../solr/example/webapps/solr.war
...
Jun 6, 2012 3:26:03 PM org.apache.solr.core.SolrCore registerSearcher
INFO: [collection1] Registered new searcher Searcher@7527e2ee main{StandardDirectoryReader(segments_1:1)}

这将在端口8983启动Jetty应用服务器，并在您的终端上显示Solr的log信息。
您可以在浏览器通过加载页面http://localhost:8983/solr/ 看到Solr已经启动，这是Solr管理的开始界面。

索引数据

您的Solr服务器已经启动运行，但是它没有任何数据。通过Posting命令，您可以修改Solr的索引：添加（或修改）文档，删除文档，并且提交添加或删除。这些命令支持多种格式(variety of formats)。

目录 exampledocs 包含了一些展示多种Solr可以接受的命令的示例文件，以及一个在终端提交这些命令的java工具（还有一个shell脚本post.sh，在本手册中，我们使用跨平台的Java客户端）。

打开一个新的终端窗口，输入exampledocs目录，然后在同目录下的一些XML文件运行“java -jar post.jar”

user:~/solr/example/exampledocs$ java -jar post.jar solr.xml monitor.xml
SimplePostTool: version 1.4
SimplePostTool: POSTing files to http://localhost:8983/solr/update..
SimplePostTool: POSTing file solr.xml
SimplePostTool: POSTing file monitor.xml
SimplePostTool: COMMITting Solr index changes..

现在，您已经在Solr中索引了两个文档，提交这些变化。在管理界面 "Query" tab，您可以搜索“Solr”，在文本框“q”里输入“solr”.点击按钮“Execute Query”后应该显示包含一个结果的如下URL...

http://localhost:8983/solr/collection1/select?q=solr&wt=xml

使用以下的命令（假设您的命令行sheel支持*.xml）您可以索引所有的示例数据。

user:~/solr/example/exampledocs$ java -jar post.jar *.xml
SimplePostTool: version 1.4
SimplePostTool: POSTing files to http://localhost:8983/solr/update..
SimplePostTool: POSTing file gb18030-example.xml
SimplePostTool: POSTing file hd.xml
SimplePostTool: POSTing file ipod_other.xml
SimplePostTool: POSTing file ipod_video.xml
...
SimplePostTool: POSTing file solr.xml
SimplePostTool: POSTing file utf8-example.xml
SimplePostTool: POSTing file vidcard.xml
SimplePostTool: COMMITting Solr index changes..

...现在您可以使用默认的Solr Query Syntax（Lucene的查询语法的一个超集）搜索各种各样的数据...

video
name:video
+video +price:[* TO 400]

有多种不同的方法导入数据至Solr（索引数据）...您可以

使用 Data Import Handler (DIH)从数据库导入记录.
导入CSV文件,包括从Excel或MySQL导入的文件.
提交JSON文档
用 Solr Cell (ExtractingRequestHandler)索引诸如Word和PDF之类的二进制文档.
使用 SolrJ for Java或其他的Solr客户端程序创建文档并发送至Solr.

更新数据

您可能已经注意到了，即使文件 solr.xml两次提交到了服务器，当您搜索"solr"时仍然只得到了一个结果。这是因为示例 schema.xml指定了一个名为"id"的"uniqueKey"字段.无论何时您POST添加在uniqueKey字段上具有相同值的文档时，它将自动替换已存在的文档。通过在统计页面的“CORE”/searcher段查看numDocs和maxDocs的值，您发现已经被替换了。

http://localhost:8983/solr/#/collection1/plugins/core?entry=searcher

numDocs表示在当前索引下可搜索的文档数目（由于一些文件可能包含多于一个的<doc>而超过XML文件的数量）。maxDoc或许会更大，因为它包括了逻辑上被删除而没有从索引中移除的文档。您可以任意多次重复提交这些示例XML文档，但是numDocs永远不会增加，因为新文档总是会替换旧的。

编辑这些XML文件，改变一些数据，然后重新执行 java -jar post.jar命令，您可以看到后续的检索反映出了这些变化。

删除数据

您可以通过POSTing删除命令至更新URL，指定文档的uniqueKey字段，或者是一个多个文档的查询(那样的话应该谨慎)以删除数据。因为那些命令比较小，我们在命令行里指定他们而不是引用一个XML文件。

执行如下命令删除指定的文档。

java -Ddata=args -Dcommit=false -jar post.jar "<delete><id>SP2514N</id></delete>"

由于我们指定了“commit=false”,一个指定id:SP2514N 的检索仍然可以检索到我们已经删除的文档。因为示例配置实用了Solr的"autoCommit"特性，Solr会自动保存这个索引，但是直到一个“openSearcher”显式执行，它不会影响检索结果.

使用可以统计updateHandler的statistics page，您可以通过查看deletesById的值下降到0，而cumulative_deletesById 和autocommit的值增加的事实观察到此次删除写入到了磁盘。

这里有一个使用delete-by-query删除一些名字里包含DDR的示例。

java -Dcommit=false -Ddata=args -jar post.jar "<delete><query>name:DDR</query></delete>"

通过往Solr发送一个commit命令您可以强制打开一个新的searcher以反映出那些变化（这是post.jar的默认作法）.

java -jar post.jar

现在重新执行前面的检索去验证那些未匹配的文档被检索到了。您可以重新访问统计页面并观察在updateHandler 提交的数量和在searcher的numDocs。

通过打开一个新的搜索器(searcher)以提交是一个代价昂贵的操作，因此最好是批量更新同一个索引，最后再发送commit命令。还有一个optimize 命令可以完成同样工作，并且会强制所有的索引segment合并成一个segment--这样会使得资源密集，但是如果您的索引变化频率不高的话，为提高搜索速度是值得的。

所有的更新命令可以指定为XML 或 JSON.

为继续本手册，到exampledocs目录执行如下命令重新添加哪些被删除的文档。

java -jar post.jar *.xml

查询数据

检索是通过发送HTTP GET请求至 select URL，需要检索的关键词由参数q指定。您可以传递一些可选的request parameters 至请求处理器以控制所需返回信息。例如您可以使用参数"fl"控制返回哪些存储的字段和是否要返回相关评分：

q=video&fl=name,id (仅返回字段name和id)

q=video&fl=name,id,score (同时也返回相关评分)

q=video&fl=*,score (返回所有的字段和相关评分)

q=video&sort=price desc&fl=name,id,price (添加排序指令，按照价格降序)

q=video&wt=json (以json方式返回)

在管理界面提供的查询表单允许设置各种查询参数，这对测试或调试查询时大有用处。

排序

Solr提供一种简单的方法用来在一个或多个索引字段上进行排序。使用参数"sort"指定“ 字段和方向”，如果有多个字段则用逗号分隔：

q=video&sort=price desc
q=video&sort=price asc
q=video&sort=inStock asc, price desc

“score”也可以用来作为一个排序的字段:

q=video&sort=score desc
q=video&sort=inStock asc, score desc

复杂的函数也可以用来排序查询结果:

q=video&sort=div(popularity,add(price,1)) desc

如果未指定排序字段，默认为评分降序(score desc)返回那些相关性最高的匹配结果。

高亮

命中高亮返回每个文档相关的片段，并且高亮显示那个上下文片段的词元。

如下示例搜索“video card”并请求高亮字段name,features.这将用<em>标签包裹那些需要高亮的词元生成一个高亮节，并将它添加到响应中。

...&q=video card&fl=name,id&hl=true&hl.fl=name,features

更多与高亮相关的请求参数在这里.

切面搜索

切面搜索按照各种属性或分类汇总匹配结果。一般会提供一些可供用户钻取的链接或者基于返回的分类完善搜索结果。

以下示例搜索所有的文档(*:*) ,并按照分类字段“cat”进行汇总。

...&q=*:*&facet=true&facet.field=cat

注意尽管只有前10个文档从结果列表中返回，切面汇总却是以整个匹配查询的结果集产生的.

我们可以一次按照多种方式切面。如下示例添加了一个按照是否有库存（inStock）的布尔值的切面。

...&q=*:*&facet=true&facet.field=cat&facet.field=inStock

Solr可以为任意查询产生汇总.以下示例查询"ipod"，并且通过使用在价格字段上的区间查询(range queries)来展示低于和高于100的价格.

...&q=ipod&facet=true&facet.query=price:[0 TO 100]&facet.query=price:[100 TO *]

Solr甚至可以按照数值区间（包括日期）进行切面。这个示例请求按照制造日期（manufacturedate_dt字段），从2004年到2010年进行逐年汇总。

...&q=*:*&facet=true&facet.rage=manufacturedate_dt&facet.rage.start=2004-01-01T00:00:00Z&facet.rage.end=2010-01-01T00:00:00Z&facet.range.gap=+1YEAR

更多关于切面搜索的信息可以查看切面概述和切面参数页面。

搜索界面

Solr包含一个用velocity模板创建的示例搜索界面，演示了许多特性，包括搜索、切面、高亮、自动填充和地理搜索(原文是“geospatial searching”).

可以在http://localhost:8983/solr/collection1/browse实践下。

文本分析

文本字段是一种典型的，通过将文本分解成符号(Tokens)，使用各种诸如转为小写、去除复数词尾(s,es等)，去除分词词尾(d,ed,ing等，这两种处理都是针对英文进行的处理)以提高相关性的典型索引。

Schema定义了索引中的字段以及在其上使用的分析器类型.您的collection现在使用的schema可以直接通过管理界面的Schema tab 查看，或者使用Schema Browser tab动态浏览.

适合您文本内容最好的分析组件（tokenization and filtering）严重依赖语言。正如你在Schema Browser中所见，许多在示例schema中的字段使用了一种叫做text_general的字段类型（fieldType）,默认情况下它适合大多数的语言.

如果您的文本内容是英语，就像本手册的示例文档一样，您可以使用面向英语的分词和停用词表，分隔复合词，您可以使用字段类型text_en_splitting来代替.继续编辑目录"solr/example/solr/conf"下的文件"schema.xml".在字段text和features上使用字段类型text_en_splitting：

   <field name="features" type="text_en_splitting" indexed="true" stored="true" multiValued="true"/>
   ...
   <field name="text" type="text_en_splitting" indexed="true" stored="false" multiValued="true"/>

做完这些改变后重启Solr，然后使用“java -jar post.jar *.xml”重新提交所有的示例文档。现在下面列出来的搜索会演示面向英语(English-specific)的转换:

搜索“power-shot”能够匹配"PowerShot",并且通过使用WordDelimiterFilter 和LowerCaseFilter，adata 能匹配 A-DATA
通过使用PorterStemFilter的分词特性，搜索“features:recharging”可以匹配Rechargeable 。
使用SynonymFilter，搜索""能够匹配"1GB"，一般性错误拼写"pixima"能匹配Pixma

可供使用的关于分析组件、Analyzers、Tokenizers和TokenFilters的完整描述请查看这里.

分析调试

有一个非常便捷的Analysis tab ,在这里您可以看到一个文本值在索引和检索时如何被分解成单词符号。这个页面展示了它们经过一系列的过滤器链处理后的符号(tokens)结果。

这个URL显示了从“Canon Power-Shot SD500”使用text_en_splitting创建的符号。表格的每一段显示了经过索引分析器的下一个符号过滤器（TokenFilter）的符号结果.注意“powershot”、“power”和"shot"是如何被索引的,使用具有相同"位置(postion)"的符号.(同使用通用字段类型处理产生的符号比较.)

鼠标移动到小节左侧的标签上将会显示出位于整个链上的那个阶段的分析器组件的全名称。选择或反选复选框"Verbose Output"将会显示或隐藏详细的符号属性.

当索引和查询值同时提供时,两个表将并排显示每个链条上的结果.最终等于查询链上的词干的索引链上的词干将会高亮显示。

其他值得关注的示例:

English stemming and stop-words 使用 text_en 字段类型

Half-width katakana normalization with bi-graming 使用 text_cjk 字段类型

Japanese morphological decomposition with part-of-speech filtering 使用text_ja 字段类型

Arabic stop-words, normalization, and stemming 使用 text_ar 字段类型

结论

恭喜您！您已经成功运行了一个小的Solr实例，并且添加了一些文档，同时对索引和schema做了修改。您了解了查询、文本分析已经Solr管理界面。您已经做好了在您项目中使用Solr的准备！请继续以下步骤:

订阅Solr邮件列表!
将Solr的示例目录做一份备份,可以作为您自己项目的一个模板.
定制schema和其他位于 solr/collection1/conf/ 下的配置以满足您的需求.

Solr拥有太多的在这里我们没有提及的特性，包括处理海量文档集合的分布式搜索，函数查询，数值类型字段统计以及搜索结果聚集。浏览Solr Wiki以更详细的了解Solr的特性。

玩得开心，我们将在Solr的邮件列表里看到您!

参数展平器：批量操作中的数据格式「翻译官」安岁_ Python oracle 数据库服务器
在开发权限管理系统或批量数据处理功能时，你是否遇到过这样的场景：需要将一组二维的权限元组转换为一维列表，才能传递给数据库执行批量操作？这种将多维数据「展平」为一维格式的工具，就是我们今天要聊的参数展平器。它是数据库批量操作的「翻译官」，能让复杂的数据结构适配底层驱动的参数要求。本文结合权限管理场景，解析其核心原理与最佳实践。一、参数展平器的核心使命：数据格式适配假设你需要批量删除用户权限，权限数据
python实现：命令行翻译.string 和 .xml 文件 -- mkTranslate：支持多种语言的互译 3行代码 python python翻译 google 翻译翻译命令行终端翻译繁体简体互译
[github传送门]功能翻译文本文件翻译.strings文件翻译.xml文件翻译文本支持谷歌翻译支持有道翻译支持i18ns.com聚合翻译会自动检测当前网络情况，从而决定使用谷歌还是有道翻译(有道翻译为了防IP封锁，使用3种渠道切换，所以速度会比谷歌慢一些，如果谷歌能用，将优先使用谷歌翻译)安装：pipinstallmkTranslation更新现有版本：pipinstall--upgradem
gamma分布_负二项分布及其应用 weixin_39853210 gamma分布几何分布的期望和方差公式推导
本文是一篇手记，记录了我对负二项分布及其应用的理解。目录如下：1.理解"负"的含义知乎回答有提到：https://www.zhihu.com/question/24253978?sort=created文档中有提到：http://www.johndcook.com/negativebinomial.pdf负二项级数：https://brilliant.org/wiki/negative-binom
二项分布的期望方差证明_负二项分布及其应用 weixin_39957068 二项分布的期望方差证明
本文是一篇手记，记录了我对负二项分布及其应用的理解。目录如下：1.理解"负"的含义知乎回答有提到：https://www.zhihu.com/question/24253978?sort=created文档中有提到：http://www.johndcook.com/negativebinomial.pdf负二项级数：https://brilliant.org/wiki/negative-binom
自然语言处理之机器翻译：OpenNMT：OpenNMT的编码器-解码器架构 zhubeibei168 自然语言处理自然语言处理机器翻译架构人工智能深度学习
自然语言处理之机器翻译：OpenNMT：OpenNMT的编码器-解码器架构一、OpenNMT简介1.1OpenNMT概述OpenNMT（OpenNeuralMachineTranslation）是一个开源的神经机器翻译框架，旨在提供一个灵活、高效且可扩展的平台，用于构建和训练机器翻译模型。它支持多种神经网络架构，包括编码器-解码器模型、注意力机制、双向循环神经网络等，适用于各种规模的翻译任务。Op
欢迎来到 C＃ 9.0（Welcome to C# 9.0） dotNET跨平台 c#java 编程语言 python 设计模式
翻译自MadsTorgersen2020年5月20日的博文《WelcometoC#9.0》，MadsTorgersen是微软C#语言的首席设计师，也是微软.NET团队的项目群经理。C#9.0正在成形，我想和大家分享一下我们对下一版本语言中添加的一些主要特性的想法。对于C#的每一个新版本，我们都在努力让常见的编码场景的实现变得更加清晰和简单，C#9.0也不例外。这次特别关注的是支持数据模型的简洁和不
W25Q128数据手册翻译（1）宁建利芯片与器件器件学习
W25Q128数据手册翻译（1）1概述2特性3器件封装类型和引脚配置4引脚描述4.1ChipSelect（/CS）（以下称片选或者/CS）4.2串行数据输入，输出和IO（DI，DO，以及IO0，IO1，IO2，IO3）4.3写保护（/WP）4.4保持（/HOLD）4.5串行时钟（CLK）4.6复位（/RESET）5方框图1概述W25Q128FV(128Mbit)型串行Flash存储器面向受限于空间
AT_abc237_f [ABC237F] |LIS| = 3 题解 Atserckcn 题解算法数据结构开发语言 c++学习
AT_abc237_f[ABC237F]|LIS|=3题解洛谷。题意够简练了，不复述。避坑注意，洛谷的翻译有误，数列各项可以等于MMM，不是MMM以下！！而且“最长增加部分列”最好改为“最长上升子序列”。思路胖头鱼教练：看题吧。我：怎么动态维护最长上升子序列长度啊……这时，注意到我们维护最长上升子序列长度并不关心序列所有数是多少。那么我们可以把最长上升子序列长度分别是111、222、333序列中的
Python概述，进制，原码、反码、补码 huangboy6 Python概述进制原码反码补码
一.Python概述（1）Python是一种解释型、面向对象、动态数据类型的高级程序设计语言（2）Python特点1.解释性语言2.交互式语言3.面向对象语言4.初学者语言（2）Python优点1.易于学习2.易于阅读3.易于维护4.一个广泛的标准库5.互动模式6.可移植性7.可扩展性8.数据库9.GUI编程10.可嵌入性（2）Python缺点1.运行速度慢（代码执行时一行一行翻译）2.代码不能加
python-docx官方文档翻译--用户指南02--快速开始 JovenGeek #windows python msword
快速开始使用python-docx入门很容易。我们先了解下基础知识。打开文档首先我们需要准备一个文档。最简单的方法是这样：fromdocximportDocumentdocument=Document()这将打开一个默认模板的空白文档，这与Word中新建的默认空白文档几乎是一样的。我们也可以使用python-docx打开和处理现有的Word文档，如下：fromdocximportDocument#
李飞飞：我们怎么教计算机理解图片 weixin_33699914 数据库人工智能大数据
前言：当一个非常小的孩子看到图片时，她可以辨认出里面简单的要素："猫""书""椅子"。现在，电脑也聪明得可以做同样的工作了。接下来呢？在这个令人震撼的演讲里，计算机视觉专家李飞飞介绍了这一技术的发展现状——包括她的团队为了"教"计算机理解图片所建立的一千五百万照片的数据库——而关键性的要点还不止于此。视频内容翻译：我先来给你们看点东西。（视频）女孩：好吧，这是只猫，坐在床上。一个男孩摸着一头大象。
观点丨李飞飞：我们怎么教计算机理解图片 weixin_34041003 数据库人工智能大数据
前言：当一个非常小的孩子看到图片时，她可以辨认出里面简单的要素：“猫”“书”“椅子”。现在，电脑也聪明得可以做同样的工作了。接下来呢？在这个令人震撼的演讲里，计算机视觉专家李飞飞介绍了这一技术的发展现状——包括她的团队为了"教"计算机理解图片所建立的一千五百万照片的数据库——而关键性的要点还不止于此。视频内容翻译：我先来给你们看点东西。（视频）女孩：好吧，这是只猫，坐在床上。一个男孩摸着一头大象。
自然语言处理之情感分析：使用卷积神经网络(CNN)进行文本预处理与分词技术 zhubeibei168 自然语言处理 cnn 人工智能神经网络深度学习
自然语言处理之情感分析：使用卷积神经网络(CNN)进行文本预处理与分词技术自然语言处理与情感分析简介自然语言处理的基本概念自然语言处理（NaturalLanguageProcessing，NLP）是人工智能领域的一个重要分支，它研究如何让计算机理解、解释和生成人类语言。NLP技术包括文本分类、情感分析、机器翻译、问答系统、语音识别等，广泛应用于搜索引擎、智能客服、社交媒体分析、新闻摘要生成等场景。
人工智能基础课【学习笔记】40 应用场景 | 数字巴别塔：机器翻译 Eleven_Whats 人工智能学习笔记
根据圣经旧约《创世纪》中的记载，大洪水劫后，诺亚的子孙们在巴比伦附近的示拿地定居。说着同样语言的人类联合起来兴建巴别塔，这让上帝深为他们的虚荣和傲慢而震怒。于是他悄悄地离开天国来到人间，变乱了人类的语言，无法交流的人们做鸟兽散，巴别塔的伟念也就轰然倒塌。圣经中对语言诞生的描述充满了天谴的色彩，虽然事实根本就不是这么回事，但语言的差异的的确确给人类的沟通与交流平添了诸多隔阂。难道伟大的巴别塔注定只是
[译] 如何向带有插槽的 React 组件传递多个 Children weixin_34378767 javascript 后端区块链 ViewUI
原文地址：PassMultipleChildrentoaReactComponentwithSlots原文作者：DaveCeddia译文出自：掘金翻译计划本文永久链接：github.com/xitu/gold-m…译者：Zheng7426校对者：noahziheng,BillShiyaoZhang假如你需要写一个可以重复使用的组件。可是呢，名为children的prop不能解决这个需求。这个组件得
Struts2高危漏洞修复方案(S2-016/S2-017) jzshmyt JAVA J2EE
近期Struts2被曝重要漏洞，此漏洞影响struts2.0-struts2.3所有版本，可直接导致服务器被远程控制从而引起数据泄漏,影响巨大,受影响站点以电商、银行、门户、政府居多.官方描述：S2-016：https://cwiki.apache.org/confluence/display/WW/S2-016S2-017：https://cwiki.apache.org/confluence/
Transformers之环境安装 AIVoyager transformers 深度学习 transformer nlp 人工智能
Transformers安装指南使用pip安装源码安装开发模式安装docker安装自定义dockerfile缓存设置离线模式获取离线时使用的模型和分词器参考Transformers提供了数以千计的预训练模型，支持100多种语言的文本分类、信息抽取、问答、摘要、翻译、文本生成。Transformers支持三个最热门的深度学习库：Jax,PyTorch以及TensorFlow—并与之无缝整合。你可以直
2025开源数据工程全景图 DolphinScheduler社区大数据
作者|AlirezaSadeghi译自PracticalDataEngineering2025年开源数据工程领域呈现蓬勃创新与生态重构的双重态势，九大技术赛道在实时化、轻量化与云原生架构驱动下加速演进。一份来自外网的2025年开源数据工程全景图全面地展示了这一领域的发展态势与走向，现翻译此文供相关从业者参考。值得注意的是，在数据工程领域全景图中，白鲸开源运营的开源项目ApacheDolphinSc
5、Rag基础：RAG 专题 Hugo_Hoo AI大模型应用开发技术路线人工智能 AI编程 langchain
RAG简介什么是检索增强生成？检索增强生成（RAG）是指对大型语言模型输出进行优化，使其能够在生成响应之前引用训练数据来源之外的权威知识库。大型语言模型（LLM）用海量数据进行训练，使用数十亿个参数为回答问题、翻译语言和完成句子等任务生成原始输出。在LLM本就强大的功能基础上，RAG将其扩展为能访问特定领域或组织的内部知识库，所有这些都无需重新训练模型。这是一种经济高效地改进LLM输出的方法，让它
AI同声传译基于PaddlePaddle框架的开源方案介绍 AI天才研究院 Python实战自然语言处理人工智能语言模型编程实践开发语言架构设计
作者：禅与计算机程序设计艺术1.简介随着人工智能技术的不断发展，越来越多的人将注意力集中在语音识别、机器翻译等领域，而这些技术虽然有其优点，但也面临着一些挑战。其中之一就是长文本翻译、多语言语音合成的难题，特别是在大规模数据和大型模型的情况下。为了解决这个问题，业界提出了许多有效的技术措施，如同声传译、分词对齐、强制教学等。在最近几年里，随着深度学习框架的火爆，出现了一系列基于神经网络的开源技术方
vue3+ts文字或链接转为二维码图片小猿L vue踩坑经验累积 vue
需求：扫描二维码下载app,后端已提供接口并请求定向到下载app功能，现需要将接口链接赋值到二维码图片，比如扫码二维码即为请求/app/download/v1.0.0接口并可实现下载功能，将图片赋值为/app/download/v1.0.0即可。实际实现即可翻译为：文字转为二维码图片1-安装qrcode库npmiqrcode2-新建QRCode组件import{defineProps,ref,on
8051单片机所有Keil C51汇编伪指令和C语言关键字大全才鲸嵌入式 7 51单片机汇编 c语言嵌入式单片机
8051单片机所有KeilC51汇编伪指令和C语言关键字大全作者将狼才鲸创建日期2025-04-21CSDN阅读地址：8051单片机所有Keil汇编伪指令和C语言关键字的详细解释8051单片机所有Keil汇编伪指令和C语言关键字的详细解释，在Keil已安装文件夹D:\Keil_v5\C51\Hlp\里有英文文档进行查阅，直接在文档里进行搜索，然后用翻译软件翻译即可，很多伪指令在网上搜不到解释，还是
DevOps与功能安全：Perforce ALM通过ISO 26262合规认证，简化安全关键系统开发流程管理iso安全证书
本文来源perforce.com，由Perforce中国授权合作伙伴、DevSecOps解决方案提供商-龙智翻译整理。近日，PerforceALM（原HelixALM）通过了国际权威认证机构TÜVSÜD的ISO26262功能安全流程认证！该认证涵盖PerforceALM解决方案的所有领域，包括需求管理、测试管理、问题管理和报告。通过ISO26262认证，Perforce确保其ALM解决方案满足汽车
集成API设计+测试+文档管理，全新一站式解决方案SmartBear API Hub功能介绍自动化测试apiapi设计
本文来源smartbear.com，由SmartBear中国授权合作伙伴、DevSecOps解决方案提供商-龙智翻译整理。创建API不仅仅是编写代码，还涉及协作、治理与提供无缝体验，以赋能团队和企业。随着企业规模和软件生态系统的扩展，API的复杂性日益增长，在治理、安全性和可见性方面面临挑战。为保持竞争力，企业团队需要一个统一且对开发者友好的解决方案，确保API从一开始就具备高质量、可发现性和安全
代码分析技术帖：静态情感分析解读与静态分析解决方案（Perforce QAC & Klocwork）代码分析代码质量
本文来源perforce.com，由Perforce中国授权合作伙伴、DevSecOps解决方案提供商-龙智翻译整理。静态情感分析（staticsentimentanalysis）是一种开创性的理论方法，可能会重塑软件开发流程。本文将为您介绍什么是静态情感分析，以及它如何能够理解开发者的意图，增强代码分析质量。什么是情感分析？情感分析处理大量数据，并使用自然语言处理（NLP）来确定一段文本的情感是
Nest.js中文文档上线啦！(最新V11版本) 前端
这是我历时1个多月翻译的最新Nest.js中文文档(最新V11.x版本)。就在这天上线吧！网站访问速度还是蛮快的哦！Nest.js中文文档访问地址：Nest中文文档https://nestjs.inode.club感兴趣可以看看，当年用的Nest.js版本比较老，后面小伙伴们都催新版本的一些用法，Nest.jsV8.x-V11.x变更的内容也比较多，大家可以先看翻译的中文文档，后面有时间我会专门出
【前端】【业务场景】【面试】在前端开发中，如何处理国际化（i18n）和本地化（l10n）需求？请描述具体的实现步骤和可能用到的工具。患得患失949 面试考题专栏（前后端）前端
标准答案：实现步骤1.提取文本手动提取：遍历项目中的HTML、JavaScript和CSS文件，找出所有需要翻译的文本内容，将它们记录下来。例如，在HTML中可能有欢迎来到我们的网站，在JavaScript中可能有alert('操作成功')，手动将这些文本整理到一个文件或数据结构中。使用工具提取：对于较大的项目，可使用工具辅助提取。例如在React项目中，可以使用react-i18next库结合i
Unity Mono内存简介与优化你一身傲骨怎能输 unity 游戏引擎
Mono内存简介Mono内存是Unity引擎通过Mono虚拟机管理的所有C#对象（即MonoObject相关）的内存占用。在使用IL2CPP模式时，Unity实际上使用的是重写的IL2CPP虚拟机，此时Mono内存对应于IL2CPP虚拟机管理的所有C#翻译后的对象（即Il2cppObject相关）。尽管如此，由于历史原因，UnityProfiler中仍然使用“Mono内存”这一术语。值得注意的是，
3、LangChain基础：LangChain Tools & Agent Hugo_Hoo AI大模型应用开发技术路线 langchain 人工智能 AI编程
Multimode集成多模态数据传输这里我们演示如何将多模态输入直接传递给模型。我们目前期望所有输入都以与OpenAI期望的格式相同的格式传递。对于支持多模态输入的其他模型提供者，我们在类中添加了逻辑以转换为预期格式。在这个例子中，我们将要求模型描述一幅图像。image_url="https://upload.wikimedia.org/wikipedia/commons/thumb/d/dd/G
Swift 个人学习笔记 - 02: 基础内容 astro
本文章纯粹是中文版《TheSwiftProgrammingLanguage》的学习笔记，所以绝大部分的内容都是文中有的。本文是本人的学习笔记，不是正式系统的记录。仅供参考以下还是有很多没看懂、不确定的地方，我会以“存疑”的注解指出。在此感谢中文版翻译者，这极大地加快了Swift的学习速度。Reference:原版：TheSwiftProgrammingLanguage中文版：Swift3编程语言S
Js函数返回值 _wy_ js return
一、返回控制与函数结果，语法为：return 表达式;作用: 结束函数执行，返回调用函数，而且把表达式的值作为函数的结果二、返回控制语法为：return;作用: 结束函数执行，返回调用函数，而且把undefined作为函数的结果在大多数情况下,为事件处理函数返回false,可以防止默认的事件行为.例如,默认情况下点击一个<a>元素,页面会跳转到该元素href属性
MySQL 的 char 与 varchar bylijinnan mysql
今天发现，create table 时，MySQL 4.1有时会把 char 自动转换成 varchar 测试举例： CREATE TABLE `varcharLessThan4` ( `lastName` varchar(3) ) ; mysql> desc varcharLessThan4; +----------+---------+------+-
Quartz——TriggerListener和JobListener eksliang TriggerListener JobListener quartz
转载请出自出处：http://eksliang.iteye.com/blog/2208624 一.概述 listener是一个监听器对象，用于监听scheduler中发生的事件，然后执行相应的操作；你可能已经猜到了，TriggerListeners接受与trigger相关的事件，JobListeners接受与jobs相关的事件。二.JobListener监听器 j
oracle层次查询 18289753290 oracle；层次查询；树查询
.oracle层次查询(connect by) oracle的emp表中包含了一列mgr指出谁是雇员的经理，由于经理也是雇员，所以经理的信息也存储在emp表中。这样emp表就是一个自引用表，表中的mgr列是一个自引用列，它指向emp表中的empno列，mgr表示一个员工的管理者， select empno,mgr,ename,sal from e
通过反射把map中的属性赋值到实体类bean对象中酷的飞上天空 javaee 泛型类型转换
使用过struts2后感觉最方便的就是这个框架能自动把表单的参数赋值到action里面的对象中但现在主要使用Spring框架的MVC，虽然也有@ModelAttribute可以使用但是明显感觉不方便。好吧，那就自己再造一个轮子吧。原理都知道，就是利用反射进行字段的赋值，下面贴代码主要类如下： import java.lang.reflect.Field; imp
SAP HANA数据存储：传统硬盘的瓶颈问题蓝儿唯美 HANA
SAPHANA平台有各种各样的应用场景，这也意味着客户的实施方法有许多种选择，关键是如何挑选最适合他们需求的实施方案。在《Implementing SAP HANA》这本书中，介绍了SAP平台在现实场景中的运作原理，并给出了实施建议和成功案例供参考。本系列文章节选自《Implementing SAP HANA》，介绍了行存储和列存储的各自特点，以及SAP HANA的数据存储方式如何提升空间压
Java Socket 多线程实现文件传输随便小屋 java socket
高级操作系统作业，让用Socket实现文件传输，有些代码也是在网上找的，写的不好，如果大家能用就用上。客户端类： package edu.logic.client; import java.io.BufferedInputStream; import java.io.Buffered
java初学者路径 aijuans java
学习Java有没有什么捷径?要想学好Java，首先要知道Java的大致分类。自从Sun推出Java以来，就力图使之无所不包，所以Java发展到现在，按应用来分主要分为三大块：J2SE,J2ME和J2EE,这也就是Sun ONE(Open Net Environment)体系。J2SE就是Java2的标准版，主要用于桌面应用软件的编程；J2ME主要应用于嵌入是系统开发，如手机和PDA的编程；J2EE
APP推广 aoyouzi APP 推广
一，免费篇 1，APP推荐类网站自主推荐最美应用、酷安网、DEMO8、木蚂蚁发现频道等,如果产品独特新颖，还能获取最美应用的评测推荐。PS：推荐简单。只要产品有趣好玩，用户会自主分享传播。例如足迹APP在最美应用推荐一次，几天用户暴增将服务器击垮。 2，各大应用商店首发合作老实盯着排期，多给应用市场官方负责人献殷勤。 3，论坛贴吧推广百度知道，百度贴吧，猫扑论坛，天涯社区，豆瓣（
JSP转发与重定向百合不是茶 jsp servlet Java Web jsp转发
在servlet和jsp中我们经常需要请求,这时就需要用到转发和重定向; 转发包括;forward和include 例子;forwrad转发; 将请求装法给reg.html页面关键代码; req.getRequestDispatcher("reg.html
web.xml之jsp-config bijian1013 java web.xml servlet jsp-config
1.作用：主要用于设定JSP页面的相关配置。 2.常见定义： <jsp-config> <taglib> <taglib-uri>URI(定义TLD文件的URI,JSP页面的tablib命令可以经由此URI获取到TLD文件)</tablib-uri> <taglib-location> TLD文件所在的位置
JSF2.2 ViewScoped Using CDI sunjing CDI JSF 2.2 ViewScoped
JSF 2.0 introduced annotation @ViewScoped; A bean annotated with this scope maintained its state as long as the user stays on the same view(reloads or navigation - no intervening views). One problem w
【分布式数据一致性二】Zookeeper数据读写一致性 bit1129 zookeeper
很多文档说Zookeeper是强一致性保证，事实不然。关于一致性模型请参考http://bit1129.iteye.com/blog/2155336 Zookeeper的数据同步协议 Zookeeper采用称为Quorum Based Protocol的数据同步协议。假如Zookeeper集群有N台Zookeeper服务器(N通常取奇数，3台能够满足数据可靠性同时
Java开发笔记白糖_ java开发
1、Map<key,value>的remove方法只能识别相同类型的key值 Map<Integer,String> map = new HashMap<Integer,String>(); map.put(1,"a"); map.put(2,"b"); map.put(3,"c"
图片黑色阴影 bozch 图片
.event{ padding:0; width:460px; min-width: 460px; border:0px solid #e4e4e4; height: 350px; min-heig
编程之美-饮料供货-动态规划 bylijinnan 动态规划
import java.util.Arrays; import java.util.Random; public class BeverageSupply { /** * 编程之美饮料供货 * 设Opt（V’，i）表示从i到n-1种饮料中，总容量为V’的方案中，满意度之和的最大值。 * 那么递归式就应该是：Opt（V’，i）=max{ k * Hi+Op
ajax大参数（大数据）提交性能分析 chenbowen00 Web Ajax 框架浏览器 prototype
近期在项目中发现如下一个问题项目中有个提交现场事件的功能，该功能主要是在web客户端保存现场数据（主要有截屏，终端日志等信息）然后提交到服务器上方便我们分析定位问题。客户在使用该功能的过程中反应点击提交后反应很慢，大概要等10到20秒的时间浏览器才能操作，期间页面不响应事件。根据客户描述分析了下的代码流程，很简单，主要通过OCX控件截屏，在将前端的日志等文件使用OCX控件打包，在将之转换为
[宇宙与天文]在太空采矿,在太空建造 comsci
我们在太空进行工业活动...但是不太可能把太空工业产品又运回到地面上进行加工,而一般是在哪里开采,就在哪里加工,太空的微重力环境,可能会使我们的工业产品的制造尺度非常巨大.... 地球上制造的最大工业机器是超级油轮和航空母舰,再大些就会遇到困难了,但是在空间船坞中,制造的最大工业机器,可能就没
ORACLE中CONSTRAINT的四对属性 daizj oracle CONSTRAINT
ORACLE中CONSTRAINT的四对属性 summary:在data migrate时,某些表的约束总是困扰着我们,让我们的migratet举步维艰,如何利用约束本身的属性来处理这些问题呢?本文详细介绍了约束的四对属性: Deferrable/not deferrable, Deferred/immediate, enalbe/disable, validate/novalidate,以及如
Gradle入门教程 dengkane gradle
一、寻找gradle的历程一开始的时候，我们只有一个工程，所有要用到的jar包都放到工程目录下面，时间长了，工程越来越大，使用到的jar包也越来越多，难以理解jar之间的依赖关系。再后来我们把旧的工程拆分到不同的工程里，靠ide来管理工程之间的依赖关系，各工程下的jar包依赖是杂乱的。一段时间后，我们发现用ide来管理项程很不方便，比如不方便脱离ide自动构建，于是我们写自己的ant脚本。再后
C语言简单循环示例 dcj3sjt126com c
# include <stdio.h> int main(void) { int i; int count = 0; int sum = 0; float avg; for (i=1; i<=100; i++) { if (i%2==0) { count++; sum += i; } } avg
presentModalViewController 的动画效果 dcj3sjt126com controller
系统自带(四种效果)： presentModalViewController模态的动画效果设置： [cpp] view plain copy UIViewController *detailViewController = [[UIViewController al
java 二分查找 shuizhaosi888 二分查找 java二分查找
需求：在排好顺序的一串数字中，找到数字T 一般解法：从左到右扫描数据，其运行花费线性时间O(N)。然而这个算法并没有用到该表已经排序的事实。 /** * * @param array * 顺序数组 * @param t * 要查找对象 * @return */ public stati
Spring Security（07）——缓存UserDetails 234390216 ehcache 缓存 Spring Security
Spring Security提供了一个实现了可以缓存UserDetails的UserDetailsService实现类，CachingUserDetailsService。该类的构造接收一个用于真正加载UserDetails的UserDetailsService实现类。当需要加载UserDetails时，其首先会从缓存中获取，如果缓存中没
Dozer 深层次复制 jayluns VO maven po
最近在做项目上遇到了一些小问题，因为架构在做设计的时候web前段展示用到了vo层，而在后台进行与数据库层操作的时候用到的是Po层。这样在业务层返回vo到控制层，每一次都需要从po-->转化到vo层，用到BeanUtils.copyProperties(source, target)只能复制简单的属性，因为实体类都配置了hibernate那些关联关系，所以它满足不了现在的需求，但后发现还有个很
CSS规范整理（摘自懒人图库） a409435341 html UI css 浏览器
刚没事闲着在网上瞎逛，找了一篇CSS规范整理，粗略看了一下后还蛮有一定的道理，并自问是否有这样的规范，这也是初入前端开发的人一个很好的规范吧。一、文件规范 1、文件均归档至约定的目录中。具体要求通过豆瓣的CSS规范进行讲解：所有的CSS分为两大类：通用类和业务类。通用的CSS文件，放在如下目录中：基本样式库 /css/core
C++动态链接库创建与使用你不认识的休道人 C++dll
一、创建动态链接库 1.新建工程test中选择”MFC [dll]”dll类型选择第二项"Regular DLL With MFC shared linked"，完成 2.在test.h中添加 extern “C” 返回类型 _declspec(dllexport)函数名(参数列表); 3.在test.cpp中最后写 extern “C” 返回类型 _decls
Android代码混淆之ProGuard rensanning ProGuard
Android应用的Java代码，通过反编译apk文件（dex2jar、apktool）很容易得到源代码，所以在release版本的apk中一定要混淆一下一些关键的Java源码。 ProGuard是一个开源的Java代码混淆器（obfuscation）。ADT r8开始它被默认集成到了Android SDK中。官网： http://proguard.sourceforge.net/
程序员在编程中遇到的奇葩弱智问题 tomcat_oracle jquery 编程 ide
　　现在收集一下：　　排名不分先后，按照发言顺序来的。 1、Jquery插件一个通用函数一直报错，尤其是很明显是存在的函数，很有可能就是你没有引入jquery。。。或者版本不对 2、调试半天没变化：不在同一个文件中调试。这个很可怕，我们很多时候会备份好几个项目，改完发现改错了。有个群友说的好：在汤匙
解决maven-dependency-plugin (goals "copy-dependencies","unpack") is not supported xp9802 dependency
解决办法：在plugins之前添加如下pluginManagement，二者前后顺序如下： [html] view plain copy <build> <pluginManagement

Solr4 Wiki 翻译 - 分布式搜索

你可能感兴趣的:(Solr4 Wiki 翻译 - 分布式搜索)