llama_index 创始人为我们展示召回提升策略(提升15%)

用句子向量替换为句子向量

句子检索,将句子转化为向量。在检索的过程中,假如句子命中,则将句子周围的内容也当做检索内容。

对比句子检索和之前的按块去做切分的检索。可以看到,内容的相关性提升了8%,

llama_index 创始人为我们展示召回提升策略(提升15%)_第1张图片

构建数据的时候,包好层次结构

llama_index 创始人为我们展示召回提升策略(提升15%)_第2张图片

如果召回的时候,更多的有命中一个父节点下的多个子节点,则将父节点的数据全部返回,作为内容。测试结果看到,召回相关性上从36%提升到 43%,提升了7%

llama_index 创始人为我们展示召回提升策略(提升15%)_第3张图片

你可能感兴趣的:(RAG,ES搜索优化,RAG召回提升,句子向量,数据分层)