水的精神

密集检索：我们应该使用什么样的检索粒度？（如何提升召回率）

最近在做搜索召回提升的研究工作，看到一篇好的论文，思路比较新颖。论文中提出了通过对原文抽取“命题”，对命题进行检索，可以提升10%-20%的召回率。（这里的命题，实际上是不可拆分的子问题。）

论文原文：https://arxiv.org/pdf/2312.06648.pdf

在现代的自然语言处理（NLP）任务中，密集检索已经成为获取相关上下文或世界知识的突出方法。当我们使用一个已学习的密集检索器在检索语料库上进行推断时，一个经常被忽视的设计选择是语料库的检索单位，例如文档、段落或句子。我们发现，检索单位的选择对检索和下游任务的性能有显著影响。

不同于典型的采用段落或句子的方法，我们引入了一个新的检索单位——命题，用于密集检索。命题被定义为文本中的原子表达式，每个命题都封装了一个不同的方面，并以简洁、自包含的自然语言格式呈现。

我们进行了不同检索粒度的实证比较。结果表明，基于命题的检索在密集检索中显著优于传统的段落或句子基方法。此外，通过命题进行检索还可以提高下游问答（QA）任务的表现，因为检索的文本更简洁，包含与问题相关的信息，从而减少了对冗长输入令牌的需求，并最大限度地减少了无关信息的包含。

一、介绍

密集检索器是一种流行的技术，用于访问外部信息源以执行知识密集型任务（Karpukhin等，2020）。在使用已学习的密集检索器从语料库中进行检索之前，我们必须做出一个重要的设计决策——检索单位，即我们分割和索引语料库的粒度。

什么事命题呢？

命题是一种精炼的、自包含的语句，它可以准确、完整地表达文本中的某个原子事实，不受其他文本部分影响即可理解。

示范：段落：乔治·弗兰克·冯·弗兰肯奥教授于1678年在德国西南部记录了最早的复活节兔子现象。命题：乔治·弗兰克·冯·弗兰肯奥是医学教授。命题：复活节兔子现象在1678年由乔治·弗兰克·冯·弗兰肯奥首次记录在案。

二、不同检索粒度的比较

在本文中，我们将比较文档、段落和句子等传统检索单位与新提出的命题检索单位之间的性能差异。我们将使用一系列实验来评估不同检索粒度对密集检索和下游任务性能的影响。

首先，我们将简要介绍传统的文档、段落和句子检索单位，并解释它们在密集检索中的使用方式。然后，我们将详细介绍命题检索单位，并解释其在密集检索中的优势和应用。

在比较不同检索粒度的实验中，我们将使用一系列评估指标来衡量性能，包括准确率、召回率和F1分数等。我们将根据实验结果讨论不同检索粒度的优缺点，并确定最适合特定任务的检索粒度。

在密集检索模型的实际应用中，一个至关重要的设计决策就是确定检索粒度，即我们如何将检索语料库划分为不同的单元来进行索引。过去的研究和实践倾向于采用固定的100词段落或句子作为检索单位，但这忽略了检索单元选择对模型检索能力和下游任务性能的潜在影响。事实上，检索粒度的选择对模型能否成功捕获和传递相关知识至关重要。

当预先训练的密集检索器使用来自检索语料库的三个不同粒度时，对5个不同的开放域QA数据集的通道检索性能（Recall@k = 5,20）。下划线表示在密集检索器的训练数据中包含了目标数据集的训练分割的情况。

在检索后读设置下的开放域QA性能（EM =精确匹配），其中检索到的单词到读者QA模型的单词数量限制在l = 100或500。我们使用UnifedQA V2（Khashabi et al.，2022）作为读者模型。从连接的顶部检索文本单元中提取的第一个l个单词作为阅读器模型的输入。下划线表示在密集检索器的训练数据中包含了目标数据集的训练分割的情况。在大多数情况下，我们看到更小的检索单元看到更好的QA性能。

三、命题检索单位的介绍

命题检索单位是一种新型的检索单位，用于密集检索。与传统的文档、段落或句子检索单位不同，命题被定义为文本中的原子表达式，每个命题都封装了一个不同的方面，并以简洁、自包含的自然语言格式呈现。

在命题检索中，语料库被分割成一系列的命题。每个命题都包含一个明确的信息点，如事实、概念或关系等。这种原子化的表示方式使得命题能够更精确地捕捉文本中的信息，并提供更紧凑的表示形式。

与传统的段落或句子检索单位相比，命题检索单位具有以下优点：

精确性：命题能够精确地捕获文本中的信息点，避免了传统方法中可能出现的冗余或不相关信息的干扰。
简洁性：命题以简洁、自包含的形式呈现信息，减少了输入令牌的长度，提高了模型的效率和可解释性。
可扩展性：命题可以轻松地应用于不同的语言和领域，而无需对整个文档或段落进行索引。这使得命题具有更好的可扩展性和灵活性。
交互性：由于命题封装了明确的信息点，用户可以更轻松地与检索结果进行交互和过滤。这有助于提高用户体验和任务效率。

四、实验结果与讨论

为了评估不同检索粒度对密集检索和下游任务性能的影响，我们进行了一系列实验。我们使用不同的评估指标来衡量不同检索粒度在密集检索和下游任务中的表现，并使用表格和图表记录了实验结果。

首先，我们比较了文档、段落和句子检索单位在密集检索中的性能。实验结果表明，句子检索单位在大多数情况下表现最好，其次是段落检索单位，最后是文档检索单位。句子检索单位能够更好地捕获文本中的信息，并提供更精确的表示形式。

然后，我们比较了基于命题的检索单位与传统的句子检索单位在密集检索中的性能。实验结果表明，基于命题的检索单位显著优于传统的句子检索单位。命题检索单位能够更准确地捕获文本中的信息点，并提供更紧凑的表示形式。此外，命题检索单位还具有更好的可扩展性和灵活性。

接下来，我们评估了命题检索单位在下游问答任务中的性能。实验结果表明，基于命题的检索可以显著提高下游问答任务的性能。由于命题检索的文本更简洁，包含与问题相关的信息，从而减少了对冗长输入令牌的需求，并最大限度地减少了无关信息的包含。此外，命题检索单位还允许用户更轻松地与检索结果进行交互和过滤，从而提高用户体验和任务效率。

在实验环节中，我们选取了五种广泛使用的开放领域问答数据集，采用六款领先的有监督和无监督双编码器检索模型（如SimCSE、Contriever、DPR、ANCE、TAS-B 和 GTR），在以段落、句子和命题为检索单位的不同情况下，评估了它们在检索和下游问答任务上的性能差异。

实验结果显示，命题检索在检索性能和下游问答任务准确度上均显著超过基于段落和句子的传统方法。尤其是在面对严格的输入令牌长度限制时，命题检索的优势尤为突出。因为命题天然具有更高的问题相关信息密度，从而减少了冗余输入和无关信息的混杂，提高了检索结果的针对性和准确性。

统计数据显示，相比于段落检索，无监督的密集检索器在Recall@20指标上平均提升了10.1个百分点，而有监督的检索器也获得了+2.2个百分点的提升。同时，在开放式问答任务中，基于命题的检索策略同样表现出色，有助于提高模型回答问题的准确性和效率。

五、未来工作

优化命题表示：我们将研究如何进一步优化命题的表示方式，以提高其捕获文本信息的能力。例如，我们可以尝试使用更复杂的信息抽取技术或模型结构来提取更丰富的信息点。
多粒度检索：除了单个粒度检索外，我们将研究多粒度检索策略，以综合利用不同粒度的信息来提高性能。例如，我们可以同时使用文档、段落、句子和命题等多种粒度进行联合检索。
跨语言和领域应用：我们将探索如何将命题检索单位扩展到不同的语言和领域中，以实现跨语言和跨领域的可扩展性和灵活性。这将有助于提高命题检索的实用性和广泛应用价值。

六、相关工作

尽管本文主要关注命题检索单位在密集检索和下游任务中的应用，但相关工作还包括其他检索粒度的比较以及相关技术的探索。

传统的检索粒度，如文档、段落和句子，已经在密集检索和下游任务中得到了广泛的研究和应用。例如，一些工作已经探讨了如何使用文档或段落作为检索单位来提高问答任务的表现（Bigham et al., 2010; Li et al., 2019）。这些研究为命题检索单位的应用提供了有益的参考和启示。

此外，相关工作还包括对其他检索技术的研究，如特征提取、语义理解和实体链接等。这些技术可以与命题检索单位相结合，以进一步提高密集检索和下游任务的表现。例如，实体链接技术可以帮助我们将文本中的实体链接到外部知识库，从而提供更丰富和准确的信息（Nickel et al., 2016）。

七、应用前景

命题检索单位在许多领域中都具有广泛的应用前景。以下是一些潜在的应用方向：

问答系统：在问答系统中，命题检索单位可以帮助我们更精确地找到与问题相关的信息，从而提高问答的准确率。同时，由于命题检索的文本更为简洁，可以减少对用户输入的冗长解释的需求，提升用户体验。
文档摘要：在文档摘要任务中，命题检索单位可以帮助我们快速提取文档中的关键信息，为用户提供一个简洁、自包含的摘要。这种简洁的表示形式有助于提高摘要的可读性和可理解性。
社交媒体分析：在社交媒体分析中，命题检索单位可以帮助我们快速识别和提取社交媒体帖子中的关键信息，如情感分析、主题建模和影响力分析等。这种原子化的表示方式有助于提高分析的精确度和效率。
机器翻译：在机器翻译中，命题检索单位可以帮助我们快速找到与目标语言相关的翻译，从而提高翻译的准确性和效率。这种检索方式有助于减少对大规模语料库的依赖，并提高翻译的流畅性和自然度。
辅助写作和编辑：在辅助写作和编辑中，命题检索单位可以帮助我们快速找到与写作主题相关的素材和信息，从而丰富写作内容、提高写作效率。这种检索方式有助于减少写作中的冗余和不相关信息的干扰。

这些应用方向只是命题检索单位潜在应用的一部分。随着自然语言处理技术的不断发展，命题检索单位有望在更多领域得到应用和推广。

八、结论

通过深入研究不同检索粒度对密集检索和下游任务性能的影响，本文特别介绍了新提出的命题检索单位。实证比较结果显示，基于命题的检索在密集检索中明显优于传统的句子检索单位，同时在下游问答任务中也取得显著的性能提升。命题检索单位以其精确性、简洁性、可扩展性和交互性等优势脱颖而出，能够更准确地捕捉文本中的信息点，并提供更紧凑的表示形式。由于命题明确封装了信息点，用户能够更轻松地与检索结果进行交互和过滤。

在未来的研究中，我们将进一步探讨命题检索单位的实施细节和优化方法。同时，我们还计划研究如何将命题检索单位与其他自然语言处理任务结合，以进一步提升任务性能和可解释性。总体而言，通过结合其他检索技术和相关技术，我们有望进一步推动密集检索和下游任务的性能，推动自然语言处理领域的进步。

九、个人实践

这篇论文内容很多，描述的比较杂，又没有给出具体的操作方案。下边是我根据论文的自己的实践经验。其实就是构建一个prompt，来抽取文本内容中的知识点。

这里给出我的案例

任务：从给定的文本段落中提取出所有代表独立事实的命题。定义：命题是一种精炼的、自包含的语句，它可以准确、完整地表达文本中的某个原子事实，不受其他文本部分影响即可理解。示范：段落：乔治·弗兰克·冯·弗兰肯奥教授于1678年在德国西南部记录了最早的复活节兔子现象。命题：乔治·弗兰克·冯·弗兰肯奥是医学教授。命题：复活节兔子现象在1678年由乔治·弗兰克·冯·弗兰肯奥首次记录在案。现在，请您基于以上定义和示范，从以下段落中生成类似的命题列表：先进的RAG已经进行了有针对性的改进，以克服了朴素RAG的不足。在检索生成的质量方面，高级RAG结合了前检索和后检索方法。为了解决朴素RAG所遇到的索引问题，高级RAG通过滑动窗口、细粒度分割和元数据等方法进行了索引优化。同时，提出了多种优化检索过程的方法。在具体的实现方面，高级RAG可以通过管道或以端到端的方式进行调整。

看抽取的结果（我是用的chat-gpt 用国内的模型效果差不多！）

先进的RAG已经进行了有针对性的改进，以克服了朴素RAG的不足。

高级RAG结合了前检索和后检索方法，以提高检索生成的质量。

高级RAG通过滑动窗口、细粒度分割和元数据等方法进行了索引优化，以解决朴素RAG所遇到的索引问题。

高级RAG提出了多种优化检索过程的方法。

在具体的实现方面，高级RAG可以通过管道或以端到端的方式进行调整。

当凌晨的键盘声，遇见黎明的星光涔溪笔记
地铁玻璃映出你困倦的脸，耳机里的音乐循环到第17遍，早高峰的人群像沙丁鱼罐头般挤压着你。这是你每天雷打不动的三小时通勤路，从城市边缘到写字楼林立的CBD，窗外的风景换了四季，而你始终困在摇晃的车厢里，困在日复一日的代码世界。深夜加班时，办公室只剩你工位的灯还亮着。屏幕蓝光映着你通红的眼睛，键盘声在寂静中格外清晰。你曾以为热爱能抵御一切，可如今，修改了无数次的需求文档、永远修复不完的BUG、凌晨三点
前后端分离与不分离解析，很全面！涔溪前端
从多个维度对前后端分离与不分离进行更加深入、系统的分析，包括技术架构、开发流程、部署维护、性能优化、团队协作、适用场景等方面全面理解两者的区别和优劣。一、概念定义1.前后端不分离（传统服务端渲染）前端页面由服务器端生成并返回给浏览器，如PHP、JSP、ASP.NET等。前端逻辑和后端业务耦合在一起，通常一个请求对应一个完整的HTML页面。2.前后端分离（现代Web开发模式）前端独立开发为一个完整的
一站式AI创作引擎：LiblibAI如何重塑中国图像生成生态 Liudef06小白人工智能 AI作画
一站式AI创作引擎：LiblibAI如何重塑中国图像生成生态无需显卡，每日免费200张图——这个本土AI平台正在让专业级图像生成变得像发微信一样简单。在StableDiffusion掀起全球AI艺术浪潮的2023年，中国设计师们面临着一个尴尬的困境：动辄数万元的高性能显卡将大多数人挡在了创作门槛之外。正是这一年5月，北京奇点星宇科技推出LiblibAI（哩布哩布AI），以**“云端StableDi
解锁阿里云E-MapReduce：大数据处理的超能力秘籍云资源服务商阿里云云计算人工智能云原生
一、引言在数字化浪潮汹涌澎湃的当下，大数据已然成为推动各行业创新发展的核心驱动力。从电商平台精准的个性化推荐，到金融机构严密的风险评估，再到医疗领域高效的疾病预测，大数据的应用场景无处不在，深刻地改变着我们的生活与工作方式。在这片充满机遇与挑战的大数据领域中，阿里云E-MapReduce宛如一颗璀璨的明星，占据着举足轻重的地位。它凭借强大的大数据处理能力、卓越的性能表现以及丰富的功能特性，为企业和
全球覆盖与跨境网络优化：SD-WAN如何助力跨国企业应对通信挑战北极光SD-WAN组网网络
随着全球化的深入发展，跨国企业的业务布局日益广泛，但随之而来的跨境网络通信问题却成为企业数字化转型的难点之一。传统广域网（WAN）架构在面对复杂的跨境通信环境时，常常暴露出高延迟、不稳定以及数据隐私合规性不足的问题。而SD-WAN（软件定义广域网）作为一种新兴的网络解决方案，凭借其智能化、灵活性和安全性，逐渐成为跨国企业的首选方案。一、SD-WAN是否具备全球范围内的覆盖能力？SD-WAN通过其分
稳定性与高可用性：SD-WAN如何保障链路故障下的业务连续性
稳定性与高可用性是现代企业网络的核心要求，尤其是在数字化转型和全球化进程中，任何网络中断都可能导致业务停滞甚至经济损失。传统网络架构对链路故障和运营商问题的应对能力较弱，而SD-WAN（软件定义广域网）以其智能化的架构设计和实时动态管理能力，成为保障业务连续性的理想选择。本文将从以下几个方面探讨SD-WAN如何通过冗余、故障转移和快速恢复技术，确保企业网络的稳定性和高可用性。一、SD-WAN如何确
如何搭建分公司到总部的专线网络？（SD-WAN双链路冗余+加密隧道配置全流程）北极光SD-WAN组网网络
#如何搭建分公司到总部的专线网络？（以北京→上海为例）在现代企业的网络架构中，分支机构与总部之间的高效、安全、稳定的网络通信是至关重要的。构建一条可靠的专线网络不仅能保障业务数据的高效传输，还能提升整体运营效率。本文将以北京到上海的分公司到总部为例，详细解析搭建专线网络的四步流程：**选服务商**→**部署SD-WAN设备**→**配置加密隧道**→**设置业务优先级策略**。##一、选服务商：选
跨区域组网如何支撑多监控点高效运营？—智能SD-WAN技术解析北极光SD-WAN组网网络
在连锁门店、工业园区、物流仓储等场景中，跨区域部署监控系统已成为企业数字化转型的重要组成部分。要实现总部实时查看各地监控画面、保障数据传输的稳定性和安全性，并同时满足成本和扩展需求，传统的组网方式正逐渐显现其局限性。本文将从技术角度出发，深入解析跨区域组网的常见痛点，并探讨如何通过智能SD-WAN技术实现高效的多监控点管理，助力企业构建灵活可靠的监控网络。一、多监控点组网的核心痛点与解决思路随着企
SD-WAN在智能仓储与物流管理中的应用解析：赋能制造业数字化转型
随着工业4.0与供应链数字化的推进，制造业在仓储与物流管理方面面临着前所未有的挑战和机遇。为实现仓储系统与生产系统、供应链系统的高度联动，网络的可靠性、灵活性和实时性成为关键问题。SD-WAN（软件定义广域网）技术凭借其高效、智能的网络管理能力，为智能仓储与物流管理提供了全新解决方案。在制造业中，仓储与物流管理是连接生产系统与供应链系统的重要环节，其高效运作直接影响到企业的生产效率和市场竞争力。随
SD-WAN 是否支持固定 IP？深度解析企业网络架构中的关键问题北极光SD-WAN组网网络 tcp/ip 架构
近年来，随着企业数字化转型的深化，SD-WAN（软件定义广域网）因其灵活性、高效性和成本优化而备受关注。许多企业在部署SD-WAN时，会产生这样一个疑问：**SD-WAN是否提供固定IP？能否满足对固定IP的需求？**本文将从技术原理、应用场景和具体实现等角度深入探讨这个问题，帮助企业在网络架构设计中做出明智选择。##一、SD-WAN的技术背景与架构SD-WAN是一种基于软件定义网络（SDN）技术
远程光伏电站网络解决方案：SD-WAN与传统方式的双剑合璧北极光SD-WAN组网网络
在“双碳”目标驱动下，光伏行业迎来了爆发式增长。然而，光伏电站由于数量多、分布广且位置偏远，其远程运维管理面临巨大挑战。传统的网络接入方式（如VPN和专线）虽然成熟稳定，但在成本、灵活性和扩展性上存在明显不足。而近年来兴起的**SD-WAN（软件定义广域网）**技术，凭借其智能化、敏捷性和成本优势，为光伏行业提供了更为灵活高效的网络解决方案。但从实际场景来看，完全“抛弃”传统方式并不可取，而是需要
《聚类算法》入门--大白话篇：像整理房间一样给数据分类
一、什么是聚类算法？想象一下你的衣柜里堆满了衣服，但你不想一件件整理。聚类算法就像一个聪明的助手，它能自动帮你把衣服分成几堆：T恤放一堆、裤子放一堆、外套放一堆。它通过观察衣服的颜色、大小、款式这些特征，把相似的放在一起，不相似的分开。在计算机世界里，聚类算法就是帮我们把杂乱的数据分成有意义的组。它不需要提前知道答案（这就是"无监督学习"），而是像侦探一样，从数据中发现隐藏的规律。二、最常见的三种
实现 el-table 中键盘方向键导航功能vue2+vue3（类似 Excel）
实现el-table中键盘方向键导航功能vue2+vue3（类似Excel）功能需求在ElementUI的el-table表格中实现以下功能：使用键盘上下左右键在可编辑的el-input/el-select之间移动焦点焦点移动时自动定位到对应单元格支持光标位置自动调整，提升编辑体验完整解决方案(vue2)1.表格结构修改在el-table中添加键盘事件监听，并为可编辑元素添加定位标识：2.核心Ja
阿里云魔搭社区AIGC专区：中国AI创作的革命性平台 Liudef06小白阿里云 AIGC 人工智能
在生成式人工智能重塑全球数字创作版图的浪潮中，中国首个一站式AIGC开发平台——阿里云魔搭社区AIGC专区于2024年9月杭州云栖大会正式亮相。这一突破性进展不仅填补了国内全流程AI创作工具的空白，更以157款多模态开源模型和全免费GPU算力的开放姿态，为超过690万开发者提供了从模型调用到应用落地的完整生态支持。一、魔搭社区：中国AI模型生态的奠基者魔搭社区（ModelScope）作为阿里云在2
探秘阿里云Tair KVCache：大模型推理的加速引擎云资源服务商阿里云云计算人工智能
一、引言近年来，人工智能领域发展迅猛，大语言模型（LLM）不断取得突破，其应用场景也日益广泛。从智能客服到内容生成，从智能写作到智能翻译，大语言模型正在深刻地改变着我们的生活和工作方式。随着模型规模的不断扩大和推理需求的日益增长，大模型推理过程中的显存瓶颈问题逐渐凸显，成为制约其发展和应用的关键因素。在大模型推理中，KVCache技术作为一种优化手段，通过缓存历史Token的Key/Value向量
C51填坑记：中断处理导致主程序函数参数改变 albert_812 C51 C51 Data Overlay 中断参数异常改变
1.现象平台：keilc51，中颖SH79F7019A现象：在增加了一个中断处理逻辑后，发现主程序异常，断点调试发现某个函数的参数被改变了，程序使用了错误的数据导致逻辑出错。2.排查初步分析，可能原因如下：1.参数寄存器(R0-R7)的值，被中断函数改变。2.堆栈溢出。2.1参数寄存器首先排查参数寄存器（中断里面调用了函数，有参数传递）。通过仿真器观察中断函数汇编代码，发现在进入中断之前是对R0-
AI正在偷偷取代这10种职业，你的工作安全吗？
近年来，人工智能（AI）的飞速发展正在悄然改变我们的工作方式。从自动化客服到AI生成内容，许多传统职业正面临被取代的风险。虽然AI带来了更高的效率和便利，但也让不少人开始担忧：我的工作会被AI抢走吗？今天，我们就来盘点10种最容易被AI取代的职业，并探讨如何在这个AI时代保持竞争力。1.客服代表取代指数：★★★★★AI驱动的聊天机器人（如ChatGPT、GoogleBard）已经能够处理大部分基础
中断与其他函数共享变量、临界资源的保护匠在江湖 C语言知识点单片机嵌入式硬件
volatilevolatile概念作用volatile(英译:易变的)是一个特征修饰符关键字，防止编译器对修饰的变量相关代码进行优化，每次使用都重新读取变量的值，而不是使用寄存器里的备份。volatile字面意思不太好理解，其实它是提醒编译器这个变量是易变的，不要去优化它！XBYTE[2]=0x55;XBYTE[2]=0x56;XBYTE[2]=0x57;XBYTE[2]=0x58;对外部硬件而
单片机中断细水长流煮红豆｛单片机
1、中断是什么中断指的是在设备运行过程中，当某个事件或条件发生时，处理器能够暂停当前正在执行的程序，转而执行一段特定的代码（称为中断服务程序或中断处理程序），以响应这个事件或条件。中断处理完成后，处理器将返回到被中断的程序中继续执行。中断的主要目的是提高系统的响应能力和处理效率。通过中断机制，嵌入式系统可以实时地响应外部设备或内部状态的变化，而无需轮询或等待这些变化的发生。这使得嵌入式系统能够更加
Win10自定义指南：隐藏“我的电脑”中的默认文件夹.zip 小馬锅
本文还有配套的精品资源，点击获取简介：在Windows10中，“我的电脑”提供了一个访问和管理本地资源的界面。本文介绍了如何通过修改注册表或使用第三方工具自定义该界面，移除默认的六个文件夹快捷方式，使“我的电脑”界面更符合个性化需求。这包括了注册表编辑的具体步骤和使用第三方软件的建议。文章强调了操作的谨慎性，并说明了如何通过反向操作恢复默认设置。1.Windows10中的“我的电脑”界面自定义1.
python正则匹配11个数字_python正则表达式re.match()匹配多个字符方法的实现小馬锅 python正则匹配11个数字
1.*表示匹配任意多个字符\d*表示匹配任意多个数字字符importretext="123h1elloworld"text1="123Helloworld456"text2="helloworld"res=re.match("\d*",text)res1=re.match("\d*",text1)res2=re.match("\d*",text2)print(res.group())print(r
mcu secure boot 设计（一、Flash layout） lwz070 单片机嵌入式硬件
Flashlayout此flash为MCU内部flash，需要硬件保护，防篡改和读取。1.PBL:为bootloader代码pbl中不支持远程升级，仅在APP中支持远程。pbl中可以支持uart和can协议升级。2.globalstate:{runflag//1:runimageA,2:runimageBImageAsecuritypassflag//1:pass,2:failImageBsecu
读芯片信息出错3_简单说说汽车MCU有关security信息安全功能 weixin_39617685 读芯片信息出错3
汽车生态系统正在快速发展，新的连接技术将推动汽车进入物联网领域，其好处与威胁并存。随着每辆车的电子控制单元(ECU)的数量增加，以及汽车与互联网，用户以及彼此之间的连接，其复杂性和攻击面呈指数级增长。空中远程诊断和软件更新，紧急呼叫，互联网服务，车载支付，移动应用以及信息娱乐和交通信息等新功能都增加了车辆的攻击面。汽车电子网络安全标准化白皮书(2018)中，通过对近年来出现的各类汽车安全事件的搜集
全局变量中断原子操作_51单片机解决中断和主程序共享全局变量的方法学弱猹全局变量中断原子操作
51单片机解决中断和主程序共享全局变量的方法所谓原子操作,并不是指一条指令,而是指一系列操作不能被打断.这种操作与临界区是密切相关的,可以说原子操作就是临界区引发出来的需求.以上是给大家提供资料查找的入口,下面我用通俗的话说说,但切不要认为自已看懂了就可以不去查以上相关资料了,知道啥叫"通俗"吗?呵呵.废话不多说:在多进程的系统里(比如多任务,比如中断服务程序),假如两组程序都要访问同一个资源,而
OKHttp框架一个快乐的小测试自动化测试 okhttp android java 自动化
一、OKHttp简介初识OKHttpOkHttp是一个处理网络请求的开源项目,是Android端一个较新的轻量级网络框架，支持HTTP/HTTPS协议、请求头设置、响应解析等功能，并且支持异步调用，因此在接口测试中也是一种非常优秀的选择。OkHttp是一个高效的HTTP客户端，其特性包括：支持HTTP/2,并且允许同一个主机地址的所有请求共享同一个socket连接，这样能减少服务器的请求次数通过连
基于STM32与ZigBee的智能指引车库系统设计科创工作室li 毕业设计1 stm32 嵌入式硬件单片机
⭐资料具有原理图流程图PCB器件清单STM32与ZigBee的智能指引车库系统设计摘要：本文设计了一种基于STM32与ZigBee的智能指引车库系统。系统包含1台主机和3台从机，从机实时检测车位状况并发送给主机，主机显示3个车位的停车情况（满、无），并能简易引导车辆驶向空位，同时主机通过WiFi模块将数据上传至阿里云。该系统实现了车库车位的智能监测与引导，提高了车库管理的效率和便捷性。关键词：ST
stm32毕设基于单片机的太阳追光系统(源码+硬件+论文) m0_984093 单片机
文章目录0前言1课题介绍光线追踪的原理系统架构2硬件设计3核心软件设计4实现效果5最后0前言这两年开始毕业设计和毕业答辩的要求和难度不断提升，传统的毕设题目缺少创新和亮点，往往达不到毕业答辩的要求，这两年不断有学弟学妹告诉学长自己做的项目系统达不到老师的要求。为了大家能够顺利以及最少的精力通过毕设，学长分享优质毕业设计项目，今天要分享的是毕业设计基于单片机的太阳追光系统(源码+硬件+论文)学长这里
电子信息毕设基于单片机的太阳追光系统(源码+硬件+论文) 爱你单片机单片机 stm32 毕业设计
文章目录0前言1课题介绍光线追踪的原理系统架构2硬件设计3核心软件设计4实现效果5最后0前言这两年开始毕业设计和毕业答辩的要求和难度不断提升，传统的毕设题目缺少创新和亮点，往往达不到毕业答辩的要求，这两年不断有学弟学妹告诉学长自己做的项目系统达不到老师的要求。为了大家能够顺利以及最少的精力通过毕设，学长分享优质毕业设计项目，今天要分享的是毕业设计基于单片机的太阳追光系统(源码+硬件+论文)学长这里
毕设开源基于单片机的太阳追光系统(源码+硬件+论文) Mdc_stdio 单片机 stm32 毕业设计
文章目录0前言1课题介绍光线追踪的原理系统架构2硬件设计3核心软件设计4实现效果5最后0前言这两年开始毕业设计和毕业答辩的要求和难度不断提升，传统的毕设题目缺少创新和亮点，往往达不到毕业答辩的要求，这两年不断有学弟学妹告诉学长自己做的项目系统达不到老师的要求。为了大家能够顺利以及最少的精力通过毕设，学长分享优质毕业设计项目，今天要分享的是毕业设计基于单片机的太阳追光系统(源码+硬件+论文)学长这里
主函数与中断函数共用变量 AARON_MJT STM32 单片机 stm32 mcu
主函数与中断函数共用变量1、变量的读-写2、多字节变量读取错误3、解决方法4、volatile使用场景1、变量的读-写主函数对变量的读-写，可能会造成中断函数对变量的读-写无效。当主函数刚刚把变量读入到内部寄存器时，还未再回写到变量中时，就发生了中断，中断改写了变量。当中断返回时，主函数将值再回写到变量中。造成中断函数对变量的改写无效。2、多字节变量读取错误当变量的其中一个字节读入到寄存器中时，发
集合框架天子之骄 java 数据结构集合框架
集合框架集合框架可以理解为一个容器，该容器主要指映射(map)、集合(set)、数组(array)和列表(list)等抽象数据结构。从本质上来说，Java集合框架的主要组成是用来操作对象的接口。不同接口描述不同的数据类型。简单介绍： Collection接口是最基本的接口，它定义了List和Set，List又定义了LinkLi
Table Driven（表驱动）方法实例 bijian1013 java enum Table Driven 表驱动
实例一： /** * 驾驶人年龄段 * 保险行业，会对驾驶人的年龄做年龄段的区分判断 * 驾驶人年龄段：01-[18,25);02-[25,30);03-[30-35);04-[35,40);05-[40,45);06-[45,50);07-[50-55);08-[55,+∞) */ public class AgePeriodTest { //if...el
Jquery 总结 cuishikuan java jquery Ajax Web jquery方法
1.$.trim方法用于移除字符串头部和尾部多余的空格。如：$.trim(' Hello ') // Hello2.$.contains方法返回一个布尔值，表示某个DOM元素（第二个参数）是否为另一个DOM元素（第一个参数）的下级元素。如：$.contains(document.documentElement, document.body); 3.$
面向对象概念的提出麦田的设计者 java 面向对象面向过程
面向对象中，一切都是由对象展开的，组织代码，封装数据。在台湾面向对象被翻译为了面向物件编程，这充分说明了，这种编程强调实体。下面就结合编程语言的发展史，聊一聊面向过程和面向对象。 c语言由贝尔实
linux网口绑定被触发 linux
刚在一台IBM Xserver服务器上装了RedHat Linux Enterprise AS 4，为了提高网络的可靠性配置双网卡绑定。一、环境描述我的RedHat Linux Enterprise AS 4安装双口的Intel千兆网卡，通过ifconfig -a命令看到eth0和eth1两张网卡。二、双网卡绑定步骤： 2.1 修改/etc/sysconfig/network
XML基础语法肆无忌惮_ xml
一、什么是XML？ XML全称是Extensible Markup Language，可扩展标记语言。很类似HTML。XML的目的是传输数据而非显示数据。XML的标签没有被预定义，你需要自行定义标签。XML被设计为具有自我描述性。是W3C的推荐标准。二、为什么学习XML？用来解决程序间数据传输的格式问题做配置文件充当小型数据库三、XML与HTM
为网页添加自己喜欢的字体知了ing 字体秒表 css
@font-face { font-family: miaobiao;//定义字体名字 font-style: normal; font-weight: 400; src: url('font/DS-DIGI-e.eot');//字体文件 } 使用： <label style="font-size:18px;font-famil
redis范围查询应用-查找IP所在城市矮蛋蛋 redis
原文地址： http://www.tuicool.com/articles/BrURbqV 需求根据IP找到对应的城市原来的解决方案 oracle表（ip_country）：查询IP对应的城市： 1.把a.b.c.d这样格式的IP转为一个数字，例如为把210.21.224.34转为3524648994 2. select city from ip_
输入两个整数，计算百分比 alleni123 java
public static String getPercent(int x, int total){ double result=(x*1.0)/(total*1.0); System.out.println(result); DecimalFormat df1=new DecimalFormat("0.0000%");
百合——————>怎么学习计算机语言百合不是茶 java 移动开发
对于一个从没有接触过计算机语言的人来说，一上来就学面向对象，就算是心里上面接受的了，灵魂我觉得也应该是跟不上的，学不好是很正常的现象，计算机语言老师讲的再多，你在课堂上面跟着老师听的再多，我觉得你应该还是学不会的，最主要的原因是你根本没有想过该怎么来学习计算机编程语言，记得大一的时候金山网络公司在湖大招聘我们学校一个才来大学几天的被金山网络录取，一个刚到大学的就能够去和
linux下tomcat开机自启动 bijian1013 tomcat
方法一：修改Tomcat/bin/startup.sh 为: export JAVA_HOME=/home/java1.6.0_27 export CLASSPATH=$CLASSPATH:$JAVA_HOME/lib/tools.jar:$JAVA_HOME/lib/dt.jar:. export PATH=$JAVA_HOME/bin:$PATH export CATALINA_H
spring aop实例 bijian1013 java spring AOP
1.AdviceMethods.java package com.bijian.study.spring.aop.schema; public class AdviceMethods { public void preGreeting() { System.out.println("--how are you!--"); } } 2.beans.x
[Gson八]GsonBuilder序列化和反序列化选项enableComplexMapKeySerialization bit1129 serialization
enableComplexMapKeySerialization配置项的含义 Gson在序列化Map时，默认情况下，是调用Key的toString方法得到它的JSON字符串的Key，对于简单类型和字符串类型，这没有问题，但是对于复杂数据对象，如果对象没有覆写toString方法，那么默认的toString方法将得到这个对象的Hash地址。 GsonBuilder用于
【Spark九十一】Spark Streaming整合Kafka一些值得关注的问题 bit1129 Stream
包括Spark Streaming在内的实时计算数据可靠性指的是三种级别： 1. At most once，数据最多只能接受一次，有可能接收不到 2. At least once, 数据至少接受一次，有可能重复接收 3. Exactly once 数据保证被处理并且只被处理一次，具体的多读几遍http://spark.apache.org/docs/lates
shell脚本批量检测端口是否被占用脚本 ronin47
#!/bin/bash cat ports |while read line do#nc -z -w 10 $line nc -z -w 2 $line 58422>/dev/null2>&1if[ $?-eq 0]then echo $line:ok else echo $line:fail fi done 这里的ports 既可以是文件
java-2.设计包含min函数的栈 bylijinnan java
具体思路参见：http://zhedahht.blog.163.com/blog/static/25411174200712895228171/ import java.util.ArrayList; import java.util.List; public class MinStack { //maybe we can use origin array rathe
Netty源码学习-ChannelHandler bylijinnan java netty
一般来说，“有状态”的ChannelHandler不应该是“共享”的，“无状态”的ChannelHandler则可“共享” 例如ObjectEncoder是“共享”的, 但 ObjectDecoder 不是因为每一次调用decode方法时，可能数据未接收完全（incomplete），它与上一次decode时接收到的数据“累计”起来才有可能是完整的数据，是“有状态”的 p
java生成随机数 cngolon java
方法一： /** * 生成随机数 * @author [email protected] * @return */ public synchronized static String getChargeSequenceNum(String pre){ StringBuffer sequenceNum = new StringBuffer(); Date dateTime = new D
POI读写海量数据 ctrain 海量数据
import java.io.FileOutputStream; import java.io.OutputStream; import org.apache.poi.xssf.streaming.SXSSFRow; import org.apache.poi.xssf.streaming.SXSSFSheet; import org.apache.poi.xssf.streaming
mysql 日期格式化date_format详细使用 daizj mysql date_format 日期格式转换日期格式化
日期转换函数的详细使用说明 DATE_FORMAT(date,format) Formats the date value according to the format string. The following specifiers may be used in the format string. The&n
一个程序员分享8年的开发经验 dcj3sjt126com 程序员
在中国有很多人都认为IT行为是吃青春饭的，如果过了30岁就很难有机会再发展下去!其实现实并不是这样子的，在下从事.NET及JAVA方面的开发的也有8年的时间了，在这里在下想凭借自己的亲身经历，与大家一起探讨一下。明确入行的目的很多人干IT这一行都冲着“收入高”这一点的，因为只要学会一点HTML, DIV+CSS，要做一个页面开发人员并不是一件难事，而且做一个页面开发人员更容
android欢迎界面淡入淡出效果 dcj3sjt126com android
很多Android应用一开始都会有一个欢迎界面，淡入淡出效果也是用得非常多的，下面来实现一下。主要代码如下： package com.myaibang.activity; import android.app.Activity;import android.content.Intent;import android.os.Bundle;import android.os.CountDown
linux 复习笔记之常见压缩命令 eksliang tar解压 linux系统常见压缩命令 linux压缩命令 tar压缩
转载请出自出处:http://eksliang.iteye.com/blog/2109693 linux中常见压缩文件的拓展名 *.gz gzip程序压缩的文件 *.bz2 bzip程序压缩的文件 *.tar tar程序打包的数据，没有经过压缩 *.tar.gz tar程序打包后，并经过gzip程序压缩 *.tar.bz2 tar程序打包后，并经过bzip程序压缩 *.zi
Android 应用程序发送shell命令 gqdy365 android
项目中需要直接在APP中通过发送shell指令来控制lcd灯，其实按理说应该是方案公司在调好lcd灯驱动之后直接通过service送接口上来给APP，APP调用就可以控制了，这是正规流程，但我们项目的方案商用的mtk方案，方案公司又没人会改，只调好了驱动，让应用程序自己实现灯的控制，这不蛋疼嘛！！！！发就发吧！一、关于shell指令：我们知道，shell指令是Linux里面带的
java 无损读取文本文件 hw1287789687 读取文件无损读取读取文本文件 charset
java 如何无损读取文本文件呢？以下是有损的 @Deprecated public static String getFullContent(File file, String charset) { BufferedReader reader = null; if (!file.exists()) { System.out.println("getFull
Firebase 相关文章索引 justjavac firebase
Awesome Firebase 最近谷歌收购Firebase的新闻又将Firebase拉入了人们的视野，于是我做了这个 github 项目。 Firebase 是一个数据同步的云服务，不同于 Dropbox 的「文件」，Firebase 同步的是「数据」，服务对象是网站开发者，帮助他们开发具有「实时」（Real-Time）特性的应用。开发者只需引用一个 API 库文件就可以使用标准 RE
C++学习重点 lx.asymmetric C++笔记
1.c++面向对象的三个特性：封装性，继承性以及多态性。 2.标识符的命名规则：由字母和下划线开头，同时由字母、数字或下划线组成；不能与系统关键字重名。 3.c++语言常量包括整型常量、浮点型常量、布尔常量、字符型常量和字符串性常量。 4.运算符按其功能开以分为六类：算术运算符、位运算符、关系运算符、逻辑运算符、赋值运算符和条件运算符。 &n
java bean和xml相互转换 q821424508 java bean xml xml和bean转换 java bean和xml转换
这几天在做微信公众号做的过程中想找个java bean转xml的工具，找了几个用着不知道是配置不好还是怎么回事，都会有一些问题，然后脑子一热谢了一个javabean和xml的转换的工具里，自己用着还行，虽然有一些约束吧，还是贴出来记录一下顺便你提一下下，这个转换工具支持属性为集合、数组和非基本属性的对象。 packag
C 语言初级位运算 1140566087 位运算 c
第十章位运算 1、位运算对象只能是整形或字符型数据，在VC6.0中int型数据占4个字节 2、位运算符：运算符作用 ~ 按位求反 << 左移 >> 右移 & 按位与 ^ 按位异或 | 按位或他们的优先级从高到低； 3、位运算符的运算功能： a、按位取反： ~01001101 = 101
14点睛Spring4.1-脚本编程 wiselyman spring4
14.1 Scripting脚本编程脚本语言和java这类静态的语言的主要区别是:脚本语言无需编译,源码直接可运行; 如果我们经常需要修改的某些代码,每一次我们至少要进行编译,打包,重新部署的操作,步骤相当麻烦; 如果我们的应用不允许重启,这在现实的情况中也是很常见的; 在spring中使用脚本编程给上述的应用场景提供了解决方案,即动态加载bean; spring支持脚本