z_believe

Chinese NER Using Lattice LSTM.Yue Zhang and Jie Yang.ACL2018

边读边参考别人的理解，边加入自己的理解。

文章目录

一.标题
二.文章

摘要
介绍：
模型

0.lstm
1.基于字向量的模型
2.基于词向量的模型
3.词格模型（Lattice Model）

实验
结论

一.标题

Chinese NER Using Lattice LSTM.Yue Zhang and Jie Yang.ACL2018

二.文章

摘要

We investigate a lattice-structured LSTM model for Chinese NER, which encodes a sequence of input characters as well as all potential words that match a lexicon.Compared with character-based methods,
our model explicitly leverages word and word sequence information. Compared with word-based methods, lattice LSTM does not suffer from segmentation errors.Gated recurrent cells allow our model to choose the most relevant characters and words from a sentence for better NER results.Experiments on various datasets show that lattice LSTM outperforms both word-based and character-based LSTM
baselines, achieving the best results.
提出了一种用于中文NER的LSTM的格子模型，与传统使用字向量的模型相比，本文提出的模型显式地利用了字序列之间的关系。与传统使用词向量的模型相比，本文提出的模型能够很好的避免分词错误带来的影响。
Lattice LSTM能够将字符级别序列信息和该序列对应的词信息同时编码供模型自动取用。相较于字粒度（字符级）的编码，Lattice LSTM加入了词信息，丰富了语义表达；相较于词粒度的编码，Lattice LSTM可以避免分词错误带来的影响。

介绍：

传统方法一般把NER看作是一个序列标记问题，同时预测序列中的实体边界以及实体所属的类别。中文中基于字向量的模型问题：因为如果单纯采用字向量的话会导致我们拆开了很多并不应该拆开的词语，从而丢失了它们本身的内在信息（比如“上海”这个词如果拆成字向量就成了“上”和“海”，这两个字的单独含义明显与它们组合起来的词的含义大相庭径）。为了解决这个问题，本文提出了一种新型的格子结构（lattice structure），它能够将单词本身的含义加入基于字向量的模型中（比如LSTM-CRF）。

相当于想方法融合了字符向量和词向量。如上图所示，格子结构最终会包含一个我们自动学出来的词典里的词（比如图中的“南京”，“市长”，“长江”，“大桥”，“南京市”，“长江大桥”），这样一来，我们的模型就会避免一些使用字向量造成的歧义，比如如果按照一个个字来组合的话还能组成“南京”，“市长”，“江大桥”这样的组合，由于“江大桥”不在词格中，我们的模型就很好的避免了这种歧义。这个词格我的理解应该是

下图所示的格子看上去有很多，说明路径个数很多，所以就要利用模型来控制从头到尾的信息流。（下面会说）模型中有一些红色的 Cell，他们是句子中潜在词汇产生的信息，同主干 LSTM 相应的 Cell 连接起来就构成了类似于网格的结构，也就是题目中的 Lattice。

模型

0.lstm

基本的 LSTM 结构中，每个 Cell 含有输入门、遗忘门和输出门，它们都是0~1的小数（默认激活函数为 Sigmoid），根据当前输入和前一个 Cell 的输出计算得到的。还有一个核心元素就是 Cell State，也就是最上面那条从左到右的箭头，它从头走到尾，记录整个序列的信息。输入门决定当前输入有多少加入 Cell State；遗忘门决定 Cell State要保留多少信息；输出门决定更新后的 Cell State 有多少可以输出。

1、 cell 的状态是一个向量，是有多个值的。
2、上一次的状态 h(t-1)是怎么和下一次的输入 x(t) 结合（concat）起来的，concat，直白的说就是把二者直接拼起来，比如 x是28位的向量，h(t-1)是128位的，那么拼起来就是156位的向量。
3、 cell 的权重是共享的，这是指这张图片上有三个绿色的大框，代表三个 cell 对吧，但是实际上，它只是代表了一个 cell 在不同时序时候的状态，所有的数据只会通过一个 cell，然后不断更新它的权重。
4、那么一层的 LSTM 的参数有多少个？根据第 3 点的说明，我们知道参数的数量是由 cell 的数量决定的，这里只有一个 cell，所以参数的数量就是这个 cell 里面用到的参数个数。假设 num_units 是128，输入是28位的，那么根据上面的第 2 点，可以得到，四个小黄框的参数一共有（128+28）（1284），也就是156 * 512，可以看看 TensorFlow 的最简单的 LSTM 的案例，中间层的参数就是这样，不过还要加上输出的时候的激活函数的参数，假设是10个类的话，就是128*10的 W 参数和10个bias 参数5、cell 最上面的一条线的状态即 s(t) 代表了长时记忆，而下面的 h(t)则代表了工作记忆或短时记忆暂时这么多。

$\tilde{c_j^c}$ 是输入状态值。 ${c_j^c}$ 是新状态值新的state值， ${h_j^c}$ 是输出。 ${x_j^c}$ 是当前的输入， ${h_{j-1}^c}$ 则表示上一时刻的输出。

其中每一个字 $c_j$ 被表示为：

隐含层的总输出表示为：

上面的那个论文中的公式其实拆开来就是下面这个公式。

分割线===========================================================分割线

模型基准取自Lample G , Ballesteros M , Subramanian S , et al. Neural Architectures for Named Entity Recognition[J]. 2016.
首先，我们以字为基本单位定义一个输入句子s为， $c_1$ 表示第1个字符：

s又可以用词为基本单位被表示为， $w_1$ 表示第一个词：

我们设 $t (i, k)$ 为句子的第i个词的第k个字在句子中的位置，比如“南京市，长江大桥”这句话中的“大”字，我们就有 $t (2, 3) = 7$ ，即“大”这个字是句子第2个词的第3个字，并且它在句子中的位置为第7个字。

1.基于字向量的模型

其中每一个字 $c_j$ 被表示为：

隐含层的总输出就可以表示为：

就是前后拼接起来。
（1）Char + bichar
就是字符的embedding和二元字符信息的embedding拼接

（2）Char + softword
就是将分词的embedding和字符embedding拼接，我估计意思是将cj按照索引去找一个词表中的词，然后取出这个词作为一个embedding，但是问题是一个字能组成多个词。

2.基于词向量的模型

和上面一样，不同的是把词作为一个单位。

（1）Word + char LSTM
普通的bilstm获得

（2）Word + char LSTM“
用两个singlelstm去获得上面的h。
（4）Word + char CNN
就是普通cnn字符，括号里面是卷积层运算，max是最大池化。

3.词格模型（Lattice Model）

比如“桥”字，句子中潜在的以它结尾的词汇有：“长江大桥”和“大桥”。因此，当前字符 Cell 除了“桥“字以外，还要考虑这两个词汇。从图上看就是两个红色 Cell 引出的两个绿色箭头，代表这两个词汇的信息。

文章中对于词汇信息的算法如下图公式所示，每个词汇的红色 Cell 类似 LSTM Cell 且相互独立。因为序列标记是以字符为级别，所以这个 Cell 中没有输出门，Cell State 即为词汇信息,所以从左到右只有一条线。
基本的lstm模型见（0）lstm
和基本的lstm不一样，计算 $c_j^c$ 需要考虑在句子中的字典序列 $w_b,_e^d$ ，它在每个序列中被表示成如下：e就是查lockup后的embebding。

$c_b,_e^w$ 被用来去表示从句子开始的循环状态recurrent state ${X_{b,e}}^w$ ， $c_b,_e^w$ 是新状态值新的state值
$c_b,_e^w$ 由下面公式计算，这个公式要记住就是要拆开来，然后圆圈点是对应元素相乘。

${c_{be}}^w$ 就是字符b到e的word。 $c_b^c$ 就是字符b开始字符。

由于标注只是在字级进行，所以word cell就不需要输出门。
下面是图2

$c_j^c$ 由上面变成了这样：

就是公式15中的a是由i门值经过下面归一化得到的。

就是公式11

实验

主要就是预训练得到了字符和词的embedding

结论

与其他模型相比，lattice具有更强的鲁棒性，其准确度也随着句子的长度增加而降低，原因应该是随着句子长度的增加lattice中的word combination的数量有指数级的增加；
lattice方法完全不依赖word segmentation ，由于它可以自由选择词表中的词，它可以更有效的利用词信息，因为他自由的选择了词表中的词。

你可能感兴趣的:(论文)

【深度强化学习】MIP-DQN 实现案例（完整Python代码）
目录MIP-DQN算法概述建模基础训练阶段（Training）部署阶段（OnlineExecution）DNN网络转化为MIP表达式性能指标完整Python代码实现主函数：random_generator_battery模型函数：MIP_DQN基础/专用库包安装模型运行（完整Python代码）参数设置函数：Parameters参考本博客根据论文《Optimalenergysystemschedul
第113期【读书分享】读《给教师的建议》部分章节感悟蒋卫波语文名师工作室
作者简介：李美玲，女，1999年参加工作，一级教师，本科学历。现在五泉镇中心校任教，从教21年来一直用“爱心、耐心、细心”教育孩子，孩子们喜欢她、家长们信任她，她曾获得示范区“优秀教师”“优秀辅导员”“先进个人”“优秀巾帼志愿者”“优秀班主任”“师德标兵”等荣誉称号！她撰写的多篇教学论文在省、市级、区级刊物中发表，同时积极参与省市级课题研究，成绩显著。假期暇闲时间，拜读苏霍姆林斯基大师的《给教师建
基于STM32单片机车牌识别系统摄像头图像处理设计的论文 weixin_112233 单片机单片机 stm32 图像处理
摘要本设计提出了一种基于32单片机的车牌识别系统摄像头图像处理方案。该系统主要由STM32F103RCT6单片机核心板、2.8寸TFT液晶屏显示、摄像头图像采集OV7670、蜂鸣器以及LED电路组成。在车牌识别过程中，STM32F103RCT6单片机核心板发挥着关键的控制作用。摄像头图像采集OV7670负责获取车辆的图像信息，能够清晰地捕捉车牌区域。采集到的图像数据传输至单片机进行处理，通过一系列
《大侦探福尔摩斯——太阳的证词》读后感陈子亿
《大侦探福尔摩斯——太阳的证词》讲述了：美国上空出现百年难得一遇的天文奇现——日环食，天文学教授在观测时不幸身亡，同行的爱犬不知去向，并且当天天文学教授的屋子里受到了盗窃。经过福尔摩斯的仔细观察，判定是一名天文大学生为了把自己的天文论文改得很好，先把天文学教授杀害，故意挪到山底下，并让警察误认为是失足而死亡的，然后从天文学教授的屋子旁边管道上爬上去砸碎玻璃，偷了单筒望远镜和几只钢笔作为掩饰，再把自
2022-02-26 charonfrompluto
刚从秦皇岛回来没两天，太过于享受那样惬意的生活，到了科学城各种不适，开三个小时才会变暖和的电热毯，又冷又无法上大号的同层卫生间，洗着洗着会变凉的热水器，冰凉刺骨的水，睡觉翻来覆去一晚上要醒好几回，办公室的同学都发了小论文能毕业了，而我小论文还没发要毕不了业了，大家的大论文都写完了，我仔细想了下自己的基本跟没写一样，差的很多；因为长胖裤子又紧又勒，强迫自己少吃的两天在今天下午崩溃，饿的不行，于是区超
【KDD2025】时间序列|KDD‘25 FPS：预测模型也能改变未来！
论文地址：https://arxiv.org/pdf/2411.15241v2代码地址：https://github.com/AdityaLab/pets为了更好地理解时间序列模型的理论与实现，推荐参考UP“ThePPP时间序列”的教学视频。该系列内容系统介绍了时间序列相关知识，并提供配套的论文资料与代码示例，有助于理论与实践相结合。https://space.bilibili.com/61345
【AAAI2025】计算机视觉|P-sLSTM:P-sLSTM：让LSTM在时间序列预测领域“重获新生”
论文地址：https://arxiv.org/pdf/2408.10006代码地址：https://github.com/Eleanorkong/P-sLSTM关注UPCV缝合怪，分享最计算机视觉新即插即用模块，并提供配套的论文资料与代码。https://space.bilibili.com/473764881摘要传统的循环神经网络结构，如长短期记忆神经网络(LSTM)，在时间序列预测(TSF)任
【TPAMI2024】计算机视觉|即插即用|FreqFusion:炸裂！告别模糊，精准分割，视觉新高度！爆改模型计算机视觉人工智能
论文地址：https://arxiv.org/pdf/2408.12879代码地址：https://github.com/Linwei-Chen/FreqFusion关注UPCV缝合怪，分享最计算机视觉新即插即用模块，并提供配套的论文资料与代码。https://space.bilibili.com/473764881摘要密集图像预测任务需要在高分辨率下具有强大的类别信息和精确空间边界细节的特征。为
大型语言模型在自动化AI科学研究与论文撰写中的应用与展望这是Jamon AI4SR 人工智能
1.引言：LLM驱动科学研究与论文撰写的范式转变大型语言模型（LLM）的快速发展正在科学发现领域引发一场深刻的范式转变。这些模型正从最初的任务特定自动化工具，逐步演变为能够自主执行复杂任务的智能代理，从根本上重新定义了研究过程以及人机协作的模式。LLM所展现出的新兴能力，例如高级规划、复杂推理和精确指令遵循，显著加速了科学发现的步伐。传统科学研究通常是一个由人类主导的、高度线性且劳动密集型的过程，
数据科学简讯 2023-04-07 数科每日
image.png头条SegmentAnything图像分割的重大进步图像分割是提取图像中代表特定对象（例如人或桌子）的所有像素的过程。由于几个原因，这是一项艰巨的任务，通常它要么需要大量预定义对象的数据集，要么需要一些的初级监督数据。Meta的这个全新的、完全开源的模型感觉就像是功能上的飞跃。他们收集了大量数据集，简化了注释功能，并创建了一个可以在浏览器中实时运行的模型。并提供演示、代码和论文。
AI人工智能领域多模态大模型的发展历程回顾 AI智能探索者 AI Agent 智能体开发实战人工智能 ai
AI人工智能领域多模态大模型的发展历程回顾关键词：AI人工智能、多模态大模型、发展历程、技术演变、应用场景摘要：本文旨在全面回顾AI人工智能领域多模态大模型的发展历程。通过对不同阶段核心概念、算法原理、数学模型等方面的深入剖析，结合实际项目案例，探讨其在各个领域的应用场景。同时，推荐相关的学习资源、开发工具和重要论文著作，最后总结多模态大模型的未来发展趋势与挑战，并对常见问题进行解答。1.背景介绍
强化学习------DDPG算法 ZPC8210 算法 numpy matplotlib
一、前言DeepDeterministicPolicyGradient(DDPG)算法是DeepMind团队提出的一种专门用于解决连续控制问题的在线式(on-line)深度强化学习算法，它其实本质上借鉴了DeepQ-Network(DQN)算法里面的一些思想。论文和源代码如下：论文：https://arxiv.org/pdf/1509.02971.pdf代码：https://github.com/
写论文时遇到的问题及解决办法小白的程序空间论文格式技能汇总经验分享 windows
问题1：利用endnote关于出现{}，而不是[1].解决办法：找到WORD中的updateCitationsandBibliography，点击后，即可恢复[]。问题2：写论文时，endnote中常用的字体是什么？解决办法：ChineseStdGBT7714(numeric)问题3：如何在word中添加Endnote的字体？解决办法：在endnote中，找到“编辑”，“输出样式”，接着“打开样式
女友除了任性没别的毛病，因没及时喝她炖的汤，她删掉了我的论文流年芳华
最近有一个知乎的话题上了微博的热搜：因琐事争端把男朋友论文删了。话题源于知乎一位女性的求助。这位知乎网友有个闺蜜，今年研究生毕业，是个公务员，家境殷实，人挺好的，按照这位网友的说法就是：“除了有点任性没有其他毛病”。闺蜜男友大她七岁，是个医生，工作很忙，总是在加班。因为闺蜜男友最近一个月一直在熬夜写论文，闺蜜劝说无果，又很心疼他，就从家里偷了冬虫夏草给男友炖汤。那天，把汤端给男友，他喝了两口就放下
基于蜣螂算法优化多头注意力机制的卷积神经网络结合双向长短记忆神经网络实现温度预测DBO-CNN-biLSTM-Multihead-Attention附matlab代码 matlab科研助手神经网络算法 cnn
✅作者简介：热爱科研的Matlab仿真开发者，修心和技术同步精进，代码获取、论文复现及科研仿真合作可私信。个人主页：Matlab科研工作室个人信条：格物致知。更多Matlab完整代码及仿真定制内容点击智能优化算法神经网络预测雷达通信无线传感器电力系统信号处理图像处理路径规划元胞自动机无人机物理应用机器学习内容介绍温度预测在气象学、农业、能源等领域具有重要的应用价值。随着大数据和人工智能技术的快速发
文献阅读：全球农田的植被总初级生产力(GPP)、蒸散发(ET)和水分利用率(WUE)的变化研究
文献阅读的是Ai-2020的《Variationofgrossprimaryproduction,evapotranspirationandwateruseefficiencyforglobalcroplands》(IF6.5，SCIQ1)。01引言：研究背景和目的这篇论文的引言逻辑非常清楚，思路大致是：粮食安全→\rightarrow→提高农田生产力→\rightarrow→引出WUE、GPP和
【2024国赛C题】【农作物的种植策略】2024 年全国大学生数学建模比赛思路、代码更新中..... 程序猿鑫数学建模
欢迎来到本博客❤️❤️博主优势：博客内容尽量做到思维缜密，逻辑清晰，为了方便读者。⛳️座右铭：行百里者，半于九十。本文目录如下：目录⛳️竞赛事件及参赛1找程序网站推荐2公式编辑器、流程图、论文排版324年国赛C题及资源下载4思路、代码分享......⛳️竞赛事件及参赛根据乡村的实际情况，充分利用有限的耕地资源，因地制宜，发展有机种植产业，对乡村经济的可持续发展具有重要的现实意义。选择适宜的农作物，
【AI论文】CLiFT：面向计算高效与自适应神经渲染的压缩光场标记
摘要：本文提出了一种神经渲染方法，该方法将场景表示为“压缩光场标记（CLiFTs）”，以保留场景丰富的外观和几何信息。CLiFT通过压缩标记实现计算高效的渲染，同时能够通过调整标记数量来表征场景，或利用单个训练好的网络渲染新视角。具体而言，给定一组图像，多视图编码器会根据相机位姿对图像进行标记化处理。潜在空间K均值聚类算法利用这些标记选取一组精简的光线作为聚类中心。随后，多视图“压缩器”将所有标记
手绘电路图的节点和端点检测一个简化版的算法实现框架 zhangfeng1133 算法
于论文描述，我将提供一个简化版的算法实现框架，用于手绘电路图的节点和端点检测，并整合生成电路原理图。以下代码结合了YOLOv5目标检测和传统图像处理技术，符合论文中提到的98.2%mAP和92%节点识别准确率的关键指标。核心算法实现（Python+OpenCV+YOLOv5）importcv2importnumpyasnpimporttorchfromyolov5importYOLOv5#需要安装
打卡 | 2019-11-2 冰果2016
今天论文deadline起床：7:40就寝：11:40天气：阴心情：不错纪念日：凌晨4点27分无忧小朋友从床上跌到地上，还好是趴着，没有磕着碰着。但是还是吓得哭了好一阵。如何培养孩子自信心第一，首先让孩子了解自己，正确的评估自己。而这些都是通过爸爸妈妈来了解，麻麻告诉孩子是个好孩子，孩子才知道自己是个好孩子。1、我是谁2、我能做什么3、我相信我能做什么4、我爱自己第二，培养孩子自信心的途径1.做擅
基于MATLAB的空时编码技术(源码+万字报告+部署讲解等) 炳烛之明科技 matlab 人工智能网络通信仿真
目录基于MATLAB的空时编码技术论文IIAbstractIII第1章绪论11.1选题的背景与选题意义11.1.1选题的背景11.1.2选题的意义21.2论文现状21.3主要内容5第2章空时编码技术72.1空时分组码72.2空时网格码102.3分层空时码112.4三种码及空时分组码优点12第三章STBC空时分组码123.1基本原理123.2编码方法153.2.1两发多收天线系统的空时分组编码方法1
SFT：大型语言模型专业化定制的核心技术体系——原理、创新与应用全景大千AI助手人工智能 Python #OTHER 语言模型人工智能自然语言处理深度学习机器学习微调 SFT
本文由「大千AI助手」原创发布，专注用真话讲AI，回归技术本质。拒绝神话或妖魔化。搜索「大千AI助手」关注我，一起撕掉过度包装，学习真实的AI技术！以下基于权威期刊、会议论文及技术报告，对监督微调（SupervisedFine-Tuning,SFT）的技术框架、创新方法与实际应用进行系统梳理：一、核心定义与技术原理基本概念SFT是在预训练语言模型（如GPT、BERT）基础上，利用标注数据集对模型进
mpiigaze的安装过程一匆匆整棹还 python
mpiigaze链接mpiigaze应该不是作者本人写的，而是社区工作者的杰作，对原论文Appearance-BasedGazeEstimationintheWild的代码进行的一些复现1.创建conda环境2.问题Buildingwheelsforcollectedpackages:dlibBuildingwheelfordlib(pyproject.toml)...errorerror:sub
「高能PPT演讲技巧训练」｜让您的演讲更加吸引听众的三条原则全息演说智慧
求职面试中的PPT介绍总让你紧张不已，不知所措？论文答辩时要怎样借助PPT表达学术观点？小组汇报、工作总结时的PPT展示怎样做更清晰有力？如何有效避免中途冷场？其实对听众演讲就像喂一个两岁的小孩子吃苹果酱。一匙的量越多，就会有越多的苹果酱掉在地板上。无论在你的幻灯片还是你的演讲正文上，你只需要那些能支持你观点的必要信息，其他的都删掉。当没有什么可以删掉时，你便写完了你的演讲稿。学会这三大原则，让你
Transformer：自注意力驱动的神经网络革命引擎大千AI助手人工智能 Python #OTHER transformer 神经网络深度学习 google 人工智能机器学习大模型
本文由「大千AI助手」原创发布，专注用真话讲AI，回归技术本质。拒绝神话或妖魔化。搜索「大千AI助手」关注我，一起撕掉过度包装，学习真实的AI技术！从语言理解到多模态智能的通用架构基石⚙️一、核心定义与历史意义Transformer是由Google团队在2017年论文《AttentionIsAllYouNeed》中提出的深度学习架构，其颠覆性创新在于：完全摒弃RNN/CNN：仅依赖自注意力机制（S
文字是灵魂最好的倾诉仁红家学
这是雪妮为你分享的第76篇文章郭红艳为你分享的第35篇文章不知从什么时候起，爱上了写作。我的印象里，最早的写作还是学生时代老师布置的作文。再后来就是写写日记，大学写写论文，参加工作后写得多的是工作汇报及年终总结。毕业进入社会，日常已远离书本，写作也渐渐淡出了生活。每天就是柴米油盐酱醋茶，为各种闲杂琐事而烦恼，内心的闲情雅致早已飞到九霄云外去了。不知从什么时候起，写作便成了少数文青的事。我不算文青，
python大数据论文_大数据环境下基于python的网络爬虫技术 weixin_39775976 python大数据论文
软件开发大数据环境下基于python的网络爬虫技术作者/谢克武，重庆工商大学派斯学院软件工程学院摘要：随着互联网的发展壮大，网络数据呈爆炸式增长，传统捜索引擎已经不能满足人们对所需求数据的获取的需求，作为搜索引擎的抓取数据的重要组成部分，网络爬虫的作用十分重要，本文首先介绍了在大数据环境下网络爬虫的重要性，接着介绍了网络爬虫的概念，工作原理，工作流程，网页爬行策略，python在编写爬虫领域的优势
2021-10-10 如鱼饮水2020
中原焦点团队网络中26期坚持分享第516天（20211010）论文答辩稿背了N篇，第三个就是我上台演讲，心跳加速，深呼吸极力默念：稳就是定海神针。前两位男生都是低头读稿，虽然自己也带着手稿，距离太远根本看不到。硬着头皮背吧，脑子断篇也得上，先阳谋一下：第一次上讲台特别紧张。调整一下语速，结合APP，能背多少是多少吧，丑媳妇总归要见公婆的。先感谢导师的悉心指导和在坐的各位，论文的结构框架和大概内容几
基于生成对抗网络增强主动学习的超高温陶瓷硬度优化神经网络15044 深度学习算法仿真模型生成对抗网络学习人工智能
复现论文：基于生成对抗网络增强主动学习的超高温陶瓷硬度优化我将使用Python复现这篇关于使用生成对抗网络(GAN)增强主动学习来优化超高温陶瓷(UHTC)硬度的研究论文。以下是完整的实现代码和解释。1.环境准备和数据加载首先，我们需要准备必要的Python库并加载数据。importnumpyasnpimportpandasaspdimportmatplotlib.pyplotaspltimpor
Synergizing RAG and Reasoning: A Systematic Review-RAG与推理能力深度结合-新方向数据分析能量站机器学习人工智能
欢迎关v：数据分析能量站0论文小结一、研究背景与核心问题大语言模型（LLM）在处理复杂任务时面临两大瓶颈：知识局限性：纯LLM存在“知识幻觉”（编造事实）和“领域知识缺口”；推理浅度：传统检索增强生成（RAG）仅通过关键词匹配获取信息，无法处理多跳推理、语义歧义等复杂需求。核心主张：RAG与推理的深度整合（RAG+Reasoning）是突破上述瓶颈的关键，通过“检索提供实时知识，推理赋予逻辑能力”
怎么样才能成为专业的程序员？ cocos2d-x小菜编程 PHP
如何要想成为一名专业的程序员？仅仅会写代码是不够的。从团队合作去解决问题到版本控制，你还得具备其他关键技能的工具包。当我们询问相关的专业开发人员，那些必备的关键技能都是什么的时候，下面是我们了解到的情况。关于如何学习代码，各种声音很多，然后很多人就被误导为成为专业开发人员懂得一门编程语言就够了？！呵呵，就像其他工作一样，光会一个技能那是远远不够的。如果你想要成为
java web开发高并发处理 BreakingBad java Web 并发开发处理高
java处理高并发高负载类网站中数据库的设计方法（java教程,java处理大量数据，java高负载数据）一：高并发高负载类网站关注点之数据库没错,首先是数据库,这是大多数应用所面临的首个SPOF。尤其是Web2.0的应用，数据库的响应是首先要解决的。一般来说MySQL是最常用的，可能最初是一个mysql主机，当数据增加到100万以上，那么，MySQL的效能急剧下降。常用的优化措施是M-S（
mysql批量更新 ekian mysql
mysql更新优化：一版的更新的话都是采用update set的方式，但是如果需要批量更新的话，只能for循环的执行更新。或者采用executeBatch的方式，执行更新。无论哪种方式，性能都不见得多好。三千多条的更新，需要3分多钟。查询了批量更新的优化，有说replace into的方式，即： replace into tableName(id,status) values
微软BI（3） 18289753290 微软BI SSIS
1) Q：该列违反了完整性约束错误；已获得 OLE DB 记录。源:“Microsoft SQL Server Native Client 11.0” Hresult: 0x80004005 说明:“不能将值 NULL 插入列 'FZCHID'，表 'JRB_EnterpriseCredit.dbo.QYFZCH'；列不允许有 Null 值。INSERT 失败。”。 A：一般这类问题的存在是
Java中的List g21121 java
List是一个有序的 collection（也称为序列）。此接口的用户可以对列表中每个元素的插入位置进行精确地控制。用户可以根据元素的整数索引（在列表中的位置）访问元素，并搜索列表中的元素。与 set 不同，列表通常允许重复
读书笔记永夜-极光读书笔记
1. K是一家加工厂,需要采购原材料,有A,B,C,D 4家供应商,其中A给出的价格最低,性价比最高,那么假如你是这家企业的采购经理,你会如何决策? 传统决策: A:100%订单 B,C,D:0% &nbs
centos 安装 Codeblocks 随便小屋 codeblocks
1.安装gcc,需要c和c++两部分,默认安装下,CentOS不安装编译器的,在终端输入以下命令即可yum install gccyum install gcc-c++ 2.安装gtk2-devel,因为默认已经安装了正式产品需要的支持库,但是没有安装开发所需要的文档.yum install gtk2* 3. 安装wxGTK yum search w
23种设计模式的形象比喻 aijuans 设计模式
1、ABSTRACT FACTORY—追MM少不了请吃饭了，麦当劳的鸡翅和肯德基的鸡翅都是MM爱吃的东西，虽然口味有所不同，但不管你带MM去麦当劳或肯德基，只管向服务员说“来四个鸡翅”就行了。麦当劳和肯德基就是生产鸡翅的Factory 　　工厂模式：客户类和工厂类分开。消费者任何时候需要某种产品，只需向工厂请求即可。消费者无须修改就可以接纳新产品。缺点是当产品修改时，工厂类也要做相应的修改。如：
开发管理 CheckLists aoyouzi 开发管理 CheckLists
开发管理 CheckLists(23) -使项目组度过完整的生命周期开发管理 CheckLists(22) -组织项目资源开发管理 CheckLists(21) -控制项目的范围开发管理 CheckLists(20) -项目利益相关者责任开发管理 CheckLists(19) -选择合适的团队成员开发管理 CheckLists(18) -敏捷开发 Scrum Master 工作开发管理 C
js实现切换百合不是茶 JavaScript 栏目切换
js主要功能之一就是实现页面的特效,窗体的切换可以减少页面的大小,被门户网站大量应用思路: 1,先将要显示的设置为display:bisible 否则设为none 2,设置栏目的id ,js获取栏目的id,如果id为Null就设置为显示 3,判断js获取的id名字;再设置是否显示代码实现: html代码: <di
周鸿祎在360新员工入职培训上的讲话 bijian1013 感悟项目管理人生职场
这篇文章也是最近偶尔看到的，考虑到原博客发布者可能将其删除等原因，也更方便个人查找，特将原文拷贝再发布的。“学东西是为自己的，不要整天以混的姿态来跟公司博弈，就算是混，我觉得你要是能在混的时间里，收获一些别的有利于人生发展的东西，也是不错的，看你怎么把握了”，看了之后，对这句话记忆犹新。 &
前端Web开发的页面效果 Bill_chen html Web Microsoft
1.IE6下png图片的透明显示： <img src="图片地址" border="0" style="Filter.Alpha(Opacity)=数值(100),style=数值(3)"/> 或在<head></head>间加一段JS代码让透明png图片正常显示。 2.<li>标
【JVM五】老年代垃圾回收：并发标记清理GC(CMS GC) bit1129 垃圾回收
CMS概述并发标记清理垃圾回收(Concurrent Mark and Sweep GC）算法的主要目标是在GC过程中，减少暂停用户线程的次数以及在不得不暂停用户线程的请夸功能，尽可能短的暂停用户线程的时间。这对于交互式应用，比如web应用来说，是非常重要的。 CMS垃圾回收针对新生代和老年代采用不同的策略。相比同吞吐量垃圾回收，它要复杂的多。吞吐量垃圾回收在执
Struts2技术总结白糖_ struts2
必备jar文件早在struts2.0.*的时候，struts2的必备jar包需要如下几个： commons-logging-*.jar Apache旗下commons项目的log日志包 freemarker-*.jar
Jquery easyui layout应用注意事项 bozch jquery 浏览器 easyui layout
在jquery easyui中提供了easyui-layout布局，他的布局比较局限，类似java中GUI的border布局。下面对其使用注意事项作简要介绍：如果在现有的工程中前台界面均应用了jquery easyui，那么在布局的时候最好应用jquery eaysui的layout布局，否则在表单页面（编辑、查看、添加等等）在不同的浏览器会出
java-拷贝特殊链表：有一个特殊的链表，其中每个节点不但有指向下一个节点的指针pNext，还有一个指向链表中任意节点的指针pRand，如何拷贝这个特殊链表？ bylijinnan java
public class CopySpecialLinkedList { /** * 题目：有一个特殊的链表，其中每个节点不但有指向下一个节点的指针pNext，还有一个指向链表中任意节点的指针pRand，如何拷贝这个特殊链表？拷贝pNext指针非常容易，所以题目的难点是如何拷贝pRand指针。假设原来链表为A1 -> A2 ->... -> An，新拷贝
color Chen.H JavaScript html css
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN" "http://www.w3.org/TR/html4/loose.dtd"> <HTML> <HEAD>&nbs
[信息与战争]移动通讯与网络 comsci 网络
两个坚持:手机的电池必须可以取下来光纤不能够入户,只能够到楼宇建议大家找这本书看看:<&
oracle flashback query(闪回查询) daizj oracle flashback query flashback table
在Oracle 10g中，Flash back家族分为以下成员： Flashback Database Flashback Drop Flashback Table Flashback Query(分Flashback Query,Flashback Version Query，Flashback Transaction Query) 下面介绍一下Flashback Drop 和Flas
zeus持久层DAO单元测试 deng520159 单元测试
zeus代码测试正紧张进行中,但由于工作比较忙,但速度比较慢.现在已经完成读写分离单元测试了,现在把几种情况单元测试的例子发出来,希望有人能进出意见,让它走下去. 本文是zeus的dao单元测试: 1.单元测试直接上代码 package com.dengliang.zeus.webdemo.test; import org.junit.Test; import o
C语言学习三printf函数和scanf函数学习 dcj3sjt126com c printf scanf language
printf函数 /* 2013年3月10日20:42:32 地点：北京潘家园功能：目的：测试%x %X %#x %#X的用法 */ # include <stdio.h> int main(void) { printf("哈哈！\n"); // \n表示换行 int i = 10; printf
那你为什么小时候不好好读书? dcj3sjt126com life
dady, 我今天捡到了十块钱, 不过我还给那个人了 good girl! 那个人有没有和你讲thank you啊没有啦....他拉我的耳朵我才把钱还给他的, 他哪里会和我讲thank you 爸爸, 如果地上有一张5块一张10块你拿哪一张呢.... 当然是拿十块的咯... 爸爸你很笨的, 你不会两张都拿爸爸为什么上个月那个人来跟你讨钱, 你告诉他没
iptables开放端口 Fanyucai linux iptables 端口
1，找到配置文件 vi /etc/sysconfig/iptables 2，添加端口开放，增加一行，开放18081端口 -A INPUT -m state --state NEW -m tcp -p tcp --dport 18081 -j ACCEPT 3，保存 ESC :wq! 4，重启服务 service iptables
Ehcache（05）——缓存的查询 234390216 排序 ehcache 统计 query
缓存的查询目录 1. 使Cache可查询 1.1 基于Xml配置 1.2 基于代码的配置 2 指定可搜索的属性 2.1 可查询属性类型 2.2 &
通过hashset找到数组中重复的元素 jackyrong hashset
如何在hashset中快速找到重复的元素呢?方法很多，下面是其中一个办法： int[] array = {1,1,2,3,4,5,6,7,8,8}; Set<Integer> set = new HashSet<Integer>(); for(int i = 0
使用ajax和window.history.pushState无刷新改变页面内容和地址栏URL lanrikey history
后退时关闭当前页面 <script type="text/javascript"> jQuery(document).ready(function ($) { if (window.history && window.history.pushState) {
应用程序的通信成本 netkiller.github.com 虚拟机应用服务器陈景峰 netkiller neo
应用程序的通信成本什么是通信一个程序中两个以上功能相互传递信号或数据叫做通信。什么是成本这是是指时间成本与空间成本。时间就是传递数据所花费的时间。空间是指传递过程耗费容量大小。都有哪些通信方式全局变量线程间通信共享内存共享文件管道 Socket 硬件（串口，USB）等等全局变量全局变量是成本最低通信方法，通过设置
一维数组与二维数组的声明与定义恋洁e生二维数组一维数组定义声明初始化
/** * */ package test20111005; /** * @author FlyingFire * @date:2011-11-18 上午04:33:36 * @author ：代码整理 * @introduce :一维数组与二维数组的初始化 *summary： */ public c
Spring Mybatis独立事务配置 toknowme mybatis
在项目中有很多地方会使用到独立事务，下面以获取主键为例（1）修改配置文件spring-mybatis.xml  <tx:annotation-driven transaction-manager="transactionManager" /> &n
更新Anadroid SDK Tooks之后，Eclipse提示No update were found xp9802 eclipse
使用Android SDK Manager 更新了Anadroid SDK Tooks 之后，打开eclipse提示 This Android SDK requires Android Developer Toolkit version 23.0.0 or above, 点击Check for Updates 检测一会后提示 No update were found

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他