有莘不殁

论文笔记: Quantifying Similarity between Relations with Fact Distribution

论文笔记: Quantifying Similarity between Relations with Fact Distribution

Author: Weize Chen, Hao Zhu, Xu Han, Zhiyuan Liu, Maosong Sun

Tsinghua, CMU

来源：ACL2019

链接:https://arxiv.org/pdf/1907.08937.pdf

动机

本文工作的核心目的是探究如何有效的量化关系的相似性。作者动作的动机是一个直觉，即关系的相似性和它对应的实体对有明显相关性，例如，关系为“trade to”或者”play for”的实体对通常为运动员和俱乐部，而“live”这种关系的实体对则通常为人和地点。作者将这个想法，进行了数学抽象，即将关系的相似转变为求解条件概率分布P(h,t|r)的相似度。对于分布相似度的求解，直接可以想到的就是利用KL散度。这里一个比较实际的问题是，KL散度在比较大的实体对空间里，基本不可解。考虑到这个因素，作者又提出了基于采样的算法来求解相应的KL散度。
在此基础上，作者希望通过设计和实验，更进一步讨论以下几个问题：

根据本文算法计算的关系相似度相比人工判断有多大的差距？
开放性的关系不可避免的会出现抽取关系的冗余，那么如何有效的减少冗余呢？
量化相似度可以达到什么程度？用最好的关系抽取模型会发生相似性判断错误么？
相似度计算有没有启发式的负采样算法？
相似度可不可以作为关系抽取softmax-margin训练中的可适应性间隔呢？

形式化定义

在量化关系相似度之前，论文依据头尾实体的概率分布给出了关系的一个形式化的数学表达。首先定义一个映射： $F_{\theta}：\epsilon × R × \epsilon \rightarrow \mathscr{R}$ ，将一个三元组代表的关系事实 $\in G = \epsilon × R × \epsilon$ 映射成一个标量，其中 $\epsilon$ 是实体集合， $R$ 是关系集合。回到本文初始动机，从概率视角审视，将F函数看成r为参数，h,t为变量的二元函数，即 $F_{\theta}( h,t;r) = \mu_{θ 1}(h; r) + \mu_{θ2}(t; h,r)$ 。对于条件概率分布 $\mu_{θ 1}$ 和 $\mu_{θ 2}$ 可以通过神经网络去模拟，作为概率分布，我们需要再添加归一化，这样这个条件分布的表达如下:
$\mu_{θ 1}(h;r) = log \frac{exp( \widetilde{\mu}_{θ 1}(h;r))}{\sum_{h'}exp( \widetilde{\mu}_{θ 1}(h';r))}$

$\mu_{θ 2}(t;h,r) = log \frac{exp( \widetilde{\mu}_{θ 2}(t;h,r))}{\sum_{t'}exp( \widetilde{\mu}_{θ 2}(t';h,r))}$
$\widetilde{\mu}_{θ 1}(h;r) = MLP_{θ1}(r)^Th$
$\widetilde{\mu}_{θ 2}(t;h,r) = MLP_{θ2}([h;r])^Th$
这样， $P_θ( h,t | r ) = exp(\mu_{θ 1}(h;r) + \mu_{θ 2}(t;h,r)) = exp(log \frac{exp( \widetilde{\mu}_{θ 1}(h;r))}{\sum_{h'}exp( \widetilde{\mu}_{θ 1}(h';r))} + log \frac{exp( \widetilde{\mu}_{θ 1}(h;r))}{\sum_{h'}exp( \widetilde{\mu}_{θ 1}(h';r))})$

这样loss function就被认为是是 $P_{\theta}$ 的最大似然的负log，即
$\mathcal{}{L}(G) = \sum_{(h,r,t \in G)} − log P_θ( h,t |r )$

相似性量化

基于前面的形式化定义，本文假定可以通过计算概率 $P_{θ^*}( h,t | r )$ 的相似度来量化关系的相似度，这也和motivation里的基本直觉是一致的，即如果两个关系的实体对是相似的，那么这两个关系也相似；反正，则有较大差异。
那么如何衡量两个概率分布的相似度呢？自然的工具就是Kullback–Leibler divergence,即KL散度， $D_{KL} ( P_{θ^*}( h,t | r1 ) || P_{θ^*}( h,t | r2 )) = E_{h,t \sim P_{θ^*}( h,t | r1 ) } log\frac{P_{θ^*}( h,t | r1 )}{P_{θ^*}( h,t | r2 )}$
考虑到KL散度的非对称性，文中将关系相似定义为：
$S(r1,r2) = g(D_{KL} ( P_{θ^*}( h,t | r1 ) || P_{θ^*}( h,t | r2 )),D_{KL} ( P_{θ^*}( h,t | r2 )|| P_{θ^*}( h,t | r1 )))$
函数 g(x,y)是一个人工定义的函数来修正对称性，因为相似度的取值为非负，且满足单调递减，所以指数族是一个好的选择，本文选取的是 $g(x,y) = e^{− max(x,y)}$

表1 关系量化方式一览

表一对比了本文和之前其他工作的关系相似度量化方式，可以看出其他方式情形将关系编码成向量，然后通过计算向量的相似度。本文认为之所以直接使用分布的差异来量化关系而不是比较关系编码后的向量，有两个原因：1）关系Embedding的过程中会丢失很多细节；2）用分布差异来量化，可解释性强。以图1为例，两个关系“be an unincorporated community in”(蓝色点)和“be a small city in”（红色点）。点的坐标是通过T-sne将采样的实体点的Embedding降维之后级联的，两个大的点，是通过TransE编码的关系向量。可以看出，编码后的关系在向量空间中比较接近，但是两个关系其实差异还是比较明显的，从实体的分布可以较为清晰的看出。

图1 关系量化方式对比差异示例

采样方法

实际到此为止，整个论文的思路已经较为完成，但是具体去实现，还差了最后一环，在一个大数据集或者开放域环境中，KL散度的计算需要遍历所有样本空间，因而是不可解的。解决这个问题的方法，自然是利用采样来实现，本文使用的是蒙特卡洛方法。具体如下：
$D_{KL} ( P_{θ^*}( h,t | r1 ) || P_{θ^*}( h,t | r2 )) \\ = E_{h,t \sim P_{θ^*}( h,t | r1 ) } log\frac{P_{θ^*}( h,t | r1 )}{P_{θ^*}( h,t | r2 )}\\ =\frac{1}{|S|}\sum_{h,t \in S}log\frac{P_{θ^*}( h,t | r1 )}{P_{θ^*}( h,t | r2 )}$
S是根据概率 $P_{θ^*}( h,t | r1 )$ 抽样得到的实体对，具体操作时采用序列抽样的方式，即首先依概率 $\mu_1$ 抽样h, 在根据h依概率 $\mu_2$ 抽样t。

数据集构建

本文使用了三个数据集，wikipeda (实体来自item，使用Reverb自动抽取，去掉特别高频的关系，使数据集均衡)，FB15k （Freebase的子集），TACRED （较大规模的有监督关系抽取数据集），参见表2。

表2 本文使用的数据集

实验和讨论

通过实验验证本文最初提出的几个关键问题：

根据本文算法计算的关系相似度相比人工判断有多大的差距？
本文通过了9个本科生进行人工标注，去衡量从wikipeda中抽取的360个关系对的相似性，并进行打分。打分原则：
4分，两个关系完全等价，如（study at, be educated at)
3分，两个关系描述同一个主题，且关联的实体类型相同，如 (be the director of, be the screenwriter of)
2分，两个关系描述同一个主题，但实体类型不同，如 (be headquartered in, be founded in)
1分，仅有语义的联系，如 (be the developer of, be the employer of)
0分，毫不相关，如 (be a railway station locates in, be published in)
以Spearman 相关系数作为指标，对比本文的方法和其他4个基线方法，可以看出，本文的方法明显更接近人类的判断，可以达到0.63左右，如图2所示

图2 Spearman correlations between human judgment and models’ outputs

开放性的关系不可避免的会出现抽取关系的冗余，那么如何有效的减少冗余呢？
有效减少开放域关系抽取带来的冗余，是本文提出的关系量化的一个重要应用。为了验证效果，本文设计了一个玩具实验和真实数据实验来进行验证。
玩具实验：
应用中国餐馆过程从wiki中抽取关系，并将其分成若干个子关系。具体来说，对于一个关系r，它当前已经有m个子关系了，对于一个新的r的实例，将其划分为一个新的子关系的概率为 $\frac{\alpha}{\alpha+n+1}$ , 而将它划分为已知的第k个子关系的概率为 $\frac{n_k}{\alpha+n+1}$ 。其中 $\alpha$ 是超参宿，文章中取值为1， $n_k$ 为第k个子关系的实例数， $n$ 为r的所有子关系的实例数。然后过滤掉所有实例数少于50的子关系，共计得到所有关系1165个。在此基础上，应用关系相似度的量化方法进行关系合并，最终得到的结果如表3所示。可以看出本文的方法在Open IE去除冗余的过程中有明显的优势。

表3 The experiment results on the toy dataset

量化相似度可以达到什么程度？用最好的关系抽取模型会发生相似性判断错误么？
对于真实数据集的评估，本文采用ReVerb构建数据集，在训练的时候不同的模式就当成是不同的关系，然后进行关系合并。因为对于真实数据集，无法遍历数据集来构建准确率和召回率这样的评价指标，作者在这里使用了拒绝采样和重要性采样的技巧，去构建评价指标，最终的结果如图3所示。可以看出本文的算法在准确率较高的情况下,可以达到一个比较高的召回率. 这里对于评价指标的定义如下:
$E_{x \sim U}I[\hat{f}(x) = 1] \approx \sum_{i=1}^n I[\hat{f}(x_i) = 1] \hat{w_i}$
$E_{x \sim U'}I[f(x) = 1] \approx \frac{1}{n}\sum_{i=1}^n I[f(x_i) = 1]$
其中, $\in R \times R$ 代表一对关系实例, $\in {0,1}$ 代表 $x$ 的label, 及表示关系r1和r2是同一个关系; $\hat{f}(x)$ 是对于 $x$ 的预测,即 $阈值\lambda$ 。分布U 是从所有 $f (x) = 1$ 的样本的一个均匀分布; U’是 $\hat{f}(x)=1$ 的样本的一个均匀分布。 $\hat{w_i}$ 代表样本重要性。

图3 Precision-recall curve on Open IE task

对于第二个问题，图4显示了模型的输出在关系预测和关系提取任务上的分散关系的相似性等级分布。从图4a和4b中，我们可以观察到最具干扰性的关系是最相似的关系，这也说明：即使在这些任务上的最佳模型在最相似的关系中仍然会犯错误，同时也反映了启发式方法对指导模型更加关注相似关系之间的边界的重要性。

图4 Similarity rank distributions of distracting relations on different tasks and datasets

相似度计算有没有启发式的负采样算法？
本文尝试使用关系类型约束进行负采样，但是与统一采样相比，看不到任何改进。具体参考论文的附录E部分。论文的第8节讨论了应用容易混淆的关系来进行负采样，效果如图5所示。

图5 Improvement of using similarity in a heuristic method for negative sampling

相似度可不可以作为关系抽取softmax-margin训练中的可适应性间隔呢？
可以将相似度作为一个可适应的margin 纳入softmax-margin, 将原来loss中的关系相似代价如， $cost(r^{(i)},r)$ 替换成 $\alpha S(r^{(i)},r)$ . 表4 证明关系模型的整体表现还是有一定幅度的提升。

表4 Improvement of using similarity in softmaxmargin loss

其他

本文有一个关于前面recall的证明非常的精彩，很好的应用了拒绝采样，重要性采样和自正规化技巧，具体参见论文附录A。

你可能感兴趣的:(NLP学习之旅,AI转型之路)

Java面试黄金宝典5 ylfhpy Java面试黄金宝典 java 面试开发语言职场和发展算法
1.ConcurrentHashMap和HashTable有哪些区别原理HashTable：它继承自Dictionary类，是Java早期提供的线程安全哈希表。其线程安全的实现方式是对每个方法都使用synchronized关键字进行同步。例如，在调用put、get等方法时，整个HashTable会被锁定，其他线程必须等待当前线程释放锁后才能访问该方法。javaimportjava.util.Has
深度学习与目标检测系列(三) 本文约(4万字) | 全面解读复现AlexNet | Pytorch | 小酒馆燃着灯深度学习目标检测 pytorch AlexNet 人工智能
文章目录解读Abstract-摘要翻译精读主要内容1.Introduction—前言翻译精读主要内容：本文主要贡献：2.TheDataset-数据集翻译精读主要内容：ImageNet简介：图像处理方法：3.TheArchitecture—网络结构3.1ReLUNonlinearity—非线性激活函数ReLU翻译精读传统方法及不足本文改进方法本文的改进结果3.2TrainingonMultipleG
软考系统架构设计师考试学习和考试的知识点大纲，覆盖所有考试考点 DKPT #系统架构设计师系统架构学习
以下是软考系统架构设计师考试的知识点大纲，覆盖所有官方考点，分为基础知识、核心技术、系统设计、案例分析、论文写作五大模块，帮助系统性学习和备考：一、基础知识模块计算机组成与体系结构计算机硬件组成（CPU、内存、I/O设备）存储系统（Cache、RAID、虚拟内存）指令系统与流水线技术操作系统进程与线程管理（调度算法、死锁）内存管理（分页、分段、虚拟内存）文件系统与磁盘管理数据库系统关系数据库（SQ
腾讯技术岗位笔试&面试题(一) TechPioneer_lp 互联网大厂技术面试 c++面试数据结构个人开发算法
说在前面本篇文章是腾讯技术面试题目汇总第一篇。后续将持续推出互联网大厂，如阿里，腾讯，百度，美团，头条等技术面试题目，以及答案和分析。欢迎大家点赞关注转发。1.map插入方式有几种？用insert函数插入pair数据，mapStudent.insert(pair(1,“student_one”));用insert函数插入value_type数据mapStudent.insert(map::valu
优先队列 priority_queue详解ん贤算法数据结构算法优先队列 c++java
说到，priority_queue优先队列。必须先要了解啥是堆与运算符重载(我在下方有解释)。否则只知皮毛，极易忘记==寸步难行。但在开头，还是简单的说下怎么用首先，你需要调用#include在main函数中，声明格式为：priority_queue队列名;priority_queuei;priority_queued;常用操作priority_queuep;p.size();//获取长度p.em
基于LangChain-Chatchat实现智能问答系统 2301_79125431 java
题解|#统计输入正数个数#5.6importjava.util.*;publicclassMain{publics广汽丰田发动机薪酬福利待遇1、工作时间：基本上为5天8小时工作制；2、薪资结构：基本工资+加班工资+各类补贴津贴+各类慰问金+小红书24届春招和25届实习，内部推荐小红书24届春招和25届实习，推荐码为:0T019BWYNARK，内推码仅适用于校招内推及微信小程序题解|#试卷发布当天作
24远景能源-动力，10月最后一周面试！【NTAKYsW】 2301_79125642 java
大模型公司收实习啦，入局好机会，全是大佬不卷后端研发实习生简历投递请联系我，牛客会屏蔽邮箱日常实习：面向全体在校生，为符合岗位要求的同学提供为期3个月及以上的项目实践机会。公司介绍下午移动笔试，晚上联通笔试我看到好多投移动都去面试了，但是我没有面试也没有任何消息，而且智联校园上面hr也没有查看，这是怎么回事，难道是随便发的笔试吗...应该投的是什么AI研究中心联通许愿美团商分octl:一面-10.
AR眼镜——软件技术栈的必经之路 Julian.zhou 人机交互未来思考人工智能 ar 人工智能交互空间计算语言模型
AR眼镜软件技术栈的必经之路：从操作系统到生态构建的深度解析摘要AR眼镜作为下一代人机交互入口，其软件技术栈的成熟度直接决定了用户体验与市场渗透率。本文基于行业最新技术动态与头部企业布局，深度剖析AR眼镜软件行业必须突破的七大技术方向，揭示从底层框架到应用生态的全栈技术储备路径。一、操作系统与底层框架：实时性与轻量化的双重革命AR眼镜软件生态的根基在于操作系统的定制化与优化，需满足三大核心需求：实
量子位招聘 | DeepSeek帮我们改的招聘启事量子位
关注前沿科技量子位未来同事，你好~这是一则招聘帖。如果你与我们志同道合，对AI大模型、具身智能、终端硬件、AI新媒体编辑感兴趣，我们正在招聘这些领域的原创作者。以下岗位均为全职，工作地点：北京中关村。岗位面向：社招、应届毕业生，所有岗位均可实习——表现出色均可转正加分项：乐于探索AI新工具，善用AI新工具；拥有解读论文的能力，能深入浅出讲解原理；有写代码能力；量子位长期读者。加入我们，你可以获得：
钉钉发布“AI创新N次方计划”，为AI生态免除佣金、保证金和算力费用量子位
3月20日，钉钉在北京举办了“AI创业N次方”生态创新大会。会上，钉钉发布了一系列全新生态政策，为AI创业者、AI转型者提供助力：包括免除佣金、免除入驻保证金和免除算力费用，并在销售、品牌、技术和投资等方面提供支持，为生态伙伴提供AI应用创业创新的全方位助力。发布AI创新扶持计划：“三免四助力”钉钉副总裁、开放平台总经理王铭在会上表示：“开放是钉钉一直以来的信仰。AI时代大幕拉开，钉钉生态也进入新
MySQL基本语句冉冉柟 mysql 数据库 oracle
一、DDL（数据定义语言）DDL主要用于定义数据库、表、视图、索引等数据库对象的结构1.1创建数据库CREATEDATABASEdatabase_name;1.2删除数据库DROPDATABASEdatabase_name;1.3选择数据库USEdatabase_name;1.4创建表CREATETABLEtable_name( column1datatypeconstraint, column2
Tinyflow AI 工作流编排框架 v0.0.7 发布自不量力的A同学人工智能
目前没有关于TinyflowAI工作流编排框架v0.0.7发布的相关具体信息。Tinyflow是一个轻量的AI智能体流程编排解决方案，其设计理念是“简单、灵活、无侵入性”。它基于WebComponent开发，前端支持与React、Vue等任何框架集成，后端支持Java、Node.js、Python等语言，助力传统应用快速AI转型。该框架代码库轻量，学习成本低，能轻松应对简单任务编排和复杂多模态推理
12.2 kubelet containerManager源码解读福大大架构师每日一题 kubernetes相关 kubelet 云原生
本节重点总结:containerManager管理容器的各种资源，比如CGroups、QoS、cpuset、device等内置了很多资源管理器，总结起来就是其他manager的管家为什么要限制本地临时存储呢早期kubernetes版本并没有限制container的rootfs的容量由于默认容器使用的log存储空间是在/var/lib/kubelet/下rootfs在/var/lib/docker下
Fatal Python error: init_stdio_encoding: failed to get the Python codec name of the stdio encoding CCLZMY python 开发语言后端
这里写自定义目录标题欢迎使用Markdown编辑器新的改变功能快捷键合理的创建标题，有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右SmartyPants创建一个自定义列表如何创建一个注脚注释也是必不可少的KaTeX数学公式新的甘特图功能，丰富你的文章UML图表FLowchart流程图导出与导入导出导入D:\Metag
光影香江聚四海，蓝陵科技扬帆数字内容新蓝海 LhcyyVSO 人工智能大数据
3月20日，第29届香港国际影视展（FILMART）圆满收官，这场亚洲顶级行业盛会吸引了34个国家和地区逾760家机构参展，搭建起全球影视产业深度对话的桥梁。蓝陵科技携三大创新数字解决方案惊艳亮相，与各国行业领袖共探影视工业化转型路径，开启文化科技出海新篇章。数字基建赋能构建全球合作生态在1B-D17展区，蓝陵科技通过影视动漫渲染、vLive虚拟直播、AI跨境电商直播数字人三大技术矩阵，向国际客商
AI工具如何改变编程学习？Trae IDE与Claude 3.5的实践案例黑金IT AI智能 AI编程 fasttify 人工智能学习 ide
在现在这个到处都是电脑和手机的时代，AI工具正在变成编程学习和开发的好帮手。今天，咱们就来好好聊聊AI工具，特别是TraeIDE和Claude3.5这两个工具，在学习FastAPI和构建知识图谱的时候有多厉害，还有它们对编程行业会有什么影响。一、AI工具：编程学习与开发的好帮手AI工具在编程学习和开发里，作用可太大了。就像TraeIDE和Claude3.5，它们能像好朋友一样，在写代码的时候帮忙检
使用 Milvus 进行向量数据库管理与实践 qahaj milvus 数据库 python
技术背景介绍在当今的AI与机器学习应用中，处理和管理大量的嵌入向量是一个常见的需求。Milvus是一个开源向量数据库，专门用于存储、索引和管理深度神经网络以及其他机器学习模型生成的大规模嵌入向量。它的高性能和易用性使其成为处理向量数据的理想选择。核心原理解析Milvus的核心功能体现在其强大的向量索引和搜索能力。它支持多种索引算法，包括IVF、HNSW等，使其能够高效地进行大规模向量的相似性搜索操
QT日志级别设置大象荒野嵌入式QT开发 qt
开发版本代码包含了大量的qDebug，发布版本可能导致未知异常。QLoggingCategory::setFilterRules用于设置日志过滤规则，从而控制日志的输出。以下是一个完整的示例，展示如何通过设置日志过滤规则来禁用qDebug()输出：#include#include#includeintmain(intargc,char*argv[]){QApplicationapp(argc,ar
1.Go - Hello World 编程_大白 go golang 开发语言后端
1.安装Go依赖https://go.dev/dl/根据操作系统选择适合的依赖，比如windows：2.配置环境变量右键此电脑-属性-环境变量PS：GOROOT：Go依赖路径；GOPATH：Go项目路径；Path：Go依赖的bin目录验证：win+r输入`cmd`，输入`go`回车3.编写代码创建hello.go文件，记事本编辑以下内容。packagemainimport"fmt"funcmain
国产Cursor来了？字节跳动出品AI编程工具——Trae使用全解析码云逸栈 AI编程
Trae是什么？Trae是字节跳动最近发布的一款AIIDE，对标Cursor、Windsurf、Copilot这类AI编程工具。它是国产工具，在语言和易用性上更符合国人习惯，且现阶段完全免费！Trae提供智能问答、代码自动补全以及基于Agent的AI自动编程能力，帮助开发者在项目开发中与AI灵活协作，大幅提升开发效率。想深入了解可查看官网文档：docs.trae.ai/docs/what-i安装下
法律行业——合同审查与AI律师 zhouyaowei1983 人工智能人工智能
一、引言：AI技术重构法律行业新格局‌随着AI技术从实验室走向规模化应用，法律行业正经历从“经验驱动”向“数据驱动”的范式转变。这一变革的核心驱动力源于法律服务的两大根本矛盾：‌传统人工服务效率瓶颈‌与‌市场对高精度、低成本法律产品的迫切需求‌‌。‌1.法律行业数字化转型的底层逻辑‌‌技术革命推手‌：以DeepSeekR1大模型为代表的开源AI技术，让法律文本解析、案例推理等复杂任务实现平民化应用
Kotlin的inline、noinline和crossinline关键字我们间的空白格 android kotlin android
一、inlineinline翻译成中文的意思就是内联，在kotlin里面inline被用来修饰函数，表明当前函数在编译时是以内嵌的形式进行编译的，从而减少了一层函数调用栈：inlinefunfun1(){Log.i("tag","1")}//调用funmainFun(){fun1()}//实际编译的代码funmainFun(){Log.i("tag","1")}这样写的一点好处就是调用栈会明显变浅
如何加快制造业数字化转型九河智造云制造云计算
加速制造业数字化转型的五大战略支点制造业数字化转型已进入深水区。工信部数据显示，2025年我国规模以上工业企业数字化研发工具普及率达88%，但全流程数字化覆盖率不足35%。破解转型困局需要构建“政策引导-技术突破-场景落地-生态协同”的加速机制，通过五大核心战略实现质效突破。一、强化顶层设计：构建转型制度保障体系政策创新需突破三大瓶颈：专项资金引导：设立2000亿元制造业数字化专项基金，对智能工厂
人工智能革命：技术演进图谱与人类文明重构路径 A达峰绮人工智能重构经验分享图形绘制数据处理 AI
当GPT-4在2023年3月通过注册会计师考试时，其财务分析模块展现的推理能力已超越85%的人类考生。这个标志性事件背后，折射出人工智能正在突破认知型工作的最后防线。我们正在见证的，不仅是技术迭代，更是人类文明范式的根本性转变。一、算力奇点降临：AI基础设施的指数级进化量子计算与神经形态芯片的融合正在重塑算力边界。IBM最新数据显示，其量子体积（QuantumVolume）从2020年的64跃升至
蓝桥杯动态规划实战：从数字三角形到砝码称重藍海琴泉蓝桥杯动态规划职场和发展
适合人群：蓝桥杯备考生|算法竞赛入门者|DP学习实践者目录一、我的动态规划入门之路1.数字三角形：经典DP首战告捷2.砝码称重：背包问题的变形二、蓝桥杯高频算法考点三、蓝桥杯DP专项训练题四、备考建议一、我的动态规划入门之路1.数字三角形：经典DP首战告捷题目描述：从三角形的顶部到底部有很多条不同的路径。对于每条路径，把路径上面的数加起来可以得到一个和，你的任务就是找到最大的和（路径上的每一步只可
微软Data Formulator：用AI重塑数据可视化的未来几道之旅人工智能智能体及数字员工人工智能信息可视化
在数据驱动的时代，如何快速将复杂数据转化为直观的图表是每个分析师面临的挑战。微软研究院推出的开源工具DataFormulator，通过结合AI与交互式界面，重新定义了数据可视化的工作流。本文将深入解析这一工具的核心功能、安装方法及使用技巧，助你轻松驾驭数据之美。一、DataFormulator是什么？DataFormulator是一款基于大语言模型（LLM）的AI工具，旨在帮助用户通过自然语言和界
本地部署deepseek-r1:14b 批量调用 Python调用本地deepseek-r1:14b实现对本地数据库的AI管理朴拙Python交易猿 python 数据库开发语言
这篇文章主要为大家详细介绍了Python如何基于DeepSeek模型，调用本地deepseek-r1:14b实现对本地数据库的AI管理场景描述基于DeepSeek模型，实现对本地数据库的AI管理。实现思路1、本地python+flask搭建个WEB，配置数据源。2、通过DeepSeek模型根据用户输入的文字需求，自动生成SQL语句。3、通过SQL执行按钮，实现对数据库的增删改查。模型服务方法1启动
【职业规划】分享003 -- 什么是职业规划师？杏子 | 职位规划师职业与个人发展经验分享
【职业规划】分享003–重新认识职业规划师最近常被问起职业，我说自己在做独立职业规划师。可能很多职场朋友对这个角色还不太熟悉，今天想和大家聊聊这份工作的价值。就像心理咨询服务心理健康，职业规划师专注解决职业困惑。如果你：▷每天重复机械工作却看不到成长▷想转型却不知从何下手▷面对职业选择总是犹豫不决那么就需要专业的职业规划师来帮你诊断问题，为你提供定制化的解决方案。拿我自己的职业历程来举例：2014
使用Wolfram Alpha API在LangChain中的应用 shuoac langchain python
在AI技术应用中，WolframAlpha以其强大的计算能力和信息检索功能，被广泛应用于各类智能系统中。本文将为您介绍如何结合LangChain使用WolframAlphaAPI，以实现功能强大的计算和信息查询服务。技术背景介绍WolframAlpha是由WolframResearch开发的问答引擎，它通过计算从外部数据源中获取答案，实现对事实性问题的解答。在开发智能应用时，我们可以利用Wolfr
QT多线程：苜柠 QT qt 开发语言
线程类：QThread类线程池：QThreadPool类QMutex:互斥锁；QReadWriteLock:读-写锁；QSemaphore:信号量；QWaitCondition:条件变量。利用它们来保护线程间共享数据的完整性.原子操作：QAtomicInteger、QAtomicPointer类，能够确保基础数据类型的读写操作的原子性。对于简单的计数、状态位的读写，使用原子操作类可以避免加锁开销。
ASM系列六利用TreeApi 添加和移除类成员 lijingyao8206 jvm 动态代理 ASM 字节码技术 TreeAPI
同生成的做法一样，添加和移除类成员只要去修改fields和methods中的元素即可。这里我们拿一个简单的类做例子，下面这个Task类，我们来移除isNeedRemove方法，并且添加一个int 类型的addedField属性。 package asm.core; /** * Created by yunshen.ljy on 2015/6/
Springmvc-权限设计 bee1314 spring Web jsp
万丈高楼平地起。权限管理对于管理系统而言已经是标配中的标配了吧，对于我等俗人更是不能免俗。同时就目前的项目状况而言，我们还不需要那么高大上的开源的解决方案，如Spring Security，Shiro。小伙伴一致决定我们还是从基本的功能迭代起来吧。目标： 1.实现权限的管理（CRUD） 2.实现部门管理（CRUD) 3.实现人员的管理（CRUD） 4.实现部门和权限
算法竞赛入门经典（第二版）第2章习题 CrazyMizzz c 算法
2.4.1 输出技巧 #include <stdio.h> int main() { int i, n; scanf("%d", &n); for (i = 1; i <= n; i++) printf("%d\n", i); return 0; } 习题2-2 水仙花数(daffodil
struts2中jsp自动跳转到Action 麦田的设计者 jsp webxml struts2 自动跳转
1、在struts2的开发中，经常需要用户点击网页后就直接跳转到一个Action，执行Action里面的方法，利用mvc分层思想执行相应操作在界面上得到动态数据。毕竟用户不可能在地址栏里输入一个Action（不是专业人士） 2、＜jsp:forward page="xxx.action" /＞，这个标签可以实现跳转，page的路径是相对地址,不同与jsp和j
php 操作webservice实例 IT独行者 PHP webservice
首先大家要简单了解了何谓webservice，接下来就做两个非常简单的例子，webservice还是逃不开server端与client端。我测试的环境为：apache2.2.11 php5.2.10做这个测试之前，要确认你的php配置文件中已经将soap扩展打开，即extension=php_soap.dll; OK 现在我们来体验webservice //server端 serve
Windows下使用Vagrant安装linux系统 _wy_ windows vagrant
准备工作：下载安装 VirtualBox ：https://www.virtualbox.org/ 下载安装 Vagrant ：http://www.vagrantup.com/ 下载需要使用的 box ：官方提供的范例：http://files.vagrantup.com/precise32.box 还可以在 http://www.vagrantbox.es/
更改linux的文件拥有者及用户组(chown和chgrp) 无量 c linux chgrp chown
本文（转） http://blog.163.com/yanenshun@126/blog/static/128388169201203011157308/ http://ydlmlh.iteye.com/blog/1435157 一、基本使用：使用chown命令可以修改文件或目录所属的用户：命令
linux下抓包工具矮蛋蛋 linux
原文地址： http://blog.chinaunix.net/uid-23670869-id-2610683.html tcpdump -nn -vv -X udp port 8888 上面命令是抓取udp包、端口为8888 netstat -tln 命令是用来查看linux的端口使用情况 13 . 列出所有的网络连接 lsof -i 14. 列出所有tcp 网络连接信息 l
我觉得mybatis是垃圾！：“每一个用mybatis的男纸，你伤不起” alafqq mybatis
最近看了每一个用mybatis的男纸，你伤不起原文地址：http://www.iteye.com/topic/1073938 发表一下个人看法。欢迎大神拍砖；个人一直使用的是Ibatis框架，公司对其进行过小小的改良；最近换了公司，要使用新的框架。听说mybatis不错；就对其进行了部分的研究；发现多了一个mapper层；个人感觉就是个dao；
解决java数据交换之谜百合不是茶数据交换
交换两个数字的方法有以下三种，其中第一种最常用 /* 输出最小的一个数 */ public class jiaohuan1 { public static void main(String[] args) { int a =4; int b = 3; if(a<b){ // 第一种交换方式 int tmep =
渐变显示 bijian1013 JavaScript
<style type="text/css"> #wxf { FILTER: progid:DXImageTransform.Microsoft.Gradient(GradientType=0, StartColorStr=#ffffff, EndColorStr=#97FF98); height: 25px; } </style>
探索JUnit4扩展：断言语法assertThat bijian1013 java 单元测试 assertThat
一.概述 JUnit 设计的目的就是有效地抓住编程人员写代码的意图，然后快速检查他们的代码是否与他们的意图相匹配。 JUnit 发展至今，版本不停的翻新，但是所有版本都一致致力于解决一个问题，那就是如何发现编程人员的代码意图，并且如何使得编程人员更加容易地表达他们的代码意图。JUnit 4.4 也是为了如何能够
【Gson三】Gson解析{"data":{"IM":["MSN","QQ","Gtalk"]}} bit1129 gson
如何把如下简单的JSON字符串反序列化为Java的POJO对象? {"data":{"IM":["MSN","QQ","Gtalk"]}} 下面的POJO类Model无法完成正确的解析： import com.google.gson.Gson;
【Kafka九】Kafka High Level API vs. Low Level API bit1129 kafka
1. Kafka提供了两种Consumer API High Level Consumer API Low Level Consumer API(Kafka诡异的称之为Simple Consumer API，实际上非常复杂) 在选用哪种Consumer API时，首先要弄清楚这两种API的工作原理，能做什么不能做什么，能做的话怎么做的以及用的时候，有哪些可能的问题
在nginx中集成lua脚本：添加自定义Http头，封IP等 ronin47 nginx lua
Lua是一个可以嵌入到Nginx配置文件中的动态脚本语言，从而可以在Nginx请求处理的任何阶段执行各种Lua代码。刚开始我们只是用Lua 把请求路由到后端服务器，但是它对我们架构的作用超出了我们的预期。下面就讲讲我们所做的工作。强制搜索引擎只索引mixlr.com Google把子域名当作完全独立的网站，我们不希望爬虫抓取子域名的页面，降低我们的Page rank。 location /{
java-归并排序 bylijinnan java
import java.util.Arrays; public class MergeSort { public static void main(String[] args) { int[] a={20,1,3,8,5,9,4,25}; mergeSort(a,0,a.length-1); System.out.println(Arrays.to
Netty源码学习-CompositeChannelBuffer bylijinnan java netty
CompositeChannelBuffer体现了Netty的“Transparent Zero Copy” 查看API（ http://docs.jboss.org/netty/3.2/api/org/jboss/netty/buffer/package-summary.html#package_description）可以看到，所谓“Transparent Zero Copy”是通
Android中给Activity添加返回键 hotsunshine Activity
// this need android:minSdkVersion="11" getActionBar().setDisplayHomeAsUpEnabled(true); @Override public boolean onOptionsItemSelected(MenuItem item) {
静态页面传参 ctrain 静态
$(document).ready(function () { var request = { QueryString : function (val) { var uri = window.location.search; var re = new RegExp("" + val + "=([^&?]*)", &
Windows中查找某个目录下的所有文件中包含某个字符串的命令 daizj windows 查找某个目录下的所有文件包含某个字符串
findstr可以完成这个工作。 [html] view plain copy >findstr /s /i "string" *.* 上面的命令表示，当前目录以及当前目录的所有子目录下的所有文件中查找"string&qu
改善程序代码质量的一些技巧 dcj3sjt126com 编程 PHP 重构
有很多理由都能说明为什么我们应该写出清晰、可读性好的程序。最重要的一点，程序你只写一次，但以后会无数次的阅读。当你第二天回头来看你的代码时，你就要开始阅读它了。当你把代码拿给其他人看时，他必须阅读你的代码。因此，在编写时多花一点时间，你会在阅读它时节省大量的时间。让我们看一些基本的编程技巧：尽量保持方法简短尽管很多人都遵
SharedPreferences对数据的存储 dcj3sjt126com
SharedPreferences简介： &nbs
linux复习笔记之bash shell (2) bash基础 eksliang bash bash shell
转载请出自出处： http://eksliang.iteye.com/blog/2104329 1.影响显示结果的语系变量（locale） 1.1locale这个命令就是查看当前系统支持多少种语系，命令使用如下： [root@localhost shell]# locale LANG=en_US.UTF-8 LC_CTYPE="en_US.UTF-8"
Android零碎知识总结 gqdy365 android
1、CopyOnWriteArrayList add(E) 和remove(int index)都是对新的数组进行修改和新增。所以在多线程操作时不会出现java.util.ConcurrentModificationException错误。所以最后得出结论：CopyOnWriteArrayList适合使用在读操作远远大于写操作的场景里，比如缓存。发生修改时候做copy，新老版本分离，保证读的高
HoverTree.Model.ArticleSelect类的作用 hvt Web .net C#hovertree asp.net
ArticleSelect类在命名空间HoverTree.Model中可以认为是文章查询条件类，用于存放查询文章时的条件，例如HvtId就是文章的id。HvtIsShow就是文章的显示属性，当为-1是，该条件不产生作用，当为0时，查询不公开显示的文章，当为1时查询公开显示的文章。HvtIsHome则为是否在首页显示。HoverTree系统源码完全开放，开发环境为Visual Studio 2013
PHP 判断是否使用代理 PHP Proxy Detector 天梯梦 proxy
1. php 类 I found this class looking for something else actually but I remembered I needed some while ago something similar and I never found one. I'm sure it will help a lot of developers who try to
apache的math库中的回归——regression（翻译） lvdccyb Math apache
这个Math库，虽然不向weka那样专业的ML库，但是用户友好，易用。多元线性回归，协方差和相关性（皮尔逊和斯皮尔曼），分布测试（假设检验，t，卡方，G），统计。数学库中还包含，Cholesky，LU，SVD，QR，特征根分解，真不错。基本覆盖了：线代，统计，矩阵，最优化理论曲线拟合常微分方程遗传算法（GA），还有3维的运算。。。
基础数据结构和算法十三：Undirected Graphs (2) sunwinner Algorithm
Design pattern for graph processing. Since we consider a large number of graph-processing algorithms, our initial design goal is to decouple our implementations from the graph representation
云计算平台最重要的五项技术 sumapp 云计算云平台智城云
云计算平台最重要的五项技术 1、云服务器云服务器提供简单高效，处理能力可弹性伸缩的计算服务，支持国内领先的云计算技术和大规模分布存储技术，使您的系统更稳定、数据更安全、传输更快速、部署更灵活。特性机型丰富通过高性能服务器虚拟化为云服务器，提供丰富配置类型虚拟机，极大简化数据存储、数据库搭建、web服务器搭建等工作；仅需要几分钟，根据CP
《京东技术解密》有奖试读获奖名单公布 ITeye管理员活动
ITeye携手博文视点举办的12月技术图书有奖试读活动已圆满结束，非常感谢广大用户对本次活动的关注与参与。 12月试读活动回顾： http://webmaster.iteye.com/blog/2164754 本次技术图书试读活动获奖名单及相应作品如下：一等奖（两名） Microhardest：http://microhardest.ite

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他