smile909

ACL 2020 Video-Grounded Dialogues with Pretrained Generation Language Models

动机

预训练好的语言模型在改善各种下游NLP任务方面已显示出显著的成功，这是由于它们能够在文本数据中建立依赖关系和生成自然反应。本文利用预训练好的语言模型来提高视频对话的效果。
基于Transformer的预训练好的语言模型的神经结构已经被用来学习视觉-文本NLP任务的跨模态表征。它可以应用于捕捉不同类型输入模式（文本和图像）之间的各种依赖关系，并具有适当的客观损失函数。这些模型的多头attention机制可以检测输入文本中的每个token与输入图像中的每个图像块或空间对象之间的长程依赖关系。作者的动机是将这条线的研究扩展到视频对话任务，并充分利用预训练好的模型的能力以在对话和视频中获得语言和视觉表示。
视频对话是一个非常具有挑战性的过程，涉及到不同动态的复杂特征：（1）视频特征可以扩展到空间和时间两个维度；（2）涉及多个对话转折的语义依赖的对话特征。
作者的目标是以端到端的方式处理基于视频的对话任务和生成自然反应。

方法

简介

视听场景感知对话(AVSD)任务，该任务旨在根据视频的视觉和音频特征生成对话响应。对话引擎需要创建响应，不仅匹配对话流，而且在多个对话轮中处理用户关于给定视频的问题。作者提出了一个扩展GPT-2模型的框架，通过将基于视频的对话任务形成为序列到序列的任务，将视觉和文本表示结合到结构化的序列中，并对预训练好的大型GPT-2网络进行微调，来应对上述挑战。作者的框架允许对语言模型进行微调，以捕获不同信息层次上的多个模态之间的依赖关系：视频中的时空级和对话上下文中的token-句子级。
首先，作者将基于视频的对话作为预训练好的语言模型的下游任务来表达输入成分。在一般的序列到序列的框架中，输入组件被组合成一个多模态的结构化序列，输出是一个系统响应。然后作者应用预训练的模型来利用深度注意力神经网络以精细粒度从而捕获文本和视频依赖关系。具体地说，作者提出了沿着输入视频的时间维度捕获文本数据中的每个token和每个空间特征之间的依赖关系。最后，作者提出了一个多任务学习框架，它除了对话反应生成目标之外，还包括其他学习目标。作者对DSTC7的视听场景感知对话(AVSD)标准进行了有希望的改进，为这方面的研究提供了一个潜在的方向。

模型

作者的模型架构可以在图1中看到。作者受到基于Transformer的LM方法的启发，该方法利用文本中不同级别的特征，如单词、字符和位置级别。作者将这一原理和技术应用于AVSD中，克服了多轮对话输入与时空变化视频输入相结合的挑战。作者建议将视频分解为块，但保持一个结构化的序列。然后，该序列直接与对话的文本输入组合，对话的文本输入也按时间顺序排列。这种特征重构简单而强大，因为它允许跨所有文本token-视频块对的显式依赖学习。因此，它可以促进更强的信号以更大的粒度回答人类的查询。
作者基于GPT-2架构训练了一个GPT模型。GPT-2模型基于Transformer网络，该网络包括在非常大的文本数据上12到24层masked多头attention。继GPT-2在基于生成的任务中取得成功之后，作者利用GPT-2预训练模型的能力来生成基于视频的对话响应，并将作者的框架称为“VGD-GPT2”。
具体包括：

输入表示。首先，作者将输入分量修改为视频帧或视频片段和对话轮的长序列。
1）视频表示。视频表示。每个视频帧或视频片段进一步被结构化为空间区域序列，所述空间区域序列可以使用预训练好的视频模型来提取。对于输入视频V，作者表示预训练好的2D CNN或3D CNN视频模型的输出作为Z_V^pre∈R^F×P×demb，其中d_emb是预训练好的视频模型的特征维度，F是得到的采样视频帧或视频片段的数目，P是每个视频帧中的空间区域的数目。作者将Z_V重塑为图像块序列，并通过带有ReLU激活的线性变换，以匹配预训练语言模型的特征维度d：

其中W_V∈R^demb×d。作者把它称为输入视频的空间级特征。从图1中可以看出，作者通过添加三个额外的编码层将不同类型的输入属性注入到X_V中：
(1) 模态级编码，用于通知信息的类型。作者使用一个模态token“vis”来统一表示视觉信息类型。
(2) 时间级编码，用于通知输入特征的帧级（或片段级）位置的模型。
(3) 包含空间级排序的位置级编码。这相当于在基于BERT的语言模型中看到的在句子中的tokens的位置编码。
所有这三层都是可训练的参数，使模型能够学习输入特征的动态特性。将所有编码层建模为具有预训练模型的相同特征维度d。作者通过点加将所有编码层组合在一起，产生了丰富的视频表示：

2）文本表示。类似地，作者将对话历史H分解为对话轮的序列H=(H₁, H₂, … , H_t)，其中t是当前的对话轮。每个对话轮被表示为一对依次串联的用户话语U和系统响应S H=((U₁, S₁), (U₂, S₂), … , U_t))（S_t是目标生成的目标响应模型）。然后，每个话语被表示为token x的序列，因此对话历史可以被表示为X_H=(x₁, x₂, … , x_LH)和Y=S_t=(y₁, y₂, … , y_LY)，其中L_H和L_Y分别是对话历史和目标响应中的token总数。遵循AVSD设置（Hori等人，2019)，作者利用视频caption C的文本输入。视频caption通常以一个或两个句子提供视频的语言摘要。标题可以表示为一系列token X_C=(x₁, x₂, … , x_LC）。作者将所有的文本输入序列组合起来形成一个单一的序列X_T=(X_C, X_H, Y₋₁)作为模型的输入。Y₋₁是左移1个位置的目标响应序列，以启用输出token的自回归预测。作者将嵌入的特性表示为Z_T^token，作为文本输入的token级的编码层。与视频特征类似，作者添加了额外的层去注入X_T的不同属性。（见图1）
(1) 用于在X_T中区分片段的模态级编码。作者使用3个不同的模态tokens：“cap”、“sys”和“usr”来指定相应位置的token是输入caption、系统响应还是用户话语的一部分。
(1) 轮次级编码，对相应位置的token的轮数进行编码。
(2) 用于注入token排序信号的位置级编码。
与视频表示类似，编码输入通过点加进行组合：

作者将Z_V和Z_T拼接起来，创建一个长度为（F×P+L_C+L_H+L_Y)和嵌入维数为d的单个输入序列Z_VT。Z_VT用作预训练好的GPT-2的输入，用于微调。
2. 优化。遵循Transfertransfo采取的类似策略。作者在多任务设置中微调模型，目标如下：
(1) 响应生成：这是一个典型的目标函数，以源序列为条件，它将输出目标响应的可能性最大化。
(2) masked多模态建模：作者探索两种损失函数：masked语言建模(MLM)和masked视觉建模(MVM)。作者在训练实例中mask视频帧中的token和空间区域，并要求模型用剩余的输入重新生成它们。通过使用softmax通过线性层，类似于响应生成来学习MLM。通过最小化masked视觉区域的输出表示和原始输入表示之间的特征空间L1损失来学习MVM。两者都通过线性变换传递到相同的维度空间。这类似于针对图像风格转移和图像分辨率任务提出的感知损失。作者遵循BERT，用一个[MASK] token随机替换每个训练实例中约15%的token和图像区域输入。然后使用对应的输出表示来恢复原始token或图像区域。
(3) 匹配视频-文本对(MVT)：对于大约15%的训练实例，作者通过随机用不正确的对话或视频输入来代替原始输入，将预训练的语言模型适应于对话领域。作者使用一种特殊的token [CLS]拼接到输入序列以学习上下文表示。该向量通过Transformer注意力层整合上下文线索，并利用相应的输出表示来预测输入的视频-文本对是否正确。

实验

实验细节

作者使用GPT-2体系结构的开源实现并获得预训练好的模型检查点。作者用两个预训练好的GPT-2模型做实验：小型(S)和中型(M)。作者使用基于网格搜索的学习率为5e-5的Adam优化器。作者采用类似于Attention is all you need使用的学习率衰减调度。作者将响应生成损失的权重设置为比其他损失高1.5倍。

作者在DSTC7的大规模AVSD基准测试中进行了基于视频的对话任务实验。AVSD基准点包含以Charades视频为基础的对话。每个对话最多由10个对话轮组成，每个轮包括一个用户话语和系统响应（参见表1）。
为了提取视觉特征，作者使用基于3D CNN的ResNext-101对Kinetics进行预训练来获取时空视频特征。作者将批处理大小固定为16个，最大序列长度与相应的GPT2模型一致。作者无重叠的每16帧采样一次视频特征。作者在4个GPU上训练了多达50个epoch。作者报告了客观评分，包括BLEU、METEOR、ROUGE-L和CIDEr。作者将系统生成的响应与6个参考GT响应进行比较。

实验结果

作者将提出的VGD-GPT2模型与以下基线模型进行了比较：
(1) Baseline提出了一种新的在视频视觉和音频时间特征上都进行以问题引导的LSTM的序列到序列的方法。对话历史由分层LSTM编码，最终表示与问题和视频表示拼接起来，作为解码对话响应的输入。
(1) AVSD Winner以更精炼的视觉特征和从一个视频摘要任务中转移学习扩展了之前的工作。
(2) MTN采用了一种基于Transformer的方法，以问题引导的方式关注作为自动编码模块制定的视觉特征。表2显示了作者结果的细节。

作者的VGD-GPT2模型在所有自动化度量中都优于现有的方法。结果表明，通过视频对话对语言模型进行微调，可以帮助生成高质量的响应，并提高模型的性能。通过使用在海量文本数据上预训练好的语言模型来初始化作者的模型，作者获得了更丰富的特征表示，从而捕获了输入之间更复杂的依赖关系。
与基于Transformer的神经网络的基线相比，作者的模型在不同维度的不同层次上以同等重要的重要性对待视觉和文本特征。具体地说，作者在视觉特征和文本特征之间对齐了token级和空间级，轮次级和时间级。相比之下，MTN只考虑了视觉特征的时间变化，主要关注基于文本的注意力。作者的早期融合策略采用多模态输入的多级对齐方法，使得在神经网络的后几层中，所有特征表示之间的关系具有更高的分辨率。
消融研究
此外，表2还表明，对一个具有时空信息和多任务目标的预训练模型进行微调，可以有利于响应生成的主要任务。仅获得空间和时间特征，作者遵循类似于Tgif-qa的方法，通过使用平均池化来沿着时间或空间维度池化视觉特征。以CIDEr为评价指标，在空间和时间两个维度上的学习依赖对学习效果的改善分别为来自仅空间特征的0.01的绝得分和仅时间特征的0.008的绝对得分。
作者提出的辅助目标也有助于通过调整预训练好的模型以适应当前的数据领域，基于视频的对话来提高模型的性能。MLM和MVM用于改进token和空间层次上的局部依赖的学习，MVT用于支持文本和虚拟模态之间的全局依赖的学习。作者观察到，加入MVM目标函数可以使CIDEr得分增加最多，增加了0.043个绝对得分，而和加入MVT(0.023个绝对得分）和MLM(0.004个绝对得分）的目标函数相比，增加了0.043个绝对得分。
作者还发现，当从小到中等的增加GPT-2的大小时，BLEU3、BLEU4和ROUGE-L的性能也有中等程度的改善。作者注意到GPT-2中不断增加的模型参数可能需要更长的微调过程或更大的对话训练数据集来充分优化对话域中的模型。

小结

作者利用预训练好的语言模型来完成一个基于视频的对话任务。作者提出了一种序列到序列的框架和一种多任务微调的方法来使预训练好好的模型适应于视频对话领域。尽管作者使用了GPT-2模型，但作者的框架可以与其他语言模型一起扩展，并类似地用于改进其他多模态对话。作者的早期融合策略有效地统一了对话和视频中不同层次的特征，而不会使网络架构复杂化。

java中vector和list_java中vector和list的区别 Creamy络
java中vector和list的区别发布时间：2020-06-1917:07:11来源：亿速云阅读：106作者：元一vector的概念Vector类是在java中可以实现自动增长的对象数组，vector在C++标准模板库中的部分内容，它是一个多功能的，能够操作多种数据结构和算法的模板类和函数库。vector的使用连续存储结构：vector是可以实现动态增长的对象数组，支持对数组高效率的访问和在数
roslaunch打开更改gazebo world报错：SpawnModel: Failure - model name mrobot already exist. 阿斯顿的风格自动驾驶人工智能机器学习
roslaunchmbot_gazeboview_mbot_gazebo_obstacle2.launch...loggingto/home/suifeng/.ros/log/e98b739c-cd05-11ec-9bfc-b0fc364da57d/roslaunch-suifeng-RESCUER-R720-15IKBN-20614.logCheckinglogdirectoryfordisku
oceanbase与mysql性能对比_金融业分布式数据库:TDSQL、HotDB、OceanBase等原理、POC性能对比及选择是...... 高中物理宋老师
本帖最后由Amygo于2020-3-1501:33编辑1、分布式的实现，是通过中间件实现分布式，还是源码级别引入分布式算法实现的？解答：(1)分布式数据库是至少由计算节点、存储节点、管理平台、备份还原程序四个部分组成，从数据库系统理论知识上说分成：全局自治和场地自治，也粗略认为：全局可理解为计算节点、场地可理解为存储节点(2)这个问题的标题“中间件实现分布式还是源码级别引入分布式算法”这个说法存在
[BJDCTF2020]JustRE 32304353 安全汇编
打开程序发现需要进行点击获取flag拖入IDA进行分析F5挨个查看代码发现疑似falg的数据经过判断，需要点击19999次获得flag把%d带入即可获取flagflag{1999902069a45792d233ac}提交flag解题思路参考文章BUUCTF-[BJDCTF2020]JustRE1-CSDN博客
mysql总结 tianyunlinger 大数据 mysql 数据库
MySQL基础1.数据库基本介绍数据库定义：用于存储数据的仓库，通过SQL语句操作。数据库作用：存储应用程序中的数据，便于管理和查询。数据库分类：关系型数据库（如MySQL、Oracle、DB2）和非关系型数据库（如Redis、HBase）。关系型数据库：通过E-R图描述数据之间的关系，支持复杂查询。2.MySQL在Linux中的安装安装前准备：配置防火墙、创建统一的管理目录（如/export/s
mysql数据库应用与开发姜桂洪课后答案_清华大学出版社-图书详情-《MySQL数据库应用与开发》... 韦盛江课后答案
前言Oracle公司的MySQL是目前最流行的关系数据库管理系统之一。MySQL所使用的SQL语言是用于访问数据库的最常用标准化语言。MySQL数据库以其精巧灵活、运行速度快、经济适用性强、开放源码等优势，作为网站数据库获得许多中小型网站的开发公司的青睐。MySQL性能卓越，搭配PHP和Apache可组成良好的软件开发环境，并且已经大量部署到中小型企业和高校的教学平台。本书从教学实际需求出发，结合
数据分析面临的三大挑战该如何解决銨靜菂等芐紶数据挖掘大数据数据分析
转载自品略图书馆http://www.pinlue.com/article/2020/09/0712/2611202048648.html有效的分析已成为决定性因素，很明显，掌握它的人会蓬勃发展。但是，实现这一目标的过程并非没有障碍。最常见的数据分析挑战是什么？公司如何自信地应对它们？下面就来介绍一下。1、浏览预算限制数据分析领导者需要在当下采取行动，但同时也需要考虑未来。平衡这些需求要求他们在制
CCF CSP 历年真题 C语言版满分代码集合 (至2021.9 持续更新中 JY_0329 CCF c语言开发语言 csp ccf 算法
CCFCSP历年真题C语言版满分代码集合（全部原创）2021-9-1数组推导2021-9-2非零段划分2021-4-1灰度直方图2021-4-2领域均值2020-12-1期末预测之安全指数2020-12-2期末预测之最佳阈值2020-9-1称检测点查询2020-9-2风险人群筛查2020-6-1线性分类器2020-6-2稀疏向量2019-12-1报数2019-12-2回收站选址2019-9-1小明
对数据库的总结 java
一、数据库基础1.数据库是一个用于存储和操作数据的文件系统2.关系型数据库：是基于二维表存储的，每个表格由列和行组成，列代表属性，行代表约束，数据的组织和查询更加方便和高效。3.库表操作结构：MySQL和Oracle，通用工具Navicat4.SQL语句的库表操作：createtable：创建表altertable：修改表droptable：删除表truncatetable：删除表中的所有数据，但
WinSCP使用普通用户登录切换到root用户的方法程序员阿明 github linux
使用Oracle的服务器时，发现服务器禁用了root账号登录，只能使用他指定的普通用户登录ssh。我在使用sftp登录上传文件时，因为普通用户权限不够，不能创建文件，非常不方便，这给管理服务器带来诸多不便。其实在我们使用winscp时，可以切换到root用户，这样就有权限进行操作了。具体方法如下：先登录ssh，执行以下使命令用来查看sftp-server执行文件目录：cat/etc/ssh/ssh
【机器学习】建模流程 CH3_CH2_CHO 什么？！是机器学习！！机器学习人工智能线性回归逻辑回归
1、数据获取1.1来源数据获取是机器学习建模的第一步，常见的数据来源包括数据库、API、网络爬虫等。数据库是企业内部常见的数据存储方式，例如：MySQL、Oracle等关系型数据库，以及MongoDB等非关系型数据库，它们能够存储大量的结构化和非结构化数据API（应用程序编程接口）提供了从外部获取数据的便捷方式，例如：社交媒体平台的API可以获取用户发布的内容和互动信息网络爬虫则适用于从网页中提取
2020 年 9 月大学英语四级考试真题（第 1 套）——纯享题目版 fo安方英语—四级CET4 四级英语学习
个人主页：fo安方的博客✨个人简历：大家好，我是fo安方，目前中南大学MBA在读，也考取过HCIECloudComputing、CCIESecurity、PMP、CISP、RHCE、CCNPRS、PEST3等证书。兴趣爱好：b站天天刷，题目常常看，运动偶尔做，学习需劳心，寻觅些乐趣。欢迎大家：这里是CSDN，是我记录我的日常学习，偶尔生活的地方，喜欢的话请一键三连，有问题请评论区讨论。导读页：这是
VsCode配置JDK\Tomcat\Maven Yang___Xing javascript VsCode Java java vscode tomcat
1、安装VsCode下载地址：VisualStudioCode-CodeEditing.Redefined安装提示安装完成即可2、安装JDK下载地址：JavaDownloads|Oracle选择版本：按照需求自行选择配置JAVA_HOMEMac的修改mac的打开终端，输入open~/.zshrc新增exportPATH="/yourpath/jdk-1.8.jdk/Contents/Home/bi
Ubuntu20.04安装并配置Pycharm2020.2.5 搬砖的打工人!!! ubuntu pycharm python
一.下载pycharm社区版1.下载地址：PyCharm:thePythonIDEfordatascienceandwebdevelopmentThePythonIDEfordatascienceandwebdevelopmentwithintelligentcodecompletion,on-the-flyerrorchecking,quick-fixes,andmuchmore.https:/
IsaacLab开发随记fixedTendon & spatialTendon Calm_dw 人工智能机器人
记一下最近用到的fixedtendon和spatialtendon，感觉还是理解的不太透彻，这部分主要是isaacsim的内容，文档链接：Articulations—OmniverseExtensionsFixedTendonSpatialTendon
IsaacLab最新2025教程(3)-搭建训练场景 Calm_dw 机器人人工智能 AI编程 python visual studio code 深度学习
前言本文将详细介绍如何使用IsaacLab进行场景搭建与物理仿真，为后续的训练打下基础。文章以IsaacLab官方tutorial为基础，从环境搭建开始，逐步实现一个包含多种物体的仿真场景，并分享开发过程中的经验。官方连接：Tutorials—IsaacLabDocumentation开发环境IsaacLab/IsaacSim4.5.0(Ubuntu22.04)代码解析这篇文章包含了前三个tuto
hive 使用oracle数据库 sardtass hadoop hive 开源项目
hive使用oracle作为数据源，导入数据使用sqoop或kettle或自己写代码（淘宝的开源项目中有一个xdata就是淘宝自己写的）。感觉sqoop比kettle快多了，淘宝的xdata没用过。hive默认使用derby作为存储表信息的数据库，默认在哪启动就在哪建一个metadata_db文件放数据，可以在conf下的hive-site.xml中配置为一个固定的位置，这样不论在哪启动都可以了。
Oracle数据库从入门到精通系列之六：临时文件快乐骑行^_^ 数据库日常分享专栏 Oracle数据库临时文件
Oracle数据库从入门到精通系列之六：临时文件Oracle中的临时数据文件是一种特殊类型的数据文件。当内存不足时，Oracle会使用它来存储一些临时数据，比如说一些比较大的排序或散列操作的中间结果、临时表中的数据以及结果集数据等。自12c起，对临时表的操作所产生的undo也会放到临时表空间中永久性的表和索引永远不会存储在临时表空间中，但是临时表中的数据及其索引会存放在这里。也就是应用程序储存数据
数据仓库和非结构化数据。 weixin_30631587 数据库
数据仓库包含标准化数据。还包含外部数据/非结构化数据如果外部数据量小可以保持数据库内部或者专用服务器。如果量大只能记住地址，在etl加载当然也有需求是实时数据比如股票汇率拿只能etl过程处理非结构化数据包含图片，视频音频如果是传统数据库db2oracle存在里面是不合适的。存储影响性能如果是hadoop无所谓影响不大，但是从使用者的角度非结构化数据只能转换关系使用建一张元数据表存储非结构化存储位置
2020年第十一届蓝桥杯python组省赛 Ruoki~ 蓝桥杯python真题蓝桥杯职场和发展
前言：python最简单的一套题了，适合小白入门练手目录填空题门牌制作寻找2020跑步锻炼蛇形填数排序编程大题成绩统计单词分析数字三角形平面切分装饰珠填空题门牌制作题目：小蓝要为一条街的住户制作门牌号。这条街一共有2020位住户，门牌号从1到2020编号。小蓝制作门牌的方法是先制作0到9这几个数字字符，最后根据需要将字符粘贴到门牌上，例如门牌1017需要依次粘贴字符1、0、1、7，即需要1个字符0
mysql vs oracle HBryce24 数据库 mysql oracle 数据库
以下是Oracle数据库与MySQL数据库的详细比较，从架构设计、功能特性、性能、适用场景等多个维度进行综合分析：1.基础特性与定位Oracle：定位：面向大型企业级应用，强调高并发、高可用性和复杂事务处理能力。授权模式：闭源商业软件，需购买许可证，成本较高。架构：多进程架构（每个用户连接对应独立进程），支持分布式集群（如RAC）。MySQL：定位：轻量级开源数据库，适合中小型应用及Web开发。授
麒麟V10 arm cpu aarch64 下编译 RocketMQ-Client-CPP 2.2.0 eamon100 Linux操作系统 java-rocketmq rocketmq c++
国产自主可控服务器需要访问RocketMQ消息队列，最新的C++SDK是2020年发布的rocketmq-client-cpp-2.2.0这个版本支持TLS模式。用默认的版本安装遇到一些问题，记录一下。下载Releases·apache/rocketmq-client-cpp·GitHubhttps://github.com/apache/rocketmq-client-cpp/releases操
C++11 SFINAE概念介绍:类成员的编译时内省(译) 丸子叮咚响 #C++11/14/17/20 SFINAE
点击查看原文AnintroductiontoC++'sSFINAEconcept:compile-timeintrospectionofaclassmemberC++的SFINAE概念介绍：类成员的编译时内省Trivia:AsaC++enthusiast,IusuallyfollowtheannualC++conferencecppconforatleasttrytokeepmyselfup-to
oracle基础知识之表的集合运算数字天下 oracle 数据库
一个查询就是一个集合：查询的结果集一条记录就是一个元素。集合运算是用来把两个或多个查询的结果集做并、交、查的集合运算，包含集合运算的查询称为复合查询。*Select基本语法如下：SELECTcolumn_1,column_2,…FROMtable_nameWHEREsearch_conditionORDERBYcolumn_1,column_2;2.常用集合运算方式的应用（1）联合运算：联合运算实
ocp考试有判断题吗?多少分及格? m0_65303136 开闭原则
ocp考试有判断题吗?多少分及格?OCP考试没有判断题。OCP考试指的是OracleOCP中级认证考试，是数据库领域非常有含金量的一种认证，如果拿到OCP证书对于个人入职或者涨薪都有帮助。OCP考试，可以说是数据库领域最值得考的一个认证，根据最新的OCP19c认证考试要求，以下是考试题型和通过成绩的详细信息：考试题型OCP认证考试均为全英文选择题，包括单选题和多选题，没有操作题或其他题型(如判断题
烧掉 700 亿学费后，中国企业终于懂了：换软件才是真正的省钱程序员安全数据库
2018年深圳宝安机场，76岁的中兴创始人侯为贵拖着行李箱赶赴美国的照片全网刷屏。芯片断供7天，这家通信巨头市值蒸发700亿；2022年某新能源车企因EDA软件禁用，耗资数十亿的研发项目直接停摆。中国企业终于意识到：躺在全球化温床上的时代，结束了。从芯片到数据库，从工业软件到办公系统，中国企业正把“进口零件”一个个抠下来——这不是赌气，而是被逼出来的生存智慧。一、当“卡脖子”变成商机2020年哈工
Pycharm python解释器 unsupported python 3.1 解决大表哥在曾母暗沙 Python PyCharm python pycharm ide 解释器模式
Pycharm环境unsupportedpython3.1解决1.问题重现2.原因分析3.解决方法1.问题重现之前使用Pycharm2024.1.1的时候，环境配置的Python3.11.9，现在改成使用Pycharm2020.2.2，结果Python解释器显示“unsupportedpython3.1”，如下图：2.原因分析因为Pycharm2020.2.2支持的Python最高版本就是Pyth
linux 安装jdk1.8 李逍遙️ linux 运维服务器
通过终端，使用wget命令下载JDK：wgethttps://download.java.net/openjdk/jdk8u41/ri/openjdk-8u41-b04-linux-x64-14_jan_2020.tar.gz解压下载的文件。你可以使用tar命令解压：tar-xzfopenjdk-8u41-b04-linux-x64-14_jan_2020.tar.gz将解压后的JDK移动到/op
Flink 通过 Chunjun Oracle LogMiner 实时读取 Oracle 变更日志并写入 Doris 的方案 roman_日积跬步-终至千里 #flink 实战 flink oracle 大数据
文章目录一、技术背景二、关键技术1、OracleLogMiner2、Chunjun的LogMiner关键流程3、修复ChunjunOracleLogMiner问题一、技术背景在大数据实时同步场景中，需要将Oracle数据库的变更数据（CDC）采集并写入ApacheDoris，以支持数据分析、BI报表、实时数据仓库等应用。本方案基于Flink+Chunjun，通过OracleLogMiner解析Re
oracle当前耗时sql语句,查看Oracle最耗时的SQL weixin_39846553 oracle当前耗时sql语句
有很多种方法可以用来找出哪些sql语句需要优化，但是很久以来，最简单的方法都是分析保存在V$sql视图中的缓存的sql信息。通过V$sql视图，可以确定具有高消耗时间、CUP和IO读取的sql语句。1.查看总消耗时间最多的前10条sql语句select*from(selectv.sql_id,v.child_number,v.sql_text,last_load_time,v.PARSING_US
js动画html标签（持续更新中） 843977358 html js 动画 media opacity
1.jQuery 效果 - animate() 方法改变 "div" 元素的高度： $(".btn1").click(function(){ $("#box").animate({height:"300px
springMVC学习笔记 caoyong springMVC
1、搭建开发环境 a>、添加jar文件，在ioc所需jar包的基础上添加spring-web.jar,spring-webmvc.jar b>、在web.xml中配置前端控制器 <servlet> &nbs
POI中设置Excel单元格格式 107x poi style 列宽合并单元格自动换行
引用：http://apps.hi.baidu.com/share/detail/17249059 POI中可能会用到一些需要设置EXCEL单元格格式的操作小结：先获取工作薄对象: HSSFWorkbook wb = new HSSFWorkbook(); HSSFSheet sheet = wb.createSheet(); HSSFCellStyle setBorder = wb.
jquery 获取A href 触发js方法的this参数无效的情况一炮送你回车库 jquery
html如下： <td class=\"bord-r-n bord-l-n c-333\"> <a class=\"table-icon edit\" onclick=\"editTrValues(this);\">修改</a> </td>" j
md5 3213213333332132 MD5
import java.security.MessageDigest; import java.security.NoSuchAlgorithmException; public class MDFive { public static void main(String[] args) { String md5Str = "cq
完全卸载干净Oracle11g sophia天雪 orale数据库卸载干净清理注册表
完全卸载干净Oracle11g A、存在OUI卸载工具的情况下：第一步：停用所有Oracle相关的已启动的服务；第二步：找到OUI卸载工具：在“开始”菜单中找到“oracle_OraDb11g_home”文件夹中 &
apache 的access.log 日志文件太大如何解决 darkranger apache
CustomLog logs/access.log common 此写法导致日志数据一致自增变大。直接注释上面的语法 #CustomLog logs/access.log common 增加： CustomLog "|bin/rotatelogs.exe -l logs/access-%Y-%m-d.log
Hadoop单机模式环境搭建关键步骤 aijuans 分布式
Hadoop环境需要sshd服务一直开启，故，在服务器上需要按照ssh服务，以Ubuntu Linux为例，按照ssh服务如下： sudo apt-get install ssh sudo apt-get install rsync 编辑HADOOP_HOME/conf/hadoop-env.sh文件，将JAVA_HOME设置为Java
PL/SQL DEVELOPER 使用的一些技巧 atongyeye java sql
1 记住密码这是个有争议的功能，因为记住密码会给带来数据安全的问题。但假如是开发用的库，密码甚至可以和用户名相同，每次输入密码实在没什么意义，可以考虑让PLSQL Developer记住密码。位置：Tools菜单－－Preferences－－Oracle－－Logon HIstory－－Store with password 2 特殊Copy 在SQL Window
PHP：在对象上动态添加一个新的方法 bardo 方法动态添加闭包
有关在一个对象上动态添加方法，如果你来自Ruby语言或您熟悉这门语言，你已经知道它是什么...... Ruby提供给你一种方式来获得一个instancied对象，并给这个对象添加一个额外的方法。好！不说Ruby了，让我们来谈谈PHP PHP未提供一个“标准的方式”做这样的事情，这也是没有核心的一部分... 但无论如何，它并没有说我们不能做这样
ThreadLocal与线程安全 bijian1013 java java多线程 threadLocal
首先来看一下线程安全问题产生的两个前提条件： 1.数据共享，多个线程访问同样的数据。 2.共享数据是可变的，多个线程对访问的共享数据作出了修改。实例：定义一个共享数据： public static int a = 0;
Tomcat 架包冲突解决征客丶 tomcat Web
环境： Tomcat 7.0.6 win7 x64 错误表象：【我的冲突的架包是：catalina.jar 与 tomcat-catalina-7.0.61.jar 冲突，不知道其他架包冲突时是不是也报这个错误】严重: End event threw exception java.lang.NoSuchMethodException: org.apache.catalina.dep
【Scala三】分析Spark源代码总结的Scala语法一 bit1129 scala
Scala语法 1. classOf运算符 Scala中的classOf[T]是一个class对象，等价于Java的T.class,比如classOf[TextInputFormat]等价于TextInputFormat.class 2. 方法默认值 defaultMinPartitions就是一个默认值，类似C++的方法默认值
java 线程池管理机制 BlueSkator java线程池管理机制
编辑 Add Tools jdk线程池一、引言第一：降低资源消耗。通过重复利用已创建的线程降低线程创建和销毁造成的消耗。第二：提高响应速度。当任务到达时，任务可以不需要等到线程创建就能立即执行。第三：提高线程的可管理性。线程是稀缺资源，如果无限制的创建，不仅会消耗系统资源，还会降低系统的稳定性，使用线程池可以进行统一的分配，调优和监控。
关于hql中使用本地sql函数的问题（问-答） BreakingBad HQL 存储函数
转自于：http://www.iteye.com/problems/23775 问：我在开发过程中，使用hql进行查询（mysql5）使用到了mysql自带的函数find_in_set()这个函数作为匹配字符串的来讲效率非常好，但是我直接把它写在hql语句里面（from ForumMemberInfo fm,ForumArea fa where find_in_set(fm.userId,f
读《研磨设计模式》-代码笔记-迭代器模式-Iterator bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.Arrays; import java.util.List; /** * Iterator模式提供一种方法顺序访问一个聚合对象中各个元素，而又不暴露该对象内部表示 * * 个人觉得，为了不暴露该
常用SQL chenjunt3 oracle sql C++c C#
--NC建库 CREATE TABLESPACE NNC_DATA01 DATAFILE 'E:\oracle\product\10.2.0\oradata\orcl\nnc_data01.dbf' SIZE 500M AUTOEXTEND ON NEXT 50M EXTENT MANAGEMENT LOCAL UNIFORM SIZE 256K ; CREATE TABLESPA
数学是科学技术的语言 comsci 工作活动领域模型
从小学到大学都在学习数学，从小学开始了解数字的概念和背诵九九表到大学学习复变函数和离散数学，看起来好像掌握了这些数学知识，但是在工作中却很少真正用到这些知识，为什么？最近在研究一种开源软件-CARROT2的源代码的时候，又一次感觉到数学在计算机技术中的不可动摇的基础作用，CARROT2是一种用于自动语言分类（聚类）的工具性软件，用JAVA语言编写，它
Linux系统手动安装rzsz 软件包 daizj linux sz rz
1、下载软件 rzsz-3.34.tar.gz。登录linux，用命令 wget http://freeware.sgi.com/source/rzsz/rzsz-3.48.tar.gz下载。 2、解压 tar zxvf rzsz-3.34.tar.gz 3、安装 cd rzsz-3.34 ; make posix 。注意：这个软件安装与常规的GNU软件不
读源码之:ArrayBlockingQueue dieslrae java
ArrayBlockingQueue是concurrent包提供的一个线程安全的队列,由一个数组来保存队列元素.通过 takeIndex和 putIndex来分别记录出队列和入队列的下标,以保证在出队列时不进行元素移动. //在出队列或者入队列的时候对takeIndex或者putIndex进行累加,如果已经到了数组末尾就又从0开始,保证数
C语言学习九枚举的定义和应用 dcj3sjt126com c
枚举的定义 # include <stdio.h> enum WeekDay { MonDay, TuesDay, WednesDay, ThursDay, FriDay, SaturDay, SunDay }; int main(void) { //int day; //day定义成int类型不合适 enum WeekDay day = Wedne
Vagrant 三种网络配置详解 dcj3sjt126com vagrant
Forwarded port Private network Public network Vagrant 中一共有三种网络配置，下面我们将会详解三种网络配置各自优缺点。端口映射(Forwarded port)，顾名思义是指把宿主计算机的端口映射到虚拟机的某一个端口上，访问宿主计算机端口时，请求实际是被转发到虚拟机上指定端口的。Vagrantfile中设定语法为： c
16.性能优化-完结 frank1234 性能优化
性能调优是一个宏大的工程，需要从宏观架构(比如拆分，冗余，读写分离，集群，缓存等)，软件设计（比如多线程并行化，选择合适的数据结构），数据库设计层面（合理的表设计，汇总表，索引，分区，拆分，冗余等）以及微观（软件的配置，SQL语句的编写，操作系统配置等）根据软件的应用场景做综合的考虑和权衡，并经验实际测试验证才能达到最优。性能水很深，笔者经验尚浅，赶脚也就了解了点皮毛而已，我觉得
Word Search hcx2013 search
Given a 2D board and a word, find if the word exists in the grid. The word can be constructed from letters of sequentially adjacent cell, where "adjacent" cells are those horizontally or ve
Spring4新特性——Web开发的增强 jinnianshilongnian spring spring mvc spring4
Spring4新特性——泛型限定式依赖注入 Spring4新特性——核心容器的其他改进 Spring4新特性——Web开发的增强 Spring4新特性——集成Bean Validation 1.1(JSR-349)到SpringMVC Spring4新特性——Groovy Bean定义DSL Spring4新特性——更好的Java泛型操作API Spring4新
CentOS安装配置tengine并设置开机启动 liuxingguome centos
yum install gcc-c++ yum install pcre pcre-devel yum install zlib zlib-devel yum install openssl openssl-devel Ubuntu上可以这样安装 sudo aptitude install libdmalloc-dev libcurl4-opens
第14章工具函数（上） onestopweb 函数
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
Xelsius 2008 and SAP BW at a glance blueoxygen BO Xelsius
Xelsius提供了丰富多样的数据连接方式，其中为SAP BW专属提供的是BICS。那么Xelsius的各种连接的优缺点比较以及Xelsius是如何直接连接到BEx Query的呢？以下Wiki文章应该提供了全面的概览。 http://wiki.sdn.sap.com/wiki/display/BOBJ/Xcelsius+2008+and+SAP+NetWeaver+BW+Co
oracle表空间相关 tongsh6 oracle
在oracle数据库中，一个用户对应一个表空间，当表空间不足时，可以采用增加表空间的数据文件容量，也可以增加数据文件，方法有如下几种： 1.给表空间增加数据文件 ALTER TABLESPACE "表空间的名字" ADD DATAFILE '表空间的数据文件路径' SIZE 50M; &nb
.Net framework4.0安装失败 yangjuanjava .net windows
上午的.net framework 4.0，各种失败，查了好多答案，各种不靠谱，最后终于找到答案了和Windows Update有关系，给目录名重命名一下再次安装，即安装成功了！下载地址：http://www.microsoft.com/en-us/download/details.aspx?id=17113 方法： 1.运行cmd，输入net stop WuAuServ 2.点击开

ACL 2020 Video-Grounded Dialogues with Pretrained Generation Language Models

动机

方法

简介

模型

实验

实验细节

实验结果

小结

你可能感兴趣的:(ACL,2020)