暖仔会飞

论文阅读之：基于序列列到到序列的中文AMR解析；Chinese AMR Parsing based on Sequence-to-Sequence Modeling

文章目录

Abstract
Introduction
Related Work
- AMR & Chinese AMR
- AMR parsing & Chinese AMR Parsing
Chinese AMR Parsing
- Seq2seq
- Data pre-processing
- Data post-processing
Combining Chinese pretrained models for Chinese AMR parsing
- Chinese Pretrained models
Experiments
- data & subword processing
- Experiments settings
- Analysis
- - Results
  - The effect of different subword strategies

Abstract

本文使用中文 AMR 语料库 CAMR1.0 采用 seq2seq（Transformer）的方法进行中文AMR语义解析
本文中文AMR语义解析方法最优性能达到了70.29的Smatch F1值。本文是第一次在该数据集上报告实验结果。

Introduction

Bevilacqua et al. (2021)使用Seq2Seq模型进行AMR语义解析，达到了目前在英语AMR语义解析中的最好结果84.5的F1值。
本文探索了 seq2seq 模型在中文 AMR 语义解析上的应用，同时为了缓解人工标注数据受限问题，还将探索并比较多种预训练在该问题上的应用
在 CAMR1.0 的实验结果表示：通过 融合中文预训练模型 获取文本的上下文表示，基于Seq2Seq模型的中文AMR解析可以达到 70.27 的F1值
本文贡献：
- 探索 seq2seq 模型在中文 AMR 语义解析中的应用，同时尝试了多种 子词化方法 对中文 AMR 语义解析的影响
- 比较了多种预训练模型在中文 AMR 解析任务的差异
- 首次在公开的中文AMR数据集CAMR1.0(LDC2019T07)上实验并报告结果

Related Work

AMR & Chinese AMR

常用的语义表示架构有：基本依赖结构(Elementary Dependency Structures,EDS)、普遍概念认知注释(Universal Conceptual Cognitive Annotation,UCCA)、抽象语义表示(Abstract Meaning Representation，AMR)等
AMR中图节点和句子的成分之间没有显式的对应关系
AMR 特点：
- 概念节点与句子成分无需一一对应，因此节省了在开始语义注释之前首先构建形态 语法结构 所需的时间（不需要构建语法结构）
- AMR的标注方法并不直接将句子成分作为节点概念，而是关注句子中对语义起作用的单词
- AMR避开了词序和形态句法标记等表面句法结构元素，而这些元素是不同语系及语言表达差异的主要来源，因此AMR使语义注释框架在不同语言间具有更强的可移植性
AMR采用从PropBank中提取的谓词框架词库，CAMR1.0在此基础上加入了Chinese Prop- bank框架(Song et al., 2019a)。Xue et al. (2014)是最早进行中文AMR相关研究的学者
但是将英语AMR标注体系迁移到中文语境并非易事，汉语具有特有语言现象，如动补结构、量词、重叠词、离合词、省略等，因此对中文的AMR标注是极其耗费人力和资源的一件事
在AMR标注体系中对仅仅提供了少量抽象概念(如and, or, contrast.01)和语义关系(如:cause, :condition, :concession, :purpose)用于对复合句的标注，并通过这些概念和语义关系的组合来表达不同复合句之间的语句关系。但是这对于复杂的中文而言，这些是远远不够的，因此Li et al. (2019)设置了10个概念来表示句子之间的关系，使中文AMR标注体系能够更好地适用于复杂地中文语言环境

AMR parsing & Chinese AMR Parsing

AMR语义解析的方法大致可以分为以下三种：基于转移的方法(transition-based parsing)、基于图的方法(graph-based parsing)以及基于序列到序列的方法(Seq2Seq-based parsing)。
基于序列到序列的方法，通过去除 AMR 图中的结构信息，将AMR图线性化为AMR序列，使用序列到序列的模型进行AMR语义解析
Barzdins and Gosko (2016)首次利用 seq2seq 模型进行AMR语义解析任务。他们在预处理过程中，通过复制AMR中共用的概念节点、删除wiki链接和变量，获得的了简化的AMR序列 ，对比原始AMR图和通过后处理恢复被删除成分的AMR图，发现这种方法获得的简化AMR序列与原始AMR的差别并不大，极大简化了输出序列的长度
Ge et al. (2019) 首先使用Transformer 进行AMR语义解析，并在此基础上通过在源端序列中 以一定规则加入句法和语义信息，帮助模型更好的学习句子语义信息
Xu et al. (2020)尝试利用 大规模外部语料 获得预训练模型，进一步提升AMR性能；
Bevilacqua et al. (2021)首先使用 encoder-decoder 的预训练模型进行AMR语义解析，将使用不同遍历方法:广度优先遍历(BFS)和深度优先遍历(DFS)获得的序列用于AMR语义解析中，得出结论使用 DFS获得序列更适用于AMR语义解析 ，并得到了目前在英语AMR语义解析中最优性能84.5的F1值

Chinese AMR Parsing

首先通过数据预处理(data preprocessing) 将AMR图序列化为易于模型处理的形式。当得到模型输出后，再通过 后处理(post-processing) 来修正输出中的结构化错误、删除重复节点，将模型输出还原为符合标准的AMR图。

Seq2seq

介绍了 transformer 的 encode 和 decoder 以及 transformer的结构

Data pre-processing

借鉴Zhu et al. (2019)和Xu et al. (2020)在英文AMR解析中的预处理方式对中文AMR图进行预处理：
- 线性化： 删除AMR图中大量的不影响AMR的语义的而只是用于指示共同引用节点的变量，在不改变句子语义的情况下获得线性化的AMR图。
- 删除一些多余的标注和对齐信息： 此外中文AMR图还对源端句子中出现的单词进行了关系对齐，如对于中文句子“每一个时代，都有其基本的特征。”其中“的”并不属于语义概念的范畴，但在中文AMR图中同样对这样的词进行了对齐，即对“基本”与“特征”的关系进行标注时也会将“的”与关系标签进行了对齐，但是它并不能提供更多的语义概念，因此我们在数据处理时删除了这些关系对齐。

Data post-processing

模型生成的AMR序列是一个不包含共用节点、wiki变量、但包含冗余和重复信息的线性化AMR序列，需要通过一系列的后处理来恢复AMR图
英文的恢复手段有：
- 恢复共用节点
- 恢复 wiki变量
- 修复模型生成的不完整的概念
中文 AMR 不包含 wiki 链接，因此只需要执行：
- 恢复共用节点
- 修复模型生成的不完整的概念
在 van Noord and Bos (2017) 提供的 预处理 和 后处理脚本 的基础上针对中文的特点进行修改，如添加删除中文AMR中的关系对齐等功能。

Combining Chinese pretrained models for Chinese AMR parsing

Xu et al. (2020)在英文数据集中对几种预训练方法进行了尝试，结果发现使用预训练模型获得文本对应的词向量可以获得最好AMR语义解析性能，因此本文也采用相同的方法
如图 3所示，本文获取预训练模型各层的输出向量，并将他们加权求和后得到的上下文相关表示作为后续编码器的输入。

Chinese Pretrained models

大多数预训练模型都是以BERT为基础从模型结构(如位置编码方式)、训练策略以及掩码方式(Mask)这几个角度进行优化衍生而来的
下面我们将对BERT、NEZHA、XLNet 进行简要介绍和横向对比
表 1中提炼了各个预训练模型改进之处。最后我们还介绍一个利用额外的中英翻译对模型进行预训练的方法。

Experiments

data & subword processing

本文使用CAMR1.0 (LDC2019T07)进行实验
我们对 源端和目标端文本 进行子词化处理。我们使用BERT提供的子词化工具 对数据集进行子词化处理。同时我们在后续的实验中也与目前比较常用的BPE工具进行了比较。同时我们在子词化时，不对目标端中的英文概念和关系标签进行切分。

Experiments settings

本实验所使用的代码是以OpenNMT-py为基础的Transformer模型。
Transformer编码器和解码器的层数皆设置为6层，将多头注意力机制的头数设置为8。
词嵌入向量和隐藏层的维度都设置为512，前馈神经网络层的维度为2048。实验中还使用了Adam优化器对参数更新进行优化，其中β1 = 0.9、β2 = 0.98、批次大小为8192个 token
实验中的预热(Warm up)步数、学习率、丢弃(Dropout)率、标签平滑分别设为16000、2.0、0.3、0.1。
解码过程中，采用束搜索(Beam seach)，束的大小设置为5。
模型的选择时，选用在开发集上性能最好的模型进行测试。AMR解析的评测使用Smatch(Cai and Knight, 2013)及其他细粒度的评判指标
预训练模型的实验中所采用的模型参数为：nezha-cn-base (NEZHA)、bert-base-chinese (BERT) hfl/chinese-bert-wwm (BERT-wwm)5和hfl/chinese-xlnet-base (XLNet)。
使用Scalar Mix对预训练模型输出进行加权求和时所用的输出层数 K 均设为12层。

Analysis

Results

表 3给出并比较了使不使用预训练模型 以及使用不同预训练模型 在中文AMR语义解析上的性能。
这充分说明，通过预训练模型获取的上下文表征可以帮助模型提升中文AMR语义解析的性能。
在模型中融合BERT-wwm 的上下文表征在中文AMR语义解析任务上的性能最好，最优性能可以达到70.29的F1值。且在Unlabeled、No WSD、Concepts、Named Ent.等细粒度指标的性能都超越了使用其他预训练模型获得的性能。
图 4中给出了在使用不同预训练模型时Scalar mix在不同层输出上的归一化权重 $s$ 的可视化结果：所有四个预训练模型的第一层输出表示的权重都是最大的，均达到了20%以上 其次为前4层和中部7-10层，而最后两层的输出的权重则较小。不同层的表示的重要程度在整体上体现出了先下降后上升再下降的趋势

The effect of different subword strategies

无论是BPE还是BERT-Tokenizer，都是通过将句子中的低频词切分为更细粒度的子词，从而使模型学习到拥有相同前缀或后缀的词之间的联系
发现对于中文来说该子词化方法并不会像英文一样根据词出现的频率进行切分，而是以字为单位切分中文句子。在本节中我们给出使用不同的子词化方法的中文AMR解析性能，探究不同的子词化方法对解析效果的影响
表 4给出了使用不同的子词化方法的词表大小、平均句长和平均未登录词(ovv)占比
使用BERT-Tokenizer对数据进行处理之后，模型的词表大小相较于不进行子词化方法或是使用BPE进行分词将大大降低，仅为不进行子词化处理的词表的1/4
且未登录词的数量在源端和目标端分别由7.841%、2.710%下降到0.404%、0.151%。由此可见使用以字为单位的子词化方法可以更好的减少中文AMR语料中的未登录词的数量，缩小源端和目标端词表规模
表 5为不同分词在中文AMR语义解析上的实验结果。相比其他两种方法，使用BERT-Tokenizer进行子词化可以让模型取得更高的P和F1值，并且在所有细粒度指标上都取得最好的结果，其中在Concepts、Named Ent.和Negations上都提高了1%以上。尤其是在Negations指标，即对否定的识别语义的上分别比以词为单位和BPE子词化的结果高出了4.22%和4.67%。
有趣的是较之于不进行子词化处理，BPE方法在否定语义的识别上表现得更差。如我们预想的那样，使用切分粒度更细的数据进行中文AMR语义解析的性能更好。
推断可能的原因为：中文词汇按照构词语素，可以分为单纯词和合成词。单纯词中只包含一个语素，如“仿佛”和“巧克力”，组成他们的字并不单独表意。包含了多个语素的词语称为合成词，如“统治”和“论文”，他们由多个语素按照一定的规律结合进行表意。合成词在中文词汇中占有很大的比例，也就是说大部分词可以拆分成多个语素组合的形式
因此将字作为模型输入的基本单位，可以让模型更好得通过对语素的学习来把握词语整体的意思。
同时这也能解释为什么以字为单位进行子词化能够让模型更好地识别否定语义。中文中否定语义主要通过“不”、“非”、“没”等否定语素进行表达。但是在进行分词时，这些否定语素往往会与其他语素进行结合构成合成词，如“不利”、“非法”和“没有”等。这些词又往往在文本中是作为常见词出现的，在进行BPE时他们将倾向于作为一个整体出现。因此模型难以学习 “不”、“非”、“没”这些否定语素的含义，在面对与否定语素进行构词而表示否定语义的罕见词和未登录词时模型也就显得心有余而力不足了。

JVM堆（Heap）详解与工作流程分析 empti_ Java基础 jvm java
JVM堆（Heap）详解与工作流程分析1.JVM堆核心架构1.1堆内存整体布局Java堆新生代YoungGeneration老年代OldGenerationEden区Survivor区S0Survivor区S1元空间Metaspace字符串常量池1.2各区域核心参数区域默认占比JVM参数存储内容Eden区80%新生代-XX:NewRatio新创建的对象Survivor区10%新生代×2-XX:Su
数字人驱动技术：让虚拟角色“活起来” CarlowZJ 数字人
目录前言一、数字人驱动技术的概念（一）驱动技术的定义（二）驱动技术的关键组成部分二、数字人驱动技术的代码示例（一）安装依赖（二）语音输入处理（三）动作捕捉数据处理（四）Unity端的驱动实现（五）完整的数字人驱动系统三、应用场景（一）虚拟客服（二）虚拟直播（三）教育与培训（四）游戏开发四、注意事项（一）输入信号的准确性（二）动作映射的自然性（三）实时性（四）反馈机制（五）性能优化（六）安全性和隐私
数字人多模态交互中的语义理解技术：让虚拟角色真正“理解”用户 CarlowZJ 数字人 python
目录前言一、语义理解技术的概念（一）语义理解的定义（二）语义理解的关键技术二、语义理解的代码示例（一）安装依赖（二）语义理解模型（三）结合情感分析（四）完整的多模态语义理解系统三、应用场景（一）虚拟客服（二）教育辅导（三）虚拟直播（四）智能助手四、注意事项（一）上下文管理（二）情感分析（三）多模态融合（四）模型选择（五）性能优化（六）安全性和隐私保护五、总结前言在数字人多模态交互中，语义理解是实现
性能分析定界指南 harmonyos
性能分析定界指南前置条件HarmonyOSNext系统前台运行Flutter页面分析工具DevEcoStudioProfilerSmartPerfFlutter线程介绍Flutter使用多个线程来完成其必要的工作，图层中仅展示了其中两个线程。你写的所有Dart代码都在UI线程上运行。尽管你没有直接访问其他线程的权限，但是你对UI线程的操作会对其他线程产生性能影响。平台线程平台的主线，插件代码在这里
UnityAPI——Math数学函数类、Random生成随机数类、OnMouseEventFunction 鼠标回调事件 WX呦 c#unity 开发语言 unity引擎
一、Mathf数学函数类1、三角函数介绍Unity的所有三角函数都以弧度为单位，提供了如下函数：Sin、Cos、Tan：计算正弦、余弦和正切值。Asin、Acos、Atan：计算反正弦、反余弦和反正切值。Atan2：计算两点之间的角度，考虑了X轴与2D向量之间的角度。应用假设您需要计算一个物体在圆周路径上的移动，您可以使用Mathf.Sin和Mathf.Cos来计算其在X和Y轴上的位置。float
QFramework v1.0 Guide: 工具篇2——UIKit,AudioKit,FluentAPI,SingletonKit,FSMKit,PoolKit,TableKit WX呦 unity 游戏引擎 c#QFramework
目录一、UIKit界面管理&快速开发解决方案1、用法（1）界面创建与层级管理（2）代码生成与组件绑定（3）打开与关闭界面（4）自定义界面加载方式2、应用场景3、示例代码二、AudioKit音频管理解决方案1、属性2、用法（1）播放音频（2）音频设置（3）音量调整（4）自定义音频加载3、应用场景4、案例（1）播放背景音乐（2）播放音效（3）播放人声三、FluentAPI链式API介绍1、属性2、用法
python-can + can-isotp + udsoncan 实现基础的UDS诊断功能；附代码 dujunqiu python python 开发语言
1：功能说明在网上搜了一下python-can+udsoncan的使用说明，发现都是很笼统的介绍，没有详细的使用说明；下面根据我自己的使用经验，来给大家介绍一下;2：源代码介绍这里主要修改的配置是“bus1=can.interface.Bus(interface=‘canalystii’,channel=0,bitrate=500000)”这一行代码，需要根据实际使用的CAN盒进行配置；详细的代码
DAY 41 简单CNN 冬天给予的预感 cnn 人工智能神经网络
知识回顾数据增强卷积神经网络定义的写法batch归一化：调整一个批次的分布，常用与图像数据特征图：只有卷积操作输出的才叫特征图调度器：直接修改基础学习率卷积操作常见流程如下：1.输入→卷积层→Batch归一化层（可选）→池化层→激活函数→下一层Flatten->Dense(withDropout，可选)->Dense(Output)importtorchimporttorch.nnasnnimpo
浅谈新能源与计算机萝萝仔笔记能源计算机新能源
最刚开始听到老师说让谈新能源跟计算机的关系的时候，我是感觉怎么这两者完全扯不上什么联系，根本就是两个不同领域啊。后来想着计算机本身也是需要能源支撑着的，这不就是联系所在，而且就我现在的专业——计算机系统结构而言，现在越来越多的研究想要做到计算机的能耗与效率的负载均衡，从体系结构层次、软件层次、算法层次，都是想要尽量节约计算机的能源。再后来想着我本科的专业——物联网工程，其实就是提倡物物相连的一个概
玩转传奇搭建，怎样用手里的云服务器搭建一款战神传奇手游技术教程，实现完全联网，实现多人同玩，10分钟学会架设游戏，云服务器或轻量云皆可搭建，快叫上朋友一起挂机砍怪吧！ qq_502428990 服务器游戏运维
这段时间不知怎么的，忽然有些怀念过往，想起十几年前和兄弟们网吧通宵砍传奇的场景，于时自己找了一些传奇代码，用云服务器搭建了一款传奇，怀念一下青春岁月！配置要求：最低2核4G,普通云服务器或轻量云皆可。系统要求：windows2008或者windows2012版64位。首先把服务器硬盘分出一个D盘来，云服务器默认没有D盘，需要从C盘分出一部分做D盘，当然你也可以购买，然后挂载上去。开始架设：第一步：
Python打卡训练营-Day41-简单CNN traMpo1ine cnn python 深度学习
@浙大疏锦行知识回顾数据增强卷积神经网络定义的写法batch归一化：调整一个批次的分布，常用与图像数据特征图：只有卷积操作输出的才叫特征图调度器：直接修改基础学习率卷积操作常见流程如下：1.输入→卷积层→Batch归一化层（可选）→池化层→激活函数→下一层Flatten->Dense(withDropout，可选)->Dense(Output)这里相关的概念比较多，如果之前没有学习过复试班强化班中
Parse error: syntax error, unexpected end of file in jaray PHP
Parseerror:syntaxerror,unexpectedendoffilein上面的这个错误提示是因为在写的代码中哪个大括号没有闭合！当死活也找不出问题所在的时候，就用那超级妙用的注释吧，一段一段的找，不行就一行一行的找。
战神授权后台报错：Parse error: syntax error, unexpected end of file in解决办法 qq_502428990 运维传奇手游架设
问题现象分析当您在战神授权后台遇到"Parseerror:syntaxerror,unexpectedendoffile"这个错误时，说明PHP解析器在解析脚本文件时遇到了意外结束的情况。这种错误通常发生在PHP代码结构不完整时，比如缺少闭合的大括号、分号或者PHP结束标记不完整等。错误原因深度解析这个特定错误的核心原因是PHP的short_open_tag配置问题。PHP支持两种形式的开始标记：
【企业管理】公司权力结构 flyair_China 产品经理
一、权力设计体系核心框架1.1表面权力体系（FormalPowerSystem）定义：通过组织架构、岗位职责、制度流程等显性规则定义的权力分配。构成要素：要素作用示例组织架构图明确汇报关系与层级董事会→CEO→部门总监→经理岗位说明书界定职责与权限边界《CFO岗位职责：资金审批权≤500万》管理制度流程化权力行使规则《采购审批流程》《人事任免制度》会议决策机制集体行权程序董事会决议需≥2/3董事通
中间件复习（java向，示例代码为java），所有问题都会有链接单独解析搞不懂语言的程序员重拾java 中间件中间件 java 开发语言
根据近些年情况整理的Java服务常用中间件及面试复习指南（每个中间件10个以上问题+实战模拟）一、核心中间件清单（2020-2023高频使用）中间件分类典型中间件核心应用场景RPC框架Dubbo3.x、gRPC、SpringCloudOpenFeign微服务通信、跨语言调用消息队列Kafka、RocketMQ、RabbitMQ异步解耦、削峰填谷、顺序消息缓存Redis（集群/Redisson）、C
打造安全认证系统：AWS Amplify与React集成竹石文化传播有限公司 AWS Amplify 用户认证 React应用集成后端资源管理 UI组件
背景简介在现代应用开发中，用户认证系统是保障安全和提供个性化体验的核心部分。本文将基于AWSAmplify的使用和配置，探讨如何在React应用程序中设置和集成一个全面的用户认证系统。设置认证系统所需的关键组件在为应用程序设置认证时，需要考虑以下几个重要组件：用户管理用户管理是指允许预定义用户列表访问系统，包括用户创建、阻止或删除等功能。角色管理角色管理涉及定义不同类型的用户角色，并将这些角色分配
AWS中的 CloudFormation 等待的L先生 aws 云计算
AWS中的CloudFormation1.CloudFormation是什么？AWSCloudFormation是亚马逊科技（AWS）提供的一项服务，允许用户通过模板来描述和配置，从而实现基础设施即代码（InfrastructureasCode，lac）。CloudFormation使用JSON或者YAML文件编写的模板来定义一组AWS资源的集合，称为“堆栈”，这些资源可以包括EC2实例，S3存储
CloudFormation 实现 GitHub Actions OIDC 与 AWS ECR 的安全集成（支持多组织配置） ivwdcwso 运维与云原生 github aws ecr CI/CD OIDC 流水线
、##引言：多组织场景下的安全挑战在企业环境中，经常需要为不同的GitHub组织（如开发组织dp和测试组织test）配置不同的访问权限。本文将详细介绍如何通过AWSCloudFormation模板实现灵活的OIDC集成，支持多GitHub组织的安全访问控制。第一部分：多组织架构设计安全认证流程（多组织场景）
设计的“第一性原理”：从Photoshop与Premiere Pro的AI革新谈起
最近有机会深入体验了一套来自英国ParvisSchoolofEconomicsandMusic的Adobe正版教育订阅，在把玩研究CreativeCloud全家桶的过程中，确实挖到了一些宝贝，感触颇深，忍不住想立刻和大家聊聊。先简单说下这套订阅给我的直观感受：它的FireflyAI积分是我见过最慷慨的，每周足足有1500点；授权设备数也达到了4台，可惜我囊中羞涩，并没有那么多设备去一一验证。最让我
Pytest自动化测试执行环境切换的两种解决方案测试老哥 pytest 测试工具 python 软件测试自动化测试测试用例职场和发展
点击文末小卡片，免费获取软件测试全套资料，资料在手，涨薪更快在实际企业的项目中，自动化测试的代码往往需要在不同的环境中进行切换，比如多套测试环境、预上线环境、UAT环境、线上环境等等，并且在DevOps理念中，往往自动化都会与Jenkins进行CI/CD，不论是定时执行策略还是迭代测试，那么问题来了，难道每次切换环境都需要提供一套测试代码？或者每次切换都要需修改我们的自动化环境配置？答案当然不是，
JMeter中变量如何使用？测试者家园智能化测试性能测试 JMeter jmeter 智能化测试性能测试软件测试质量效能软件开发和测试持续测试
在性能测试的世界中，ApacheJMeter是一把利器，凭借其强大的可扩展性与图形化操作界面，在工业界和开源社区中广受青睐。而“变量的使用”作为JMeter中提高测试灵活性、可维护性和复用性的关键技术点，却常常被初学者忽略或误用。本文将从变量的定义方式、作用域、典型应用场景到高级技巧全面展开剖析，并结合实际案例为读者提供具有启发性的思维视角。一、什么是变量？为什么JMeter离不开它？JMeter
红黑树与2-3树：插入、删除操作的时间复杂度与实现机制比较一键难忘红黑树数据结构
本文收录于专栏：算法之翼红黑树与2-3树：插入、删除操作的时间复杂度与实现机制比较红黑树（Red-BlackTree）和2-3树（2-3Tree）是两种广泛用于平衡二叉查找树的自平衡树结构。它们在插入、删除和查找操作中的性能都表现良好，并且可以确保树的高度是对数级别，从而保证了高效的操作时间。本文将对红黑树和2-3树进行深入的比较，并结合代码实例说明它们的实现和应用。1.数据结构简介1.1红黑树简
学习三维动画心得 2501_92205961 开发语言青少年编程
在大二学年的三维动画设计学习进程中，我围绕3dsMax和Blender两大核心软件展开深入钻研，并在此基础上探索技术应用与创新。不仅熟练掌握了基础操作，还深入到代码编写与复杂技术问题解决领域，逐步构建起系统的三维动画设计知识与技能体系，以下是详细的学习总结。一、3dsMax的深度学习与技术实践（一）高级建模与脚本优化在3dsMax的学习中，基础建模掌握后，我开始挑战高级建模技术。利用NURBS建模
Python网安-zip文件暴力破解（仅供学习） Whoisshutiao python网安 python 开发语言网络安全
目录源码在这里需要的模块准备一个密码本和需要破解的ZIP文件一行一行地从密码文件中读取每个密码。核心部分注意，需要修改上段代码注释里的这段具有编码问题的代码：源码在这里https://github.com/Wist-fully/Attack/tree/cracker需要的模块fromtqdmimporttqdmimportzipfileimportpyzipper准备一个密码本和需要破解的ZIP文
【力扣hot100】python刷题笔记之哈希 Animato. 哈希算法 leetcode 笔记
1.两数之和（简单）题目描述：给定一个整数数组nums和一个整数目标值target，请你在该数组中找出和为目标值target的那两个整数，并返回它们的数组下标。你可以假设每种输入只会对应一个答案，并且你不能使用两次相同的元素。你可以按任意顺序返回答案。示例：解法一：暴力解法：双层循环（这里就不给代码了）解法二：哈希表（时间复杂度O(n)）算法思路：（1）先创建一个空字典当做哈希表来存储已经遍历过的
半导体FAB中的服务器硬件故障监控与预防全方案：从预警到零宕机实战爱吃青菜的大力水手服务器运维半导体 FAB运维 IT运维
服务器硬件故障监控与预防全方案：从预警到零宕机实战关键词：SMART监控RAID预警IPMI传感器性能基线PrometheusZabbix高可用架构一、硬件故障前的7大预警信号（附关联工具）故障类型关键指标监控工具预警阈值磁盘故障Reallocated_Sector_Countsmartctl+smartd>0立即告警Current_Pending_SectorPrometheus+NodeExp
高可用系统：让服务永不中断的秘密爱吃青菜的大力水手 linux 运维服务器
高可用系统：让服务永不中断的秘密在数字化时代，系统的高可用性（HighAvailability,HA）至关重要。无论是电商平台还是金融服务，系统宕机都可能带来巨大损失。那么，什么是高可用系统？它又是如何实现的呢？本文将为您揭开高可用系统的神秘面纱，带您了解集群、节点、脑裂等核心概念，并推荐最经济实用的集群架构。什么是集群与节点？集群（Cluster）集群是一组协同工作的服务器，共同完成任务。它们就
AI对话导出工具 (AI Chat Exporter)——支持 ChatGPT, Grok 和 Gemini 平台 ALGORITHM LOL 人工智能 chatgpt
AI对话导出工具(AIChatExporter)轻松将AI对话导出为标准Markdown格式支持ChatGPT,Grok和Gemini平台相关代码已开源至Github欢迎Star✨功能特点多平台支持：同时支持ChatGPT,Grok和Gemini三大AI平台完整内容保留：精确导出所有对话内容，包括代码块、数学公式、链接和格式化文本标准Markdown格式：输出符合标准的Markdown格式，确保最
AMHS工程项目中-MCS-STKC之间的office 测试场景的介绍爱吃青菜的大力水手半导体自动化 AMHS MCS
工业自动化/半导体/面板制造等行业中常见的系统间接口预调试测试，通常称为Mockup测试、Office测试或FAT-Simulation测试。它的核心目标是在设备实际搬入工厂现场并连接真实物理设备之前，在办公室环境中验证上位系统（MCS）与下位系统（STOCKER控制器）之间的通信接口、协议逻辑和业务流程是否正常工作。以下是针对此场景的详细解读和关键点：核心目标：验证通信协议互通性：确保MCS发送
生成式AI技术对未来知识生产模式的颠覆性影响：跨学科案例分析德宿人工智能
引言随着人工智能技术的迅猛发展，生成式AI作为一种革命性技术正在深刻地改变人类知识生产和学术研究的范式。生成式AI不仅能够创建原创内容，还能模拟人类思维过程，处理和生成大量数据，从而在各个学科领域展现出广阔的应用前景。本研究报告旨在深入探讨生成式AI技术对未来知识生产模式的颠覆性影响，通过对比传统学术研究与AI辅助研究的范式差异，并选取医学、法学、文学、经济学和艺术学等五个典型领域进行深度案例分析
jvm调优总结（从基本概念到深度优化） oloz java jvm jdk 虚拟机应用服务器
JVM参数详解：http://www.cnblogs.com/redcreen/archive/2011/05/04/2037057.html Java虚拟机中，数据类型可以分为两类：基本类型和引用类型。基本类型的变量保存原始值，即：他代表的值就是数值本身；而引用类型的变量保存引用值。“引用值”代表了某个对象的引用，而不是对象本身，对象本身存放在这个引用值所表示的地址的位置。
【Scala十六】Scala核心十：柯里化函数 bit1129 scala
本篇文章重点说明什么是函数柯里化，这个语法现象的背后动机是什么，有什么样的应用场景，以及与部分应用函数(Partial Applied Function)之间的联系 1. 什么是柯里化函数 A way to write functions with multiple parameter lists. For instance def f(x: Int)(y: Int) is a
HashMap dalan_123 java
HashMap在java中对很多人来说都是熟的；基于hash表的map接口的非同步实现。允许使用null和null键；同时不能保证元素的顺序；也就是从来都不保证其中的元素的顺序恒久不变。 1、数据结构在java中，最基本的数据结构无外乎：数组和引用（指针），所有的数据结构都可以用这两个来构造，HashMap也不例外，归根到底HashMap就是一个链表散列的数据
Java Swing如何实时刷新JTextArea，以显示刚才加append的内容周凡杨 java 更新 swing JTextArea
在代码中执行完textArea.append("message")后，如果你想让这个更新立刻显示在界面上而不是等swing的主线程返回后刷新，我们一般会在该语句后调用textArea.invalidate()和textArea.repaint()。问题是这个方法并不能有任何效果，textArea的内容没有任何变化，这或许是swing的一个bug，有一个笨拙的办法可以实现
servlet或struts的Action处理ajax请求 g21121 servlet
其实处理ajax的请求非常简单，直接看代码就行了： //如果用的是struts //HttpServletResponse response = ServletActionContext.getResponse(); // 设置输出为文字流 response.setContentType("text/plain"); // 设置字符集 res
FineReport的公式编辑框的语法简介老A不折腾 finereport 公式总结
FINEREPORT用到公式的地方非常多，单元格（以=开头的便被解析为公式），条件显示，数据字典，报表填报属性值定义，图表标题，轴定义，页眉页脚，甚至单元格的其他属性中的鼠标悬浮提示内容都可以写公式。简单的说下自己感觉的公式要注意的几个地方： 1.if语句语法刚接触感觉比较奇怪，if(条件式子,值1,值2)，if可以嵌套，if(条件式子1，值1，if(条件式子2，值2，值3)
linux mysql 数据库乱码的解决办法墙头上一根草 linux mysql 数据库乱码
linux 上mysql数据库区分大小写的配置 lower_case_table_names=1 1-不区分大小写 0-区分大小写修改/etc/my.cnf 具体的修改内容如下: [client] default-character-set=utf8 [mysqld] datadir=/var/lib/mysql socket=/va
我的spring学习笔记6-ApplicationContext实例化的参数兼容思想 aijuans Spring 3
ApplicationContext能读取多个Bean定义文件，方法是： ApplicationContext appContext = new ClassPathXmlApplicationContext（ new String[]｛“bean-config1.xml”，“bean-config2.xml”，“bean-config3.xml”，“bean-config4.xml
mysql 基准测试之sysbench annan211 基准测试 mysql基准测试 MySQL测试 sysbench
1 执行如下命令，安装sysbench-0.5： tar xzvf sysbench-0.5.tar.gz cd sysbench-0.5 chmod +x autogen.sh ./autogen.sh ./configure --with-mysql --with-mysql-includes=/usr/local/mysql
sql的复杂查询使用案列与技巧百合不是茶 oracle sql 函数数据分页合并查询
本片博客使用的数据库表是oracle中的scott用户表; ------------------- 自然连接查询查询 smith 的上司(两种方法) &
深入学习Thread类 bijian1013 java thread 多线程 java多线程
一．线程的名字下面来看一下Thread类的name属性，它的类型是String。它其实就是线程的名字。在Thread类中，有String getName()和void setName(String)两个方法用来设置和获取这个属性的值。同时，Thr
JSON串转换成Map以及如何转换到对应的数据类型 bijian1013 java fastjson net.sf.json
在实际开发中，难免会碰到JSON串转换成Map的情况，下面来看看这方面的实例。另外，由于fastjson只支持JDK1.5及以上版本，因此在JDK1.4的项目中可以采用net.sf.json来处理。一.fastjson实例 JsonUtil.java package com.study; impor
【RPC框架HttpInvoker一】HttpInvoker：Spring自带RPC框架 bit1129 spring
HttpInvoker是Spring原生的RPC调用框架，HttpInvoker同Burlap和Hessian一样，提供了一致的服务Exporter以及客户端的服务代理工厂Bean，这篇文章主要是复制粘贴了Hessian与Spring集成一文，【RPC框架Hessian四】Hessian与Spring集成在【RPC框架Hessian二】Hessian 对象序列化和反序列化一文中
【Mahout二】基于Mahout CBayes算法的20newsgroup的脚本分析 bit1129 Mahout
#!/bin/bash # # Licensed to the Apache Software Foundation (ASF) under one or more # contributor license agreements. See the NOTICE file distributed with # this work for additional information re
nginx三种获取用户真实ip的方法 ronin47
随着nginx的迅速崛起，越来越多公司将apache更换成nginx. 同时也越来越多人使用nginx作为负载均衡, 并且代理前面可能还加上了CDN加速，但是随之也遇到一个问题：nginx如何获取用户的真实IP地址,如果后端是apache,请跳转到<apache获取用户真实IP地址>，如果是后端真实服务器是nginx，那么继续往下看。实例环境：用户IP 120.22.11.11
java-判断二叉树是不是平衡 bylijinnan java
参考了 http://zhedahht.blog.163.com/blog/static/25411174201142733927831/ 但是用java来实现有一个问题。由于Java无法像C那样“传递参数的地址，函数返回时能得到参数的值”，唯有新建一个辅助类：AuxClass import ljn.help.*; public class BalancedBTree {
BeanUtils.copyProperties VS PropertyUtils.copyProperties 诸葛不亮 PropertyUtils BeanUtils
BeanUtils.copyProperties VS PropertyUtils.copyProperties 作为两个bean属性copy的工具类，他们被广泛使用，同时也很容易误用，给人造成困然；比如：昨天发现同事在使用BeanUtils.copyProperties copy有integer类型属性的bean时，没有考虑到会将null转换为0，而后面的业
[金融与信息安全]最简单的数据结构最安全 comsci 数据结构
现在最流行的数据库的数据存储文件都具有复杂的文件头格式，用操作系统的记事本软件是无法正常浏览的，这样的情况会有什么问题呢？从信息安全的角度来看，如果我们数据库系统仅仅把这种格式的数据文件做异地备份，如果相同版本的所有数据库管理系统都同时被攻击，那么
vi区段删除 Cwind linux vi 区段删除
区段删除是编辑和分析一些冗长的配置文件或日志文件时比较常用的操作。简记下vi区段删除要点备忘。 vi概述引文中并未将末行模式单独列为一种模式。单不单列并不重要，能区分命令模式与末行模式即可。 vi区段删除步骤： 1. 在末行模式下使用:set nu显示行号非必须，随光标移动vi右下角也会显示行号，能够正确找到并记录删除开始行
清除tomcat缓存的方法总结 dashuaifu tomcat 缓存
用tomcat容器，大家可能会发现这样的问题，修改jsp文件后，但用IE打开依然是以前的Jsp的页面。出现这种现象的原因主要是tomcat缓存的原因。解决办法如下: 在jsp文件头加上 <meta http-equiv="Expires" content="0"> <meta http-equiv="kiben&qu
不要盲目的在项目中使用LESS CSS dcj3sjt126com Web less
　如果你还不知道LESS CSS是什么东西，可以看一下这篇文章，是我一朋友写给新人看的《CSS——LESS》　　不可否认，LESS CSS是个强大的工具，它弥补了css没有变量、无法运算等一些“先天缺陷”，但它似乎给我一种错觉，就是为了功能而实现功能。　　比如它的引用功能 ? .rounded_corners{
[入门]更上一层楼 dcj3sjt126com PHP yii2
更上一层楼通篇阅读完整个“入门”部分，你就完成了一个完整 Yii 应用的创建。在此过程中你学到了如何实现一些常用功能，例如通过 HTML 表单从用户那获取数据，从数据库中获取数据并以分页形式显示。你还学到了如何通过 Gii 去自动生成代码。使用 Gii 生成代码把 Web 开发中多数繁杂的过程转化为仅仅填写几个表单就行。本章将介绍一些有助于更好使用 Yii 的资源：
Apache HttpClient使用详解 eksliang httpclient http协议
Http协议的重要性相信不用我多说了，HttpClient相比传统JDK自带的URLConnection，增加了易用性和灵活性（具体区别，日后我们再讨论），它不仅是客户端发送Http请求变得容易，而且也方便了开发人员测试接口（基于Http协议的），即提高了开发的效率，也方便提高代码的健壮性。因此熟练掌握HttpClient是很重要的必修内容，掌握HttpClient后，相信对于Http协议的了解会
zxing二维码扫描功能 gundumw100 android zxing
经常要用到二维码扫描功能现给出示例代码 import com.google.zxing.WriterException; import com.zxing.activity.CaptureActivity; import com.zxing.encoding.EncodingHandler; import android.app.Activity; import an
纯HTML+CSS带说明的黄色导航菜单 ini html Web html5 css hovertree
HoverTree带说明的CSS菜单:纯HTML+CSS结构链接带说明的黄色导航在线体验效果：http://hovertree.com/texiao/css/1.htm代码如下,保存到HTML文件可以看到效果： <!DOCTYPE html > <html > <head> <title>HoverTree
fastjson初始化对性能的影响 kane_xie fastjson 序列化
之前在项目中序列化是用thrift，性能一般，而且需要用编译器生成新的类，在序列化和反序列化的时候感觉很繁琐，因此想转到json阵营。对比了jackson，gson等框架之后，决定用fastjson，为什么呢，因为看名字感觉很快。。。网上的说法： fastjson 是一个性能很好的 Java 语言实现的 JSON 解析器和生成器，来自阿里巴巴的工程师开发。
基于Mybatis封装的增删改查实现通用自动化sql mengqingyu DAO
1.基于map或javaBean的增删改查可实现不写dao接口和实现类以及xml，有效的提高开发速度。 2.支持自定义注解包括主键生成、列重复验证、列名、表名等 3.支持批量插入、批量更新、批量删除 <bean id="dynamicSqlSessionTemplate" class="com.mqy.mybatis.support.Dynamic
js控制input输入框的方法封装(数字，中文，字母，浮点数等) qifeifei javascript js
在项目开发的时候，经常有一些输入框，控制输入的格式，而不是等输入好了再去检查格式，格式错了就报错，体验不好。 /** 数字，中文，字母,浮点数(+/-/.) 类型输入限制，只要在input标签上加上 jInput="number,chinese,alphabet,floating" 备注：floating属性只能单独用*/ funct
java 计时器应用 tangqi609567707 java timer
mport java.util.TimerTask; import java.util.Calendar; public class MyTask extends TimerTask { private static final int
erlang输出调用栈信息 wudixiaotie erlang
在erlang otp的开发中，如果调用第三方的应用，会有有些错误会不打印栈信息，因为有可能第三方应用会catch然后输出自己的错误信息，所以对排查bug有很大的阻碍，这样就要求我们自己打印调用的栈信息。用这个函数：erlang:process_display (self (), backtrace).需要注意这个函数只会输出到标准错误输出。也可以用这个函数：erlang:get_s

论文阅读之：基于序列列到到序列的中文AMR解析；Chinese AMR Parsing based on Sequence-to-Sequence Modeling

文章目录

Abstract

Introduction

Related Work

AMR & Chinese AMR

AMR parsing & Chinese AMR Parsing

Chinese AMR Parsing

Seq2seq

Data pre-processing

Data post-processing

Combining Chinese pretrained models for Chinese AMR parsing

Chinese Pretrained models

Experiments

data & subword processing

Experiments settings

Analysis

Results

The effect of different subword strategies

你可能感兴趣的:(论文阅读与代码复现,论文阅读)