IJCIAI-20-Argot

NLP对抗文本攻击(3)——中文对抗文本生成Argot

文章目录

  • NLP对抗文本攻击(3)——中文对抗文本生成Argot
  • 文献来源
  • 前言
  • 对于中文的五种扰动
    • Synonyms
    • shuffle
    • splitting-character
    • glyph
    • pinyin
  • Argot模型
    • 流程
    • pinyin扰动细节
    • glyph扰动
    • 评估
    • 说明


文献来源

Zhang, Z. , Liu, M. , Zhang, C. , Zhang, Y. , & Sun, D. . (2020). Argot: Generating Adversarial Readable Chinese Texts. Twenty-Ninth International Joint Conference on Artificial Intelligence and Seventeenth Pacific Rim International Conference on Artificial Intelligence {IJCAI-PRICAI-20.}

前言

对于英文的攻击(insert,delete等)无法直接移植到中文中,中文以字为单位,通过字组成词,然后组成句子

对于中文的五种扰动

Synonyms

同义词替换,好-妙

shuffle

交换顺序,阅读理解-读阅理解

splitting-character

偏旁部首拆分,只拆分左右,半包围

IJCIAI-20-Argot_第1张图片

glyph

相似字形替换
IJCIAI-20-Argot_第2张图片

pinyin

相似拼音替换,平翘舌音,前后鼻音
IJCIAI-20-Argot_第3张图片

Argot模型

流程

IJCIAI-20-Argot_第4张图片
输入句子 x x x,结巴分词 W = < w 1 , w 2 . . . w n > W= W=<w1,w2...wn>,对词按重要性排序,对每个词依次进行上述五种扰动,选择置信度变化最大的。
在这里插入图片描述

pinyin扰动细节

IJCIAI-20-Argot_第5张图片

glyph扰动

用chaizi-jt.txt对字进行部首拆分,
三种替换:替换别的部首;删除部首;增加部首
判断新生成的字是否存在
选择与与原字最相似的生成的字,采用基于siamese network的DNN,IJCIAI-20-Argot_第6张图片

IJCIAI-20-Argot_第7张图片

评估

成功率,扰动率,效率
IJCIAI-20-Argot_第8张图片

说明

nlp模型为cnn与lstm,中文nlp有基于字和词的,
使用word2vec训练300维的词向量。
IJCIAI-20-Argot_第9张图片

你可能感兴趣的:(NLP文本对抗)