论文研读|学科交叉研究回顾与反思

在学术界多个边缘游走,读过一定数量的论文,经常在阅读某一领域的论文时看到其他领域的影子,下面来总结一下几个印象比较深刻的工作。

二叉树用于图像水印

这是在2020年秋季学期课堂报告上汇报过的一篇文章。

相关论文:

  • Features Classification Forest: A Novel Development that is Adaptable to Robust Blind Watermarking Techniques(TIP, 2017) National Chung Hsing University, Chang and Shen

BPE算法用于文本分词

BPE算法起初是1994年被提出用来解决数据压缩问题的,后来在2016年的ACL上被提出用来完成文本分词,现如今这项技术已经被成功应用于GPT-2等一系列语言模型中。

相关论文:

  • Neural Machine Translation of Rare Words with Subword Units(ACL, 2016) University of Edinburgh, Sennrich

欧拉二次剩余定理用于自然语言文本水印

这是2023年1月份读到的一篇论文中使用的方法。

相关论文:

  • Natural Language Watermarking Using Semantic Substitution for Chinese Text(IWDW, 2003) Advanced e-Commerce Technology Lab., Chiang et al.

压缩编码用于文本隐写

在生成概率分布后的采样阶段,通过压缩编码的方式,将秘密信息嵌入到生成的 token 中。

相关论文:

  • 定长编码:Generating Steganographic Text with LSTMs(ACL Workshop, 2017) Waterloo University, Fang et al.
  • 霍夫曼编码:RNN-Stega: Linguistic Steganography Based on Recurrent Neural Networks(TIFS, 2019) Tshinghua University, Yang et al.
  • 算术编码:Neural Linguistic Steganography(EMNLP, 2019) Harvard University, Ziegler et al.

文本隐写中用到的数学原理

最近看到的生成式文本隐写相关工作中,用到大数定理、总变分距离、平斯克不等式、柯克霍夫原则、齐夫定律、琴生不等式以及拒绝采样等数学知识,可见数学的重要性!详见 此篇博客。


思考:记得在2022年11月下旬一次学术交流研讨会上,导师说过一句话:“跨界要形成降维打击。”不知道以上述几项工作为代表的研究算不算成功的跨界应用,但这至少提醒我们一点,那就是,思路要打开,思维要灵活。

你可能感兴趣的:(论文研读,一点思考,交叉学科,论文研读,NLP)