TAT-QA: A Question Answering Benchmark on a Hybrid of Tabular and Textual Content in Finance

文章目录

  • 前言
  • 一、摘要(abstract)
  • 二、引言(Introduction)
    • 1.引入库
    • 2.读入数据
  • 总结


前言

TAT-QA: A Question Answering Benchmark on a Hybrid of Tabular and Textual Content in Finance是2021年5月发表在ACL上的文章。改文章主要介绍针对基于金融领域表格(Tabular)和文本(Textual)混合(Hybrid)(即结构化和非结构化混合数据)的数据进行问题回复的研究。
文章获取链接: 论文下载链接.


一、摘要(abstract)

在论文摘要中,作者介绍了现有的研究,忽视了混合数据的问题回答(QA)。
本文的创新工作,1、从实际财务报告中抽取样本,构建一个包含表格和文本的大型QA数据集,命名为 TAT-QA。2、为了对表格数值进行推理,本文提出了一个新的模型TAGOP。
数据集获取链接: TAT-QA下载链接.

二、引言(Introduction)

1.引入库

代码如下(示例):

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
import warnings
warnings.filterwarnings('ignore')
import  ssl
ssl._create_default_https_context = ssl._create_unverified_context

2.读入数据

代码如下(示例):

data = pd.read_csv(
    'https://labfile.oss.aliyuncs.com/courses/1283/adult.data.csv')
print(data.head())

该处使用的url网络请求的数据。


总结

提示:这里对文章进行总结:
例如:以上就是今天要讲的内容,本文仅仅简单介绍了pandas的使用,而pandas提供了大量能使我们快速便捷地处理数据的函数和方法。

你可能感兴趣的:(文献阅读笔记)