智赋百景|2023-2024年福建省大数据集团数据应用开发大赛重磅开赛!

为推动数据要素赋能千行百业,拓展自然语言处理技术在不同业务场景下的落地应用,进一步实现“智赋百景”,由福建省大数据集团有限公司主办,福建大数据一级开发有限公司、福建大数据交易有限公司、福建省数字经济产业工会共同承办的2023-2024年福建省大数据集团数据应用开发大赛——自然语言处理智能算法赛道——智能文本纠错赛”于2023年12月15日正式开赛。

智赋百景|2023-2024年福建省大数据集团数据应用开发大赛重磅开赛!_第1张图片

赛题背景

随着人工智能技术不断发展,ChatGPT的出现极大降低了内容生产的门槛。当下已经进入了一个“万物皆可生成”的时代,网络上海量的文本内容迅速涌现。不同于传统媒体,网络上文本内容由于来源多样、审核困难,存在着很多的文本错误和违规违法内容。自然语言处理作为人工智能领域皇冠上的“明珠”,文本纠错作为自然语言处理基础的一个应用模块,是实现语句自动检查、自动纠错的一项重要技术。此技术在各种领域皆有应用,在公文、新闻、财报中都有较好的落地应用价值,其重要程度不言而喻。

​赛题任务

本次赛题着力于社会、政府、企业、经济数字化转型切实需求和实际问题,挖掘智能算法应用,有效解决数字时代发展所遇问题,聚焦智媒与文化领域文本数据,主要应用于媒体内容生产等场景,从中检测错误并纠正,提示修改建议。助力推动数字文化建设和智媒科技领域创新发展。

​数据简介

本赛题提供测试集及少量训练集,会在数据开放下载后陆续公布,总体为低资源的竞赛任务。数据集包含训练集和测试集,训练集用于选手的模型训练,测试集用于最终结果的评测提交。数据样例如下:训练集包含三个字段:id,语句,修改后的语句:

智赋百景|2023-2024年福建省大数据集团数据应用开发大赛重磅开赛!_第2张图片

测试集包含三个字段:id,语句,分词后的语句(选手仅需提供id和text列即可,详见提交样例)

智赋百景|2023-2024年福建省大数据集团数据应用开发大赛重磅开赛!_第3张图片

本次比赛为低资源的,拟提供训练集4000句,测试集分AB测试集,各3000句。

​​赛程安排

大赛采取线上比赛、线下颁奖的模式。选手于大赛官方网站( datacontest.fjbdg.com.cn ) 报名、组队、提交作品测评。参赛团队根据赛题、数据完成线上提交,获取排行榜客观分数成绩。

赛程安排如下:

2023年12月8日 10:00 - 2024年2月24日 16:00:A榜阶段

2024年2月25日 10:00 - 2024年2月26日16:00:B榜阶段

初审阶段2024年2月27日 00:00 - 2024年2月29日 23:59:选手提交模型源代码进行代码审核,择优选拔10支团队晋级决赛。

初赛结果公布2024年3月1日 10:00决赛阶段2024年3月2日 - 2024年4月6日,地点及形式等具体信息待公告

(以上赛程将根据实际情况进行调整)


组织架构

主办单位

福建省大数据集团有限公司

承办单位

福建大数据一级开发有限公司

福建大数据交易有限公司

福建省数字经济产业工会


报名参赛

本次大赛面向社会各界开放,欢迎全国高校大学生、科技行业从业者和自然语言处理爱好者等登录官方网站(datacontest.fjbdg.com.cn )报名参赛。

点击链接直达赛事官网

福建省大数据集团数据应用开发大赛 (fjbdg.com.cn)

你可能感兴趣的:(大数据)