数据科学竞赛 | 记一次天池大赛热身赛-NLP实践-文本分类

特别感谢Datawhale组织的组队比赛学习活动以及提供的baseline等开源代码,感谢各位伙伴的无私分享~

下面将简单记录我在比赛过程的参考的教程、遇到的问题及解决方案

前期准备


赛题地址

https://tianchi.aliyun.com/competition/entrance/531865/information


Docker环境配置

https://mp.weixin.qq.com/s/JiimSmuD3S5lSS9MmH2GJw

针对上述教程的一些注意事项

  • “镜像版本”是自填的,第一次配置填1.0即可
  • 后续使用IntelliJ IDEA进行结果提交,比较方便
  • 教程“2.1.3. 构建并上传应用”中的第2点,“在 IntelliJ IDEA 界面左侧的 Project 中右键单击您的 Docker 应用工程名,在弹出的下拉菜单中选择 Alibaba Cloud > Deploy to ACR/ACK > Deploy to ACR”。
    但我在软件界面没有找到“Deploy to ACR” ,后来实际选择为Alibaba Cloud > Deploy to ACR/ACK > Deploy to ACR,如下图


    Alibaba Cloud > Deploy to ACR/ACK > Deploy to ACR.png

感谢@面包猎人
的作业参考https://blog.csdn.net/weixin_40807714/article/details/113856151


baseline流程体验

baseline代码参考https://github.com/finlay-liu/tianchi-multi-task-nlp


docker上传与天池比赛结果提交

比赛结果打包

这部分参考@面包猎人的教程

构建镜像与推送

参考Docker练习场中的“2.1 IDE + Cloud Toolkit”
注意:提交运行结果中,镜像路径一栏填阿里云镜像容器的公网地址,末尾要加上版本号


运行结果记录

使用上文的baseline,暂时取epoch=1,batch_size=16,分数如下:


Baseline第一次运行分数.png

你可能感兴趣的:(数据科学竞赛 | 记一次天池大赛热身赛-NLP实践-文本分类)