自我介绍
介绍一下简历里面的项目经历(我的项目是多模态情感分类的,感觉太简单了)
讲一下 BERT 模型怎么预训练的,和 GPT 模型预训练任务的区别?
BERT 和 GPT 模型各自的优势是什么?
项目细节:数据集大小?各个类别的数量?单卡训练还是多卡训练?
是否了解多 GPU 并行训练?数据并行和模型并行?
如何解决训练的时候 GPU 利用率低的问题?
BERT模型输入长度超过512如何解决?
提问 ViT 的模型架构和细节,它是如何把图片变成一个序列的?
介绍暑假的实习经历
编程题:最长回文子序列
可能因为我是本科生,面试官人很好,问的也都比较偏基础,有几个问题也是在引导着我回答,主要是我的项目实在很水没什么技术含量
希望对大家也有参考