DataLossError : corrupted record at XXXXXXX,BERT预训练报错

预训练过程中主要修改了两个文件,一个是create_pretraining_data和run_pretrain.
前者运行需要读取一个txt文件,记得改成utf-8。在前者代码里面,将读进来的txt转化成了tfrecod形式,存进了example.tfrecord,在后者的程序里会调用它,来预训练。

两个代码程序都需要保证读取成功,如果路径没问题,仍然报错,在这里插入图片描述
可以去路径下看example.tfrecord有没有正确生成。

你可能感兴趣的:(bert,深度学习,人工智能)