计算模型参数量的方法

方法

from transformers import AutoModel
model = AutoModel.from_pretrained('/model/GPT-2/gpt2-medium/')
sum([p.numel() for p in model.parameters()]
输出:
354823168

解释

在PyTorch中,模型的参数通常是通过nn.Module类的parameters()方法返回的一个迭代器。这个迭代器包含了模型中所有需要训练的参数,每个参数都是一个torch.Tensor类型的对象。

在代码sum(p.numel() for p in model.parameters())中,p.numel()表示计算一个参数张量中元素的总数。numel()是PyTorch中torch.Tensor类的一个方法,用于返回张量中元素的总数。因此,p.numel()返回的是一个参数张量中元素的总数,而sum(p.numel() for p in model.parameters())则返回整个模型中所有参数元素的总数

numel是什么的简写吗

numel是number of elements的缩写,表示张量中元素的数量

新方法-num_parameters()

cls_model.num_parameters()
直接输出:7110668288

你可能感兴趣的:(深度学习)