打起来了~ 最小SOTA模型:Mistral 7B,各方面碾压LLaMA2 13B和LLaMA1 34B
深度学习自然语言处理分享MistralAI团队自豪地发布了Mistral7B,这是迄今为止尺寸最小的最强大的语言模型。进NLP群—>加入NLP交流群Mistral7B简介Mistral7B是一个73亿参数的模型,具有以下特点:在所有基准测试上优于Llama213B在许多基准测试上优于Llama134B在代码方面接近CodeLlama7B的性能,同时在英语任务上表现良好使用分组查询注意力(GQA)以