LLm微调使用的数据集

https://baijiahao.baidu.com/s?id=1769124161629981325&wfr=spider&for=pc

RefGPT:基于RefGPT生成大量真实和定制的对话数据集

地址:https://github.com/ziliwangnlp/RefGPT

数据集说明:包括RefGPT-Fact和RefGPT-Code两部分,其中RefGPT-Fact给出了5万中文的关于事实性知识的多轮对话,RefGPT-Code给出了3.9万中文编程相关的多轮对话数据。

COIG

地址:https://huggingface.co/datasets

你可能感兴趣的:(NLP,人工智能,数据库)