阅读笔记——《Removing RLHF Protections in GPT-4 via Fine-Tuning》
【参考文献】ZhanQ,FangR,BinduR,etal.RemovingRLHFProtectionsinGPT-4viaFine-Tuning[J].arXivpreprintarXiv:2311.05553,2023.【注】本文仅为作者个人学习笔记,如有冒犯,请联系作者删除。目录摘要一、介绍二、背景三、方法四、实验五、案例研究六、负责的公开七、结论摘要LLM公司为了减少它们的大语言模型产生