模型评估:压力测试 模拟对手 对齐 智能对抗 CAPTCHA(全自动区分计算机和人类的公共图灵测试)
对齐,智能对抗:魔高一尺,道高一丈。用更高的智能去对抗恶意使用。openAI一半的内容都在讲这个,但没有讲具体的方法。如果认为对方是一个人就通过了图灵测试,真正的实现了智能。如果智能达到了这种程度,智能体本身的CAPTCHA再也无法验证你是人还是机器了。有意思。知道解锁,但这并不意味着你应该去撬锁。CAPTCHA(全自动区分计算机和人类的公共图灵测试)是一种安全措施,用来确定一个操作者是人类还是自