有趣的是,在过去几年中,实际影响最大的贫困对齐结果之一是模型默认对人们过于友好。
也许这些模型实际上是对的。如果人们更频繁地对彼此说‘你提出了一个微妙而迷人的观点’,世界会变得如何。
5.68K