我只是一个人,我的编程需求有些不寻常(构建各种统计预测模型)。但如果你在六个月前问我,我本来会期待从大型语言模型中看到更一致的生产力提升,但现在我并没有看到。
对于低复杂度的任务,它们几乎总是有帮助的。对于中等复杂度的任务,可能大致平分为三类:1)第一次尝试时像魔法一样有效;2)错误但在方向上有帮助或经过调整后有效;3)证明是浪费时间。
它们通常值得“赌博”。如果我自己弄清楚某件事需要30分钟,而1) 节省我25分钟,2) 节省我15分钟,3) 花费我30分钟,那么期望值是正的。但仍然有相当一部分是3)。
864.62K