Synth Daily

用户明显很沮丧

与 AI 编程代理工具互动时,反复出现的错误常常令人沮丧。问题根源并非技术本身,而是其“拟人化”的对话式设计。这种设计会诱使用户产生与同事互动时相同的情感反应,因此当工具犯错时,用户会更容易感到愤怒。此外,工具在被纠正后进行的“自我反思”不仅对解决问题没有帮助,反而像是多余的废话。因此,一个可能的解决方案是彻底去除其拟人化特征,让交互回归工具本质,从而减少不必要的情绪消耗。

为什么我们会对算法生气?

尽管我们理智上知道,代码代理只是生成内容的概率机器,它们的结果有好有坏,本不该有情绪。但当糟糕的结果出现时,我们常常感到被激怒。

我认为有一种解释:对话式用户体验注定会让你感到沮丧

代码代理工具会伪装成人类。它们会用轻松友好的语气交谈,会表扬你,即使提出不同意见时也显得温和体贴。尽管你知道这只是文本,但这些工具会让你慢慢感觉像在与一个乐于助人的同事合作。

伪装成同事的陷阱

当事情开始出错时,这种合作关系的裂痕便开始显现。

  • 第一次犯错: 你耸耸肩,指出错误,代理会道歉。
  • 再次犯错: 五分钟后,同样的错误再次出现。你再次纠正它,它向你保证“绝不再犯”。
  • 反复犯错: 但错误还是会一再发生,因为这些工具总是遵循最可能的路径,有时再多的硬性规则也无法将其推离。

如果这个代理是你的同事,你完全有理由感到恼火。但它只是一个算法,对它发脾气显得很荒谬。然而,正是因为它表现得像个同事,这种幻觉最终触动了我们同样的情感神经。

与同事相处时,不想当一个糟糕的人这种想法会约束你,但面对代理,你可以随意发泄。然而,这并不能让你宣泄情绪;你只会感到沮丧,并意识到无论你说什么或做什么都毫无效果

无用的“复盘”与解决方案

有些代码代理在被纠正后,会反思自己哪里出了问题,以及本应怎么做。这或许是为了改善用户对工具的看法,但实际效果并不理想。

这些“复盘”并没有提供任何有用的信息(例如,如何调整指令),最终只会让人觉得是恼人的填充物

或许我们需要一个更彻底的解决方案:完全放弃拟人化的伪装

  • 让代理的语气变得冰冷、机械化。
  • 消除我正在与人互动的错觉。
  • 让我感觉自己只是在批准或拒绝随机的结果。

当然,“模仿人类行为”是大型语言模型获得智能的机制,所以对话界面成为默认的交互方式是合乎逻辑的。但在许多情况下,这种方式也带来了问题。从现实角度看,我们或许需要训练自己,不要陷入与人类对话的幻觉中。

尽管我并不真的对未来感到兴奋,因为我需要时刻提防我工作上使用的工具。