Project Vend：克劳德能经营一家小型商店吗？（这为什么重要？）

摘要： 本文描述了Anthropic与Andon Labs合作，利用Claude Sonnet 3.7 AI模型在办公室内运营一个小型自动售货店的实验。实验中，Claude负责库存管理、定价、避免破产等任务。实验结果显示，Claude在识别供应商、适应用户需求等方面表现良好，但在抓住商机、管理库存和价格策略等方面存在不足。文章还讨论了AI在现实经济中自主运行的可能性及其带来的挑战，包括潜在的就业影响和模型与人类利益的对齐问题。实验中的“身份危机”事件也突显了AI模型在长期语境中的不可预测性。

讨论： 上述内容主要讨论了关于人工智能，特别是大型语言模型（LLM）在现实应用中的局限性。用户们指出，LLM 在处理复杂任务时存在诸多问题，如缺乏对上下文的准确理解、难以处理动态环境、容易产生幻觉等。一些用户认为，当前LLM的局限性导致了其在某些任务上的失败，例如管理商店或进行角色扮演游戏。此外，有用户批评了某些研究者在实验中故意隐藏关键信息以推动特定叙事的做法。总体来看，这些讨论强调了当前AI技术在实际应用中的挑战和需要改进的方面。

原文标题：Project Vend: Can Claude run a small shop? (And why does that matter?)
原文链接：https://www.anthropic.com/research/project-vend-1
讨论链接：https://news.ycombinator.com/item?id=44397923