多智能体协作

Google的新论文

  • TUMIX: Multi-Agent Test-Time Scaling with Tool-Use Mixture
  • 谷歌刚刚建立了一个可以自我组织的人工智能,更准确地说,是一个多智能体网络,TUMIX
  • 这是多个AI协同工作的系统。每个代理使用不同的工具:一个编写代码,一个运行搜索,还有一个以纯文本进行推理。
  • 他们独立解决同一个问题,分享答案,并经过几轮改进,直到小组达成共识。
  • 结果令人惊叹。运行 TUMIX 的 Gemini-2.5 比其他所有推理系统的性能提升高达 17.4%,而推理成本却只有后者的一半左右。无需重新训练,无需新数据,只需更智能地协调。

TUMIX 证明了智能可以源于组织,而不仅仅是规模。

  • 思考一下,在人类文明的进步中,个别天才的作用当然毋庸置疑,但更重要的是大规模群体协作的力量。
  • 我一直对有个事情比较疑惑,目前的大模型们,已经做到单个模型将人类几乎所有(公开可见的)知识全部学习了,但是,这些知识其实是不协调一致的,有些甚至是相互矛盾对立的,那么大模型是如何自洽的?
  • 譬如我们每个人,虽然知识很有限,但是作为个人,在某个时间点,我们是自洽的,我们不会同时相信两个矛盾对立的观点。
  • 个人组成社会、国家,分工协作,类似于达尔文的自然进化,正确的(或者说可行的)思想战胜错误的思想,最后一步步推动整个社会的进步。
  • 推理的下一个飞跃可能不是一个万亿参数模型,而是一个由更小的模型组成的学习如何共同思考的网络。