多智能体协作

Google的新论文

TUMIX: Multi-Agent Test-Time Scaling with Tool-Use Mixture
谷歌刚刚建立了一个可以自我组织的人工智能，更准确地说，是一个多智能体网络，TUMIX
这是多个AI协同工作的系统。每个代理使用不同的工具：一个编写代码，一个运行搜索，还有一个以纯文本进行推理。
他们独立解决同一个问题，分享答案，并经过几轮改进，直到小组达成共识。
结果令人惊叹。运行 TUMIX 的 Gemini-2.5 比其他所有推理系统的性能提升高达 17.4%，而推理成本却只有后者的一半左右。无需重新训练，无需新数据，只需更智能地协调。

思考一下，在人类文明的进步中，个别天才的作用当然毋庸置疑，但更重要的是大规模群体协作的力量。
我一直对有个事情比较疑惑，目前的大模型们，已经做到单个模型将人类几乎所有（公开可见的）知识全部学习了，但是，这些知识其实是不协调一致的，有些甚至是相互矛盾对立的，那么大模型是如何自洽的？
譬如我们每个人，虽然知识很有限，但是作为个人，在某个时间点，我们是自洽的，我们不会同时相信两个矛盾对立的观点。
个人组成社会、国家，分工协作，类似于达尔文的自然进化，正确的（或者说可行的）思想战胜错误的思想，最后一步步推动整个社会的进步。
推理的下一个飞跃可能不是一个万亿参数模型，而是一个由更小的模型组成的学习如何共同思考的网络。