微软搞了个“理事会”的机制，让好几个模型一起上场研究问题，最后大家还能把结果摆出来比比谁更强

微软刚刚在2026年3月31日这一天，给用户们把一个超级好用的研究工具给放出来了。这是个深度研究智能体的更新，是他们为了把AI搞聪明一点，特地推出的新玩法。现在用户要是在365Copilot里搞研究，完全可以把OpenAI的GPT跟Anthropic的Claude给同时请出来干活，系统管这个新功能叫“Critique”。这个做法真的很猛，DRACO基准测试显示，两个AI一起配合干活，那效果比单打独斗强多了。大家都知道AI有时候会瞎编内容，但这个“Critique”功能特别擅长查漏补缺。它先是让GPT写好初稿，然后让Claude去仔细检查这稿子准不准确、全不全、引用对不对头。最后Claude还能直接生成一份反馈报告。虽然现在还是GPT写在先Claude评在后，但以后微软打算搞双向的，先由Claude写个报告，再让GPT去把这报告改得更漂亮。微软在这方面真的下了很大功夫，他们的副总裁Nicole Herskowitz就表示，这么做能大大减少AI说瞎话的情况。而且微软还搞了个“理事会”的机制，让好几个模型一起上场研究问题，最后大家还能把结果摆出来比比谁更强。在这次演示里，裁判模型就把GPT和Claude独立生成的研究报告给比了个高下。大家可能会觉得奇怪，为啥微软要费这么大力气去搞这种多模协作呢？其实这事儿跟微软跟OpenAI、英伟达还有Anthropic的一系列合作有很大关系。去年10月份，微软刚跟OpenAI签了个大协议，把未来几年用模型和产品的权利给拿到手了；紧接着11月份又宣布要跟英伟达和Anthropic结成新的伙伴关系，并且打算向OpenAI的竞争对手砸下最多50亿美元的钱。为了配合这个大动作，微软就在今年3月把Anthropic的CopilotCowork代理给引进来了。这就好比给家里又添了一个干活的好手。所以你看这是一系列动作的延续，微软肯定是想借着这次的机会多卖货、多赚钱，同时也给咱们搞研究的人提供更强大的工具支持。不管股价这会儿是涨是跌（昨天涨了快2%，但去年10月以来已经跌了超过30%），反正他们在AI领域的步子是越迈越大了。