微软刚刚在2026年3月31日这一天,给用户们把一个超级好用的研究工具给放出来了。这是个深度研究智能体的更新,是他们为了把AI搞聪明一点,特地推出的新玩法。现在用户要是在365Copilot里搞研究,完全可以把OpenAI的GPT跟Anthropic的Claude给同时请出来干活,系统管这个新功能叫“Critique”。这个做法真的很猛,DRACO基准测试显示,两个AI一起配合干活,那效果比单打独斗强多了。 大家都知道AI有时候会瞎编内容,但这个“Critique”功能特别擅长查漏补缺。它先是让GPT写好初稿,然后让Claude去仔细检查这稿子准不准确、全不全、引用对不对头。最后Claude还能直接生成一份反馈报告。虽然现在还是GPT写在先Claude评在后,但以后微软打算搞双向的,先由Claude写个报告,再让GPT去把这报告改得更漂亮。 微软在这方面真的下了很大功夫,他们的副总裁Nicole Herskowitz就表示,这么做能大大减少AI说瞎话的情况。而且微软还搞了个“理事会”的机制,让好几个模型一起上场研究问题,最后大家还能把结果摆出来比比谁更强。在这次演示里,裁判模型就把GPT和Claude独立生成的研究报告给比了个高下。 大家可能会觉得奇怪,为啥微软要费这么大力气去搞这种多模协作呢?其实这事儿跟微软跟OpenAI、英伟达还有Anthropic的一系列合作有很大关系。去年10月份,微软刚跟OpenAI签了个大协议,把未来几年用模型和产品的权利给拿到手了;紧接着11月份又宣布要跟英伟达和Anthropic结成新的伙伴关系,并且打算向OpenAI的竞争对手砸下最多50亿美元的钱。 为了配合这个大动作,微软就在今年3月把Anthropic的CopilotCowork代理给引进来了。这就好比给家里又添了一个干活的好手。所以你看这是一系列动作的延续,微软肯定是想借着这次的机会多卖货、多赚钱,同时也给咱们搞研究的人提供更强大的工具支持。不管股价这会儿是涨是跌(昨天涨了快2%,但去年10月以来已经跌了超过30%),反正他们在AI领域的步子是越迈越大了。