这是个超大的数学证明ai,模型里面的参数有5677亿那么多,简直吓人

讲个在3月21日发生的事儿,美团搞出了一款叫做LongCat-Flash-Prover的东西。这是个超大的数学证明AI,模型里面的参数有5677亿那么多,简直吓人。这款AI给大家展示了人工智能在数学证明上的强大能力,真的是个大突破。 这个模型可不是简简单单地把参数叠加上去。它用了一种叫混合专家模型的架构(MoE),让推理过程又灵活又高效。 测试结果显示,LongCat-Flash-Prover在MiniF2F-Test里面拿了97.1%的高分,只用了72次尝试就解决了难题。在PutnamBench任务上,它解决了41.5%的问题。这就证明了这个模型真的很厉害。 为了确保严谨性,美团给这个模型加了很多保障措施。它用了抽象语法树(AST)的流程和Lean4语言来验证推理过程。还有自研的HisPO算法和一致性检测机制来防止训练时出现差错。 现在这个模型已经在GitHub和HuggingFace上面开源了,让更多人能参与进来。有了这个东西,AI在数学逻辑和代码验证这些专业领域的应用前景可好了。 总之,这是美团在AI领域的一次成功尝试。未来随着技术进步,数学证明可能不再依赖人类的思维了。