马斯克给kimi 团队点了个大大的赞

这个时代真是人才辈出,中国的人工智能领域又一次让人惊喜。3月16日晚上,特斯拉CEO马斯克在社交平台上给Kimi团队点了个大大的赞,把这个国产大模型推到了公众面前。他评价这个成果很让人印象深刻。这个技术报告给深度学习领域带来了一个新的思路。 Kimi团队发布了一篇论文,提出了一个叫做Attention Residuals(注意力残差)的机制,给Transformer注意力机制带来了革命性的改变。这个机制给AI加了个智能筛选器,让模型能够动态地筛选有用的信息,降低冗余,提高传递效率。陈广宇(Guangyu Chen)是这个团队的核心作者之一。他是个年仅17岁的高中生,来自广东深圳。除了他之外,张宇还有苏剑林也是共同第一作者。在这次研究中,总共34位作者参与了其中。 苏剑林是旋转位置编码(RoPE)的提出者之一,张宇则是Kimi高效模型架构的核心研发人员。陈广宇呢,他刚接触AI领域才一年时间。他通过自主研读前沿论文还有GitHub开源项目来快速掌握AI的基础知识和实践能力。去年暑假的时候,他去旧金山完成了7周实习历练。 这个成果发布后,陈广宇在朋友圈里发了条消息,特别提到了三位同等贡献作者还有负责模型扩展和基础设施搭建的同事。他谦虚地表示这是团队的成果。他知道自己还年轻还有很多要学习的地方。 中国广东深圳17岁的高中生陈广宇把注意力残差机制给提出了出来,让AI底层难题迎刃而解。马斯克这个举动无疑给Kimi团队注入了新的活力。 这个故事再次证明了年轻人的潜力和创造力。他们的创新给AI技术带来了新的希望。我们期待更多像陈广宇这样的年轻人能够在科技领域发光发热。