ai 视觉的编程工具会不会变成标配?

4月2日,智谱华章(HK2513)把全新的原生多模态Coding基座模型GLM-5V-Turbo给亮相了,这算是给AI编程开启了一个全新的“视觉原生”时代。智谱MaaS平台目前已经开放了这个模型的接入功能。GLM-5V-Turbo跟以前那种只懂文字的模型不一样,它最大的本事就是能看懂图。不管是设计稿、网页截图,还是K线图,它都能直接处理,然后直接变出能运行的代码。这就让开发变得更直观了,效率高了很多,门槛也降低了。这次发布不仅让大家开始盯着多模态Agent赛道看,也让人看好AI编程在实际用的时候能有多厉害。在多模态Coding和Agent方面,GLM-5V-Turbo成绩都很不错。而且它加入了看图的能力之后,原来的纯文字编程和推理能力也没落下。最重要的是,这个模型特别适合ClaudeCode这个场景,不管是写代码还是补全代码,甚至是调试代码,都能更精准、更顺手。多模态Coding是让AIAgent变得实用的关键一步。通过理解图片和文字这些多模态信息,AIAgent就能更好地干活了。比如GLM-5V-Turbo能帮开发者快速搭好智能家居控制系统,只要给它个界面设计图就能生成代码,这样产品迭代就快多了。 这次智谱华章发布的GLM-5V-Turbo,不仅让他们在人工智能这块更有竞争力了,也给整个行业带来了新的机会。以后这类能结合AI视觉的编程工具会不会变成标配呢?大家觉得怎么样?