ai 视觉的编程工具会不会变成标配？

4月2日，智谱华章（HK2513）把全新的原生多模态Coding基座模型GLM-5V-Turbo给亮相了，这算是给AI编程开启了一个全新的“视觉原生”时代。智谱MaaS平台目前已经开放了这个模型的接入功能。GLM-5V-Turbo跟以前那种只懂文字的模型不一样，它最大的本事就是能看懂图。不管是设计稿、网页截图，还是K线图，它都能直接处理，然后直接变出能运行的代码。这就让开发变得更直观了，效率高了很多，门槛也降低了。这次发布不仅让大家开始盯着多模态Agent赛道看，也让人看好AI编程在实际用的时候能有多厉害。在多模态Coding和Agent方面，GLM-5V-Turbo成绩都很不错。而且它加入了看图的能力之后，原来的纯文字编程和推理能力也没落下。最重要的是，这个模型特别适合ClaudeCode这个场景，不管是写代码还是补全代码，甚至是调试代码，都能更精准、更顺手。多模态Coding是让AIAgent变得实用的关键一步。通过理解图片和文字这些多模态信息，AIAgent就能更好地干活了。比如GLM-5V-Turbo能帮开发者快速搭好智能家居控制系统，只要给它个界面设计图就能生成代码，这样产品迭代就快多了。这次智谱华章发布的GLM-5V-Turbo，不仅让他们在人工智能这块更有竞争力了，也给整个行业带来了新的机会。以后这类能结合AI视觉的编程工具会不会变成标配呢？大家觉得怎么样？