idc 预言2028年全球新冒出的数据量将飙到393.9zb

IDC预言，2028年全球新冒出的数据量将会飙到393.9ZB。中新网广州那边5月17日发了篇报道，说记者蔡敏婕搞到了现场的情况。大家都觉得，AI时代带来了个大麻烦，新数据多得像洪水一样冲进来。李凌霄，也就是IDC中国软件行业研究的经理，那天在广州也说了，报告里写得明明白白，生成式AI把企业的数据量推得飞快。到了2028年，光是新生成的这些数字就得堆到393.9ZB那么多，尤其是企业那边的数据特别显眼。这几年AI技术到处用，给了企业一种新本事，能从一大堆数据里挖出有用的信息。比如那个叫数字孪生的技术，一直在进步，现在造东西、开车、飞上天、看病还有公用事业，好多行业都在用这个。再加上物联网帮忙，AI的准确度跟实际用处都提高了。就在那天，OceanBase开了第三届开发者大会。那个《IDC数据库前沿趋势白皮书》也说了个事，数据量涨得太快了，企业的仓库装不下了。以前说结构化的数据能存PB级就算很大了，现在大家都觉得这得往EB级上冲才是常事儿。李凌霄接着吐槽说，老一套的存储办法碰上这么多数字可不行。读写速度慢下来不说，存东西的钱还得翻倍花。搞管理的人头疼死了，事儿也多得数不过来。虽然现在的GenAI技术越来越好用，企业也慢慢明白了它能帮着干活更快更省事。所以很多公司都把AI当成了战略大棋的一部分，赶紧准备把AI装上去。IDC搞的全球调研也显示出来了，有37%的受访企业把2025年的钱袋子都用来买AI了，跟省IT运维成本并列第一。怎么把AI和数据库这些东西揉在一起呢？李凌霄给大家支了几招：先排排队看谁重要先干谁、分几个阶段来搞、选个开放点的架构、把队伍能力重新弄一下、还有早点想好未来的路怎么走。他说升级基础设施的时候就得盯着AI会对数据库提啥要求，别等到全弄好了再去配AI，得一起动手。蚂蚁集团的CTO何征宇也出来说了说心里话。他说互联网上那海量的数据造就了现在的大模型，但是大模型老是闹幻觉也是因为数据有问题。他觉得幻觉的本质其实就是缺数据，“提供更好的数据是解决幻觉的源头”。何征宇还指出大模型的能力上限主要看数据好不好。现在还有四个坎儿过不去：一是拿钱买数据太贵了；二是正经的行业数据太少又不好流动；三是多模态的数据太难处理；四是不知道怎么评测数据质量行不行。面对大家的真实需求，OceanBase也在琢磨怎么升级。他们想把一体化数据库变成一体化的数据底座，用一套引擎就能同时应付TP/AP/AI这三种混合的活儿。支持向量数据库以后，就能用SQL和AI混着检索了。中国联通那边负责OceanBase研发的邱永刚也提了个醒：随着大家学的东西越来越多，向量库的体积也会变得巨大无比。这就逼着我们一方面得把检索算法搞得更牛叉，另一方面还得靠硬件撑着才能扛得住海量的检索请求。