idc 预言2028年全球新冒出的数据量将飙到393.9zb

IDC预言,2028年全球新冒出的数据量将会飙到393.9ZB。中新网广州那边5月17日发了篇报道,说记者蔡敏婕搞到了现场的情况。大家都觉得,AI时代带来了个大麻烦,新数据多得像洪水一样冲进来。李凌霄,也就是IDC中国软件行业研究的经理,那天在广州也说了,报告里写得明明白白,生成式AI把企业的数据量推得飞快。 到了2028年,光是新生成的这些数字就得堆到393.9ZB那么多,尤其是企业那边的数据特别显眼。这几年AI技术到处用,给了企业一种新本事,能从一大堆数据里挖出有用的信息。比如那个叫数字孪生的技术,一直在进步,现在造东西、开车、飞上天、看病还有公用事业,好多行业都在用这个。再加上物联网帮忙,AI的准确度跟实际用处都提高了。 就在那天,OceanBase开了第三届开发者大会。那个《IDC数据库前沿趋势白皮书》也说了个事,数据量涨得太快了,企业的仓库装不下了。以前说结构化的数据能存PB级就算很大了,现在大家都觉得这得往EB级上冲才是常事儿。 李凌霄接着吐槽说,老一套的存储办法碰上这么多数字可不行。读写速度慢下来不说,存东西的钱还得翻倍花。搞管理的人头疼死了,事儿也多得数不过来。虽然现在的GenAI技术越来越好用,企业也慢慢明白了它能帮着干活更快更省事。所以很多公司都把AI当成了战略大棋的一部分,赶紧准备把AI装上去。IDC搞的全球调研也显示出来了,有37%的受访企业把2025年的钱袋子都用来买AI了,跟省IT运维成本并列第一。 怎么把AI和数据库这些东西揉在一起呢?李凌霄给大家支了几招:先排排队看谁重要先干谁、分几个阶段来搞、选个开放点的架构、把队伍能力重新弄一下、还有早点想好未来的路怎么走。他说升级基础设施的时候就得盯着AI会对数据库提啥要求,别等到全弄好了再去配AI,得一起动手。 蚂蚁集团的CTO何征宇也出来说了说心里话。他说互联网上那海量的数据造就了现在的大模型,但是大模型老是闹幻觉也是因为数据有问题。他觉得幻觉的本质其实就是缺数据,“提供更好的数据是解决幻觉的源头”。何征宇还指出大模型的能力上限主要看数据好不好。现在还有四个坎儿过不去:一是拿钱买数据太贵了;二是正经的行业数据太少又不好流动;三是多模态的数据太难处理;四是不知道怎么评测数据质量行不行。 面对大家的真实需求,OceanBase也在琢磨怎么升级。他们想把一体化数据库变成一体化的数据底座,用一套引擎就能同时应付TP/AP/AI这三种混合的活儿。支持向量数据库以后,就能用SQL和AI混着检索了。中国联通那边负责OceanBase研发的邱永刚也提了个醒:随着大家学的东西越来越多,向量库的体积也会变得巨大无比。这就逼着我们一方面得把检索算法搞得更牛叉,另一方面还得靠硬件撑着才能扛得住海量的检索请求。