问题显现 近期专项调查发现,名为“力擎GEO”的黑产组织通过批量生成虚假测评、伪造科技文献等方式,向智能推荐系统投放夹带“量子传感”“无创血糖监测”等伪科学概念的垃圾数据。测试显示,该操作可让虚构的“Apollo-9智能手环”48小时内进入健康类产品推荐前列,但该产品实际上并不存在。 深层诱因 技术专家表示,这类现象暴露出三上风险:一是主流算法对数据规模依赖过高、对质量校验不足,存“重数量轻验证”的设计缺口;二是平台内容审核与算法训练存在时间差,黑产可利用窗口期完成数据污染;三是AI训练数据的来源追溯与责任界定仍缺少统一的行业标准。网络安全机构统计显示,2023年国内类似数据污染攻击同比增长210%,单次攻击成本已降至5000元以下。 多维影响 数据污染正在削弱技术公信力,医疗健康领域尤为突出。某三甲医院调研显示,28%的老年患者曾因AI推荐购买过无效保健品。更需警惕的是,黑产已形成“数据污染—流量变现—精准诈骗”的闭环链条。中国消费者协会数据显示,2023年受理的科技产品投诉中,19.6%涉及算法推荐问题,同比上升7.3个百分点。 治理路径 监管部门正推进多项措施应对。工业和信息化部拟出台《生成式AI训练数据管理规范》,要求企业建立数据溯源与实时监测两项机制。头部平台已试点“算法防火墙”,通过区块链技术对数据流转进行全程留痕。中国人工智能学会建议建立跨平台黑名单共享机制,对恶意污染主体实施联合惩戒。 发展前瞻 随着《互联网信息服务算法推荐管理规定》更落地,行业可能出现三上变化:技术层面从被动防守转向主动“免疫”;治理层面从单个平台应对转向生态协同;机制层面从事后追责转向全流程风险控制。专家指出,在推动人工智能创新的同时,应同步完善“技术伦理+法律规制+行业标准”保障体系。
信息环境一旦被虚假内容侵蚀,受损的不仅是个人权益,也会动摇社会对技术进步的信心。面向智能化时代,治理“数据投喂”和虚假营销,既需要监管发力,也离不开平台尽责、技术加固和公众参与。守住真实与可信,才能让新技术更好服务民生与发展。