把ai 放进主观性那么强的评标环节肯定会有不少实际问题得面对:ai 打分准不准?算法会不会带偏见

青岛这次把Deepseek这个AI模型引进招投标了,用来辅助评标,这可是挺新鲜的事儿。住房和城乡建设局搞了个试点,想用AI给出个主观打分参考,还能实时告诉你打出来的分跟群体平均值偏了多少。听上去好像只是把技术用深了点,其实是监管思维上的大改变。这一招不光是让评标流程升级了,更是为了管住权力、堵住寻租的空子,给咱们破解这个老大难问题找到了个新路子。 评标的公正一直是大家心里的疙瘩,主观打分那部分最难管,因为没法量化又容易出猫腻。以前的监管多半靠事后查、靠举报,信息不对称不说,还得等事儿闹大了才知道。青岛这次的突破就在于,不再把AI当个单纯的数据处理机器了,而是把它变成了衡量主观判断的尺子和标准。Deepseek不光能按招标文件的要求直接算出AI给的分,还会附上理由给专家看;更绝的是它能盯着每个专家打出来的分和AI以及平均分会偏差多大,一旦发现不对就提醒你。 这设计挺巧妙的,没抢走专家法定的决定权,打分参考和偏离提示都是“参考”和“提示”,最后怎么判还是人说了算。但这种技术在场的实时监督就像把个紧箍咒戴在了头上,逼着大家干活时更小心点,谁要是想瞎打偏了就得有个合理解释。这就是典型的辅助不替代的定位,制度上想得挺周到。AI不是要让人脑子生锈不用动了,而是用技术撑腰让人有根有据地判断。专家要是不服AI给出的意见,就得拿出更硬气的理由来说服系统和监管部门。 这种机制其实是把那种摸不着头脑的主观裁量放进了坐标系里变得可比可查了。值得注意的是,AI的结果和专家的偏差都会被系统全程记下来推送给监管部门,这就变成了监管的线索依据。这下好了,监管不再是秋后算账那种事后诸葛亮的样子了。每一分打在哪儿、偏了多少、理由充不充分都被记下来留着查账。这种全流程的数字化管理把监管的准确性和威慑力都给拉满了。 站在大一点的角度看,青岛这次给公共资源交易领域的权力规范开了个好头。以前想管好专家的自由裁量权真难办:管得太死怕影响效率和专业水准;管得太松又怕滋生腐败。青岛的办法是通过技术划了条参考线。既让专家还有发挥专业判断的空间(不至于管死),又给他们套上了个“金箍”(让权力在阳光下运行)。 不过任何新东西刚出来总会遇到磕磕绊绊。把AI放进主观性那么强的评标环节肯定会有不少实际问题得面对:AI打分准不准?算法会不会带偏见?专家会不会太依赖提示或者不当对抗?这些都得在实践中慢慢摸索修正。但只要态度谨慎开放点(别犯教条主义),建个算法评估和风险防控的机制(随时查漏补缺),技术绝对是推动公平公正的一股积极力量。 等到“客观参照”的AI和“主观决断”的人能互动得好起来的时候(良性循环),每一项权力的行使都被技术的探照灯照着查的时候(透明公开),咱们就有理由相信招投标领域的阳光会更明亮更温暖(公平性更高)。青岛这步走得稳当又有远见头(战略眼光),给更多领域用数字技术规范权力提升效率(监管效能)提供了可以照着做的先例(借鉴)。