集创赛的智能垃圾分类系统

集创赛的这个设计项目叫智能垃圾分类系统,名字是王智鹏、李文斌和李国勇他们做的,单位在中国科学院 成都计算机应用研究所和中国科学院大学。它有几个亮点。 第一个亮点是架构设计,核心是FPGA并行计算加上STM32控制决策。前端用OV5640传感器抓1024乘768分辨率的视频数据,然后把数据存到SDRAM里,中间要用FPGA里的FIFO缓存一下。图像分成两路处理,一路是HDMI输出到显示器让人看,另一路进入FPGA做预处理。预处理包括滤波去噪、边缘锐化还有下采样压缩。 第二个亮点是图像预处理,主要是解决垃圾图像里椒盐噪声和高斯噪声的问题。中值滤波先把RGB三通道都处理一遍,用3乘3的滑动窗口,这样能把边缘模糊率控制在5%以下,还能保留纸张褶皱和塑料瓶的轮廓。Sobel算子做边缘锐化,把梯度幅值算出来和原图像叠加,能增强果皮纹理和腐烂边缘这些特征。双线性插值把1024乘768的图压缩到32乘32,用邻近4个像素的灰度加权平均来算新值,这样既减少数据量又不产生锯齿效应。 第三个亮点是轻量化CNN模型设计和INT16量化。为了适配FPGA的计算特性和板载带宽限制,把LeNet网络剪短了,只留了1个卷积层和2个下采样层,把全连接层拓展到了3层。这种做法在降低计算量的同时强化了全局特征整合能力。模型用INT16量化策略把所有参数和中间输出都转成16位有符号整数,引入了伸缩变化因子和逐层缩减因子来控制数据范围在安全值内。 第四个亮点是实验结果,准确率达到了83.33%,延迟只有40毫秒。在Kaggle的Garbage Dataset数据集上做了测试。这个异构轻量化CNN验证损失稳定在0.9左右,验证准确率升到了70%左右,在四个对比模型里是最高的。资源占用方面,FPGA的LUT、FF、DSP这些利用率都没超过45%,CLB利用率到了90%,给以后扩展留了空间。 最后一个是结论和展望。以后可以从多模态感知融合、低功耗优化还有硬件IP核定制化这些方面继续研究,提高系统的鲁棒性和能效比。参赛海报就是这个样子了。