集创赛的智能垃圾分类系统

集创赛的这个设计项目叫智能垃圾分类系统，名字是王智鹏、李文斌和李国勇他们做的，单位在中国科学院成都计算机应用研究所和中国科学院大学。它有几个亮点。第一个亮点是架构设计，核心是FPGA并行计算加上STM32控制决策。前端用OV5640传感器抓1024乘768分辨率的视频数据，然后把数据存到SDRAM里，中间要用FPGA里的FIFO缓存一下。图像分成两路处理，一路是HDMI输出到显示器让人看，另一路进入FPGA做预处理。预处理包括滤波去噪、边缘锐化还有下采样压缩。第二个亮点是图像预处理，主要是解决垃圾图像里椒盐噪声和高斯噪声的问题。中值滤波先把RGB三通道都处理一遍，用3乘3的滑动窗口，这样能把边缘模糊率控制在5%以下，还能保留纸张褶皱和塑料瓶的轮廓。Sobel算子做边缘锐化，把梯度幅值算出来和原图像叠加，能增强果皮纹理和腐烂边缘这些特征。双线性插值把1024乘768的图压缩到32乘32，用邻近4个像素的灰度加权平均来算新值，这样既减少数据量又不产生锯齿效应。第三个亮点是轻量化CNN模型设计和INT16量化。为了适配FPGA的计算特性和板载带宽限制，把LeNet网络剪短了，只留了1个卷积层和2个下采样层，把全连接层拓展到了3层。这种做法在降低计算量的同时强化了全局特征整合能力。模型用INT16量化策略把所有参数和中间输出都转成16位有符号整数，引入了伸缩变化因子和逐层缩减因子来控制数据范围在安全值内。第四个亮点是实验结果，准确率达到了83.33%，延迟只有40毫秒。在Kaggle的Garbage Dataset数据集上做了测试。这个异构轻量化CNN验证损失稳定在0.9左右，验证准确率升到了70%左右，在四个对比模型里是最高的。资源占用方面，FPGA的LUT、FF、DSP这些利用率都没超过45%，CLB利用率到了90%，给以后扩展留了空间。最后一个是结论和展望。以后可以从多模态感知融合、低功耗优化还有硬件IP核定制化这些方面继续研究，提高系统的鲁棒性和能效比。参赛海报就是这个样子了。