基于决策树和随机森林模型的食品安全风险预警——以山东省食品添加剂为例摘要
食品安全是关系到国计民生的重大问题,加强对食品安全风险的评估和监管工作是食品安全监管部门的重要责任。加强食品安全风险的动态检测,进而破解食品安全难题,既是推进供给侧结构性改革、全面建成小康社会的客观需要,也是建设健康中国、健全公共安全体系的重要内容。然而对一个地区的食品安全风险状况进行评价和预警,是当前我国基层食品安全监管工作的一个热点与难点问题。因此,本文以山东省食品添加剂抽检数据为例,通过构建食品安全风险指数对食品安全状况进行评价,并通过构建决策树和随机森林模型对食品安全风险指数进行预警,据此提出降低食品安全风险的建议,对加强食品安全风险的事前预防,提高我国食品安全水平有着重要意义。本文以食品安全不合格度为基础,依据食品安全抽检数据的检测值和标准值,构建取值范围为0到1之间的食品安全风险指数,以此来衡量食品安全风险,并以2016-2019年山东省食品添加剂抽检数据为例,从食品类别、添加剂种类与所属地区的不同角度描述了食品安全风险指数的统计特征。据此,利用决策树和随机森林模型预测了食品安全风险指数,并对影响预测的变量包括食品分类、食品添加剂不合格项目、生产企业所在城市、被抽样单位所在城市、抽检季度与生产年份等的重要性进行了排序。在食品安全风险级别的评价方面,以平均食品安全风险指数为界,将食品添加剂分为高风险和低风险两类,构建决策树和随机森林预警模型并且利用SMOTE方法对随机森林进行了改进,取得了良好的预测效果。通过研究,本文发现,根据决策树分类模型,以食品添加剂风险指数为分类标准,可以根据食品分类和食品添加剂具体不合格项目的不同,将山东省抽检食品整体分为高风险和低风险两类,其中高风险食品具体包括三种情况,低风险食品具体包括两种情况。对于各类食品,二氧化硫、色素和乙二胺四乙酸二钠这三类食品添加剂均属于较高风险级别,需要加以重视。对于苯甲酸及其钠盐、防腐剂混合用量、甜蜜素、脱氢乙酸及其钠盐这些不合格项目,在餐饮食品、糕点、蔬菜及蔬菜制品、水果及水果制品、调味品这五类食品中风险较低,而在罐头、酒类、肉及肉制品、水产品这几类食品中风险较高。而对于糖精钠和山梨酸及其钾盐,在糕点、肉及肉制品、蔬菜和水果制品以及水产品中风险较低,而在罐头、酒类、餐饮食品、调味品这几类食品中风险较高。此外,根据食品安全风险指数的随机森林模型,食品分类和食品添加剂的具体不合格项目在对食品添加剂风险指数进行预测时的重要性显著高于其他变量。因此,这两项有必要在食品生产和检测等环节进行额外考虑,并且严加规定。在预测效果方面,经过SMOTE改进后的随机森林模型在正样本(低风险)和负样本(高风险)中的预测准确率以及整体的预测准确率都高于决策树模型,由此可以体现随机森林是一种高性能的机器学习模型。本文的创新主要体现在:构造了以食品安全抽检数据的检测值和标准值为基础的取值范围为0到1之间的食品安全风险指数,并充分利用了食品安全抽检数据,结合现状加入对食品安全风险有较强解释作用的预测因子,为实现对食品安全风险指数较为理想的预测效果,利用网格搜索和交叉验证的方法不断进行参数调优。此外,在食品安全风险级别的评价方面,以平均食品安全风险指数为界,将食品添加剂分为高风险和低风险两类,便于比较不同食品类别的食品添加剂风险的相对高低和对食品添加剂风险进行预警。在模型的优化方面,针对利用随机森林模型预测食品添加剂的安全风险等级过程中出现的过拟合现象,结合SMOTE算法对其进行改进,通过生成新数据对高风险分类样本和低风险分类样本进行平衡,既解决了过拟合问题,同时也提高了模型的预测精度和稳定性。
|
@ 2023 版权所有 中国地质图书馆 (中国地质调查局地学文献中心)
京ICP备 05064591号 京公网安备11010802017129号
建议浏览器: 火狐、谷歌、微软 Edge、不支持 IE