机器预测咖啡风味是不是很不可思议?但是真的存在!
导语:咖啡是世界上最常见的消费商品之一,精品咖啡更是以其丰富的口味吸引消费者关注。目前,只有经过认证的咖啡感官员才能提供精品咖啡豆的风味描述。然而,该类专业人士很少,而市场需求巨大。该研究以咖啡粉的近红外光谱为输入信息,研究训练机器学习(Machine-Learning, ML)和深度学习(Deep-Learning, DL)模型预测精品咖啡风味的可行性。成功的模型开发将为预测食品和饮料产品中的复杂风味提供一个新的客观框架。
咖啡是世界上最常见的消费商品之一,精品咖啡更是以其丰富的口味吸引消费者关注。目前,只有经过认证的咖啡感官员才能提供精品咖啡豆的风味描述。然而,该类专业人士很少,而市场需求巨大。该研究以咖啡粉的近红外光谱为输入信息,研究训练机器学习(Machine-Learning, ML)和深度学习(Deep-Learning, DL)模型预测精品咖啡风味的可行性。成功的模型开发将为预测食品和饮料产品中的复杂风味提供一个新的客观框架。
1. 采集来自14个国家的266个阿拉卡比咖啡,经不同方法处理及不同程度烘焙;
2. 样品经研磨,过筛后采集近红外光谱分析,光谱范围为700-2500 nm;
3. 经过专业咖啡感官人员对其风味进行分类,确定了9个风味类别;
4. 基于光谱数据,采用PCA、SVM及DCNN建立咖啡风味预测模型。
多风味预测模型采用集成学习。每个子模型解决一个风味类别的二元分类问题(Fig. 1), Y是每个Yi的拼接结果,集合模型的最终输出。PCA结果发现,近红外光谱和咖啡烘焙程度具有较高的相关性,但无法实现综合风味的明确识别(Fig. 2)。对九类咖啡风味预测的结果表明,采用集成SVM和ResNet101模型的准确率相似(78–79%),但ResNet101模型的召回率更高(70.65%)。为了提供更加客观的模型预测性能,去除酸味/发酵味和辣味外,开发的模型对预测7种风味类别更可行。深度卷积神经网络(deep convolutional neural network, DCNN)和支持向量机开发的模型取得了相似的性能,召回率和准确率分别为70–73%和75–77%。通过提出的可视化方法(聚焦图,Fig.3),展示了DCNN模型的高权重光谱区域、预测的风味类别和相应的化学成分之间的潜在相关性。
研究证明了将ML和DL方法应用于磨碎咖啡的近红外光谱预测精品咖啡风味的可行性。基于266个样本,有效模型对七种风味类别进行了适度预测,SVM和CDNN模型的正确率和召回率都超过了70%。分类和可视化结果表明,所建立的DCNN模型是一种很有前景的咖啡风味预测方法。该研究提出了一种新的、客观的预测精品咖啡复杂风味的方法,该方法可广泛应用于食品和饮料科学或工业中的其他风味预测。