人工智能:基于集成学习的温室育种智能决策算法
来源:未知 2020-09-15 23:21
我国传统农业管理粗放,导致作物,尤其是温室育种生成效率低,进而影响种植产量。本文针对温室种植自动化程度低的情况,提出利用传感器采集多源种植环境数据,结合机器学习方
人工智能:基于集成学习的温室育种智能决策算法
摘要:我国传统农业管理粗放,导致作物,尤其是温室育种生成效率低,进而影响种植产量。本文针对温室种植自动化程度低的情况,提出利用传感器采集多源种植环境数据,结合机器学习方法,进行基于集成学习的温室育种智能决策,不仅可以融合多源种植信息,还可以自适应调整各信息源的权重。实验表明,所提方法可提高温室育种成活率,对提高农业的经济效益有很大的现实意义。
关键词:智能决策;多源信息;集成学习
0 引言
我国农业精细化主要依靠温室培育,温室培育可为农作物生长提供较优越的生长环境,进而通过温室培育可以提高农作物产量和质量,提升现代农业国际竞争力。温室育种是温室培育最重要的环节,其直接影响农业的发展,但是温室育种需要更为精细的生长环节控制,然而目前温室管理水平相对落后,自动化程度较低,对生长环境调节主要依靠人工调控,使得效率较低且浪费资源。
鉴于以上情况,对温室育种环境通过传感器进行采集,将获得的多源种植信息融合并对种植操作进行种植智能决策是很有必要的[1][2][3][4]。然而在目前的农业智能决策系统存在的主要问题是,农业种植信息为多源异构数据,其涉猎学科较广泛,包括气象学、化学、生物学等学科。与此同时,农业种植信息有很强的相关性,例如温度和湿度都是共同影响植物生长,其内在相辅相成。因此,利用人工智能机器学习方法将多源异构农业种植信息结合,使得农业知识得到有效利用,并帮助进行智能决策,是亟待解决的难题。
目前,国内外存在相关研究将多源异构信息进行融合。信息融合主要有三类:数据融合[4],决策融合[8],特征融合[6][7]。数据融合是将数据先进行融合,再进行运算。尽管数据融合时,对数据损失小,但是直接融合导致数据维度过大,会计算难度增加。决策融合即对每类信息分别决策,再进行融合,尽管可以减少计算量,但是忽略了信息之间的关联。特征融合,即将信息在提取特征后进行融合,尽管会有少量的信息损失,但是可以考虑信息之间的关联关系,适合于多源异构的农业种植信息融合。因此,本文设计了基于集成学习的温室种植智能决策算法,可以对多源信息在特征层面上进行融合,并考虑多源信息的相互关联性,且其融合权重可以自适应改变,以完成温室育种的智能监测与控制,实现温室育种的智能化,实时性、以及低成本等需求,提升农业种植智能化。
1 基于集成学习的温室育种智能决策框图
为弥补人工育种环境控制的不可靠性以及节约人力资源成本,使得通过传感器采集种植环境信息,结合机器学习,对多源环境信息进行融合并决策,同时考虑多源信息的权重自适应性,来控制温室育种。因此,本文提出基于集成学习的温室育种智能决策算法,旨在将多源种植信息融合并为温室育种进行智能决策。
图1给出基于集成学习的温室育种智能决策的系统框图。首先,为了获取温室育种环境信息,从多种温室种植信息传感器获取种植环境信息,如土壤含有微量元素的量(氮元素、磷元素等),温室二氧化碳浓度、湿度、温度等。然后,将传感器获取的数据上传到上位机,将采集数据进行清洗预处理,再通过集成学习建模,可以对多源信息进行融合并自适应选择融合权重,最终完成智能决策算法的设计以判断对温室育种的处理,例如加水、施肥、通风或调解温度等。
2种植环境信息采集及预处理
为保证数据准确性,减少采集误差,将在育种试验田中,同种类传感器布局n个。将每类传感器采集的种植环境信息,上传到上位机中,再对每类种植信息进行预处理。
每类传感器为n个,同一时刻返回测量值为n个,则同类数据A的同一时刻平均值为
。 (1)
由于各类传感器采集数据单位不同,现利用平均值将每类采集数据量化到[0,1]范围内。
3基于集成学习的温室育种智能决策算法
为针对多源种植信息对育种进行某种操作,如加水、通风或者调温,将单一操作看为分类问题[10],由于专家不能在每一时刻,都全部标记出是否应该进行某项操作,则采用构建拉普拉斯图,完成半监督的分类决策[11][12],表示为
(2)
其中, 表示希尔伯特空间, 为铰链函数, 表示流形的光滑程度, 为分类器的复杂程度。
由于需要融合多源种植信息,则需要对每类信息构建拉普拉斯图模型,结合温室种植信息,以及专业人士标记信息,利用基于集成学习的流形学习下的Laplician支持向量机进行分类决策判断,其公式为
(3)
其中, 为某一时刻的传感器值,由于为多源信息采集,则对每一类信息的传感器值,例如t时刻的 构建拉普拉斯图, , 为第k类种植信息, , 为平衡参数,加入 为防止过拟合。最终,采用迭代优化的方法[11]来求解此分类问题。此模型可以直接求解出不同信息源对于某项种植操作的分配权重,进而在基于集成学习的模型下完成多源种植信息融合并进行智能决策。
4实验结果与分析
4.1实验设置
实验对象为某公司温室育种试验田,其育种植物为苜蓿草,已知苜蓿草育种最优生长条件为:1) 温度范围在14℃-21℃之间;2)湿度范围在50%-70%之间;3) 最湿度范围在60%-80%之间。本实验在温室育种试验田布局30个种植信息采集子节点,每个节点安装温度、湿度、二氧化碳浓度采集传感器。此次实验以一小时为时间间隔进行数据采集,共采集三十天,因此,总共采集七百二十次,每类种植信息也为七百二十次。
为验证所设计智能决策算法的准确性,要求农业领域温室育种专家根据不同时间采集的多源种植信息,进行操作标记,分别对是否加水,是否通风,是否改变温度进行“0”或“1”标记,“0”表示在某一时刻不需要进行某类操作,“1”表示在某一时刻需要进行某类操作。雇佣三名专家进行数据标记,每次操作结果有两人或两人以上判别相同,则将此结果定为人工判断操作结果。
4.2实验结果与分析
由于实验以半监督学习为基础而设计的基于集成学习的温室育种智能决策,则根据训练数据的多少而进行准确度判定,如表1所示,训练数据的个数由50,100,150,200,250,300,350变化时,每类操作的决策准确率。对比方法采用传统的支持向量机方法,利用单一信息源进行决策操作结果,再结合三种信息源的决策结果进行融合,以少数服从多数原则进行三种决策结果融合。
表1-(1)决策是否加水的准确率
Table.1-(1) Accuracy of decision whether to add water
表1-(2)决策是否通风的准确率
Table.1-(2) Accuracy of decision whether to ventilate
表1-(3)决策是否调温的准确率
Table.1-(3) Accuracy of decision whether to regulate temperature
由以上结果可以得出结论,本文所提的基于集成学习的温室育种智能决策,以半监督分类问题进行建模,所设计的基于集成学习的方法不仅对多源信息进行融合,并且可以通过专家标记数据,进行很好的预测。同时,从实验结果可以看出,所提的方法在标记数据超过250个左右时候,其准确率有所降低,这说明所设计的模型采用半监督学习还解决了标记数据少的问题。而对比方法支持向量机的准确率是根据单一结果进行投票进行的,由于其是全监督方法随着训练样本的增加,准确率升高。与此同时,对于加水这项操作受温度和湿度影响,所以对于最终投票结果,其准确率高于通风这项操作的准确率,因为通风仅受二氧化碳浓度影响较多。基于此,也可得出结果,所设计的基于集成学习的多源信息融合决策方法优于单一决策判断再融合决策的结果。
为验证所设计方法采用多源信息融合的权重自适应的必要性,将权重设为平均分配和基于集成学习的权重自适应算法进行对比。由于实验采用三种信息源进行融合,因此对比方法平均权重方法,将权重分配为 。训练数据的个数设为200,得到如表2的权重平均与权重自适应决策准确率对比。
表2权重平均与权重自适应决策准确率
Table.1-(3) Weighted average and weight adaptive decision accuracy
由表2所示结果可以得出,所设计的基于集成学习的智能决策算法,可以将多源信息进行权重自适应融合是十分必要的,也符合农业种植多源信息之间存在依存关系,但是利用人工经验很难准确得各信息之间的权重关系,但是利用集成学习模型可以通过机器学习方法学习出多源信息融合的权重关系。
4.3讨论
作为智能决策算法,目前的应用多数都是进行辅助决策,还是由人工根据决策结果进行辅助判断,由于本文设计的算法模型为硬分类,为方便进行人工辅助智能决策,将分类结果转换为判断概率,则为
(3)
因此,人工可根据概率 进行智能决策判断是否进行某种操作。
5结论
随着我国温室种植的发展以及智慧农业的提出,对于温室种植自动控制有很大的需求。因此,本文结合温室种植信息,提出了基于集成学习的温室育种智能决策,主要是通过分析育种种植的环境需求,结合机器学习和数学建模方法,利用种植专家的专业知识及经验,对温室育种操作进行专业化决策。
实验结果表明,所提方法适用于实际应用中专家标记过少,且可以权重自适应的结合多源信息进行智能决策。因此,本文所提的方法不仅对温室种植具有积极意义和应用价值,更是结合人工智能机器学习对智慧农业的推动。