2022年6月第4卷第2期Jun.2022Vol.4,No.2
智慧农业(中英文)Smart Agriculture
中国饲料营养大数据分析平台研制
熊本海1*,赵一广1,罗清尧1,郑姗姗1,高华杰2
(1.中国农业科学院北京畜牧兽医研究所动物营养学国家重点实验室/中国饲料数据库情报网中心,北京
100193;2.北京大北农科技集团股份有限公司,北京100080)
摘要:饲料粮缺口的逐渐加大,导致中国饲料粮安全问题逐步转化为粮食安全问题。因此,全面整合饲料营养基础数据资源,提高一切可利用饲料资源的营养价值,成为中国今后长期保障国家粮食安全的技术措施之一。本研究依据16类中国饲料原料描述规范和属性数据标准,全面用数字化模式收集整理了自“六五”至“十三五”期间累积的50万条以上已有饲料资源的种类、空间分布、饲料成分含量及营养价值特性数据,利用MySQL网络数据库及PHP程序语言,开发了新一代饲料营养大数据分析平台(http://www.chin⁃/)并提供Web数据共享功能。首先,平台提供所有入库数据的可视化分析,可实现单个或多个饲料多种养分和多种图形模式的直观比对。通过二维码技术提供所有饲料营养属性数据及饲料实体样本溯源数据的移动端实时分享与下载服务。其次,平台构建了通过已知饲料概
略养分在线预测其他有效养分的回归模型,为饲料原料养分变异提供动态分析。最后,平台基于地理信息系统技术,将饲料概略养分和主要矿物元素含量数据与其所处的地理位置分布相结合,实现了饲料营养数据地理信息图谱的分布查询及对比分析,同时提供各种数据的下载方式,为已有饲料数据的全面应用带来便利。研究表明,拓展饲料资源数据并提供饲料养分的预测分析模型,可最大化利用已有饲料养分数据的价值,进一步嵌入各类饲料配方的网络计算模块,可以达到饲料营养数据的一站式服务及数据的最大化升值服务。
关键词:饲料粮;饲料营养数据;大数据;数据挖掘;GIS;饲料安全
中图分类号:S816;TP311文献标志码:A文章编号:SA202205003引用格式:熊本海,赵一广,罗清尧,郑姗姗,高华杰.中国饲料营养大数据分析平台研制[J].智慧农业(中英文), 2022,4(2):110-120.
XIONG Benhai,ZHAO Yiguang,LUO Qingyao,ZHENG Shanshan,GAO Huajie.Development of China feed nu‐trition big data analysis platform[J].Smart Agriculture,2022,4(2):110-120.(in Chinese with English abstract)
1引言
中国是世界第一饲料生产大国。2020年,中国是全球饲料产量占比最高的国家,达20.21%。其中工业
饲料产量为2.53亿吨,同比2019年增长10.4%[1]。但是,随着中国规模化养殖业的发展,满足工业饲料加工所需的饲料原料缺口正不断扩大。以2021年为例,中国进口粮食总量达1.65亿吨,其中大豆进口总量达9652吨,玉米、小麦、大麦及高粱的进口亦增加到2835万、977万、1248万及942万吨,同比2020年分别增加152.3%、16.6%、54.5%及96%。同时,进口鱼粉182.3万吨[2],进口各种蛋白杂粕包括葵花籽粕、菜籽粕、棕榈仁粕、椰子仁粕及少量豆粕等
doi:10.12133/j.smartag.SA202205003
收稿日期:2022-05-09
基金项目:科技部数据平台项目(NASDC2022XM02);“十四五”国家重大科技攻关项目(2021YFD2000800);重庆市技术创新与应用发展专项重点项目(cstc2019jscx-gksbX0091)
*通信作者:熊本海(1963-),男,博士,研究员,研究方向为智慧畜牧业。E-mail:
熊本海等:中国饲料营养大数据分析平台研制Vol.4,No.2
达500万吨以上。此外,还有油菜籽、芝麻、亚麻籽等。这些进口原料加工后的副产品都可作为饲料原料。能量饲料玉米自2020年以来缺口逐渐扩大,特别是2021年进口量上升到近3000万吨[3]。中国饲料粮安全问题正逐步转化为国家粮食安全问题。饲料用粮和工业用粮总量持续增长,占粮食总消费
量的比重不断提高,其中饲料用粮占粮食总产量的比重已由20世纪50年代的20%上升到当前的40%,预测到2030年这一比例将达到56.5%,超过粮食总消耗量的一半[1],将更加凸显中国粮食安全问题。
畜牧养殖业对粮食的硬性需求导致的缺口增加,全面推动了主要饲料原料玉米及大豆粕价格的快速上涨。面对世界能源问题及供应链不畅等挑战,一方面从宏观上布局调整中国“粮经饲”三元种植结构,将饲料作物的种植计划靠前部署;另一方面从微观上广辟饲料资源,利用一切可以利用的饲料原料,并通过饲料营养价值的精准评定、养分的充分挖掘及饲料配方的优化设计,提高饲料资源的利用价值,最终从宏观和微观角度全面保障中国今后一段时期内饲料粮安全。
中国饲料营养大数据分析平台始建于20世纪80年代,主要用于收集、整理并补测、补遗不断出现的新的饲料原料类型及主要养分,不断完善中国饲料营养数据资源。平台主要为饲料科学数据的升值利用提供服务,尤其为饲料配方的优化计算和饲料新产品的研发提供科技支撑,为各类大宗饲料原料以及尚构不成商品的非常规饲料资源的科学合理利用提供基础数据,缓解了中国饲料资源不断出现的缺口,受到行业的一致认可。中国饲料营养大数据分析平台的使命就是做好饲料营养数据的深层次挖掘和利用,可视化、多维度分析来自中国不同地域、不同类型的饲料原料及不同饲料养分的盈缺规律,为区域饲料资源的调度及饲料配方的优化设计提供大数据分析平台。2数据准备及来源
中国饲料营养大数据分析平台以中国饲料数据库情报网中心的门户网站www.chinafeeddata. org旧版数据为基础进行建设,数据来源包括国内饲料营养数据和国际饲料营养数据。其中国内饲料营养数据主要来源于从“六五”期间开始积累的饲料营养价值评定数据。以1983年国务院“电子计算机和大规模集成电路领导小组”下达并由原中国农业科学院畜牧研究所与原北京农业大学畜牧系共同主持的《畜禽饲料数据库及筛选猪、鸡最佳饲料配方技术的研究》研究课题(65-3-13)为起点;“七五”期间,通过国家科技攻关项目“中国饲料数据库软件开发(75-05-05-05)”建立了“中国饲料数据库”;1989年由当时农业部批准在中国农业科学院启动中国饲料数据库情报网中心工作后,每年收集、整理并补测、补遗典型饲料样品数据,不断完善已经发布的饲料成分表,包括最常用的畜禽饲料的概略养分及有效营养成分,以及针对不同畜禽的氨基酸消化率或经过校正的表观回肠利用率等数据,从1990年至2021年已连续发布了32版《中国饲料成分及营养价值表》[4-6];“十三五”期间,又增加了国家科技基础性项目——中国主要畜禽饲料资源分布调查及数据库构建(2014FY111000)[7]相关研究成果,包括覆盖中国31个省份的40种典型饲料原料,总共4047种(次)饲料样品的空间属性(所在县市、经度、纬度等)数据、概略养分及主要矿物元素含量数据等共约5万条记录。国际饲料营养数据来源主要参考了美国、日本、巴西、法国、俄罗斯等国家及知名饲料营养公司,如DEGUSSA、CVB等发布的饲料营养数据。
综合以上,本研究涉及总的数据记录达50万条左右,数据项达600万个以上。在数据制定标准和规范
方面,突破了国际上8大类饲料原料分类的局限性,在每一类饲料原料单个营养成分特性或多个营养成分组合特性的基础上,进一步细分出16个亚类,按国际都柏林核心元数据
111
Vol.4,No.2智慧农业(中英文)Smart Agriculture
(Dublin Core Element)标准,制定了16类中国饲料原料描述规范,形成了独具特的中国饲料原料分类法,突破了因中国饲料种类和加工工艺复杂造成的饲料养分数字化描述与分类建库管理的技术瓶颈。通过综合考虑饲料原料的有效能值、可消化和可代谢蛋白质、氨基酸及矿物质的评价方法及评价指标的演进,制定了16类中国饲料原料属性数据标准。
3平台研发路线及关键技术
3.1平台研发主要挑战
一是在数据加工方面,饲料原料营养成分数据受到产地、品种、加工条件和储存工艺等诸多因素的影响,在建设和使用中国饲料营养大数据分析平台时均需要准确体现数据的来源和背景。除从作者研究团队所主持项目获得数据外,还需大量收集、数字化整理相关文献中有关饲料资源的营养数据,增加相同品种及相同特性参数的样本量,不断扩充数据资源建设,拓展数据平台的基础数据量,使数据更
有代表性与参考价值。
二是在技术开发方面,需要深度挖掘饲料原料营养成分之间的相关性。饲料原料营养价值存在变异,平台中的数据是大量饲料原料样品的算数平均值,因此需要建立饲料原料营养价值的动态模型,根据饲料原料的概略养分数据,推测出需要开展动物饲养试验才能获得的有效养分数据,并将这些模型嵌入到平台建设中。
三是在数据安全维护方面,一方面用于平台建设的海量数据存储系统需能够提供高级别的数据保护并支持容灾功能。另一方面需研究饲料营养大数据平台的安全管理与共享技术,严格制定网络数据及档案数据的保密目录、期限、层级及解密的条件,确保数据的发布与共享符合国家相关要求。
3.2平台研发技术路线
如图1所示,饲料营养大数据分析平台的研发是以饲料营养数据的数字化整理为切入点,按
结构化数据库的构建方法建立网络数据库,将不同营养属性的数据项分别储存在不同的数据表中。例如,饲料采样描述数据表、饲料概略养分数据表、饲料蛋白质及氨基酸数据表、饲料氨基酸利用率数据库表、饲料微量元素及维生素数据表等。此外,因饲用对象不同而交叉构成针对不同畜禽的饲料营养数据库/表。每个数据库由数量不等的数据表组成,以形成“轻便”型数据库。
与饲料营养数据库构建对应的是用于数据分析模型库构建、可视化分析及地理信息系统(Geographic Information System,GIS)分析工具模块开发,以及数据结构或中间件的设计。基于构建的数据库/表及数据结构或中间件,可在线开展针对养分数据及其组合的可视化分析与输出、饲料养分及其组合的GIS图谱分析等,从而构成中国饲料营养基础数据的大数据分析平台,更好地满足数据用户对数据深度分析的需求。
3.3平台总体架构
如图2所示,平台总体架构包括饲料营养属性数据数字化和饲料样品空间数据数字化两大部分。其中饲料营养属性数据数字化架构包括属性数据标引、属性数据数字化、属性数据入库及属性数据可视化。另一方面,饲料样品空间数据数字化架构包括空间数据标引、空间数据数字化、空间数据过滤及空间数据入库。平台通过提供所有入库数据的可视化分析和比对,利用GIS
分析图1饲料营养大数据分析平台研发技术路线Fig.1Technical route of China feed nutrition big data
analysis platform
112
熊本海等:中国饲料营养大数据分析平台研制
Vol.4,No.2
技术将饲料养分查询和空间分布查询同步融合,最终可实现饲料种类或品种的全国地理信息专题图分析,指定饲料全国地理信息专题图分析,指定省份全饲料种类地理信息专题图分析和指定省份指定饲料种类地理信息专题图分析。
3.4平台建设的关键技术
该大数据分析平台主要管理具有可描述的以数字型数据为主的饲料养分数据。
(1)数据管理方法。大数据分析平台数据库设计采用了MySQL8.0.28中文版网络数据库。该数据库中提供了多种数据库存储引擎,适用于不同的应用场合,用户可以选择合适的引擎以得到高性能服务体验,且支持多种目前流行的程序设计语言,包括C 、C++、Java 、Perl 、PHP 等。平台开发采用PHP 语言,该语言是一种通用开源脚本语言,吸收了C 语言、Java 和Perl 的优点,利于学习,使用广泛,主要适用于Web 数据库开发领域,与数据库的接入性能优越,管理高效。
(2)数据分析方法。首先是原始数据的直接可视化对比法。例如,同一饲料不同类别下不同养分的对比,如饲料的概略养分图谱、蛋白质及氨基酸图谱、氨基酸利用率图谱和矿物元素图谱等,表现形式有曲线、直方图和柱形图等。通过可视化对比,可直观地反应出同种饲料原料营养成分数据因产地、品种、加工条件和储存工艺的不同而造成的影响。其次为模型分析法,主要是通过已知养分去预测未知养分。采用的典型模型有多元线性回归模型、单因素正交多项式回归模
型等。这些方法是大样本多元数据分析的主要方式。由此建立的动态模型,可有效预测饲料原料营养价值中存在的变异,尤其是可提供有效养分数据而不仅仅是属性描述数据,推动了数据的升值化利用。
(3)数据查询方法。首先面向数据平台全局查询的方法是全文检索法,可实现对检索数据库全记录内容的全覆盖检索,包括字符、中文及数据等。其次是二维码查询技术,便于推送转移查询到的数据、文字及图片;三是基于GIS 技术的查询[8],主要实现将指定饲料的属性数据与对应的空间位置数据融合,实现数据特性的空间分布查询,获得各种不同类型的专题图。例如,全国玉米、小麦、大豆等某指定养分盈缺特性空间分布图等。
(4)GIS 分析平台支撑系统。该系统以“百度专网地图(Du Geographic Information System ,DUGIS )”中的WEB GIS 模块为基础[8]。该系统在时空数据服务、空间可视化分析服务、数据管理等方面具有明显优势,可满足饲料营养大数据空间分析,尤其可为饲料样本营养成分的空间分布属性及特定养分的盈缺规律分析提供技术支撑。
(5)数据的二维码转换技术。采用快速反应(Quick Response ,QR )码技术,它除具有比一维条码及其它二维条码所具有的信息容量大、可靠性高、可表示汉字及图象等多种文字、保密防伪性强等优点外,还具有超高速识读及全方位识读等特点[9],可满足饲料成分及图谱的识别与溯源。在便利化数据共享及下载方式的同时,可分类、分级限定发布及分享的内容,为饲料营养大数据平台的安全管理提供可靠技术保障。
4平台主要功能
首先,平台提供了所有入库饲料养分数据的
可视化分析,可实现单个或多个饲料多种养分、多种图形模式的直观比对。同时,通过二维码提
供了所有饲料营养属性数据及饲料实体样本溯源
图2中国饲料营养大数据分析平台架构图
Fig.2Architecture diagram of China feed nutrition big data
platform
113
Vol.4,No.2
智慧农业(中英文)Smart Agriculture 图片的移动端实时分享与下载。其次,平台构建了通过已知饲料概略养分在线预测其他有效养分的回归模型,为饲料原料养分变异提供动态分析。最后,平台基于GIS 技术,将饲料概略养分和主要矿物元素含量数据与其所处的地理位置分布相结合,实现了饲料营养数据地理信息的分布查询及对比分析。
4.1饲料养分的在线可视化分析
4.1.1
单个或多个饲料养分含量的图谱分析图3所示为选取单个饲料——玉米的氨基酸
组成图谱在线分析,可一目了然地判断单个氨基酸的盈缺规律,同时获得的图形既可以以文件方式下载,也可以扫描下方的二维码将图片转移到手机上贮存,方便用户分享图谱。此外,也可以同时选取多个饲料并指定多个养分进行比较分析。如图4所示,指定了4种饲料原料(玉米、膨化玉米、小麦及黑麦)6种氨基酸的猪表观回肠消化率(Standardized Ileal Digestibility of Ami ‐no Acids ,SIAA )数据的对比,输出的图形模式可事先选择折线图、柱形图等。依此类推,可开展其他养分的多个饲料的各类比较分析。
4.1.2基于二维码的属性数据及溯源查询
基于饲料样本的采集场景图片与测试数据,本研究构建了基于二维码的数据及图片查询系统,便于对样品来源的养分数据查询与溯源,方便随时调用。系统为每个饲料样本生成了对应的
二维码,通过二维码与后台数据库互联互通,一旦数据库中数据修改或追加后,通过扫描如图5所示的二维码,即可调用包括图片的饲料属性数据进入手机移动端。4.1.3
主要饲料原料养分变异动态分析图6展示了饲料数据库中163个大豆粕样品中粗蛋白及粗纤维的动态变异分析。其中包括了美国国家研究委员会(National Research Coun ‐
cil ,NRC )2012年发布的《猪营养需要量》
[10]
中的大豆粕数据及法国国家农业科学研究院(Institut National de la Recherche Agronomique ,INRA )2008年发布的“饲料成分及营养价值
表”[11]
中的数据。图6较好地反映了随大豆品种
及其加工浸提及去皮技术的提升,粗蛋白含量稳步提升,最高值达到48%左右。相对而言,粗纤维的含量波动较大,但主要集中在6.5%左右,
按统计学分析处理后,营养成分表中的粗纤维数
mysql下载哪个版本好2022图3单个饲料(玉米)指定系列养分(氨基酸)指标的图谱动态分析
Fig.3Dynamic analysis of several specified nutrients (amino acids )in a single feed (corn
)
注:以猪饲料氨基酸标准回肠消化率为例
图4多个饲料指定系列养分指标的图谱动态分析Fig.4Dynamic analysis of multiple specified nutrients in
several feeds
114
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论