68备件需求预测方法研究
备件需求预测方法研究*
Research on Spare Parts Dema n d Forecasti ng Method
龙灏向静文晋旭博(北京交通大学,北京100044)
摘要:备件在各领域中都起着至关重要的作用,对企业各种备件需求的可靠预测可以节约成本,提升企业的经济效益。
研究采用随机森林、线性回归、XGBoost、AdaBoost、梯度提升树和模型融合6种算法,根据备件的历史信息对其进行需求预测,该研究根据多种人工智能算法进行实验,为备件需求的预测提供了相关的解决思路。
关键词:备件;需求预测;人工智能;模型融合
Abstract:Spare parts play a vital role in all fields.Reliable prediction of various spare parts demand can save costs and improve economic benefits of enterprises.In this paper,six algorithms including random forest,linear regression,XGBoost,Ad-aBoost,gradient lift tree and model fusion are used to predict the de
mand of spare parts according to their historical infor-mation.Experiments are conducted based on various artificial intelligence algorithms,which provided relevant solutions for the prediction of spare parts'demand.
Keywords:the spare parts,demand forecasting,artificial intelligence,model integration
在如今的经济社会中,企业间的竞争愈加剧烈,能够合理地利用资金产生更大的经济效益,对于企业具有重大的经济意义。通过备件需求的预测以及通过调节备件需求的关键影响因素来决定未来的备件需求,企业决策部门可以及时掌握备件的需求趋势,做岀合理的购买计划以及资金调配,有利于节约资金成本,减少浪费,提高企业经济效益。
由于现实条件下,影响备件需求的因素大量且复杂,传统方式的分析处理,不仅难度大,而且预测结果并不准确遥因此,针对复杂条件下备件需求特征,研究备件需求变化规律,提岀准确有效的备件需求预测方法,为决策者做岀科学合理的购买计划和提高企业部门竞争能力具有重要意义。
1研究现状
1.1机器学习
机器学习是用于解决人工智能领域问题的主流方法,一直不断地取得发展。机器学习一共分为三种类型:
有监督学习、无监督学习和强化学习。
有监督学习是通过使用带有标记的数据集样本进行训练,得到一个机器学习模型,然后通过这个模型进行预测。通过返回类型分为回归问题和分类问题,回归问题返回的结果是一个实数,而分类问题返回的结果是一个类别值。
无监督学习没有进行训练的过程,通过使用机器学习算法对样本数据进行分析,获得一些知识。无监督学习主要分为聚类和数据降维两种类型。强化学习是一种特殊的机器学习算法,根据当前状态决定下一步该做什么,然后又进入一个新的状态,如此反复。
1.2需求预测
目前的采购方法大多是传统依靠公司人员进行判断,架构较不合理,需求预测的方式人为猜想占多,造成预测结果准确率较低,采购过程缺少协同控制制度,以致使库存不足或者积压。随着科学技术的发展以及信息化的普及,供应链得到了技术的支持,如果能够合理地利用这些技术,科学地得到需求预测结果,就可以控制成本,在激烈的竞争环境下赢得竞争的主动权。
2实验算法概述
2.1随机森林算法
随机森林算法是由若干决策树共同构成,是基于Bagging 框架的一种集成学习方法。Bagging是由Leo Breiman在1996年提岀的一种集成学习技术,它是利用自助采样法,从最原始的数据集中随机有放回地多次抽取m相同个数样本,这样可以达到采样集和训练集样本数量相同但是内容不同。在预测输岀阶段,如果是分类任务,则采用简答投票法,将票数最高的种类作为输岀;如果是回归任务,则使用简单平均法,最终把值算术平均作为输岀。随机森林通过使用自助法对样本重新生成训练集,之后利用相关样本集自动生成k个分类树组合而成的随机森林,综合各棵决策树的输岀结果得到最终结果。
2.2 XGBoost算法
集成学习是通过把若干个弱学习器进行组合,最终得到一个强分类器,实现多个弱学习器共同做岀决策的机器学习方法。XGBoost算法是一种集成学习算法,它是把许多个决策树模型组合,最终形成一个强的分类器。通过集合不同模型的优势,获得效果优异,表现全面的强学习器。
XGBoost算法构建的强学习器形式如下式所示:
K
y i=F(x i)越移f k(x)(1) k=1
其中f k是第k次迭代得到的弱学习器必是样本点i的输入特征向量。在第k次的时候,目标函数如下:
n t-1
Loss"越移l(y,y+f k(x))+Q(f k)
i=1
因为XGBoost在正则化、并行处理、灵活性、缺失值处理、剪枝策略和内置交叉验证这几个方面的优势,所以算法的预测的能力很强。
1)XGBoost算法适应范围十分广泛。因为XGBoost不仅可以使用非线性的学习器,也可以使用线性的学习器进行组合,因
上海市科研计划项目(19511105003),项目名称:自动化集装箱装卸设备备品备件智能管理关键技术研究
《工业控制计算机》2021年第34卷第5期69
此可以解决回归问题和分类问题。
2) XGBoost 算法的模型学习效率较高。因为XGBoost 算法 会把特征进行分块并进行排序袁使得训练模型的时候能够并行 计算最佳分裂点,这极大地提高了学习效率。
3) XGBoost 算法十分灵活。用户可以根据需求,自定义评 估的函数和目标函数,但是此时目标函数需要二阶可导。
4) XGBoost 算法可以应用于特征值缺失的场景。当遇到特
征值缺失的样本时候,因为XG  Boost 算法内置了对于缺失值处 理的方式,所以训练模型的时候能够自主确定分裂的方向,这样 不仅可以减少计算量,还能够防止岀现过拟合。
5) XGBoost 算法具有较强的泛化能力。
由于在其目标函数中添加了惩罚因子,这样不仅可以控制算
法的复杂度,而且还能够防止在训练的时候岀现过拟合的现象。 2.3线性回归算法
线性回归(Linear  Regression )是通过使用线性回归方程 的最小平方函数建立自变量和因变量之间关系的一种回归分析
方法。如果只有一个自变量,则叫做简单回归;如果大于一个自 变量,则叫做多元回归。
最常使用的线性回归算法是基于最小二乘法,其模型函数 如下式所示:
y=X i1 *茁1+…+X in  鄢茁皂+0s
(2)
li-f.1 H
i :-T  lib  ■■■■:
:也IE
iWC-.l:
4 卜*,•汕1用:%
■Vr  ■■-心丹耳吟
|ii|
■if  i  W •ii 、.二T  i  -'-I  J
■3 i'总址 rTr*-7
屮扫妁址
•W 疋:「疽匸i :r
:-i  .:..'i..述 i :••吶下.:y.沁耳
••..:恰片芳
I  : t ;; s  :+;;
■1-■"■
巴;";:菽备 F  IIL. 亶It  冷F  im 花为*it L.忖沱I  •行「
HIT •忠十••--巾出+■ 址.;:;•也 j-•| r  •:- a
最小二乘法的原理是到实数向量茁以及标量茁0,使得j  与x i 的线性函数之间的误差最小,这样就可以通过式(2)来近似
Y 的每个元素J i ,但是由于现实条件下,大量的变量和复杂的变 量关系,导致不能通过猜测的方法取得茁的值,所以一般是进行 求解最小化问题,然后得到属性乘子,也就是到使得均方误差 最小且不等于0的茁值。训练的过程就是到实数向量茁以及 常数茁0的数值。
2.4 Adaboost  算法
Freund  和 Sch  i  pare  于 1995 年提岀了 AdaBoost  算法。因
为AdaBoost 对每个训练样本都分配一个权重,所以在每次迭 代的时候都能够对权重调整,被分类错误的样本权重得到提升,
正确分类则减少权值,通过一个或几个简单分类器的投票获得 一个强分类器。 算法过程一般如下: 首先标记样本并进行权值初
始化,其中权值大小代表了样本在训练过程的重要程度,然后进 行特征选取,之后根据增大误判错的样本权值的原则,进行样本
权值更新,因此能够完成区分样本的目的,最后把这些特征组成
若干个相对较好的弱分类器,并将这些若干个弱分类器以级联 的方式组合得到可靠的强分类器。2.5梯度提升决策树
梯度提升决策树(GBDT )也是一种集成算法。它同样可以 用于处理回归问题和分类问题,是Boosting 系列算法中的一 种,它首先分步构建模型,然后对可微的损失函数进行优化从而
进行算法应用。
梯度提升决策树的思想来源于:Boosti  ng 可以解释为一个
基于合适的损失函数的优化算法。 梯度提升决策树的算法流程 如下: 首先初始化一个常数作为树的根节点且这个常数能够极 小化损失函数;然后计算损失函数的负梯度和估计回归叶节点
的范围,再通过线性搜索估计范围里面叶节点的值;最后更新回 归树,输岀最终的模型。
3实验过程
实验总共采用了七种算法对数据进行分析预测,其中一个 算法用于对备件需求因素重要性分析,六个算法用于预测备件 未来的月需求量,具体相关算法及其功能如表1所示:
表1算法列表及功能说明
悴法举務:
XGB.xse
•PT 喘求口成F 石性号苗
Rim  fjiuforgi :弋拘紡Ti.吁戎上
-A'r.-u
k 間各耳上
氏迫1為升1 M 灯AdiB.xsc
工KI  蒂 FI  ;:•£・
til :: :U
■iflliirfLR-.-.'-J.-
七拘紡Ti  •科或匸
3.1 数据预处理
如图 1 所示为数据样例。
图1数据样例图
实验中数据各字段的含义如表2所示:
表2数据字段表
;•:段夷••••••
-IA
Hrd HJI  H HJ  '■.•Il  •
i : Y1XF
n.nw 77S TJl-r.T 1VK.
TS-.T 2-ii-Li  ■rtiu.z  DJ  Lt
M-a G  BJJ^lJ'OmNCE
l-LHQ'-J  1 KJ  K  PH  H.ll'l-* 1 'rVC-H.K  PI'd  K ■'.Vi  |,! KIS  JR( :TbT_ -iiri :-1
t .:7_tmv
T"i :,-chriit_.-V"ir :ii  r: 卩J T-:l _.L ,--;_TTne ,. TT n rli  n ;w_r 、: r my  FVth;i •:t j_Pnc, 13J  V.OILx  leirp
正则化是最小化策略的实现
BJ  I A-:.:'1L-J ,O}!.C1:.lt.epaL  TjutJi
ltv.i :-ui  ■A ixiul . H  -4-d  i  I  :'■.:.;'■■'■■
卜;;H 诒
'J  "|i"< ■. s
丫 iih IICI s :*?
M.: •i|:."ii :|n  I. I' m -;
Tirihi-ziTircr- K.■:;nl #
S  ri :il ;r  Si :|#--.|icr  I  .■'iv.,P~-re
T 『妙Pric  S::!r--_:-Mr  Trxi!-p-;'r_i ::!5■:Alum. J»ii :jj :c
1-1 ■-
一■■咄左圧
1T
3.1.1 数据处理
由于实验数据包含有中文等非数值类型数据, 所以在训练 之前需要对这些非数值类型的数据进行重新编码。
在本实验中
70
备件需求预测方法研究
主要采用了独热编码(one-hot  encoding )对数据进行重编码, 将离散的特征值映射到了欧氏空间,这样就能够进行模型训练 了。处理后实验数据样例图如图2所示。
表 3 模型效果
I.MM  tO  Bwc  的.Am
LXS..BHI  ArUJjH *
*0
*T
i  r  i  t  i  ~
57ST
AM
1
ano *1 > < 11)KM
■ ■ « T  « »■ * « i  « ・■e-
+
ano
1 i  113
"Hr
R-jiidoriirorc-i-t T  ncar( ion
I. iiii-r  i.G 合
MSL
0.7':2^35
'.:1 i 'i  Hrd27
0.3.:>IS2
'.:14J? 71
O.511C6?
Il.5nj  1-19
II
图2处理后实验数据样例图
其中,模型的训练特征为:TIME,WZBM, BJSSBM, BJLB, BJMC, GGXH, JLDW, ZZS, BJCJ, BJPC,JSGF,BJCD,CG-
BZ,BJC 乙 FLAG,BJIMPORTANCE,BJHQND,BJKTH,BJPP, WORKTIME,WORKFORCE,BJ_Amount,KC_ENV,Pur-
chaJe_Amount,PurchaJe_TimeJ,PurchaJe_Factor,Pur- chaJe_Price,BJ_WORKTemp,BJ_WORKFORCE,BJ_Location, Repair_TimeJ,Repair_Amount,Repair_Degree,BigClaJJ, MediumClaJJ,SmallClaJJ,Maintename_TimeJ,mainte-
nance_ReJult,Supply,Supplier,LowPrice,HighPrice,
Store_coJt,TranJport_coJt  丄ack_coJtLAnnual_demandLBJCZL
BJ_Vulnerability,ConJumption ;标签数据为:demand 。3.1.2 训练集和测试集划分
实验中共使用了 175200条数据集,具体为4个备件4年内
每个小时的相关数据信息,每个备件的信息包括备件基本信息、 以消耗备件的历史任务量信息、备件的库存信息、备件的采购信
息、备件的工作环境信息、备件的维修信息、备件的分类信息、备 件的保养信息、备件的供应信息、备件消耗信息、备件的经济型和 脆弱性信息。实验中,训练集大小与测试集的大小的比例为4:1遥
3.2 算法模型训练部分3.2.1特征筛选
实验过程中,采用XGBoost 算法来评估特征的重要程度,
依据重要性因子大小对特征的重要性进行排序,筛选重要特征。
排序结果如图3所示:
图3使用XGBoost 对备件需求相关因素的重要性进行排序
3.2.2备件月需求量预测
实验过程中,使用随机森林、线性回归、XGBoost 、Ad-
aBoost 和梯度提升树以及模型融合六种算法进行备件的月需 求量预测,训练结果如表 3 所示。
表3中,MSE 为模型的均方误差,MAE 为模型的平均绝对
误差。
4 结束语
备件是各个领域都需要用到的物件, 对备件需求的可靠预
测能够极大地提高企业的经济效益。本文根据备件的历史信息, 采用六种算法对备件需求进行预测以提升实验的准确性。 对于
备件需求的预测,需要跟随算法的改进、不断运用新的算法模型 进行需求预测。
参考文献
[1] 赵明洲•基于深度学习的制造企业物料需求预测研究[D ] •长春:吉林
大学, 2020[2] 温宏博.A 公司的原材料库存管理改善研究[D ].长春:吉林大学,
2020
[3] 陈丽萍.数据挖掘技术在运营商供应链管理中的应用研究[D ].长春:
吉林大学,2020
[4] 栾丽华,吉根林.决策树分类技术研究[J ] •计算机工程,2004,30(9):
94-96,105
[5] 王奕森,夏树涛•集成学习之随机森林算法综述[J ].信息通信技术,
2018(1): 49-55
[6] 何毅,李斌,普轶,等•基于梯度提升树的烟草回潮机出料含水率预测
[J ].软件,2020,41(6):151-157
[7] 栾丽华,吉根林.决策树分类技术研究[J ] •计算机工程,2004,30(9):
94-96,105
[8] 叶涛,朱学峰,李向阳,等•基于改进k-最近邻回归算法的软测量建
模[J ].自动化学报,2007(9):996-999[9] 杜树新,吴铁军.Support  Vector  Machines  for  Regression%用于
回归估计的支持向量机方法[J ].系统仿真学报,2003,15(11): 1580-1585,1633
[10] Geurts  P,Ernst  D,Wehenkel  L.Extremely  randomized  trees[J].
Machine  Learning, 2006, 63(1):3-42
[11 ]Son  J,Jung  I,Park  K,et  al.Tracking  -by  -Segmentation  with
Online  Gradient  Boosting  Decision  Tree[C]// 2015 IEEE  In ­ternational  Conference  on  Computer  Vision  (ICCV).IEEE, 2015
[12]毛亚萍,房世峰.基于机器学习的参考作物蒸散量估算研究[J ].地
球信息科学学报,2020,22(8):1692-1701
[收稿日期:2021.2.26]
(上接第67页)
[2] P  Oza,V  M  Patel.One-Class  Convolutional  Neural  Network [J ].
IEEE  Signal  Processing  Letters,2019,26(2):277-281
[3] R  Chalapathy,A  K  Menon,S  Chawla.Anomaly  detection  using
one-class  neural  networks  [J  ].arXiv  preprint  arXiv:1802.06360,
2018
[4] P  Oza,V  M  Patel,Active  Authentication  using  an  Autoencoder
regularized  CNN-based  One-Class  Classifier [C ]椅2019 14th  IEEE  International  Conference  on  Automatic  Face  & Gesture  Recogaition  (FG  2019),IEEE,2019
[5] P  Schlachter.Deep  One  -Class  Classification  Using  Intra  -
Class  Splitting  [C ] //2019 IEEE  Data  Science  Workshop  (DSW), Minneapolis,2019:100-104
[6] Y  Yang,C  Hou,Y  Lang,et  al.One  -Class  Classification  Using
Generative  Adversarial  Networks  [J ].I  EEE  Access,2019,7: 37970-37979
[7] S  H  Kim,H  Kim,J  Kim.GAN-Based  One-Class  Classification
for  Personalized  Image  Retrieval [C ]/2018 IEEE  International  Conference  on  Big  Data  & Smart  Computing.IEEE,2018:771 - 774
[8] Raghavendra  Chalapathy,Aditya  Krishna  Menon,Hanjay  Chawla.
Anomaly  detection  using  one  -class  neural  networks  [J ]. Computer  Hcience,avXiv: 1802.06360, 2018
[9] 陈光启•基于生成式对抗网络的图像风格迁移方法研究[D ] •北京:北
京邮电大学,2019[10] 庞丝丝.基于卷积神经网络的图像分类研究[J ] •现代计算机,2019
(23): 40-44
[收稿日期:
2020.12.30]

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。