您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 信息化管理 > 基于机器学习对销量预测的研究
基于机器学习方法对销售预测的研究销售预测现状与痛点CONTENTS0102销售预测四大步骤03销售预测基本方法04销售预测效果评估方法与指标05某电商网站销售预测案例分享销售预测全景图供货链条送货时间、送货地点、是否包邮等物流市场营销促销方案商品减价、商品促销、组合销售等生成和采购合理安排生成和采购的时间节点,优化库存库存财务管理财务和会计实时反馈公司财务报表,监控公司资金流动管理销售预测的现状与痛点销售预测是完善客户需求管理、指导运营、以提高企业利润为最终目的商业问题。而预测的精确性是销售预测的核心痛点。销售预测的痛点商业环境因素众多,变化极快,难以及时把握和分析供应链整体水平低,导致货物积压严重产品定价、商品服务的单一性,导致企业竞争力小变化模式预测的基本思想预测是通过历史数据或其他外部因素构建模型、学习其变化“模式”,利用该“模式”对未来事物进行预测的一个过程。特点:短期预测的精度要远远高于长期预测。业务理论数据量假设销售预测体系框架销售预测现状与痛点CONTENTS0102销售预测四大步骤03销售预测基本方法04销售预测效果评估方法与指标05某电商网站销售预测案例分享收集数据确定预测对象、预测目标和需求;预测周期:短、中和长期需求与预测精度的权衡准确性与可解释性的权衡预测目标收集数据、整理指标体系数据描述与数据探索数据预处理评价指标算法的选择模型的训练与预测过拟合问题的处理建立建模RMSE、MAPE等定量评价指标AIC、BIC等模型评价指标需求探索开发完善预测的基本步骤预测目标预测对象:性质、结构、业务场景等预测时间:短期预测、中期预测和长期预测等精确性可解释性时间数据量少于5天大于4周或1个月短期预测长期预测中期预测介于两者之间业务目标:准确性和模型可解释性的匹配度数据探索对数据检查和理解:比如库存量为负值、星期数大于8等对结果变量的分析:包括分布、趋势性、周期性等对预测变量的分析:包括变量筛选、多重共线性、相关性数据预处理中心化和标准化缺失值处理:邻近插补、多重插补、线性插补等数据转换:取对数、Box-Cox变换离群点处理数据降维和特征选择:PCA、AIC/BIC等收集数据或理解数据数据搜集目标数据(内部数据、外部数据)额外数据:天气、经纬度、节假日、CPI指数等时期变量2015-05-2310.02015-05-2410.0…2016-05-099.82016-05-109.8时期变量2015-05-23NA2015-05-2410.0…2016-05-099.82016-05-10NA处理之前处理之后收集数据或理解数据数据预处理的缺失值部分处理缺失值的两大类方法:(1)直接删除缺失的预测变量(2)利用不同的方法对预测变量的缺失值进行插补,插补方法有:均值插补、多重插补、随机插补、K近邻插补、线性插补等。注意:一般对于带有时间戳的时序变量,考虑到变量的时效性和经济因素,通常采用邻近插补法或者线性插补。一个需要进行数据变换的原因是去除分布的偏度。一个无偏分布是大致对称的分布,这意味着随机变量落入分布均值两侧的概率大体一致。数据变换一般有两种方法:(1)对数据做变换,如取对数、平方根或倒数(2)Box-Cox变换收集数据或理解数据数据预处理的数据变换部分销售预测现状与痛点CONTENTS0102销售预测四大步骤03销售预测基本方法04销售预测效果评估方法与指标05某电商网站销售预测案例分享主观预测专家法时间序列指数平滑法自回归移动模型销售预测的基本方法机器学习线性回归决策树随机森林xgboost神经网络支持向量回归时间销量销量时间根据过去经验专家法专家预测法:由专家根据他们的经验和判断能力对待定产品的未来销售进行判断和预测,通常有三种不同的形式:(1)个别专家意见汇集法(2)专家小组法(3)德尔菲法优点:简单、快速缺点:准确率低、受人的主观影响大指数平滑遵循“重近轻远”原则,对全部历史数据采用逐步衰减的不等加权办法进行数据处理的一种预测方法。基本公式:𝑦𝑡+1=𝑎∙𝑦𝑡+(1−𝑎)𝑦𝑡−1其中,𝑦𝑡是时间𝑡的时间值;𝑎是平滑常数,其取值范围为[0,1]。优点:简单、适合趋势预测、模糊预测缺点:准确率不高、需要趋势性较好的数据指数平滑法ARIMA模型是指将非平稳时间序列转化为平稳时间序列,然后将结果变量做自回归(AR)和自平移(MA)。自回归移动模型(ARIMA)训练集测试集机器学习算法模型参数模型评估特征筛选预测Y’值真实Y值YX样本数据销售量影响销售量的因素机器学习的实现流程使用机器学习的有监督学习对进行销量变化进行建模,依据建模结果来预测未来销量值。其实现流程如下:(X,Y)(4)模型选择,如随机森林、LASSO等[模型输出]x3x4x2····x4x1x6x5x3x1x6x5特征筛选特征筛选是一类预测变量变换的方法,通过这种方式,能够用更具有信息量的变量来构建模型,排除无信息量的变量的噪声干扰,提高模型稳健性。常用的特征筛选方法:(1)相关性等统计[阈值过滤](2)信息增益、信息增益率、基尼系数等[阈值过滤](3)向前、向后和逐步选择法,如AIC/BIC准则[最小值]原理简介:通过结果变量与预测变量直接建立线性关系数值型回归优点:模型可解释性强线性回归模型:广义线性模型线性模型随机分布指数分布、泊松分布等线性回归𝑌=𝜃0+𝜃1∗𝑋1+𝜃2∗𝑋2+⋯+𝜃𝑁∗𝑋𝑁Y为销量值,X为预测变量,N为预测变量个数,θ为参数激活函数激活函数:sigmod,log函数等缺点:只适用于线性规律逻辑回归原理简介:通过训练数据,形成if-then规则集合由根节点到叶节点的每一条路径构成规则对结果变量有主要解释作用的特征会先分裂形成规则回归树用平方误差最小化准则,节结点为单元内数值的平均值优点:可拟合非线性规律,计算复杂度较低缺点:容易出现过拟合决策树(回归树)妹纸评分:[0,10]五官端正是否身材好是否有钱是9否53不好7随机森林原理简介:是包含多个回归树的组合器输出的数值是由个别树输出的数值的平均而定优点:准确度高训练速度快容易做出并行算法可处理大量变量并评估变量重要性缺点:在噪声较大的数据上会有过拟合问题xgboostxgboost𝑔𝑖𝑓𝑡𝑥𝑖+ℎ𝑖𝑓𝑡2𝑥𝑖xgboost目标函数去掉常数项:𝑂𝑏𝑗(𝑡)=𝑛𝑖=112+𝛺(𝑓𝑡)找到那颗树𝑓𝑡,使得目标函数达到最优即可。原理简介:是基于传统的GBDT上做了一些优化的开源工具包,目前有python,R,Java版。优点:高速准确可移植,可以自己定义假设函数可容错神经网络𝑌=f(X)(非线性映射)原理简介:是利用一系列非线性回归,将预测变量映射到结果变量的一种方法。优点:准确度高训练速度快并行处理能力强缺点:需要大量的参数不能观察学习的过程,对结果难以解释支持向量回归(SVR)原理简介:是通过寻求结构化风险最小来提高学习泛化能力,实现经验风险和置信范围最小化,从而达到获得良好统计规律的目的优点:可以解决小样本情况下的机器学习问题可以解决高维、非线性问题缺点:对非线性问题没有通用解决方案,对核函数的选择非常敏感SVR最本质与SVM类似,都有一个margin,只不过SVM的margin是把两种类型分开,而SVR的margin是指里面的数据不会对回归有任何帮助。销售预测现状与痛点CONTENTS0102销售预测四大步骤03销售预测基本方法04销售预测效果评估方法与指标05某电商网站销售预测案例分享模型评估方法:k折交叉验证法K折交叉验证法–在k-折交叉验证中,初试数据被划分成k个互不相交的子集或“折”,每个折的大小大致相等。训练和测试k次。在第i次迭代中,第i折用作测试集,其余的子集都用于训练分类法。–准确率估计是k次迭代正确分类数除以初始数据中的样本总数。数据S1S2……Sk测试集训练集导出回归法评估精度模型评估方法:k折交叉验证法K折交叉验证法–在k-折交叉验证中,初试数据被划分成k个互不相交的子集或“折”,每个折的大小大致相等。训练和测试k次。在第i次迭代中,第i折用作测试集,其余的子集都用于训练分类法。–准确率估计是k次迭代正确分类数除以初始数据中的样本总数。数据S1S2……Sk测试集训练集导出回归法评估精度模型评估方法:k折交叉验证法K折交叉验证法–在k-折交叉验证中,初试数据被划分成k个互不相交的子集或“折”,每个折的大小大致相等。训练和测试k次。在第i次迭代中,第i折用作测试集,其余的子集都用于训练分类法。–准确率估计是k次迭代正确分类数除以初始数据中的样本总数。数据S1S2……Sk测试集训练集导出回归法评估精度𝑖=1(𝑦𝑖−𝑦𝑖)𝑖=1(𝑦𝑖−𝑦𝑖)𝑅𝑀𝑆𝐸=𝑛2𝑛–其中,𝑦𝑖为第i个样本的真实值,𝑦𝑖为第i个样本的预测值,n为样本量。–有时也用𝑀𝑆𝐸=𝑛2𝑛来评估回归模型的准确率,与RMSE效果相同。模型评估指标:RMSE(均方根误差)–RMSE–与分类模型不同,回归模型是对连续的因变量进行预测,因此判断回归模型的准确率需要考虑的是预测值与真实值之间差异的大小。模型评估指标:AIC&BICAIC准则是评估统计模型的复杂度和衡量统计模型拟合优度的一种标准:–𝐴𝐼𝐶=−2ln𝐿+2𝑝–其中L是在相应模型下的最大似然估计值,p是模型的变量个数。–增加变量的数目提高了拟合的优良性,但可能造成过度拟合的情况。AIC鼓励数据拟合的优良性但是尽量避免出现过度拟合(overfitting)的情况。–AIC值越小,模型越好。AIC准则是寻找可以最好地解释数据但包含最少自由参数的模型。–BIC准则是依贝叶斯理论提出的一种模型选择准则。–𝐵𝐼𝐶=−2ln𝐿+ln(𝑛)𝑝–其中L是在相应模型下的最大似然估计值,n是样本量,p是模型的变量个数。–BIC值越小,模型越好。–AIC准则倾向于过拟合,BIC准则倾向于欠拟合,BIC选出的模型相对于AIC的更为精简。销售预测现状与痛点CONTENTS0102销售预测四大步骤03销售预测基本方法04销售预测效果评估方法与指标05某电商网站销售预测案例分享销售预测的企业案例分析项目背景某电商平台主营海外代购业务,由于海外代购物流时间长、发货时间慢等因素导致该电商平台存在大量库存积压情况,想通过销售预测模型改善安排进货、提高发货速度以及优化库存。预测某类销量排行Top20某单品未来7天的销量情况预测目标1.收集数据:~18个月数据,样本513,指标722.数据探索:与销量的变量分析3.数据预处理:缺失值、Box-Cox变换、stepBIC等收集数据时间序列方法机器学习算法应用模型评估指标可视化展示评价指标收集数据:采集影响商品销量指标维度6维度72指标商品销量指标体系季节特征(1个)营销推广(14个)商品优惠商品抢购商品促销首页广告商品分销商品换货商品退款商品退货商品复购用户评价商品税率商品库存商品销量商品物流商品产地商品供货节假日消费等级零售价格交易价格交易税率用户行为(21个)浏览行为购物车行为咨询行为下单行为收藏行为支付行为321商品信息(10个)4价格变化(13个)56商品品牌商品质量(13个)数据探索:节假日与销量关系节假日变量对销量的影响明显数据探索:预测变量之间的多重共线性结论:订单数、订单金额和订单用户数之间相关性较高!需要过滤多重共线性!模型效果:真实值与预测值对比图xgboost和随机森林的预测效果较佳,线性回归和ARIMA效果较差应用模型:xgboost红色点线:某商品的真实销量绿色点线:某商品的预测销量RMSE(均方根误差):3.68837算法名称RMSE性能ARIMA5.32速度较慢,2.5min线性回归4.28速度快,1min决策树5.02速度快,1min随机森林2.85速度快,1minxgboost3.68速度适中,1.5min神经网络4.99速度快,1mi
本文标题:基于机器学习对销量预测的研究
链接地址:https://www.777doc.com/doc-4468707 .html