观远数据已经帮助联合利华、百威英博等多家500强客户实施需求预测,有大量的零售领域数据预测经验。我们看到,500强企业之所以愿意花上百万,甚至大几百万来做AI预测项目,是基于其庞大的业务体量来评估ROI后作出的选择:
一方面,高质量的数据预测确实需要专业的数据科学家和分析人员深入了解业务场景,不断迭代优化预测模型,经过长时间的锤炼才能获得;
另一方面,业务规模足够大时,一点点的预测准确度的提升都能给企业带来巨额的利润回报。
但同时,我们也意识到,不是任何企业都有这个资金实力去做此类高质量的数据预测的,并且在业务需求上也可能仅仅是想做一些初步预测来为决策提供参考。那么如何满足这类客户的预测需求,同时又能给他们提供比一般方法更优秀的预测结果呢?
这一篇我们就给大家讲讲观远数据为入门级数据分析人员准备的零售数据「AI预测引擎」。
AI预测引擎概述
了解过观远产品的朋友们都知道,观远数据在BI平台里面内置了Smart ETL智能数据处理模块。该模块基于Spark大数据计算引擎开发,提供拖拽式、图形化的数据流开发方式,使得一般业务人员也能做专业的数据分析处理。一般的ETL过程整理主要做的是数据的清洗、转换、关联、加载等操作,那观远的Smart ETL何以称之为智能呢?这是因为Smart ETL中除了支持Spark本身自带的函数之外,还支持自定义的UDF、UDAF函数开发,具有非常强大的智能算子 扩展能力。
举个例子,如果你想挖掘商品间的潜在联系,开拓更多销售机会,你就可以使用Smart ETL内置的“关联性挖掘”这个智能算子来快速实现商品销售关联分析。
而「AI预测引擎」则是另一个重要的智能算子。你可以用它来做各种级别的销售预测,大到门店,小到品类,甚至SKU。有了可靠的销售预测的数据,商品层面,对于鲜食类商品,可以做更为客观的订货量评估,降低报废风险的同时把握更多销售机会;对于大众消费商品,可以提供更为精准的动销天数估算,指导商品订货、补货、配货。另一方面,销售预测也可以用来指导人员排班,以及提供更为合理的销售进度评估。
「AI预测引擎」智能算子
在观远Smart ETL中,用户仅需要拖入一个「AI预测引擎」算子,接入事先预处理好的历史数据,然后简单配置日期字段、预测指标,以及指标聚合维度(日/周/月/季度/年)和预测周期数,便可开始预测。预测结果可以输出到数据集进行下一步的展示分析与决策支持。
「AI预测引擎」节点配置
观远数据的「AI预测引擎」主要适用于零售企业的销售预测或需求预测。上图所示只是一个极简模式的预测算子,但即便配置如此简单,对零售行业门店级别(以超市数据为例)的日商预测平均准确度达到83%(MAPE≈17.65%),个别门店接近90%;而细化到单门店单品类(鲜肉类)的日商预测,准确度达到84%。而在这个基础上,我们还能提供更多配置项,添加诸如天气情况、促销活动、品类级别的日期特征等外部信息,进一步提升数据预测的准确度;同时也可以提供多门店、多品类的批量预测。
架构解密
为什么如此简单的操作,便能实现还不错的销售数据预测呢?
这是因为架构层面观远数据将预测算法封装成Spark UDF函数,有机地融合进Smart ETL,成为一个可点选配置的智能算子;算法层则采用了先进的算法,并将观远数据多年沉淀的零售行业预测经验转化为相应日期特征优化配置后预置进算法包里。
如此一来,看似简单的时序预测,其实已经包含影响零售行业销售数据的周期性特征、节假日特征以及节前节后特征,这样的预测自然是要比一般时序预测方法准确度提升不少了。
未来,我们还会根据不同品类的消费特征,分别给予不同的品类特征日历,进一步提升品类甚至SKU级别的预测准确度。同时,还可以增加天气作为额外特征,这样对于一些极端天气情况下的销售预测也会进一步提升准确度了。
算法解密
具体到算法层面,为什么观远的AI智能预测算法能够比市面上通用的预测算法在预测准确度上再提升一个层级呢?
首先我们来看一般时序预测工具中常用的ARIMA模型(Autoregressive Integrated Moving Average Model)。它是一种结合自回归与移动平均方法进行预测的模型,要求时序数据是稳定的,或者通过差分化后是稳定的,一般来说很难符合现实数据的情况。与之类似的还有GARCH模型等传统时序方法,大都只能进行单变量的建模,局限性较大。
近年来涌现出更多复杂时序模型,以便解决实际业务中的复杂情况。例如比较有代表性的TBATS的预测模型,结合了Box-Cox转换,趋势拟合,ARMA建模,周期性分析等复杂技术手段来进行建模预测。它实际上是一种状态空间模型(State Space Model)的算法实现,类似的还有隐马尔可夫模型,RNN等也都属于此类。这类模型主要限制是参数繁多,计算量大,在大规模时序预测时往往需要花费很大的计算成本实现。
那零售行业现实状况是怎样的呢?我们不妨先来看看零售数据本身具有的一些特征:
趋势特征: 一般销售数据在一个比较长期的时间范围内,具有整体增长或下滑的趋势特征。
周期特征: 销售数据具有明显的周期性和季节性。
非规律性的节假日特征: 节假日及节假日前后对销售数据有显著影响。
各类外部因素影响: 促销活动、天气、搜索指数、销售指标等因素也会显著影响销售数据。
数据稀疏性: 一般零售行业的SKU,门店等维度的组合会非常巨大,但每个组合中的时序数据数量往往比较有限。
基于直观的理解,我们就可以发现简单的ARIMA模型与复杂的状态空间模型对于零售数据的预测都有一定的局限之处。而观远数据则是根据具体的业务数据情况,结合使用高效的广义累加模型和状态空间模型,统筹考虑零售时序数据的趋势性、周期性,并加入对节假日及促销、天气等可预测波动因素的分析,给出综合预测结果,可以说这是一个专门为零售预测而生的算法模型!
预测结果呈现
观远数据对预测数据呈现做了定向优化,对实际数据与预测数据进行了颜色和线型的区分,并添加了预测数据的置信区间,提供时间轴的缩略展示。
「AI预测引擎」数据展示
小结
本文给大家介绍了集成在观远BI平台内的「AI预测引擎」功能的架构设计与算法实现方案。事实上,观远数据提供的「AI预测引擎」解决方案不仅仅是引入了先进的AI预测算法,更是将多年沉淀的、符合本土日历特征的零售数据预测经验预置进了算法模型里面,同时结合BI平台,给出了数据接入、整理、预测到展现的端到端整体解决方案。有兴趣了解更多的朋友赶快联系我们试用哦!
下一篇我们将给大家介绍更多观远数据在AI领域的落地案例与应用效果,欢迎持续关注!
申请创业报道,分享创业好点子。点击此处,共同探讨创业新机遇!
2023年7月6日,第六届世界人工智能大会(WAIC2023)在上海开幕,“人工智能大模型”是本届大会的备受瞩目的话题,据悉,在昇腾AI大模型的创新研发中,华为联手26家行业领军企业,组建了一支协同创新的“AI明星队”,云天励飞作为中国人工智能企业的杰出代表,和互联网大厂、运营商、科研院所等优秀团队
这几个月来,以ChatGPT为代表的生成式AI展现出的能力令世界惊叹。自从2016年AlphaGo战胜李世石掀起了一波AI浪潮后,AI仿佛已经沉寂了很久,ChatGPT的横空出世就如同一束耀眼的光芒,让AI这个名词重回C位。过去在AI1.0时代,主要通过训练模型来实现图像识别、声音识别、语言处理等特
文:互联网江湖作者:志刚2023年的IoT需要一个新故事。6月29日,涂鸦智能在开发者大会上,发布了企业级战略PaaS2.0,希望通过一个平台+四大开发服务,建立起IoT生态。对于这场发布会,市场的态度是积极的。美东时间6月29日收盘,涂鸦智能美股股价上涨5.6%,来到1.87美元/股。近日股价稳定
2020年底,王慧文在朋友圈写下这句话时,外界本以为这位伴随中国互联网发展而持续创业20年的人物即将告别创业舞台。但是,一个曾经多次创业,正值壮年的互联网老将心中的创业热情是难以熄灭的。
近日,谷歌母公司Alphabet在美股盘后公布了第二季度财报,其中,总营收847亿美元,同比增长14%,高于分析师普遍预期的842亿美元
商业化愿景下,AI应用元年已经到来。2024年以来,诸多已布局AI大模型技术的科技公司都开始加速推出AI应用产品。比如,今年7月16日,腾讯旗下大模型应用“腾讯元宝”推出“3D角色梦工厂”玩法,成为首个拥有打印级3D生成能力的通用大模型App。无独有偶,百度也推出了一款名为“文小言”的AI数字人社交
文|智能相对论作者|叶远风松弛感,是这届奥运会开幕式给很多人留下的直观感受。而让用户观看奥运的过程也获得松弛感,同样是各路APP在奥运季努力的方向。从各种大型赛事报道来看,一般来说,APP们往往致力于整合信息、形成专题页面,方便用户一站式浏览,从容选择、查看。但“智能相对论”观察到,一些尝试推动用户
AIO是什么?AIO原意是指集成在一起的意思,但这里的AIO,不是AllInOne,是AI+O结合在一起的。AI,懂的人知道,不是爱,是ArtificialIntelligence(人工智能)的简称。而O,是英文Optimization(优化)的首字母。所以这里的AIO是指人工智能优化的意思。AIO
北京时间7月27日凌晨,巴黎奥运会即将开幕。今年,云上转播将正式超越卫星转播,成为奥运赛事走向全球数十亿观众的主要转播方式。巴黎奥运会预计11000小时的赛事直播画面,将通过阿里云向全球分发。这将是1964年奥运会开始卫星电视转播以来,又一次重大技术进步。据介绍,OBSLiveCloud将成为202
7月26日,巴黎奥运会开幕在即,国际奥委会主席巴赫在国际转播中心举行的活动中表示,2024巴黎奥运会展现了奥运转播的未来,广泛应用的阿里AI技术正在将巴黎奥运转播带到新的高度。(国际奥委会主席巴赫)在巴黎奥运会上,云计算将替代卫星成为奥运赛事直播的主要方式。超过三分之二奥运直播信号将通过阿里云支撑的
大模型落地呼声越来越大,但是以什么方式落地依然有争议。国内如此,国外亦然。不同的思想对应着不同的方法论。一部分AI企业忙着更新通用大模型打榜,做一些视频生成工具之类的热门产物,巨头多数属于此类。另一部分则在专注行业大模型或是平台,例如国外的Glean和国内的第四范式,后者最近还发布了AI数字人视频合
2023年是AI大语言模型爆发的一年,以OpenAI推出的GPT大模型为起始,整个行业开始从“推理式AI”向“生成式AI”迈进。据MarketDataForecast预测,全球AI市场规模将从2023年的1502亿美元增长到2030年的13452亿美元,年复合增长率高达36.8%。在此背景下,国内如
随着AI产业化和产业AI化成为业界共识,大模型的“新赛季”来了。2024年是国产大模型全面商业化的元年,各地人工智能产业发展的政策密集出台。同时,在2024世界人工智能大会(WAIC2024)上,各大AI厂商纷纷表示要让大模型落地应用场景。不过,对于大模型商业化的路线,科技巨头和大模型初创公司之间存
对所有大模型而言,其真正考验如同科大讯飞创始人刘庆峰所说,在最后一公里的应用和商业化落地上。作者|Cindy编辑|杨铭恐怕谁也不会想到,百模大战进入商业化下半场,围绕大模型大规模、旷日持久的战争,竟是开源和闭源路线的交锋。最近,在2024世界人工智能大会(WAIC)上,刘庆峰、李彦宏、王坚、朱啸虎、