04 Prediction of hierarchical time series using structured regularization and its application to artificial neural networks (2020)
LightGBM 中文文档
LightGBM 是一个梯度 boosting 框架, 使用基于学习算法的决策树. 它是分布式的, 高效的, 装逼的, 它具有以下优势: * 速度和内存使用的优化 * 减少分割增益的计算量 * 通过直方图的相减来进行进一步的加速 * 减少内存的使用 减少并行学习的通信代价 * 稀疏优化 * 准确率的优化 * Leaf-wise (Best-first) 的决策树生长策略 * 类别特征值的最优分割 * 网络通信的优化 * 并行学习的优化 * 特征并行 * 数据并行 * 投票并行 * GPU 支持可处理大规模数据
安利 4 个时序预测算法:Prophet、Deep AR..
时间序列预测在供应链、金融、工业等众多领域有着广泛的应用。与CV、NLP等标准化应用不同,时间序列预测项目与业务场景结合紧密。预测对象、颗粒度、前置期、准确性指标等对于构建模型最关键的因素往往并非一目了然,只有通过对不同场景的需求进行深入分析才能找到合适解决方案。因此从业者不但需要掌握各种方法的原理,还需要能够结合业务具体使用场景分析项目的需求,找到合适的算法。这对从业者的能力提出了很高的要求,也是业内时间序列预测资深专家短缺的原因。
1、基于历史数据对未来做出预测×2篇
01 Forecasting at Scale 02 Deep AR: Probabilistic Forecasting with Autoregressive Recurrent Networks
推荐理由:
1) Prophet 是Facebook开发的时间序列预测软件包,在业内具有广泛的应用。《Forecasting at Scale》介绍了Prophet的算法原理。
2)Deep AR…一文提出了一种基于LSTM的时间序列预测算法,适用于高通量时间序列预测。该方法不仅能给出预测结果,还能给出结果的置信区间。本文作者来自亚马逊算法研究所。论文中的算法DeepAR已经集成在Amazon Sagemaker机器学习平台,对外提供预估服务的功能。
2、兼顾长短期预测×1篇
03 A Multi-Horizon Quantile Recurrent Forecaster(2018)
推荐理由:
本文提出了一种特殊的MLP网络结果,能够很好地兼顾短期和长期预测。此外,训练时间序列预测模型时往往需要通过滑动窗口的形式产生训练集样本,使得数据进行了大量复制,占用了大量内存资源。为了解决这一问题,本文提出了叉式训练(fork-training)方法,在不复制数据的情况下,达到滑动窗相似的训练效果。本文是亚马逊算法研究所在时间序列领域的又一力作。
3、多层级预测×1篇
04 Prediction of hierarchical time series using structured regularization and its application to artificial neural networks (2020)
推荐理由:
在实践中经常会出现需要在不同层级做预测的情况,比如说预测某个产品的销量,既需要在较高层级的全国层面做预测,也要在较低层级的省市层面预测。一般上的方法无法保证低层级的预测累加的结果和高层级的结果是一致的,给结果的应用造成了困扰。本论文提出了一种方法,用于解决不同层级预测结果不一致的问题。
指数平滑法 (ETS) 算法
返回在表里跟键 Key1 紧随的上一个键 Key2。如果是 ordered_set 类型的表,返回的是 Erlang 项顺序的前一个键将被返回;如果是其他类型的表,该函数的处理跟 ets:next/2 一样
读取一个由tab2file/2 或 tab2file/3生成的文件并创建对应的表。目前支持的选项只有
FORECAST.指数平滑法 (ETS) 算法 ETS.CONFINT 函数
日程表 必需。 数值数据的独立数组或范围。 日程表中的日期之间必须具有一致的步骤,不能为零。 时间线不需要按 FORECAST 排序。ETS。CONFINT 将隐式排序以用于计算。 如果提供的时间线中无法识别常量步骤,则 FORECAST。ETS。CONFINT 将返回#NUM! 错误。 如果时间线包含重复值,则 FORECAST。ETS。CONFINT 将返回#VALUE! 错误。 如果时间线和值的范围不相同,则 FORECAST。ETS。CONFINT 将返回#N/A 错误。
Confidence_level 可选。 一个介于 0 和 1 之间的数值 (独占) ,指示计算置信区间的置信水平。 例如,对于 90% 的置信区间,将计算 90% 的置信水平 (90% 的未来点从预测值计算到此) 。 默认值为 95%。 对于超出范围的数字, (0,1) 预测。ETS。CONFINT 将返回#NUM! 错误。
季节性 可选。 数值。 默认值 1 表示Excel自动检测季节性,并使用正的、完整的数字作为季节性模式的长度。 0 表示无季节性,这意味着预测将是线性的。 正整数将指示算法使用此长度的模式作为季节性。 对于任何其他值,为 FORECAST。ETS。CONFINT 将返回#NUM! 错误。
最大支持 seasonality 是8,760(一年中的小时数)。 该数字上方的任何 seasonality 将导致"# NUM ! 错误。
数据完成 可选。 虽然时间线需要数据点之间的固定步骤,但 FORECAST。ETS。CONFINT 最多支持 30% 的数据缺失,并会自动调整数据。0 将指示算法将缺失点视为零。 默认值 指数平滑法 (ETS) 算法 1 将计算缺少的点,即将其完成为相邻点的平均值。
聚合 可选。 虽然时间线需要数据点之间的固定步骤,但 FORECAST。ETS。CONFINT 将聚合具有相同时间戳的多个点。 聚合参数是一个数值,指示哪个方法用于聚合具有相同时间戳的几个值。 默认值 0 将使用 AVERAGE,而其他选项为 SUM、COUNT、COUNTA、MIN、MAX、MEDIAN。