予測は、データのパターンを使用して将来の結果を予測する結果操作です。
予測には少なくとも2サイクルのデータを含む日付フィールドの値が使用されます。データのサイクルとは、複数の値に分割された期間です。たとえば、年は月または週で分割されます。自動モードでは、予測は各年を1サイクルとして認識します。そのため、予測を生成するには2年間のデータが必要になります。
この記事では、次のトピックについて説明します。
予測の基本
この手順を使用して、レポートに予測を追加する方法を学習します。
レポートに予測を追加するには
- レポートビルダーで、時間ベースのレポートを作成します。たとえば、「メトリック」パネルにCOUNT(Tickets)を追加し、「列」パネルにTicket created - Yearを追加できます。
- 結果操作アイコン()をクリックし、「予測」をクリックします。
- 「予測」メニューで、「結果に基づいて予測を計算」を選択します。
予測の設定オプションが表示されます。
- 「パス」で、予測のベースにするものとしてグラフの列または行を選択します。選択するものには日付ベースの属性が含まれている必要があります。パスには、必ず予測の日付ベースの属性を含めます。
- 「方法」で、「加法傾向と乗法季節」または「加法傾向と加法季節」を選択します。
使用できる予測方法の詳細については、後述の「予測のメカニズム」参照してください。
- 「予測する値」で、次のいずれかを選択します。
- 自動:予測する値の最適数をExploreに自動計算させます。
- カスタム:予測する数値を指定します。たとえば、属性が年ベースの場合、予測する年数を指定します。
- 「サイクル別の値」では、各サイクルに含めるデータポイントの数を設定することができます。たとえば、12か月のデータに対して、サイクルごとに6つの値を選択できます。「自動」を選択すると、使用する最適な数値をExploreが計算してくれます。
- 完了したら、「適用」をクリックします。
- ビジュアライゼーションメニュー()から、棒グラフ、縦棒グラフ、エリアグラフ、折れ線グラフ、またはスパークライングラフを選択します。それ以外のグラフタイプでは予測結果は表示されません。
グラフ上の予測された箇所は、他とは異なるスタイルで表示されます。たとえば、折れ線グラフ上の予測された部分は、たとえば次のように点線で表示されます。
たとえば、レポートに「チケットの作成日時-月」という属性を含めて1年以上データを収集している場合、このフィールドの値は集計され、エラーメッセージが表示されます。この場合、「チケット作成-年」の属性を追加してエラーを解決します。
予測のメカニズム(専門的な内容)
Exploreの予測方法にはHolt wintersモデルを採用しており、時系列データのレベル、トレンド、および季節性に3重指数平滑法を適用しています。
Exploreは、ほとんどのユースケースに適合する2つのサブモデルを使用し、さらに季節変動も考慮します。
AAメソッド
AA(加法傾向と加法季節)モデルは、最もよく使用され、最も現実的な結果を生成するため、デフォルトで使用されています。
初期値は次の式で処理されます。
次に、Holt Winters AAモデルを適用できます。
AMメソッド
AM(加法傾向と乗法季節)モデルは、場合によっては時間ベースの傾向となります。
初期値は次の式で処理されます。
次に、Holt Winters AMモデルを適用できます。
周期
計算では、「周期(Periods per cycle)」という値も使用します。これは、季節指標を処理するために必要な季節の長さを決定するために使用されます。上記の式では、この値は「h」で表されています。
平滑化パラメータ
予測を処理する前に、他の3つのパラメーターを定義する必要があります。これらは、「α」(レベル)、「β」(トレンド)、「γ」(季節変動)と呼ばれる平滑化パラメータにそれぞれ対応します。つまり、これらのパラメータは時系列の初期値と最終値に与えられる重要度の比率に対応し、各周期の結果に影響を与えます。例を次に示します。
「アルファ、ベータ、ガンマの推定値はそれぞれ0.41、0.00、0.96です。アルファ(0.41)の値は比較的低く、現時点でのレベルの推定は、最近の観測とより遠い過去のいくつかの観測の両方に基づいていることを示しています。ベータの値は0.00であり、傾向成分の勾配bの推定値は時系列にわたって更新されず、代わりにその初期値に等しく設定されることを示します。レベルは時系列に沿ってかなり変化しますが、トレンドコンポーネントの勾配bはほぼ同じままなので、非常に直感的にこれは理解できます。対照的に、ガンマ(0.96)の値は高く、現時点での季節成分の推定値はごく最近の観測に基づいていることを示しています。」
これら3つの最適化パラメータには、最適なものを見つけるための公式的なアルゴリズムはありません。これは、NP-Complete問題となります。最適化問題は、予測結果の平均2乗誤差を0≤α≤1、0≤β≤1、0≤γ≤1で最小化することです。
したがって、Exploreの独自のアルゴリズムにより、0.01の精度で、最良の3つのパラメータを線形時間で算出します。