Die Prognose ist eine Ergebnismanipulation, bei der Muster in Ihren Daten verwendet werden, um künftige Ergebnisse vorherzusagen.
Die Prognose verwendet Werte aus Datumsfeldern mit mindestens zwei Datenzyklen. Ein Datenzyklus ist ein Zeitraum, der in mehrere Werte unterteilt ist. Ein Jahr wird beispielsweise nach Monaten oder Wochen aufgeschlüsselt. Im automatischen Modus erkennt die Prognose jedes Jahr als einen Zyklus. Deshalb benötigen Sie Daten aus zwei Jahren, um eine Prognose zu generieren.
In diesem Beitrag werden folgende Themen behandelt:
Prognosegrundlagen
In diesem Abschnitt erfahren Sie, wie Sie eine Prognose zu einem Bericht hinzufügen.
So fügen Sie eine Prognose zu einem Bericht hinzu
- Erstellen Sie im Report Builder einen zeitbasierten Bericht. Fügen Sie beispielsweise COUNT(Tickets) als Metrik und Ticket erstellt – Jahr als Spalte hinzu.
- Klicken Sie auf das Symbol „Ergebnismanipulation“ () und dann auf Prognose.
- Aktivieren Sie im Menü Prognose das Kontrollkästchen Ergebnisprognose erstellen.
Die Optionen zur Konfiguration der Prognose werden angezeigt.
- Pfad bestimmt, ob die Prognose auf den Spalten oder auf den Zeilen Ihres Diagramms basiert. In beiden Fällen müssen die Felder ein datumsbasiertes Attribut enthalten. Der Pfad enthält immer das datumsbasierte Attribut für Ihre Prognose.
- Wählen Sie unter Methode entweder Additiver Trend und multiplikative Saison oder Additiver Trend und additive Saison.
Weitere Informationen zu den verfügbaren Prognosemethoden finden Sie unter Funktionsweise der Prognose.
- Wählen Sie unter Vorherzusagende Werte eine der folgenden Optionen aus:
- Automatisch: Explore berechnet automatisch die optimale Anzahl von Werten für die Prognose.
- Angepasst: Sie legen die Anzahl der Prognosewerte selbst fest. Wenn Sie beispielsweise ein jahresbasiertes Attribut verwenden, geben Sie die Anzahl der Jahre an, die Sie vorausberechnen möchten.
- Unter Werte pro Zyklus können Sie die Anzahl der Datenpunkte in einem Zyklus einstellen. Für Daten aus zwölf Monaten können Sie beispielsweise sechs Werte pro Zyklus auswählen. Wenn Sie Automatisch wählen, berechnet Explore die optimale Anzahl der Werte für die Prognose.
- Wenn Sie fertig sind, klicken Sie auf Anwenden.
- Wählen Sie im Visualisierungsmenü () ein Balken-, Säulen-, Flächen-, Linien- oder Sparkline-Diagramm aus. Andere Diagrammtypen sind für die Anzeige von Prognoseergebnissen nicht verfügbar.
Die prognostizierte Entwicklung ist im Diagramm durch einen anderen Stil gekennzeichnet. In einem Liniendiagramm wird die Prognose beispielsweise als gepunktete Linie dargestellt:
Wenn der Bericht zum Beispiel das Attribut Ticket erstellt – Monat enthält und Sie seit mehr als einem Jahr Daten sammeln, wird das Feld aggregiert und die Fehlermeldung angezeigt. Fügen Sie in diesem Fall auch das Attribut Ticket erstellt – Jahr hinzu, um den Fehler zu beheben.
Funktionsweise der Prognose (erweitert)
Die von Explore verwendete Prognosemethode basiert auf dem Holt-Winters-Modell der dreifachen exponentiellen Glättung anhand des Niveaus, des Trends und der Saison einer Zeitreihe.
Explore verwendet zwei Submodelle, die für die meisten Anwendungsfälle geeignet sind und saisonale Schwankungen berücksichtigen.
Die AA-Methode
Das AA-Modell (Additiver Trend und Additive Saison) ist die Standardmethode, da sie am häufigsten verwendet wird und die realistischsten Ergebnisse liefert.
Die Ausgangswerte werden nach der folgenden Formel verarbeitet:
Anschließend können wir das Holt-Winters AA-Modell anwenden:
Die AM-Methode
Das AM-Modell (Additiver Trend und Multiplikative Saison) ist in manchen Fällen ein zeitbasierter Trend.
Die Ausgangswerte werden nach der folgenden Formel verarbeitet:
Anschließend können wir das Holt-Winters AM-Modell anwenden:
Zeiträume pro Zyklus
In der Berechnung verwenden wir auch den Wert „Zeiträume pro Zyklus“. Er dient zum Bestimmen der Länge einer Saison und wird benötigt, um saisonale Indizes zu verarbeiten. Dieser Wert ist in den oben stehenden Formeln mit „h“ angegeben.
Glättungsparameter
Vor der Verarbeitung der Prognose müssen drei weitere Parameter definiert werden. Diese entsprechen den Glättungsparametern „α“ für das Niveau, „β“ für den Trend und „γ“ für die Saisonalität. Sie geben die relative Gewichtung des ersten und des letzten Wertes zeitbasierter Reihen an und beeinflussen die Ergebnisse der einzelnen Zeiträume. Ein Beispiel:
„Die Schätzwerte für Alpha, Beta und Gamma lauten jeweils 0,41, 0,00 und 0,96. Der Wert von Alpha (0,41) ist relativ niedrig, was darauf hinweist, dass die Schätzung des Niveaus zum aktuellen Zeitpunkt sowohl auf neueren Beobachtungen als auch auf einigen länger zurückliegenden Beobachtungen beruht. Der Wert von Beta ist 0,00, was bedeutet, dass die Schätzung des Anstiegs b der Trendkomponente nicht über die Zeitreihe hinweg aktualisiert, sondern dem Anfangswert gleichgesetzt wird. Dies ist einleuchtend, da sich das Niveau im Laufe der Zeitreihe ziemlich stark verändert, der Anstieg b der Trendkomponente aber ungefähr gleich bleibt. Der Wert von Gamma (0,96) ist hingegen hoch, was zeigt, dass die Schätzung der saisonalen Komponente zum aktuellen Zeitpunkt nur auf den jüngsten Beobachtungen basiert.“
Es gibt keinen offiziellen Algorithmus für die Bestimmung der besten Werte für die drei Optimierungsparameter. Sie wird zu einem NP-vollständigen Problem, bei dem zur Optimierung die mittlere quadratische Abweichung der prognostizierten Ergebnisse in den Bereichen 0≤α≤1, 0≤β≤1 und 0≤γ≤1 minimiert werden muss.
Deshalb verwendet Explore einen eigenen Algorithmus, um in einer linearen Zeit die besten drei Parameter mit einer Genauigkeit von 0,01 zu bestimmen.