Frage
Ich sehe sowohl COUNT als auch D_COUNT als Optionen für die Aggregation. Welche sollte ich verwenden?
Antwort
COUNT und D_COUNT (Distinct Count) sind Möglichkeiten zum Aggregieren von Daten. Bei der Datenaggregation wird eine Liste von Elementen zu einem Datenpunkt zusammengeführt. Beispiel: SUM ist eine Aggregation, bei der die aufgelisteten Werte addiert werden.
COUNT zählt die aggregierten Elemente. D_COUNT zählt die eindeutigen Elemente, die aggregiert werden. Betrachten Sie die folgende Liste.
- Katze
- Katze
- Hund
- Vogel
Wenn Sie die obige Liste um COUNT aggregieren, zeigt die Liste das Ergebnis von 4 an, da es vier Elemente gibt. Wenn Sie die gleiche Liste um D_COUNT aggregieren, gibt die Liste das Ergebnis 3 zurück, da zwei Elemente gleich sind. COUNT und D_COUNT werden in Explore vorwiegend zum Aggregieren von Ticket-IDs verwendet. D_COUNT sorgt dafür, dass jedes Ticket nur einmal erscheint. Bei COUNT kann ein Ticket mehrmals gezählt werden.
Wenn ein Bericht Attribute in Zeilen oder Spalten enthält, werden COUNT und D_COUNT innerhalb der einzelnen Zellen aggregiert, nicht für den gesamten Bericht. Im obigen Beispiel sind „Katze“, „Hund“ und „Vogel“ Stichworte, die in drei Tickets unterteilt sind:
- Ticket 1: Katze
- Ticket 2: Katze, Hund
-
Ticket 3: Vogel
COUNT und D_COUNT für Tickets geben jeweils drei zurück, da es drei Tickets gibt. Wenn Stichwörter jedoch unter Zeilen hinzugefügt werden, ändert sich der Gesamtwert:
- Katze: 2 Tickets
- Hund: 1 Ticket
- Vogel: 1 Ticket
Die Gesamtzahl ist 4, obwohl es nur drei Tickets gibt. Dies liegt daran, dass zwei eindeutige Tickets das Stichwort „Katze“ aufweisen. Wenn ein Bericht mehrere Zeilen oder Spalten aufweist, kann die Summe der D_COUNT-Werte höher sein als die D_COUNT-Werte ohne Zeilen oder Spalten.
Weitere Informationen zu den unterschiedlichen Explore-Aggregatoren finden Sie im folgenden Beitrag: Ändern des Metrikaggregators.