Zum Hauptinhalt springen
Power BI

Modellierung vs. Modellierung in Power BI

Level: Anfänger

Ziel dieses Artikels ist es, Ihnen zu helfen, die Unterschiede zwischen der Formgebung Ihrer Daten (mithilfe von Power Query) und der Modellierung Ihrer Daten (mithilfe der Modellierungswerkzeuge in Power BI) zu verstehen. Sie müssen beides tun, um einen robusten Power BI-Bericht zu erstellen. Ich habe diesen Artikel zum ersten Mal im September 2016 geschrieben und aktualisiere ihn jetzt, um die neuesten Entwicklungen in Power BI widerzuspiegeln.

Die vier Phasen eines Self-Service-BI-Projekts

Ich stelle mir ein Self-Service-BI-Projekt gerne mit vier logischen Phasen vor, wie unten gezeigt.

4-Phasen-der-Selbstbedienung-bi-3333024

Das Bild oben zeigt die Logik Datenfluss von der Quelle bis zur Lieferung der Abschlussberichte. Während das Bild zeigt, dass die Daten von links nach rechts fließen, ist die Realität, dass Sie beim Erstellen der Lösung wahrscheinlich iterativ durch die verschiedenen Phasen springen, bis die Aufgabe erledigt ist. Zwei der vorherigen Phasen sind Teil des aktuellen Themas. Datenerfassung (Modellierung) y Datenmodellierung. Beides sind IT-BI-Begriffe, die Geschäftsbenutzer möglicherweise zuvor gehört haben oder nicht.

Formen und Modellieren Ihrer Daten

Bei der Datenerfassung mit Power Query erfolgt die "Modellierung", und bei der Datenmodellierung mit der Power BI Analysis Services-Engine erfolgt die "Modellierung". Sie müssen beides tun, um einen guten Power BI-Bericht zu erstellen.

Definition der Modellierung

Formen ist der Prozess von extrahieren Ihre Quelldaten, verwandeln die Daten in der Form, die Sie benötigen, und dann Wird geladen in Power BI. Dieser Prozess wird häufig als ETL (Extrahieren, Transformieren und Laden) bezeichnet. Der Grund, warum ich das Wort Form mag, ist, dass es klar beschreibt, was Sie in diesem Schritt tun. Der Prozess der Gestaltung Ihrer Daten umfasst:

    • Restrukturieren Sie die Daten aus Ihren Quelltabellen in neue Tabellen, die die Anforderungen der Berichtsdatenbank erfüllen. Die Tabellenstruktur in einer relationalen Datenbank ist für Power BI selten (wenn überhaupt) geeignet. Fallen Sie nicht in die Falle, einfach zu laden, was in Ihren Quelldaten enthalten ist.
    • Wählen Sie nur die erforderlichen Spalten und Zeilen aus. Laden Sie alles, was Sie brauchen und nichts, was Sie nicht brauchen. Es ist einfach, später bei Bedarf Änderungen vorzunehmen.
    • Vorab Hinzufügen der Daten (wenn Sie es wollen / brauchen), obwohl ich es in den meisten Fällen im Allgemeinen nicht empfehle (es gibt immer Ausnahmen).
    • Benennen / benennen Sie Spalten und Tabellen um, damit sie für Unternehmen einfach verwendet werden können.
    • Laden Sie alles in die Power BI-Datenbank (das Datenmodell).

Wann immer möglich, ist es am besten, diese Setup-Arbeit in Ansichten in Ihrer relationalen Datenbank durchzuführen (falls vorhanden). Wenn dies aus irgendeinem Grund nicht möglich ist, erledigt Power Query die Aufgabe für Sie.

Definition der Modellierung

Modellierung ist der Prozess von Design die Struktur Ihrer Datentabellen, Gebäude die Beziehungen zwischen Ihren Tabellen und Schreiben Schritte zum Extrahieren der Geschäftsinformationen, die Sie in Ihren Berichten benötigen.

Die Datenmodellierung umfasst:

  • Zu entscheiden Welche Daten werden geladen und welche nicht.
  • Zu entscheiden in einem Tabellenschema; Ist es eine Tabelle, zwei Tabellen, viele Tabellen? Wenn möglich, sollten Sie immer ein Sternschema bevorzugen.
  • Zu entscheiden Welche Namen geben Sie den Spalten und Tabellen?
  • Zu entscheiden ob Ihre Tabellen breit und kurz (viele Spalten) oder lang und schmal (weniger Spalten) sind
  • Verknüpfen Sie Tabellen mithilfe von Beziehungen (falls erforderlich).
  • Schreiben Sie Geschäftslogik in Maßnahmen, um Mehrwert aus Ihren Rohdaten zu extrahieren.
  • Formatieren Sie Kennzahlen und Spalten korrekt, um die Geschäftsanforderungen zu erfüllen (z. B. Währung, Prozent, angemessene Anzahl von Dezimalstellen).
  • Geben Sie Maßnahmen, die genau beschreiben, was berechnet wird, gute Handelsnamen.

Beachten Sie oben, dass die Die Entscheidung, was geladen werden soll, ist Teil der Modellierung, aber Der Prozess der Datenstrukturierung ist Teil der Formgebung. Diese beiden Konzepte sind eindeutig eng miteinander verbunden und bedingen sich gegenseitig.

Vielleicht interessieren Sie sich >>>  Gruppiertes Spalten- und Liniendiagramm in Power BI

Die Dinge sind nicht immer klar

Eine Sache, die für neue Power BI-Benutzer viel Verwirrung stiftet, ist die folgende Es gibt mindestens zwei Möglichkeiten, Ihren Daten Spalten hinzuzufügen. Sie können eine Spalte mit Power Query oder eine berechnete Spalte mit DAX hinzufügen. Natürlich kann es auch auf dritte Weise möglich sein; Fügen Sie stattdessen die Daten in der Quellendatenbank hinzu. Unabhängig von der verwendeten Methode, die Entscheidung darüber, ob die Spalte hinzugefügt werden soll (oder nicht) und was in der Spalte enthalten sein soll, Es ist eine Entscheidung zur Datenmodellierung. Es ist fraglich, ob der Prozess des tatsächlichen Hinzufügens eines berechnete Spalte Es ist Modellieren oder Modellieren, aber ich denke darüber nach als Formaufgabe.

Welches sollte ich also verwenden?

Es gibt also 3 Stellen, an denen Sie eine Spalte hinzufügen können. Welche sollten Sie also verwenden? Nun, es hängt davon ab, was Sie versuchen zu tun. Mein allgemeiner Rat beim Hinzufügen von Spalten zu Ihren Tabellen lautet, die Änderung so nah wie möglich an der Quelle vorzunehmen. In der Reihenfolge Ihrer Präferenz müssen Sie also:

  1. Fügen Sie die Spalte in Ihren Quelldaten (z. B. Ihrem Data Warehouse) bei Bedarf mithilfe Ihrer IT-Freunde hinzu.
  2. Fügen Sie die Spalte mit Power Query beim Laden der Daten hinzu.
  3. Fügen Sie die Spalte in Power BI mithilfe einer berechneten Spalte hinzu.

Die Gründe für diese Empfehlung sind folgende:

Wenn Sie die Spalte in der Quelle hinzufügen, haben Sie Zugriff darauf für Ihre aktuellen BI-Anforderungen, aber auch für zukünftige BI-Anforderungen und andere BI-Benutzer.. Das Hinzufügen der Spalte zur Quelle bietet die größte Wiederverwendbarkeit. Wenn Sie später Änderungen vornehmen müssen, ist dies die geringste Wartung. Die Realität ist jedoch, dass es aus verschiedenen Gründen häufig nicht zur Quelle hinzugefügt (oder geändert) werden kann oder zumindest nicht schnell umgesetzt werden kann. Daher ist dies häufig keine besondere Option für BI aus dem Self-Service.

Wenn Sie die Spalte in Power Query (oder in der Quelle) hinzufügen, wird sie beim Laden der Daten geladen und mit allen anderen Spalten komprimiert. Dies bedeutet normalerweise eine bessere Gesamtkomprimierung der Tabelle und damit ein gutes Ergebnis für das Gesamtmodell. Außerdem werden alle Ihre Modellierungsaufgaben zusammengehalten, wodurch das Finden von Dingen intuitiver und einfacher zu warten ist.

Der häufigste Grund, warum Sie eine berechnete Spalte (mit DAX) hinzufügen sollten, ist Wenn Sie vorhandene Teile des Modells nutzen müssen, um die neuen Daten zu erstellen. Ein Adventure Works-Beispiel hier sollte helfen. Angenommen, Sie möchten Ihre Kunden in Bänder, hohe Umsätze, mittlere Umsätze oder niedrige Umsätze einteilen. Sie benötigen eine neue Spalte in Ihrer Kundentabelle (eine Modellierungsentscheidung), um diese Spalte in einem Slicer in einem Ihrer Berichte zu verwenden. Wenn Sie versuchen würden, diese Aufgabe in Power Query auszuführen, wäre dies eine Menge zusätzlicher Arbeit. Sie müssten den Gesamtumsatz für jeden Kunden in Power Query berechnen, und das würde dies erfordern

  1. Erstellen Sie eine Verknüpfung zwischen der Kundentabelle und der Verkaufstabelle
  2. Fügen Sie die Verkaufsdaten jedes Kunden vorab hinzu
  3. Gruppieren Sie Kunden mithilfe der von Ihnen benötigten Geschäftslogik in Größenbänder.
  4. Fügen Sie die Spalte hinzu (hoch, mittel, niedrig).

Der wichtige Punkt ist, dass die obigen Punkte 1 und 2 wahrscheinlich bereits im Datenmodell selbst vorhanden sind. Bei Adventure Works verfügt das Modell bereits über eine Kundentabelle, eine Beziehung zur Verkaufstabelle und eine Kennzahl, mit der die Verkäufe aggregiert werden. Diese Modellfunktionen können verwendet werden, um die neue berechnete Spalte mithilfe von DAX einfach hinzuzufügen. Kurz gesagt, Sie sollten eine berechnete Spalte bevorzugen, wenn Sie Ihre Modelllogik (Kennzahlen und Beziehungen) nutzen, damit Sie diese Logik in Power Query nicht wiederholen müssen.

Nur weil du kannst, heißt das nicht, dass du es solltest. Bitte Fallen Sie nicht in die Falle, zu viele berechnete Spalten zu verwenden anstatt Messungen zu schreiben. Ich rede hier darüber. Verwenden Sie berechnete Spalten, wenn Sie sie benötigen. Andernfalls vermeiden Sie sie.

Wickeln

Wir hoffen, dass diese Erklärung der Shaping- und Modellierungsfunktion in Power BI dazu beigetragen hat, einige Dinge zu klären. Wenn dieser Artikel für Sie hilfreich war, können Sie die anderen hilfreichen Artikel in meiner Wissensdatenbank hier lesen.

Error: Beachtung: Geschützter Inhalt.