, ,

Metainformationen von Dateien laden

Beim Laden von Dateien kann es manchmal hilfreich sein, die Metainformationen der Datei mit zu laden.

Mit Metainformationen meine ich Dateieigenschaften wie den Dateinamen, die Dateierweiterung, den Speicherort, das Erstell- und Änderungsdatum.

Interessant könnte zum Beispiel das Erstelldatum sein, wenn man diese Information benötigt, diese aus der Datei selbst aber nicht hervorgeht.

Besonders interessant sind die Metainformationen, wenn man mehrere gleichartige Dateien laden möchte. Aber auch mit einer einzelnen Datei ist das mit einem kleinen Trick möglich.

Der Trick in Power Query

Der Trick, um in Power Query auch an die Metainformationen heranzukommen besteht darin, die Dateien aus der Quelle „Ordner“ zu laden und zu kombinieren. Das geht auch bei nur einer Datei.

Das Beispiel

In meinem Beispiel habe ich im Verzeichnis c:\daten zwei Dateien erstellt: „irish.csv“ und „italian.csv“. Die Datei „irish“ enthält irische Vor- und Nachnamen, die Datei „italian“ italienische. Es geht ja nur darum, das Prinzip zu zeigen, nicht um den Sinn.

In Power BI Desktop gehen wir auf „Daten abrufen“, dann auf „Weitere“.
Dann wählen wir „Ordner“ aus und klicken Verbinden.
Beim Ordnerpfad geben wir im Beispiel c:\Daten ein oder wählen das Verzeichnis über „Durchsuchen“ aus.

Jetzt wird es wichtig: im sich öffnenden Fenster klicken wir zuerst auf „Kombinieren“, dann auf „Daten kombinieren und transformieren“.

Im nächsten Fenster wählen wir die Beispieldatei aus, in unserem Fall können wir das auf „Erste Datei“ lassen. Wie gesagt, das funktioniert auch, wenn wir nur eine Datei im Ordner liegen haben. Dann klicken wir „Ok“.

Es öffnet sich der Power Query-Editor und nimmt gleich einige Schritte automatisch vor.
Unter anderem wurden die Spalten mit den Metainformationen gleich entfernt – das korrigieren wir jetzt.

Bei den angewendeten Schritten bearbeiten wir den Schritt „Andere entfernte Spalten1“

Wenn wir rechts von „Andere entfernte Spalten1“ auf das Zahnrad klicken, bekommen wir eine Liste mit den Metainformationen der Datei. Die meisten wurden bereits ausgeblendet.


Hier können wir das Häkchen setzen bei den Informationen, die uns interessieren. Ich lasse Source.Name und wähle neu an: „Date created“ (was übrigens auch die Erstell-Uhrzeit beinhaltet).

Nun klicke ich auf „ok“ und gehe zum letzten angewendeten Schritt.

Die geladenen Daten mit den Metainformationen Sorce.Name und Date created

Es wurden nun beide Dateien geladen und kombiniert.
Ich wähle hier jetzt noch „Erste Zeile aus Überschriften verwenden“, muss dann aber den beiden Meta-Spalten selbst einen sprechenden Namen geben. Alternativ kann ich z.B. bei Spalte „Column1“ den Wert „Vorname“ abwählen – mir gefällt die erste Variante besser.

Die fertig geladene Tabelle aus zwei Quelldateien mit zwei geladenen Meta-Informationen

Habt Ihr vielleicht noch eine andere Variante, wie man die Metadaten von Dateien einlesen kann? Dann schreibt es gerne in die Kommentare.

0 Kommentare

Hinterlasse einen Kommentar

An der Diskussion beteiligen?
Hinterlasse uns deinen Kommentar!

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert