Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

DSPL-Prüfung

DSPL Check ist ein Dienstprogramm zur Validierung eines DSPL-Datasets. Kriterien wie die Einhaltung des offiziellen DSPL-Schemas, Konsistenz interner Referenzen und CSV-Dateistruktur. Das Dienstprogramm kann viele Probleme zu erkennen, die zu DSPL-Importfehlern führen. diese Probleme schnell zu beheben, bevor Sie mit dem Eingabeprozess beginnen.

Beachten Sie, dass das Dienstprogramm (noch) nicht Ihr DSPL-Dataset auf alle möglichen Probleme. Es werden jedoch die häufigsten Wenn Ihr Dataset also erfolgreich vom Tool validiert wurde, hohe Wahrscheinlichkeit, dass es importiert und in den Public Data Explorer. Weitere Informationen finden Sie im Abschnitt Details prüfen. unten finden Sie weitere Informationen.

DSPL-Prüfung wird ausgeführt

Grundlagen

Hinweis:In dieser Anleitung wird vorausgesetzt, dass Sie hat der Installation bereits gefolgt Anleitung auf der Seite mit den DSPL-Tools.

Um DSPL Check auszuführen, gehe zum Terminal / zur Eingabeaufforderung auf deinem System und Typ:

python dsplcheck.py [path to dataset XML or zip file]

wobei der in Klammern angegebene Term durch den relativen Pfad zu eine Dataset-XML-Datei oder ein gezipptes DSPL-Bundle.

Wenn das Dataset gültig ist, gibt das Tool eine erfolgreich“ angezeigt. Andernfalls werden eine oder mehrere Fehlermeldungen ausgegeben. und beschreibt, warum die Validierung fehlgeschlagen ist. Falls Letzteres eintritt, beheben Sie wie angegeben und führen Sie das Tool dann erneut aus.

Prüfpegel

Standardmäßig untersucht die DSPL-Prüfung das gesamte Dataset, einschließlich der CSV-Dateien. auf die in der DSPL-XML-Hauptdatei verwiesen wird. Dieser Prozess eignet sich gut für kleine bis hin zu mittelgroßen Datasets. für Datasets, die sehr groß sind (d.h. im Bereich Hunderte von Megabyte oder größer).

Um diese Probleme zu beheben, verfügt das Tool über eine Prüfebene. mit der Sie den Umfang der Prüfung festlegen und die Leistung bei Bedarf anpassen. Zum Verwenden --checking_level=[...] einfügen vor dem Dataset-Pfad, wobei der in Klammern gesetzte Term durch einen der folgende Werte:

schema_only: Validiert die Dataset-XML-Datei anhand des DSPL-Schema und halten Sie dann an.
schema_and_model: Schema- und grundlegende Modellvalidierung durchführen, aber CSV-Inhalte nach der Kopfzeile ignorieren.
full: Schema-, Modell- und Datenvalidierung durchführen (Standardeinstellung)

Überprüfungsdetails

Die DSPL-Prüfung führt die folgenden Validierungen durch:

Validierung des XML-Schemas: Überprüft, ob Ihr Dataset Metadatendatei eine gültige XML-Datei ist und den offizielles DSPL-Schema.
CSV-Datei vorhanden:Es wird geprüft, ob alle CSV-Dateien die in Ihrem Dataset referenziert sind, und können geladen werden.
Konzeptprüfungen: Verschiedene Prüfungen jedes Konzepts in Ihrem Dataset, einschließlich: <ph type="x-smartling-placeholder">
- Dataset enthält mindestens ein Konzept^*
- Alle Themenverweise sind gültig
- Tabellenverweis ist vorhanden, wenn das Konzept nicht zeitbezogen verwendet wird Dimension^*
- Tabellenverweis ist gültig, falls vorhanden
- Die referenzierte Tabelle hat eine Spalte, die der Konzept-ID entspricht
Slice-Prüfungen:Verschiedene Prüfungen jedes Slice in Ihrem Dataset, einschließlich: <ph type="x-smartling-placeholder">
- Dataset hat mindestens ein Segment^*
- Mindestens ein Segment verweist auf eine Nicht-Zeitdimension^*
- Das Segment hat mindestens einen Messwert und eine Dimension
- Bezieht sich auf genau eine Dimension time kanonisches Konzept^*
- Jedes Segment hat eine eindeutige Kombination von Dimensionen
- Alle Verweise auf lokale Konzepte sind gültig
- Tabellenreferenz vorhanden
- Tabellenverweis ist gültig
- Die referenzierte Tabelle hat eine Spalte für jede Dimension und jeden Messwert im Segment
- Die Spaltentypen in der referenzierten Tabelle entsprechen den Typen der die im Slice verwendete Konzepte
Tabellenprüfungen:Verschiedene Prüfungen jeder Tabelle im Dataset, einschließlich: <ph type="x-smartling-placeholder">
- Dataset enthält mindestens eine Tabelle^*
- Die Anzahl der Spalten der CSV-Datei entspricht der der Tabelle
- CSV-Headerstrings stimmen mit Spalten-IDs überein
- Alle Datumsspalten haben ein format-Attribut
- Datumsformate entsprechen ungefähr den dazugehörigen Zeitkonzepten, Das Format für eine time:year-Spalte umfasst z.B. mindestens ein y Zeichen^*
CSV-Datenprüfungen:Verschiedene Prüfungen der CSV-Datendateien in Ihrer Dataset-XML-Datei, auf die verwiesen wird, einschließlich: <ph type="x-smartling-placeholder">
- Jede CSV-Zeile hat dieselbe Anzahl an Spalten wie der Header
- Die CSV-Datei mit Konzeptdefinitionen enthält jeweils nur eine Zeile Konzept-ID
- Die Slice-CSV-Datei enthält nicht mehr als eine Zeile für jede Kombination von Dimensionen
- Dimensionswerte, auf die in der Slice-CSV-Datei verwiesen wird, sind gültig
- Die Slice-CSV-Datei ist richtig sortiert
- CSV-Werte mit Ganzzahl und Gleitkommazahl sind korrekt formatiert

Mit einem * gekennzeichnete Kriterien sind erforderlich für Visualisierung im Public Data Explorer, sind jedoch für das DSPL-Format.

Andererseits berücksichtigt das Tool (noch) nicht Folgendes:

Dataset-Importe
Attribut- und Attributverweise
Konzepterweiterungen

DSPL-Prüfung Mit Sammlungen den Überblick behalten Sie können Inhalte basierend auf Ihren Einstellungen speichern und kategorisieren.

DSPL-Prüfung wird ausgeführt

Grundlagen

Prüfpegel

Überprüfungsdetails

DSPL-Prüfung