Diese Seite wurde von der Cloud Translation API übersetzt.

CSV-Connector bereitstellen

Dieser Leitfaden richtet sich an Administratoren, die mit dem Google Cloud Search-Connector für kommagetrennte Werte (Comma-Separated Values, CSV) arbeiten und für das Herunterladen, Konfigurieren, Ausführen und Überwachen zuständig ist.

In diesem Artikel erhalten Sie Anleitungen zu Hauptaufgaben im Zusammenhang mit dem Deployment eines CSV-Connectors:

Software für den Google Cloud Search-CSV-Connector herunterladen
Connector für die Verwendung mit einer bestimmten CSV-Datenquelle konfigurieren
Connector bereitstellen und ausführen

Um die Konzepte in diesem Dokument zu verstehen, sollten Sie mit den Grundlagen von Google Workspace, mit CSV-Dateien und Zugriffssteuerungslisten (Access Control Lists, ACLs) vertraut sein.

Google Cloud Search-CSV-Connector

Der Cloud Search-CSV-Connector funktioniert mit allen Textdateien mit kommagetrennten Werten (CSV). In einer CSV-Datei werden tabellarische Daten gespeichert. Jede Zeile der Datei ist dabei ein Datensatz.

Der CSV-Connector von Google Cloud Search extrahiert einzelne Zeilen aus einer CSV-Datei und indexiert sie über die Indexing API von Cloud Search in Cloud Search. Nach der erfolgreichen Indexierung können einzelne Zeilen aus CSV-Dateien über die Cloud Search-Clients oder die Cloud Search Query API durchsucht werden. Der CSV-Connector unterstützt außerdem die Steuerung des Nutzerzugriffs auf Inhalte in den Suchergebnissen mithilfe von ACLs.

Der Google Cloud Search-CSV-Connector kann unter Linux oder Windows installiert werden. Damit er bereitgestellt werden kann, sind die folgenden Komponenten erforderlich:

Java JRE 1.8, installiert auf einem Computer, auf dem der Google Cloud Search-CSV-Connector ausgeführt wird
Die folgenden Google Workspace-Informationen liegen vor. Sie sind erforderlich, um Beziehungen zwischen Google Cloud Search und der Datenquelle herzustellen:
- Privater Google Workspace-Schlüssel, der die ID des Dienstkontos enthält
- ID der Google Workspace-Datenquelle
Normalerweise erhalten Sie diese Informationen vom Google Workspace-Administrator der Domain.

Deployment

Führen Sie die folgenden Schritte aus, um den Google Cloud Search-CSV-Connector bereitzustellen:

Die CSV-Connector-Software von Google Cloud Search installieren
Konfiguration des CSV-Connectors festlegen
Zugriff auf die Google Cloud Search-Datenquelle konfigurieren
Den CSV-Dateizugriff konfigurieren
Die zu indexierenden Spaltennamen, Spalten mit eindeutigem Schlüssel und Datum/Uhrzeit-Spalten festlegen
Spalten angeben, die für anklickbare URLs im Suchergebnis verwendet werden
Metadateninformationen, Spaltenformate und Suchqualität angeben
Datendurchlauf planen
Optionen für ACLs angeben

1. SDK Installieren

Installieren Sie das SDK in Ihrem lokalen Maven-Repository.

Klonen Sie das SDK-Repository von GitHub.

$ git clone https://github.com/google-cloudsearch/connector-sdk.git
$ cd connector-sdk/csv

Checken Sie die gewünschte Version des SDKs aus:
```
$ git checkout tags/v1-0.0.3
```
Erstellen Sie den Connector:
```
$ mvn package
```

Kopieren Sie die ZIP-Datei des Connectors in das lokale Installationsverzeichnis:

$ cp target/google-cloudsearch-csv-connector-v1-0.0.3.zip installation-dir
$ cd installation-dir
$ unzip google-cloudsearch-csv-connector-v1-0.0.3.zip
$ cd google-cloudsearch-csv-connector-v1-0.0.3

2. Konfiguration des CSV-Connectors angeben

Als Administrator für einen Connector können Sie das Verhalten eines CSV-Connectors und dessen Attribute steuern, die die Parameter in seiner Konfigurationsdatei bestimmen. Zu den konfigurierbaren Parametern gehören:

Zugriff auf eine Datenquelle
Speicherort der CSV-Datei
CSV-Spaltendefinitionen
Spalte(n), die eine eindeutige ID definieren
Durchlaufoptionen
ACL-Optionen zum Einschränken des Datenzugriffs

Damit der Connector auf eine CSV-Datei zugreifen und den relevanten Inhalt indexieren kann, müssen Sie zuerst eine Konfigurationsdatei für ihn erstellen.

So erstellen Sie eine Konfigurationsdatei:

Öffnen Sie einen Texteditor Ihrer Wahl und geben Sie einen Namen für die Konfigurationsdatei ein.
Fügen Sie dem Dateiinhalt key=value-Paare (Schlüssel/Wert-Paare) hinzu, wie in den folgenden Abschnitten beschrieben.
Speichern und benennen Sie die Konfigurationsdatei.
Google empfiehlt den Namen connector-config.properties. Zum Ausführen des Connectors sind dann keine zusätzlichen Kommandozeilenparameter erforderlich.

Da Sie den Pfad der Konfigurationsdatei in der Befehlszeile angeben können, ist kein Standardspeicherort erforderlich. Behalten Sie die Konfigurationsdatei jedoch im selben Verzeichnis wie den Connector. So lässt er sich leichter nachverfolgen und ausführen.

Damit der Connector die Konfigurationsdatei erkennt, müssen Sie ihren Pfad in der Kommandozeile angeben. Andernfalls wird die Datei connector-config.properties in Ihrem lokalen Verzeichnis als Standarddateiname verwendet. Weitere Informationen zum Angeben des Konfigurationspfads in der Kommandozeile finden Sie unter Cloud Search-CSV-Connector ausführen.

3. Zugriff auf die Google Cloud Search-Datenquelle konfigurieren

In jeder Konfigurationsdatei müssen als erstes die Parameter angegeben werden, die für den Zugriff auf die Cloud Search-Datenquelle erforderlich sind. Sie finden sie in der folgenden Tabelle. Normalerweise benötigen Sie die Datenquellen-ID, die Dienstkonto-ID und den Pfad zur privaten Schlüsseldatei des Dienstkontos, um den Zugriff des Connectors auf Cloud Search zu konfigurieren. Wie Sie eine Datenquelle einrichten, erfahren Sie unter Integration von Drittanbietern.

Einstellung	Parameter
ID der Datenquelle	`api.sourceId=1234567890abcdef` Erforderlich. Die ID der vom Google Workspace-Administrator eingerichteten Google Cloud Search-Quelle, wie in den Hilfeartikeln zur Integration von Drittanbietern beschrieben.
Pfad zur privaten Schlüsseldatei des Dienstkontos	`api.serviceAccountPrivateKeyFile=./PrivateKey.json` Erforderlich. Die Schlüsseldatei des Google Cloud Search-Dienstkontos für den Zugriff des CSV-Connectors auf Google Cloud Search.
ID der Identitätsquelle	`api.identitySourceId=x0987654321` Erforderlich, wenn externe Nutzer und Gruppen verwendet werden. Die ID der Google Cloud Search-Identitätsquelle, die vom Google Workspace-Administrator eingerichtet wurde.

4. Parameter der CSV-Datei konfigurieren

Bevor eine CSV-Datei vom Connector durchlaufen und zur Indexierung Daten daraus abgerufen werden können, müssen Sie den Pfad zur Datei angeben. Sie können auch das Dateiformat und den Typ der Dateicodierung angeben. Fügen Sie die folgenden Parameter hinzu, um die Eigenschaften der CSV-Datei in der Konfigurationsdatei anzugeben.

Einstellung	Parameter
Pfad zur CSV-Datei	`csv.filePath=./movie_content.csv` Erforderlich. Der Pfad zur CSV-Datei, auf die zugegriffen und aus der Inhalt zur Indexierung abgerufen werden soll.
Dateiformat	`csv.format=DEFAULT` Das Format der Datei. Mögliche Werte stammen aus der Apache-Commons-CSV-Klasse CSVFormat. Zu den Formatwerten gehören: `DEFAULT`, `EXCEL`, `INFORMIX_UNLOAD`, `INFORMIX_UNLOAD_CSV`, `MYSQL`, `RFC4180`, `ORACLE`, `POSTGRESQL_CSV`, `POSTGRESQL_TEXT` und `TDF`. Wenn kein Wert angegeben ist, wird `DEFAULT` verwendet.
Dateiformatmodifikator	`csv.format.withMethod=value` Eine Änderung der Dateiverarbeitung in Cloud Search. Mögliche Methoden stammen aus der Apache-Commons-CSV-Klasse CSVFormat und beinhalten diejenigen, für die ein einzelnes Zeichen, ein String oder ein boolescher Wert genutzt wird. Wenn Sie beispielsweise ein Semikolon als Trennzeichen angeben möchten, verwenden Sie `csv.format.withDelimiter=;`. Mit `csv.format.withIgnoreEmptyLines=true` können Sie leere Zeilen ignorieren.
Dateicodierungstyp	`csv.fileEncoding=UTF-8` Der Java-Zeichensatz, der verwendet wird, wenn die Datei von Cloud Search gelesen wird. Wenn Sie nichts angeben, wird der Standardzeichensatz der Plattform verwendet.

5. Zu indexierende Spaltennamen und Spalten mit eindeutigem Schlüssel festlegen

Damit über den Connector Zugriff auf CSV-Dateien besteht und sich diese indexieren lassen, müssen Sie in der Konfigurationsdatei Informationen zu Spaltendefinitionen angeben. Wenn die Konfigurationsdatei keine Parameter für die zu indexierenden Spaltennamen und Spalten mit eindeutigem Schlüssel enthält, werden Standardwerte verwendet.

Einstellung	Parameter
Spalten für Indexierung	`csv.csvColumns=movieId,movieTitle,description,actors,releaseDate,year,userratings...` Die zu indexierenden Spaltennamen aus der CSV-Datei. Wenn `csv.csvColumns` nicht festgelegt ist, wird die erste Zeile der CSV-Datei als Kopfzeile verwendet. Wenn `csv.csvColumns` festgelegt ist, hat sie Vorrang vor der ersten Zeile der CSV-Datei. Wenn Sie `csv.csvColumns` festgelegt haben und die erste Zeile der CSV-Datei eine Liste mit Spaltennamen ist, müssen Sie `csv.skipHeaderRecord=true` festlegen, damit die erste Zeile nicht als Daten indexiert wird. Standardwerte sind die Spalten in der Kopfzeile der Datei.
Eindeutige Schlüsselspalten	`csv.uniqueKeyColumns=movieId` Die CSV-Spalten, deren Werte verwendet werden, um die eindeutige ID jedes Eintrags zu generieren. Wenn nicht angegeben, sollte der Hash des CSV-Eintrags als eindeutiger Schlüssel verwendet werden. Der Standardwert ist der Hashcode des Eintrags.

6. Spalten angeben, die für anklickbare URLs im Suchergebnis verwendet werden

Wenn ein Nutzer mithilfe von Google Cloud Search sucht, erhält er seine Antwort über eine Trefferliste mit anklickbaren URLs für jeden Treffer. Damit diese Funktion aktiviert wird, müssen Sie der Konfigurationsdatei den Parameter hinzufügen, der in folgender Tabelle angezeigt wird.

Einstellung	Parameter
URL-Format für Suchergebnisse	`url.format=https://mymoviesite.com/movies/{0}` Erforderlich. Das Format, in dem eine URL für CSV-Inhalte dargestellt wird.
URL-Parameter für Suchergebnisse.	`url.columns=movieId` Erforderlich. Die CSV-Spaltennamen, deren Werte zum Generieren der Eintrags-URL verwendet werden.
Zu codierende URL-Parameter für Suchergebnisse	`url.columnsToEscape=movieId` Optional. Die CSV-Spaltennamen, deren Werte in der URL codiert werden, damit eine gültige URL angezeigt wird.

7. Metadateninformationen, Spaltenformate und Suchqualität angeben

Sie können der Konfigurationsdatei Parameter hinzufügen, mit denen Folgendes angeben wird:

Konfigurationsparameter für Metadaten
Spaltenformate
Suchqualität

Konfigurationsparameter für Metadaten

Konfigurationsparameter für Metadaten beschreiben die CSV-Spalten, die zum Auffüllen von Metadaten eines Elements verwendet werden. Wenn die Konfigurationsdatei diese Parameter nicht enthält, werden Standardwerte verwendet. In der folgenden Tabelle sehen Sie diese Parameter:

Einstellung	Parameter
Titel	`itemMetadata.title.field=movieTitle` `itemMetadata.title.defaultValue=Gone with the Wind` Das Metadatenattribut, das den Wert enthält, der dem Dokumenttitel entspricht. Der Standardwert ist ein leerer String.
URL	`itemMetadata.sourceRepositoryUrl.field=url` `itemMetadata.sourceRepositoryUrl.defaultValue=https://www.imdb.com/title/tt0031381/` Das Metadatenattribut, das den Wert für die Dokument-URL der Suchergebnisse enthält.
Zeitstempel der Erstellung	`itemMetadata.createTime.field=releaseDate` `itemMetadata.createTime.defaultValue=1940-01-17` Das Metadatenattribut, das den Wert für den Zeitstempel bei Dokumenterstellung enthält
Zeitpunkt der letzten Aktualisierung	`itemMetadata.updateTime.field=releaseDate` `itemMetadata.updateTime.defaultValue=1940-01-17` Das Metadatenattribut, das den Wert für den Zeitstempel der letzten Änderung am Dokument enthält.
Dokumentsprache	`itemMetadata.contentLanguage.field=languageCode` `itemMetadata.contentLanguage.defaultValue=en-US` Die Inhaltssprache der indexierten Dokumente.
Schema-Objekttyp	`itemMetadata.objectType.field=type` `itemMetadata.objectType.defaultValue=movie` Der Objekttyp, der vom Connector verwendet wird, wie im Schema beschrieben. Der Connector indexiert keine strukturierten Daten, wenn dieses Attribut nicht angegeben ist.

Datum/Uhrzeit-Formate

Diese Formate geben die in Metadatenattributen erwarteten Formate an. Wenn die Konfigurationsdatei diesen Parameter nicht enthält, werden Standardwerte verwendet. In der folgenden Tabelle finden Sie eine Beschreibung dieses Parameters:

Einstellung Parameter

Zusätzliche Datum/Uhrzeit-Formate structuredData.dateTimePatterns=MM/dd/uuuu HH:mm:ssXXX
Eine durch Semikolons getrennte Liste zusätzlicher Muster des Typs java.time.format.DateTimeFormatter. Diese werden verwendet, wenn Stringwerte für Datums- oder Datum/Uhrzeit-Felder in den Metadaten oder im Schema geparst werden. Der Standardwert ist eine leere Liste. Die Formate RFC 3339 und RFC 1123 werden jedoch immer unterstützt.

Spaltenformate

Mit Spaltenformaten werden Informationen zu Spalten angegeben, die Teil des suchbaren Inhalts sein sollen. Wenn die Konfigurationsdatei diese Parameter nicht enthält, werden Standardwerte verwendet. In der folgenden Tabelle sehen Sie diese Parameter:

Einstellung	Parameter
Überschrift überspringen	`csv.skipHeaderRecord=true` Boolescher Wert. Die Kopfzeile (erste Zeile) einer CSV-Datei wird ignoriert. Wenn Sie `csv.csvColumns` festgelegt haben und die CSV-Datei eine Kopfzeile hat, müssen Sie `skipHeaderRecord=true` festlegen. Dadurch wird verhindert, dass die Inhalte der ersten Zeile in der Datei als Daten indexiert werden. Wenn die CSV-Datei keine Kopfzeile hat, legen Sie `skipHeaderRecord=false` fest. Der Standardwert ist "false".
Spalten mit mehreren Werten	`csv.multiValueColumns=genre,actors` Die Namen der Spalten in der CSV-Datei, die mehrere Werte enthalten. Der Standardwert ist ein leerer String.
Trennzeichen für Spalten mit mehreren Werten	`csv.multiValue.genre=;` Das Trennzeichen für Spalten mit mehreren Werten. Das Standardtrennzeichen ist ein Komma.

Suchqualität

Der CSV-Connector von Cloud Search erlaubt automatische HTML-Formatierung von Datenfeldern. Die Datenfelder werden dazu zu Beginn der Ausführung vom Connector festgelegt. Danach wird mit einer Inhaltsvorlage jeder Datensatz formatiert, bevor er in Cloud Search hochgeladen wird.

In der Inhaltsvorlage wird die Wichtigkeit jedes Feldwerts für die Suche bestimmt. Das Titelfeld ist eine Pflichtangabe und als höchste Priorität definiert. Für alle anderen Inhaltsfelder können Sie die Wichtigkeitsstufen hoch, mittel oder niedrig für die Suchqualität festlegen. Jedes Inhaltsfeld, das nicht in einer bestimmten Kategorie definiert ist, hat standardmäßig eine niedrige Priorität. In der folgenden Tabelle sehen Sie diese Parameter:

Einstellung	Parameter
Titel des Inhalts	contentTemplate.csv.title=`movieTitle` Der Titel des Inhalts ist das Feld mit der höchsten Suchqualität.
Hohe Suchqualität für Inhaltsfelder	contentTemplate.csv.quality.high=`actors` Inhaltsfelder mit einem hohen Wert für die Suchqualität. Der Standardwert ist ein leerer String.
Geringe Suchqualität für Inhaltsfelder	contentTemplate.csv.quality.low=`genre` Inhaltsfelder mit einem niedrigen Wert für die Suchqualität. Der Standardwert ist ein leerer String.
Mittlere Suchqualität für Inhaltsfelder	contentTemplate.csv.quality.medium=`description` Inhaltsfelder mit einem mittleren Wert für die Suchqualität. Der Standardwert ist ein leerer String.
Nicht festgelegte Inhaltsfelder	contentTemplate.csv.unmappedColumnsMode=`IGNORE` Die Vorgehensweise des Connectors bei nicht festgelegten Inhaltsfeldern. Gültige Werte sind: APPEND: fügt der Vorlage nicht spezifizierte Inhaltsfelder hinzu IGNORE: Nicht spezifizierte Inhaltsfelder werden ignoriert Der Standardwert ist APPEND.

8. Datendurchlauf planen

Der Durchlauf ist der Prozess des Connectors, bei dem Inhalte aus der Datenquelle ermittelt werden, hier in einer CSV-Datei. Während der CSV-Connector ausgeführt wird, werden die Zeilen einer CSV-Datei durchsucht und jede Zeile wird über die Indexing API für Cloud Search indexiert.

Bei einem Durchlauf mit vollständiger Indexierung (Full Traversal) werden alle Spalten in der Datei indexiert. Bei einem Durchlauf mit Teilindexierung (Incremental/List Traversal) werden nur die Spalten indexiert, die seit dem letzten Durchlauf hinzugefügt oder geändert wurden. Von einem CSV-Connector werden nur Durchläufe mit vollständiger Indexierung ausgeführt. Es werden keine Durchläufe mit Teilindexierung ausgeführt.

Die Planungsparameter bestimmen, wie viel Zeit zwischen den einzelnen Connectordurchläufen vergeht. Wenn die Konfigurationsdatei keine Planungsparameter enthält, werden Standardwerte verwendet. In der folgenden Tabelle sehen Sie diese Parameter:

Einstellung	Parameter
Durchlauf mit vollständiger Indexierung nach Intervall	schedule.traversalIntervalSecs=`7200` Nach einem angegebenen Intervall wird ein Connectordurchlauf mit vollständiger Indexierung durchgeführt. Geben Sie das Intervall zwischen den Durchläufen in Sekunden an. Der Standardwert ist 86.400 (Anzahl der Sekunden eines Tags).
Durchlauf mit vollständiger Indexierung beim Starten des Connectors	schedule.performTraversalOnStart=`false` Beim Start des Connectors wird ein Durchlauf mit vollständiger Indexierung durchgeführt, anstatt auf das Ablaufen des ersten Intervalls zu warten. Der Standardwert ist true.

9. Optionen für ACLs angeben

Der Google Cloud Search CSV-Connector unterstützt Berechtigungen über ACLs, um den Zugriff über Suchergebnisse auf Inhalte in einer CSV-Datei zu steuern. Es stehen mehrere ACL-Optionen zur Verfügung, mit denen Sie den Nutzerzugriff auf indexierte Datensätze verhindern können.

Wenn Ihrem Dokument individuelle ACL-Informationen zugeordnet sind, laden Sie alle ACL-Informationen hoch, um den Dokumentzugriff in Cloud Search zu steuern. Wenn Ihr Repository nur zum Teil oder gar keine ACL-Informationen enthält, können Sie in den folgenden Parametern Standard-ACL-Informationen angeben, die dem Connector vom SDK zur Verfügung gestellt werden.

In der Konfigurationsdatei müssen Standard-ACLs für den Connector aktiviert sein. Wenn Sie diese aktivieren möchten, setzen Sie defaultAcl.mode auf einen anderen Modus als none und konfigurieren Sie ihn mit defaultAcl.*.

Einstellung	Parameter
ACL-Modus	defaultAcl.mode=fallback Erforderlich. Für CSV-Connectors wird die Standard-ACL-Funktionalität benötigt. Nur der Fallback-Modus wird vom Connector unterstützt.
Standard-ACL-Name	defaultAcl.name=`VIRTUAL_CONTAINER_FOR_CONNECTOR_1` Optional. Ermöglicht das Überschreiben des Namens des virtuellen Containers, der vom Connector zum Einrichten von Standard-ACLs verwendet wird. Der Standardwert ist „DEFAULT_ACL_VIRTUAL_CONTAINER“. Sie können diesen Wert überschreiben, wenn Inhalte von mehreren Connectors in derselben Datenquelle indexiert werden.
Standardmäßige öffentliche ACL	defaultAcl.public=`true` Die Standard-ACL, die für das gesamte Repository verwendet wird, ist auf Leserechte für jeden innerhalb der Domain festgelegt. Der Standardwert ist false.
Allgemeine ACL für Gruppen mit Leseberechtigung	defaultAcl.readers.groups=google:`group1, group2`
Allgemeine ACL für Nutzer mit Leseberechtigung	defaultAcl.readers.users=`user1, user2, google:user3`
Allgemeine ACL für Gruppen ohne Leseberechtigung	defaultAcl.denied.groups=`group3`
Allgemeine ACL für Nutzer ohne Leseberechtigung	defaultAcl.denied.users=`user4, user5`
Zugriff auf die gesamte Domain	Wenn Sie festlegen möchten, dass jeder indexierte Datensatz für jeden Nutzer in der Domain öffentlich zugänglich sein soll, legen Sie für beide der folgenden Optionen die folgenden Werte fest: defaultAcl.mode=fallback defaultAcl.public=true
Allgemein festgelegte ACL	Wenn Sie eine ACL für jeden Datensatz des Datenrepositorys angeben möchten, legen Sie alle folgenden Parameterwerte fest: defaultAcl.mode=fallback defaultAcl.public=false defaultAcl.readers.groups=google:`group1, group2` defaultAcl.readers.users=`user1, user2, google:user3` defaultAcl.denied.groups=`group3` defaultAcl.denied.users=`user4, user5` Es wird angenommen, dass alle angegebenen Nutzer und alle Gruppen lokal definierte Nutzer/Gruppen sind, sofern nicht das Präfix „google:“ (Literalkonstante) verwendet wurde. Der Standardnutzer oder die Standardgruppe ist ein leerer String. Geben Sie nur Nutzer- und Gruppenoptionen an, wenn defaultAcl.public auf false festgelegt wurde. Verwenden Sie eine durch Kommas getrennte Liste, um mehrere Gruppen und Nutzer aufzulisten. Wenn defaultAcl.mode auf none festgelegt ist, können Datensätze ohne definierte individuelle ACLs nicht gesucht werden.

Schemadefinition

Mit Cloud Search können Sie sowohl strukturierte als auch unstrukturierte Inhalte indexieren und bereitstellen. Damit Abfragen von strukturierten Daten für Ihre Daten unterstützt werden, müssen Sie ein Schema für Ihre Datenquelle einrichten.

Anschließend kann mit dem CSV-Connector auf das definierte Schema verwiesen werden, um Indexierungsanforderungen zu erstellen. Dies kann an folgendem Beispiel veranschaulicht werden, in dem in einer CSV-Datei Informationen über Filme enthalten sind.

Nehmen Sie für die CSV-Datei folgenden Beispielinhalt an:

movieId
movieTitle
Beschreibung
Jahr
releaseDate
actors (mehrere durch Komma (,) getrennte Werte)
genre (mehrere Werte)
Bewertungen

Basierend auf der obigen Datenstruktur können Sie ein Schema für eine Datenquelle definieren, unter dem Sie Daten aus einer CSV-Datei indexieren möchten.

{
  "objectDefinitions": [
    {
      "name": "movie",
      "propertyDefinitions": [
        {
          "name": "actors",
          "isReturnable": true,
          "isRepeatable": true,
          "isFacetable": true,
          "textPropertyOptions": {
            "operatorOptions": {
              "operatorName": "actor"
            }
          }
        },
        {
          "name": "releaseDate",
          "isReturnable": true,
          "isRepeatable": false,
          "isFacetable": false,
          "datePropertyOptions": {
            "operatorOptions": {
              "operatorName": "released",
              "lessThanOperatorName": "releasedbefore",
              "greaterThanOperatorName": "releasedafter"
            }
          }
        },
        {
          "name": "movieTitle",
          "isReturnable": true,
          "isRepeatable": false,
          "isFacetable": false,
          "textPropertyOptions": {
            "retrievalImportance": {
              "importance": "HIGHEST"
            },
            "operatorOptions": {
              "operatorName": "title"
            }
          }
        },
        {
          "name": "genre",
          "isReturnable": true,
          "isRepeatable": true,
          "isFacetable": true,
          "enumPropertyOptions": {
            "operatorOptions": {
              "operatorName": "genre"
            },
            "possibleValues": [
              {
                "stringValue": "Action"
              },
              {
                "stringValue": "Documentary"
              },
              {
                "stringValue": "Drama"
              },
              {
                "stringValue": "Crime"
              },
              {
                "stringValue": "Sci-fi"
              }
            ]
          }
        },
        {
          "name": "userRating",
          "isReturnable": true,
          "isRepeatable": false,
          "isFacetable": true,
          "integerPropertyOptions": {
            "orderedRanking": "ASCENDING",
            "maximumValue": "10",
            "operatorOptions": {
              "operatorName": "score",
              "lessThanOperatorName": "scorebelow",
              "greaterThanOperatorName": "scoreabove"
            }
          }
        }
      ]
    }
  ]
}

Beispiel: Konfigurationsdatei

In der folgenden Beispielkonfigurationsdatei sehen Sie die key=value-Parameterpaare, von denen das Verhalten eines Beispielconnectors definiert wird.

# data source access
api.sourceId=1234567890abcd
api.serviceAccountPrivateKeyFile=./PrivateKey.json

# CSV data structure
csv.filePath=./movie_content.csv
csv.csvColumns=movieId,movieTitle,description,releaseYear,genre,actors,ratings,releaseDate
csv.skipHeaderRecord=true
url.format=https://mymoviesite.com/movies/{0}
url.columns=movieId
csv.datetimeFormat.releaseDate=yyyy-mm-dd
csv.multiValueColumns=genre,actors
csv.multiValue.genre=;
contentTemplate.csv.title=movieTitle

# metadata structured data and content
itemMetadata.title.field=movieTitle
itemMetadata.createTime.field=releaseDate
itemMetadata.contentLanguage.defaultValue=en-US
itemMetadata.objectType.defaultValue=movie
contentTemplate.csv.quality.medium=description
contentTemplate.csv.unmappedColumnsMode=IGNORE

#ACLs
defaultAcl.mode=fallback
defaultAcl.public=true

Ausführliche Beschreibungen der einzelnen Parameter finden Sie in der Referenzdokumentation zu Konfigurationsparametern.

Cloud Search-CSV-Connector ausführen

Geben Sie folgenden Befehl in die Kommandozeile ein, um den Connector auszuführen:

$ java -jar google-cloudsearch-csv-connector-v1-0.0.3.jar -Dconfig=my.config

Standardmäßig sind Connectorprotokolle in der normalen Ausgabe verfügbar. Sie können Protokolle erstellen und in Dateien speichern lassen, indem Sie logging.properties angeben.