CSV-Connector bereitstellen

Dieser Leitfaden richtet sich an Administratoren des Google Cloud Search-Connectors mit kommagetrennten Werten (kommagetrennte Werte), also alle, die für das Herunterladen, Konfigurieren, Ausführen und Überwachen des Connectors verantwortlich sind.

In diesem Leitfaden erfahren Sie, wie Sie wichtige Aufgaben im Zusammenhang mit der Bereitstellung des CSV-Connectors ausführen:

  • Laden Sie die CSV-Connector-Software von Google Cloud Search herunter.
  • Connector für die Verwendung mit einer bestimmten CSV-Datenquelle konfigurieren
  • Connector bereitstellen und ausführen

Um die Konzepte in diesem Dokument zu verstehen, sollten Sie mit den Grundlagen von Google Workspace, CSV-Dateien und Access Control Lists (ACLs) vertraut sein.

Übersicht über den CSV-Connector von Google Cloud Search

Der CSV-Connector von Cloud Search funktioniert mit jeder Textdatei mit kommagetrennten Werten (CSV). In einer CSV-Datei werden tabellarische Daten gespeichert. Jede Zeile der Datei ist ein Datensatz.

Der CSV-Connector von Google Cloud Search extrahiert einzelne Zeilen aus einer CSV-Datei und indexiert sie über die Indexing API von Cloud Search in Cloud Search. Nach der erfolgreichen Indexierung können einzelne Zeilen aus CSV-Dateien über die Cloud Search-Clients oder die Query API von Cloud Search durchsucht werden. Mit dem CSV-Connector kann mithilfe von ACLs auch der Nutzerzugriff auf Inhalte in den Suchergebnissen gesteuert werden.

Der CSV-Connector von Google Cloud Search kann unter Linux oder Windows installiert werden. Prüfen Sie vor dem Bereitstellen des CSV-Connectors von Google Cloud Search, ob die folgenden Komponenten vorhanden sind:

  • Java JRE 1.8, installiert auf einem Computer, auf dem der CSV-Connector von Google Cloud Search ausgeführt wird
  • Google Workspace-Informationen, die erforderlich sind, um Beziehungen zwischen Google Cloud Search und der Datenquelle herzustellen:

    In der Regel erhalten Sie diese Anmeldedaten vom Google Workspace-Administrator der Domain.

Deployment

So stellen Sie den CSV-Connector für Google Cloud Search bereit:

  1. Die CSV-Connector-Software von Google Cloud Search installieren
  2. Konfiguration des CSV-Connectors festlegen
  3. Zugriff auf die Google Cloud Search-Datenquelle konfigurieren
  4. CSV-Dateizugriff konfigurieren
  5. Zu indexierende Spaltennamen, Spalten mit eindeutigem Schlüssel und Datum/Uhrzeit-Spalten angeben
  6. Spalten angeben, die in anklickbaren Suchergebnis-URLs verwendet werden sollen
  7. Metadateninformationen und Spaltenformate angeben
  8. Datendurchlauf planen
  9. Optionen für ACLs (Access Control List) festlegen

1. SDK Installieren

Installieren Sie das SDK in Ihrem lokalen Maven-Repository.

  1. Klonen Sie das SDK-Repository von GitHub.

    $ git clone https://github.com/google-cloudsearch/connector-sdk.git
    $ cd connector-sdk/csv
  2. Prüfen Sie die gewünschte SDK-Version:

    $ git checkout tags/v1-0.0.3
  3. Erstellen Sie den Connector:

    $ mvn package
  4. Kopieren Sie die ZIP-Datei des Connectors in Ihr lokales Installationsverzeichnis:

    $ cp target/google-cloudsearch-csv-connector-v1-0.0.3.zip installation-dir
    $ cd installation-dir
    $ unzip google-cloudsearch-csv-connector-v1-0.0.3.zip
    $ cd google-cloudsearch-csv-connector-v1-0.0.3

2. Konfiguration des CSV-Connectors angeben

Als Connector-Administrator steuern Sie das Verhalten des CSV-Connectors und die Attribute, mit denen Parameter in der Konfigurationsdatei des Connectors definiert werden. Zu den konfigurierbaren Parametern gehören:

  • Zugriff auf eine Datenquelle
  • Speicherort der CSV-Datei
  • CSV-Spaltendefinitionen
  • Spalte(n), die eine eindeutige ID definieren
  • Durchlaufoptionen
  • ACL-Optionen zum Einschränken des Datenzugriffs

Damit der Connector ordnungsgemäß auf eine CSV-Datei zugreifen und die relevanten Inhalte indexieren kann, müssen Sie zuerst die zugehörige Konfigurationsdatei erstellen.

So erstellen Sie eine Konfigurationsdatei:

  1. Öffnen Sie einen Texteditor Ihrer Wahl und geben Sie der Konfigurationsdatei einen Namen.
    Fügen Sie dem Dateiinhalt key=value-Paare hinzu, wie in den folgenden Abschnitten beschrieben.
  2. Speichern Sie die Konfigurationsdatei und benennen Sie sie.
    Google empfiehlt, die Konfigurationsdatei connector-config.properties zu nennen. Zum Ausführen des Connectors sind dann keine zusätzlichen Befehlszeilenparameter erforderlich.

Da Sie den Konfigurationsdateipfad in der Befehlszeile angeben können, ist kein Standarddateispeicherort erforderlich. Belassen Sie die Konfigurationsdatei jedoch im selben Verzeichnis wie der Connector, um das Tracking und die Ausführung des Connectors zu vereinfachen.

Damit der Connector die Konfigurationsdatei erkennt, müssen Sie ihren Pfad in der Befehlszeile angeben. Andernfalls verwendet der Connector connector-config.properties in Ihrem lokalen Verzeichnis als Standarddateiname. Weitere Informationen zum Angeben des Konfigurationspfads in der Befehlszeile finden Sie unter Cloud Search-CSV-Connector ausführen.

3. Zugriff auf die Google Cloud Search-Datenquelle konfigurieren

Die ersten Parameter, die in jeder Konfigurationsdatei angegeben werden müssen, sind diejenigen, die für den Zugriff auf die Cloud Search-Datenquelle erforderlich sind (siehe folgende Tabelle). In der Regel benötigen Sie die Datenquellen-ID, die Dienstkonto-ID und den Pfad zur privaten Schlüsseldatei des Dienstkontos, um den Zugriff des Connectors auf Cloud Search zu konfigurieren. Wie Sie eine Datenquelle einrichten, erfahren Sie unter Datenquellen von Drittanbietern verwalten.

Einstellung Parameter
ID der Datenquelle api.sourceId=1234567890abcdef

Erforderlich. Die ID der vom Google Workspace-Administrator eingerichteten Google Cloud Search-Quelle, wie unter Drittanbieter-Datenquellen verwalten beschrieben.

Pfad zur privaten Schlüsseldatei des Dienstkontos api.serviceAccountPrivateKeyFile=./PrivateKey.json

Erforderlich. Die Schlüsseldatei des Google Cloud Search-Dienstkontos für den Zugriff auf den CSV-Connector von Google Cloud Search.

ID der Identitätsquelle api.identitySourceId=x0987654321

Erforderlich, wenn externe Nutzer und Gruppen verwendet werden. Die ID der Google Cloud Search-Identitätsquelle, die vom Google Workspace-Administrator eingerichtet wurde.

4. Parameter der CSV-Datei konfigurieren

Bevor der Connector eine CSV-Datei durchlaufen und Daten zur Indexierung daraus extrahieren kann, müssen Sie den Pfad zur Datei angeben. Sie können auch das Dateiformat und die Art der Dateicodierung angeben. Fügen Sie die folgenden Parameter hinzu, um die Eigenschaften der CSV-Datei in der Konfigurationsdatei anzugeben.

Einstellung Parameter
Pfad zur CSV-Datei csv.filePath=./movie_content.csv

Erforderlich. Der Pfad zur CSV-Datei, auf die zugegriffen werden soll und die Inhalte für die Indexierung extrahiert werden sollen.

Dateiformat csv.format=DEFAULT

Das Format der Datei. Mögliche Werte stammen aus der Apache Commons CSV-Klasse CSVFormat.

Zu den Formatwerten gehören: DEFAULT, EXCEL, INFORMIX_UNLOAD, INFORMIX_UNLOAD_CSV, MYSQL, RFC4180, ORACLE, POSTGRESQL_CSV, POSTGRESQL_TEXT und TDF. Wenn kein Wert angegeben ist, verwendet Cloud Search DEFAULT.

Dateiformatmodifikator csv.format.withMethod=value

Eine Änderung an der Verarbeitung der Datei in Cloud Search. Mögliche Methoden stammen aus der Apache Commons CSV-Klasse CSVFormat und beinhalten Methoden, die ein einzelnes Zeichen, einen String oder einen booleschen Wert annehmen.

Wenn Sie beispielsweise ein Semikolon als Trennzeichen angeben möchten, verwenden Sie csv.format.withDelimiter=;. Verwenden Sie csv.format.withIgnoreEmptyLines=true, um leere Zeilen zu ignorieren.

Dateicodierungstyp csv.fileEncoding=UTF-8

Der Java-Zeichensatz, der verwendet wird, wenn Cloud Search die Datei liest. Wenn keine Angabe gemacht wird, verwendet Cloud Search den Standardzeichensatz der Plattform.

5. Zu indexierende Spaltennamen und Spalten mit eindeutigem Schlüssel angeben

Damit der Connector auf CSV-Dateien zugreifen und diese indexieren kann, müssen Sie Informationen zu Spaltendefinitionen in der Konfigurationsdatei angeben. Wenn die Konfigurationsdatei nicht die Parameter enthält, die die zu indexierenden Spaltennamen und Spalten mit eindeutigen Schlüssel angeben, werden Standardwerte verwendet.

Einstellung Parameter
Spalten für Indexierung csv.csvColumns=movieId,movieTitle,description,actors,releaseDate,year,userratings...

Die aus der CSV-Datei zu indexierenden Spaltennamen. Wenn csv.csvColumns nicht festgelegt ist, wird die erste Zeile der CSV-Datei als Header verwendet. Wenn csv.csvColumns festgelegt ist, hat sie Vorrang vor der ersten Zeile der CSV-Datei. Wenn Sie csv.csvColumns festgelegt haben und die erste Zeile der CSV-Datei eine Liste von Spaltennamen ist, müssen Sie csv.skipHeaderRecord=true festlegen, damit nicht versucht wird, die erste Zeile als Daten zu indexieren. Standardwerte sind die Spalten in der Kopfzeile der Datei.

Eindeutige Schlüsselspalten csv.uniqueKeyColumns=movieId

Die CSV-Spalten, deren Werte zum Generieren der eindeutigen ID jedes Datensatzes verwendet werden. Wenn nicht angegeben, sollte der Hash des CSV-Eintrags als eindeutiger Schlüssel verwendet werden. Der Standardwert ist der Hashcode des Eintrags.

6. Spalten angeben, die in anklickbaren Suchergebnis-URLs verwendet werden sollen

Wenn ein Nutzer mit Google Cloud Search sucht, wird eine Ergebnisseite mit anklickbaren URLs für jedes Ergebnis angezeigt. Um diese Funktion zu aktivieren, müssen Sie der Konfigurationsdatei den in der folgenden Tabelle gezeigten Parameter hinzufügen.

Einstellung Parameter
Format der Suchergebnis-URL url.format=https://mymoviesite.com/movies/{0}

Erforderlich. Das Format, in dem eine Ansichts-URL für CSV-Inhalte erstellt wird.

URL-Parameter für Suchergebnisse. url.columns=movieId

Erforderlich. Die CSV-Spaltennamen, deren Werte zum Generieren der Ansichts-URL des Eintrags verwendet werden.

URL-Parameter für Suchergebnisse, die maskiert werden sollen url.columnsToEscape=movieId

Optional. Die CSV-Spaltennamen, deren Werte mit URL-Escape-Zeichen versehen werden, um eine gültige Ansichts-URL zu generieren.

7. Metadateninformationen, Spaltenformate und Suchqualität angeben

Sie können der Konfigurationsdatei Parameter hinzufügen, die Folgendes angeben:

Konfigurationsparameter für Metadaten

Konfigurationsparameter für Metadaten beschreiben die CSV-Spalten, die zum Auffüllen von Objektmetadaten verwendet werden. Wenn die Konfigurationsdatei diese Parameter nicht enthält, werden Standardwerte verwendet. Die folgende Tabelle zeigt diese Parameter.

Einstellung Parameter
Titel itemMetadata.title.field=movieTitle
itemMetadata.title.defaultValue=Gone with the Wind

Das Metadatenattribut, das den Wert enthält, der dem Dokumenttitel entspricht. Der Standardwert ist ein leerer String.

URL itemMetadata.sourceRepositoryUrl.field=url
itemMetadata.sourceRepositoryUrl.defaultValue=https://www.imdb.com/title/tt0031381/
Das Metadatenattribut, das den Wert für die Dokument-URL für Suchergebnisse enthält.
Zeitstempel der Erstellung itemMetadata.createTime.field=releaseDate
itemMetadata.createTime.defaultValue=1940-01-17

Das Metadatenattribut, das den Wert für den Zeitstempel der Dokumenterstellung enthält.

Zeitpunkt der letzten Aktualisierung itemMetadata.updateTime.field=releaseDate
itemMetadata.updateTime.defaultValue=1940-01-17

Das Metadatenattribut, das den Wert für den Zeitstempel der letzten Änderung für das Dokument enthält.

Dokumentsprache itemMetadata.contentLanguage.field=languageCode
itemMetadata.contentLanguage.defaultValue=en-US

Die Inhaltssprache der indexierten Dokumente.

Schemaobjekttyp itemMetadata.objectType.field=type
itemMetadata.objectType.defaultValue=movie

Der Objekttyp, der vom Connector verwendet wird, wie im Schema definiert. Der Connector indexiert keine strukturierten Daten, wenn diese Eigenschaft nicht angegeben ist.

Datums-/Uhrzeitformate

Datum/Uhrzeit-Formate geben die in Metadatenattributen erwarteten Formate an. Wenn die Konfigurationsdatei diesen Parameter nicht enthält, werden Standardwerte verwendet. In der folgenden Tabelle sehen Sie diesen Parameter.

Einstellung Parameter
Zusätzliche Datum/Uhrzeit-Formate structuredData.dateTimePatterns=MM/dd/uuuu HH:mm:ssXXX
Eine durch Semikolons getrennte Liste zusätzlicher Muster des Typs java.time.format.DateTimeFormatter. Die Muster werden verwendet, wenn Stringwerte für Datums- oder Datum-Uhrzeitfelder in den Metadaten oder im Schema geparst werden. Der Standardwert ist eine leere Liste. Die Formate RFC 3339 und RFC 1123 werden jedoch immer unterstützt.

Spaltenformate

Spaltenformate geben Informationen zu den Spalten an, die Teil des durchsuchbaren Inhalts sein sollen. Wenn die Konfigurationsdatei diese Parameter nicht enthält, werden Standardwerte verwendet. Die folgende Tabelle zeigt diese Parameter.

Einstellung Parameter
Kopfzeile überspringen csv.skipHeaderRecord=true

Boolescher Wert. Ignorieren Sie den Header-Datensatz (erste Zeile) in der CSV-Datei. Wenn Sie csv.csvColumns festgelegt haben und die CSV-Datei eine Kopfzeile hat, müssen Sie skipHeaderRecord=true festlegen. Dadurch wird verhindert, dass die erste Zeile in der Datei als Daten indexiert wird. Wenn die CSV-Datei keine Kopfzeile hat, legen Sie skipHeaderRecord=false fest. Der Standardwert ist „false“.

Spalten mit mehreren Werten csv.multiValueColumns=genre,actors

Die Spaltennamen in der CSV-Datei, die mehrere Werte enthalten. Der Standardwert ist ein leerer String.

Trennzeichen für Spalten mit mehreren Werten csv.multiValue.genre=;

Das Trennzeichen für die Spalten mit mehreren Werten. Das Standardtrennzeichen ist ein Komma.

Suchqualität

Der CSV-Connector von Cloud Search ermöglicht die automatische HTML-Formatierung für Datenfelder. Die Datenfelder werden vom Connector zu Beginn der Ausführung definiert und dann mithilfe einer Inhaltsvorlage jeder Datensatz formatiert, bevor er in Cloud Search hochgeladen wird.

In der Inhaltsvorlage wird die Wichtigkeit jedes Feldwerts für die Suche definiert. Das Titelfeld ist erforderlich und hat die höchste Priorität. Für alle anderen Inhaltsfelder können Sie Wichtigkeitsstufen für die Suchqualität festlegen: hoch, mittel oder niedrig. Jedes Inhaltsfeld, das nicht in einer bestimmten Kategorie definiert ist, hat standardmäßig eine niedrige Priorität. Die folgende Tabelle zeigt diese Parameter.

Einstellung Parameter
Titel des Inhalts contentTemplate.csv.title=movieTitle

Der Inhaltstitel ist das Feld mit der höchsten Suchqualität.

Hohe Suchqualität für Inhaltsfelder contentTemplate.csv.quality.high=actors

Inhaltsfelder mit einem hohen Wert für die Suchqualität. Der Standardwert ist ein leerer String.

Niedrige Suchqualität für Inhaltsfelder contentTemplate.csv.quality.low=genre

Inhaltsfelder mit einem niedrigen Wert für die Suchqualität. Der Standardwert ist ein leerer String.

Mittlere Suchqualität für Inhaltsfelder contentTemplate.csv.quality.medium=description

Inhaltsfelder mit einem mittleren Wert für die Suchqualität. Der Standardwert ist ein leerer String.

Nicht angegebene Inhaltsfelder contentTemplate.csv.unmappedColumnsMode=IGNORE

Die Verarbeitung nicht angegebener Inhaltsfelder durch den Connector. Gültige Werte sind:

  • APPEND: Fügt der Vorlage nicht spezifizierte Inhaltsfelder hinzu
  • IGNORE: Nicht spezifizierte Inhaltsfelder werden ignoriert

    Der Standardwert ist APPEND..

8. Datendurchlauf planen

Der Durchlauf ist der Prozess des Connectors, bei dem Inhalte in der Datenquelle ermittelt werden, in diesem Fall eine CSV-Datei. Während der CSV-Connector ausgeführt wird, durchläuft er die Zeilen einer CSV-Datei und indexiert jede Zeile über die API für Cloud Search.

Bei einem Durchlauf mit vollständiger Indexierung (Full Traversal) werden alle Spalten in der Datei indexiert. Beim inkrementellen Durchlauf werden nur Spalten indexiert, die seit dem vorherigen Durchlauf hinzugefügt oder geändert wurden. Der CSV-Connector führt nur Durchläufe mit vollständiger Indexierung durch. Es werden keine Durchläufe mit Teilindexierung durchgeführt.

Mit den Planungsparametern legen Sie fest, wie oft der Connector zwischen Durchläufen wartet. Wenn die Konfigurationsdatei keine Planungsparameter enthält, werden Standardwerte verwendet. Die folgende Tabelle zeigt diese Parameter.

Einstellung Parameter
Durchlauf mit vollständiger Indexierung nach Intervall schedule.traversalIntervalSecs=7200

Der Connector führt nach einem bestimmten Intervall einen vollständigen Durchlauf durch. Geben Sie das Intervall zwischen den Durchläufen in Sekunden an. Der Standardwert ist 86.400, also die Anzahl der Sekunden eines Tages.

Durchlauf mit vollständiger Indexierung beim Start des Connectors schedule.performTraversalOnStart=false

Der Connector führt beim Start des Connectors einen vollständigen Durchlauf durch, anstatt auf den Ablauf des ersten Intervalls zu warten. Der Standardwert ist true.

9. Optionen für Access Control List (ACL) festlegen

Der CSV-Connector von Google Cloud Search unterstützt Berechtigungen über ACLs, um den Zugriff auf den Inhalt der CSV-Datei in den Suchergebnissen zu steuern. Es gibt mehrere ACL-Optionen, mit denen Sie den Nutzerzugriff auf indexierte Datensätze schützen können.

Wenn jedem Dokument in Ihrem Repository individuelle ACL-Informationen zugeordnet sind, laden Sie alle ACL-Informationen hoch, um den Dokumentzugriff in Cloud Search zu steuern. Wenn Ihr Repository unvollständige oder keine ACL-Informationen enthält, können Sie in den folgenden Parametern Standard-ACL-Informationen angeben. Diese werden vom SDK an den Connector weitergeleitet.

Für den Connector müssen Standard-ACLs in der Konfigurationsdatei aktiviert sein. Wenn Sie Standard-ACLs aktivieren möchten, setzen Sie defaultAcl.mode auf einen anderen Modus als none und konfigurieren Sie ihn mit defaultAcl.*

Einstellung Parameter
ACL-Modus defaultAcl.mode=fallback

Erforderlich. Für CSV-Connectors sind die Standard-ACL-Funktionen erforderlich. Connector unterstützt nur den Fallback-Modus.

Standard-ACL-Name defaultAcl.name=VIRTUAL_CONTAINER_FOR_CONNECTOR_1

Optional. Ermöglicht das Überschreiben des Namens des virtuellen Containers, der vom Connector zum Einrichten von Standard-ACLs verwendet wird. Der Standardwert ist "DEFAULT_ACL_VIRTUAL_CONTAINER". Sie können diesen Wert überschreiben, wenn Inhalte in derselben Datenquelle von mehreren Connectors indexiert werden.

Standardmäßige öffentliche ACL defaultAcl.public=true

Als Standard-ACL für das gesamte Repository ist der Zugriff auf die öffentliche Domain festgelegt. Der Standardwert ist false.

Allgemeine ACL für Gruppen mit Leseberechtigung defaultAcl.readers.groups=google:group1, group2
Allgemeine ACL für Nutzer mit Leseberechtigung defaultAcl.readers.users=user1, user2, google:user3
Allgemeine ACL für Gruppen ohne Leseberechtigung defaultAcl.denied.groups=group3
Allgemeine ACL für Nutzer ohne Leseberechtigung defaultAcl.denied.users=user4, user5
Zugriff auf gesamte Domain Um anzugeben, dass jeder indexierte Datensatz für jeden Nutzer in der Domain öffentlich zugänglich sein soll, legen Sie die beiden folgenden Optionen mit Werten fest:
  • defaultAcl.mode=fallback
  • defaultAcl.public=true
Allgemeine ACL Um eine ACL für jeden Datensatz des Datenarchivs anzugeben, legen Sie alle folgenden Parameterwerte fest:
  • defaultAcl.mode=fallback
  • defaultAcl.public=false
  • defaultAcl.readers.groups=google:group1, group2
  • defaultAcl.readers.users=user1, user2, google:user3
  • defaultAcl.denied.groups=group3
  • defaultAcl.denied.users=user4, user5

    Es wird angenommen, dass es sich bei allen angegebenen Nutzern und Gruppen um eine in der lokalen Domain definierte Nutzer-/Gruppe handelt, sofern ihnen nicht das Präfix google: (Literalkonstante) vorangestellt ist.

    Der Standardnutzer oder die Standardgruppe ist ein leerer String. Geben Sie Nutzer- und Gruppenoptionen nur an, wenn defaultAcl.public auf false gesetzt ist. Verwenden Sie eine durch Kommas getrennte Liste, um mehrere Gruppen und Nutzer aufzulisten.

    Wenn defaultAcl.mode auf none festgelegt ist, können Datensätze ohne definierte individuelle ACLs nicht gesucht werden.

Schemadefinition

Mit Cloud Search können strukturierte und unstrukturierte Inhalte indexiert und bereitgestellt werden. Damit Abfragen von strukturierten Daten für Ihre Daten unterstützt werden, müssen Sie ein Schema für Ihre Datenquelle einrichten.

Nach der Definition kann der CSV-Connector auf das definierte Schema verweisen, um Indexierungsanfragen zu erstellen. Als Beispiel dient hier eine CSV-Datei mit Informationen zu Filmen.

Angenommen, die Eingabe-CSV-Datei enthält folgenden Inhalt.

  1. movieId
  2. movieTitle
  3. Beschreibung
  4. Jahr
  5. releaseDate
  6. Schauspieler (mehrere durch Komma (,) getrennte Werte)
  7. genre (mehrere Werte)
  8. Bewertungen

Basierend auf der obigen Datenstruktur können Sie ein Schema für eine Datenquelle definieren, unter dem Sie Daten aus einer CSV-Datei indexieren möchten.

{
  "objectDefinitions": [
    {
      "name": "movie",
      "propertyDefinitions": [
        {
          "name": "actors",
          "isReturnable": true,
          "isRepeatable": true,
          "isFacetable": true,
          "textPropertyOptions": {
            "operatorOptions": {
              "operatorName": "actor"
            }
          }
        },
        {
          "name": "releaseDate",
          "isReturnable": true,
          "isRepeatable": false,
          "isFacetable": false,
          "datePropertyOptions": {
            "operatorOptions": {
              "operatorName": "released",
              "lessThanOperatorName": "releasedbefore",
              "greaterThanOperatorName": "releasedafter"
            }
          }
        },
        {
          "name": "movieTitle",
          "isReturnable": true,
          "isRepeatable": false,
          "isFacetable": false,
          "textPropertyOptions": {
            "retrievalImportance": {
              "importance": "HIGHEST"
            },
            "operatorOptions": {
              "operatorName": "title"
            }
          }
        },
        {
          "name": "genre",
          "isReturnable": true,
          "isRepeatable": true,
          "isFacetable": true,
          "enumPropertyOptions": {
            "operatorOptions": {
              "operatorName": "genre"
            },
            "possibleValues": [
              {
                "stringValue": "Action"
              },
              {
                "stringValue": "Documentary"
              },
              {
                "stringValue": "Drama"
              },
              {
                "stringValue": "Crime"
              },
              {
                "stringValue": "Sci-fi"
              }
            ]
          }
        },
        {
          "name": "userRating",
          "isReturnable": true,
          "isRepeatable": false,
          "isFacetable": true,
          "integerPropertyOptions": {
            "orderedRanking": "ASCENDING",
            "maximumValue": "10",
            "operatorOptions": {
              "operatorName": "score",
              "lessThanOperatorName": "scorebelow",
              "greaterThanOperatorName": "scoreabove"
            }
          }
        }
      ]
    }
  ]
}

Beispiel: Konfigurationsdatei

In der folgenden Beispielkonfigurationsdatei sehen Sie die key=value-Parameterpaare, die das Verhalten eines Beispielconnectors definieren.

# data source access
api.sourceId=1234567890abcd
api.serviceAccountPrivateKeyFile=./PrivateKey.json

# CSV data structure
csv.filePath=./movie_content.csv
csv.csvColumns=movieId,movieTitle,description,releaseYear,genre,actors,ratings,releaseDate
csv.skipHeaderRecord=true
url.format=https://mymoviesite.com/movies/{0}
url.columns=movieId
csv.datetimeFormat.releaseDate=yyyy-mm-dd
csv.multiValueColumns=genre,actors
csv.multiValue.genre=;
contentTemplate.csv.title=movieTitle

# metadata structured data and content
itemMetadata.title.field=movieTitle
itemMetadata.createTime.field=releaseDate
itemMetadata.contentLanguage.defaultValue=en-US
itemMetadata.objectType.defaultValue=movie
contentTemplate.csv.quality.medium=description
contentTemplate.csv.unmappedColumnsMode=IGNORE

#ACLs
defaultAcl.mode=fallback
defaultAcl.public=true

Ausführliche Beschreibungen der einzelnen Parameter finden Sie in der Referenz zu den Konfigurationsparametern.

Cloud Search-CSV-Connector ausführen

Geben Sie den folgenden Befehl ein, um den Connector über die Befehlszeile auszuführen:

$ java -jar google-cloudsearch-csv-connector-v1-0.0.3.jar -Dconfig=my.config

Connector-Protokolle sind standardmäßig in der Standardausgabe verfügbar. Sie können Protokolle erstellen und in Dateien speichern lassen, indem Sie logging.properties angeben.