CSV Bağlayıcısı dağıtma

Bu kılavuz, Google Cloud Search CSV (virgülle ayrılmış değerler) bağlayıcı yöneticilerine, yani bağlayıcıyı indirmekten, yapılandırmaktan, çalıştırmaktan ve izlemekten sorumlu olan kişiler için hazırlanmıştır.

Bu kılavuz, CSV bağlayıcı dağıtımıyla ilgili temel görevlerin gerçekleştirilmesine yönelik talimatları içerir:

  • Google Cloud Search CSV bağlayıcı yazılımını indirin
  • Bağlayıcıyı belirli bir CSV veri kaynağıyla kullanılacak şekilde yapılandırma
  • Bağlayıcıyı dağıtma ve çalıştırma

Bu belgedeki kavramları anlamak için Google Workspace, CSV dosyaları ve Erişim Kontrol Listeleri (EKL'ler) ile ilgili temel bilgilere aşina olmanız gerekir.

Google Cloud Search CSV bağlayıcısına genel bakış

Cloud Search CSV bağlayıcısı, virgülle ayrılmış değerler (CSV) metin dosyalarıyla çalışır. CSV dosyası, tablo biçimindeki verileri depolar ve dosyanın her satırı bir veri kaydıdır.

Google Cloud Search'ün CSV Bağlayıcısı, CSV dosyasından bağımsız satırları ayıklar ve Cloud Search'ün Dizine Ekleme API'si aracılığıyla Cloud Search'e dizine ekler. Başarıyla dizine eklenen CSV dosyalarındaki satırlar, Cloud Search istemcileri veya Cloud Search'ün Query API'si üzerinden ayrı ayrı aranabilir. CSV bağlayıcısı, EKL'leri kullanarak kullanıcıların arama sonuçlarındaki içeriğe erişiminin kontrol edilmesini de destekler.

Google Cloud Search CSV bağlayıcısı, Linux veya Windows'a yüklenebilir. Google Cloud Search CSV bağlayıcısını dağıtmadan önce aşağıdaki gerekli bileşenlere sahip olduğunuzdan emin olun:

  • Google Cloud Search CSV bağlayıcısını çalıştıran bir bilgisayarda yüklü Java JRE 1.8
  • Google Cloud Search ile veri kaynağı arasında ilişki kurmak için gereken Google Workspace bilgileri:

    Genellikle bu kimlik bilgilerini alanın Google Workspace yöneticisi sizin için sağlayabilir.

Dağıtım adımları

Google Cloud Search CSV bağlayıcısını dağıtmak için şu adımları uygulayın:

  1. Google Cloud Search CSV bağlayıcı yazılımını yükleme
  2. CSV bağlayıcı yapılandırmasını belirtme
  3. Google Cloud Search veri kaynağına erişimi yapılandırma
  4. CSV dosyası erişimini yapılandırma
  5. Dizine eklenecek sütun adlarını, benzersiz anahtar sütunlarını ve tarih ve saat sütunlarını belirtme
  6. Tıklanabilir arama sonucu URL'lerinde kullanılacak sütunları belirtme
  7. Meta veri bilgilerini, sütun biçimlerini belirtme
  8. Veri geçişini planlama
  9. Erişim Kontrol Listesi (EKL) seçeneklerini belirtme

1. SDK'yı yükleyin

SDK'yı yerel Maven deponuza yükleyin.

  1. GitHub'dan SDK deposunu klonlayın.

    $ git clone https://github.com/google-cloudsearch/connector-sdk.git
    $ cd connector-sdk/csv
  2. İstediğiniz SDK sürümünü kontrol edin:

    $ git checkout tags/v1-0.0.3
  3. Bağlayıcıyı oluşturun:

    $ mvn package
  4. Bağlayıcı zip dosyasını yerel yükleme dizininize kopyalayın:

    $ cp target/google-cloudsearch-csv-connector-v1-0.0.3.zip installation-dir
    $ cd installation-dir
    $ unzip google-cloudsearch-csv-connector-v1-0.0.3.zip
    $ cd google-cloudsearch-csv-connector-v1-0.0.3

2. CSV bağlayıcı yapılandırmasını belirtme

Bağlayıcı yöneticisi olarak, bağlayıcının yapılandırma dosyasında CSV bağlayıcısının davranışını ve parametreleri tanımlayan özellikleri siz kontrol edersiniz. Yapılandırılabilir parametreler şunlardır:

  • Bir veri kaynağına erişim
  • CSV dosyasının konumu
  • CSV sütunu tanımları
  • Benzersiz bir kimliği tanımlayan sütunlar
  • Geçiş seçenekleri
  • Veri erişimini kısıtlamak için EKL seçenekleri

Bağlayıcının bir CSV dosyasına düzgün şekilde erişmesi ve ilgili içeriği dizine eklemesi için önce yapılandırma dosyasını oluşturmanız gerekir.

Bir yapılandırma dosyası oluşturmak için:

  1. İstediğiniz metin düzenleyiciyi açın ve yapılandırma dosyasını adlandırın.
    anahtar=değer çiftlerini, aşağıdaki bölümlerde açıklandığı şekilde dosya içeriklerine ekleyin.
  2. Yapılandırma dosyasını kaydedin ve adlandırın.
    Google, bağlayıcı çalıştırmak için ek komut satırı parametrelerine gerek kalmayacak şekilde yapılandırma dosyasını connector-config.properties olarak adlandırmanızı önerir.

Yapılandırma dosyası yolunu komut satırında belirtebileceğiniz için standart bir dosya konumu gerekli değildir. Ancak, bağlayıcının izlenmesini ve çalıştırılmasını kolaylaştırmak için yapılandırma dosyasını bağlayıcıyla aynı dizinde tutun.

Bağlayıcının yapılandırma dosyanızı tanıdığından emin olmak için komut satırında yolunu belirtin. Aksi takdirde, bağlayıcı varsayılan dosya adı olarak yerel dizininizde connector-config.properties'i kullanır. Komut satırında yapılandırma yolunu belirtme hakkında bilgi edinmek için Cloud Search CSV bağlayıcısını çalıştırma bölümünü inceleyin.

3. Google Cloud Search veri kaynağına erişimi yapılandırma

Her yapılandırma dosyasının belirtmesi gereken ilk parametreler, aşağıdaki tabloda gösterildiği gibi, Cloud Search veri kaynağına erişmek için gereklidir. Genellikle, bağlayıcının Cloud Search'e erişimini yapılandırmak için veri kaynağı kimliğine, hizmet hesabı kimliğine ve hizmet hesabının özel anahtar dosyasının yoluna ihtiyacınız olur. Veri kaynağı oluşturmak için gereken adımlar Üçüncü taraf veri kaynaklarını yönetme bölümünde açıklanmıştır

Yer Parametre
Veri kaynağı kimliği api.sourceId=1234567890abcdef

Zorunlu. Google Workspace yöneticisi tarafından ayarlanan Google Cloud Search kaynak kimliği (Üçüncü taraf veri kaynaklarını yönetme başlıklı makalede açıklandığı gibi).

Hizmet hesabı özel anahtar dosyasının yolu api.serviceAccountPrivateKeyFile=./PrivateKey.json

Zorunlu. Google Cloud Search CSV bağlayıcı erişilebilirliği için Google Cloud Search hizmet hesabı anahtar dosyası.

Kimlik kaynağı kimliği api.identitySourceId=x0987654321

Harici kullanıcılar ve gruplar kullanılıyorsa gereklidir. Google Workspace yöneticisi tarafından oluşturulan Google Cloud Search kimlik kaynağı kimliği.

4. CSV dosyası parametrelerini yapılandırma

Bağlayıcının bir CSV dosyasını çekip dizine eklemek üzere bu dosyadan veri çıkarabilmesi için dosyanın yolunu belirlemeniz gerekir. Dosya biçimini ve dosya kodlama türünü de belirtebilirsiniz. Yapılandırma dosyasında CSV dosyası özelliklerini belirtmek için aşağıdaki parametreleri ekleyin.

Yer Parametre
CSV dosyasının yolu csv.filePath=./movie_content.csv

Zorunlu. Erişilecek ve dizine eklenecek içeriği çıkaracak CSV dosyasının yolu.

Dosya biçimi csv.format=DEFAULT

Dosyanın biçimi. Olası değerler Apache Commons CSV CSVFormat sınıfındandır.

Biçim değerleri şunları içerir: DEFAULT, EXCEL, INFORMIX_UNLOAD, INFORMIX_UNLOAD_CSV, MYSQL, RFC4180, ORACLE, POSTGRESQL_CSV, POSTGRESQL_TEXT ve TDF. Belirtilmemişse Cloud Search, DEFAULT değerini kullanır.

Dosya biçimi değiştiricisi csv.format.withMethod=value

Cloud Search'ün dosyayı işleme biçiminde yapılan bir değişiklik. Olası yöntemler, Apache Commons CSV CSVFormat sınıfındandır ve tek bir karakter, dize veya boole değeri içeren yöntemleri içerir.

Örneğin, bir noktalı virgülü ayırıcı olarak belirtmek için csv.format.withDelimiter=; işlevini kullanın. Boş satırları yoksaymak için csv.format.withIgnoreEmptyLines=true işlevini kullanın.

Dosya kodlama türü csv.fileEncoding=UTF-8

Cloud Search dosyayı okurken kullanılacak Java karakter kümesi. Belirtilmemişse Cloud Search, platformun varsayılan karakter kümesini kullanır.

5. Dizine eklenecek sütun adlarını ve benzersiz anahtar sütunlarını belirtin

Bağlayıcının CSV dosyalarına erişmesi ve bunları dizine eklemesi için yapılandırma dosyasındaki sütun tanımları hakkında bilgi sağlamanız gerekir. Yapılandırma dosyası, dizine eklenecek sütun adlarını ve benzersiz anahtar sütunlarını belirten parametreleri içermiyorsa varsayılan değerler kullanılır.

Yer Parametre
Dizine eklenecek sütunlar csv.csvColumns=movieId,movieTitle,description,actors,releaseDate,year,userratings...

CSV dosyasından dizine eklenecek sütun adları. csv.csvColumns ayarlanmazsa CSV dosyasının ilk satırı başlık olarak kullanılır. csv.csvColumns ayarlanırsa ilk CSV satırına göre öncelikli olur. csv.csvColumns değerini ayarladıysanız ve CSV dosyasının ilk satırı sütun adlarının bir listesiyse ilk satırı veri olarak dizine eklemeye çalışmamak için csv.skipHeaderRecord=true değerini ayarlamanız gerekir. Varsayılan değerler, dosyanın başlık satırındaki sütunlardır.

Benzersiz anahtar sütunları csv.uniqueKeyColumns=movieId

Her kaydın benzersiz kimliğini oluşturmak için değerleri kullanılacak olan CSV sütunları. Belirtilmezse CSV kaydının karması, benzersiz anahtar olarak kullanılmalıdır. Varsayılan değer, kaydın karma kodudur.

6. Tıklanabilir arama sonucu URL'lerinde kullanılacak sütunları belirtin

Bir kullanıcı Google Cloud Search'ü kullanarak arama yaptığında, her sonuç için tıklanabilir URL'ler içeren bir sonuç sayfası göstererek yanıt verir. Bu özelliği etkinleştirmek için aşağıdaki tabloda gösterilen parametreyi yapılandırma dosyasına eklemeniz gerekir.

Yer Parametre
Arama sonucu URL biçimi url.format=https://mymoviesite.com/movies/{0}

Zorunlu. CSV içeriği için görüntüleme URL'si oluşturma biçimi.

Arama sonuçları URL parametreleri. url.columns=movieId

Zorunlu. Kaydın görünüm URL'sini oluşturmak için değerleri kullanılacak olan CSV sütun adları.

Çıkış yapılacak arama sonuçları URL parametreleri url.columnsToEscape=movieId

İsteğe bağlı. Geçerli bir görüntüleme URL'si oluşturmak için değerleri URL çıkışlı olacak şekilde CSV sütun adları.

7. Meta veri bilgilerini, sütun biçimlerini, arama kalitesini belirtin

Yapılandırma dosyasına aşağıdakileri belirten parametreler ekleyebilirsiniz:

Meta Veri Yapılandırma Parametreleri

Meta Veri Yapılandırma Parametreleri, öğe meta verilerini doldurmak için kullanılan CSV sütunlarını açıklar. Yapılandırma dosyası bu parametreleri içermiyorsa varsayılan değerler kullanılır. Bu parametreler aşağıdaki tabloda gösterilmiştir.

Ayar Parametre
Başlık itemMetadata.title.field=movieTitle
itemMetadata.title.defaultValue=Gone with the Wind

Doküman başlığına karşılık gelen değeri içeren meta veri özelliği. Varsayılan değer boş bir dizedir.

URL itemMetadata.sourceRepositoryUrl.field=url
itemMetadata.sourceRepositoryUrl.defaultValue=https://www.imdb.com/title/tt0031381/
Arama sonuçları için doküman URL'sinin değerini içeren meta veri özelliği.
Oluşturma zaman damgası itemMetadata.createTime.field=releaseDate
itemMetadata.createTime.defaultValue=1940-01-17

Doküman oluşturma zaman damgası değerini içeren meta veri özelliği.

Son değiştirilme zamanı itemMetadata.updateTime.field=releaseDate
itemMetadata.updateTime.defaultValue=1940-01-17

Dokümanın son değiştirme zaman damgasının değerini içeren meta veri özelliği.

Belge dili itemMetadata.contentLanguage.field=languageCode
itemMetadata.contentLanguage.defaultValue=en-US

Dizine eklenen dokümanların içerik dili.

Şema nesnesi türü itemMetadata.objectType.field=type
itemMetadata.objectType.defaultValue=movie

Şemada tanımlandığı şekilde, bağlayıcı tarafından kullanılan nesne türü. Bu özellik belirtilmezse bağlayıcı hiçbir yapılandırılmış veriyi dizine eklemez.

Tarih ve saat biçimleri

Tarih ve saat biçimleri, meta veri özelliklerinde beklenen biçimleri belirtir. Yapılandırma dosyası bu parametreyi içermiyorsa varsayılan değerler kullanılır. Aşağıdaki tabloda bu parametre gösterilmektedir.

Ayar Parametre
Ek tarih ve saat biçimleri structuredData.dateTimePatterns=MM/dd/uuuu HH:mm:ssXXX
Ek java.time.format.DateTimeFormatter kalıplarının noktalı virgül ile ayrılmış listesi. Kalıplar, meta veri veya şemadaki herhangi bir tarih veya tarih-saat alanına ait dize değerlerini ayrıştırırken kullanılır. Varsayılan değer boş bir listedir ancak RFC 3339 ve RFC 1123 biçimleri her zaman desteklenir.

Sütun biçimleri

Sütun biçimleri, aranabilir içeriğin bir parçası olması gereken sütunlarla ilgili bilgileri belirtir. Yapılandırma dosyası bu parametreleri içermiyorsa varsayılan değerler kullanılır. Bu parametreler aşağıdaki tabloda gösterilmiştir.

Yer Parametre
Üstbilgiyi atla csv.skipHeaderRecord=true

Boole. CSV dosyasındaki başlık kaydını (ilk satır) yoksayın. csv.csvColumns ayarını yaptıysanız ve CSV dosyasında başlık satırı varsa skipHeaderRecord=true değerini ayarlamanız gerekir. Bu durum, dosyadaki ilk satırın veri olarak dizine eklenmesini engeller. CSV dosyasında başlık satırı yoksa skipHeaderRecord=false değerini ayarlayın. Varsayılan değer false'tur.

Birden çok değer içeren sütunlar csv.multiValueColumns=genre,actors

CSV dosyasında birden fazla değere sahip sütun adları. Varsayılan değer boş bir dizedir.

Birden çok değerli sütunlar için sınırlayıcı csv.multiValue.genre=;

Birden çok değerli sütunlara ilişkin ayırıcı. Varsayılan ayırıcı virgüldür.

Arama kalitesi

Cloud Search CSV bağlayıcısı, veri alanları için otomatik HTML biçimlendirmesi sağlar. Bağlayıcınız, bağlayıcı yürütme işleminin başında veri alanlarını tanımlar ve Cloud Search'e yüklemeden önce her bir veri kaydını biçimlendirmek için bir içerik şablonu kullanır.

İçerik şablonu, arama için her alan değerinin önemini tanımlar. Başlık alanı zorunludur ve en yüksek öncelik olarak tanımlanır. Diğer tüm içerik alanları için arama kalitesi önem düzeyleri belirleyebilirsiniz: yüksek, orta veya düşük. Belirli bir kategoride tanımlanmamış herhangi bir içerik alanı, varsayılan olarak düşük önceliğe sahiptir. Bu parametreler aşağıdaki tabloda gösterilmiştir.

Yer Parametre
İçerik başlığı contentTemplate.csv.title=movieTitle

İçerik başlığı, en yüksek arama kalitesi alanıdır.

İçerik alanları için yüksek arama kalitesi contentTemplate.csv.quality.high=actors

Arama kalitesi değerinin yüksek olduğu içerik alanları. Varsayılan değer boş bir dizedir.

İçerik alanları için düşük arama kalitesi contentTemplate.csv.quality.low=genre

İçerik alanlarına düşük arama kalitesi değeri verilir. Varsayılan değer boş bir dizedir.

İçerik alanları için arama kalitesi orta contentTemplate.csv.quality.medium=description

İçerik alanlarına orta seviyede arama kalitesi değeri verilir. Varsayılan değer boş bir dizedir.

Belirtilmemiş içerik alanları contentTemplate.csv.unmappedColumnsMode=IGNORE

Bağlayıcının belirtilmemiş içerik alanlarını nasıl işlediği. Valid values are:

  • APPEND: Belirtilmemiş içerik alanlarını şablona ekler.
  • YOKSAY: Belirtilmemiş içerik alanlarını yoksayın

    Varsayılan değer APPEND.'dır.

8. Veri geçişi planlayın

Geçiş, bağlayıcının veri kaynağından (bu örnekte CSV dosyası) içerik keşfetme işlemidir. CSV bağlayıcısı çalışırken, bir CSV dosyasının satırlarını aktarır ve Dizine Ekleme API'si aracılığıyla her satırı Cloud Search'e ekler.

Tam geçiş, dosyadaki tüm sütunları dizine ekler. Artımlı geçiş yalnızca önceki geçişten sonra eklenen veya değiştirilen sütunları dizine ekler. CSV bağlayıcısı yalnızca tam geçişler gerçekleştirir. Artımlı geçişler yapmaz.

Planlama parametreleri, bağlayıcının geçişler arasında ne sıklıkta bekleyeceğini belirler. Yapılandırma dosyası planlama parametreleri içermiyorsa varsayılan değerler kullanılır. Bu parametreler aşağıdaki tabloda gösterilmiştir.

Yer Parametre
Bir aradan sonra tam geçiş schedule.traversalIntervalSecs=7200

Bağlayıcı, belirtilen bir aralıktan sonra tam geçiş yapar. Geçişler arasındaki aralığı saniye cinsinden belirtin. Varsayılan değer 86400 (bir gündeki saniye sayısı) şeklindedir.

Bağlayıcı başlatıldığında tam geçiş schedule.performTraversalOnStart=false

Bağlayıcı, ilk aralığın süresinin dolmasını beklemek yerine bağlayıcı başlatılırken tam bir geçiş gerçekleştirir. Varsayılan değer true (doğru) değeridir.

9. Erişim Kontrol Listesi (EKL) seçeneklerini belirtme

Google Cloud Search CSV bağlayıcısı, arama sonuçlarındaki CSV dosyasının içeriğine erişimi kontrol etmek için EKL'ler üzerinden izinleri destekler. Dizine eklenen kayıtlara kullanıcı erişimini korumanızı sağlamak için birden fazla EKL seçeneği vardır.

Deponuz her belgeyle ilişkili bağımsız EKL bilgileri içeriyorsa Cloud Search'te belge erişimini kontrol etmek için tüm EKL bilgilerini yükleyin. Deponuz EKL bilgisi kısmi sağlıyorsa veya hiç sağlamıyorsa EKL bilgilerini SDK'nın bağlayıcıya sağladığı aşağıdaki parametrelerde sağlayabilirsiniz.

Bağlayıcı, yapılandırma dosyasında etkinleştirilen varsayılan EKL'lere dayanır. Varsayılan EKL'leri etkinleştirmek için defaultAcl.mode öğesini none dışında herhangi bir moda ayarlayın ve defaultAcl.* ile yapılandırın.

Yer Parametre
EKL modu defaultAcl.mode=fallback

Zorunlu. CSV bağlayıcısı Varsayılan EKL işlevini temel alır. Bağlayıcı yalnızca yedek modu destekler.

Varsayılan EKL Adı defaultAcl.name=VIRTUAL_CONTAINER_FOR_CONNECTOR_1

İsteğe bağlı. Varsayılan EKL'leri ayarlamak için bağlayıcı tarafından kullanılan sanal kapsayıcı adının geçersiz kılınmasına olanak tanır. Varsayılan değer "DEFAULT_ACL_VIRTUAL_CONTAINER" şeklindedir. Birden fazla bağlayıcı aynı veri kaynağındaki içeriği dizine ekliyorsa bu değeri geçersiz kılmak isteyebilirsiniz.

Varsayılan herkese açık EKL defaultAcl.public=true

Deponun tamamı için kullanılan varsayılan EKL, genel alan erişimi olarak ayarlanmıştır. Varsayılan değer false.

Ortak EKL grup okuyucuları defaultAcl.readers.groups=google:group1, group2
Yaygın EKL okuyucuları defaultAcl.readers.users=user1, user2, google:user3
ACL'de reddedilen yaygın grup okuyucuları defaultAcl.denied.groups=group3
EKL tarafından reddedilen yaygın okuyucular defaultAcl.denied.users=user4, user5
Tüm alan erişimi Dizine eklenen her kaydın alandaki tüm kullanıcılar tarafından erişilebilir olmasını sağlamak için aşağıdaki iki seçeneği de değerlerle ayarlayın:
  • defaultAcl.mode=fallback
  • defaultAcl.public=true
Ortak tanımlı EKL Veri deposunun her kaydı için bir EKL belirtmek üzere aşağıdaki parametre değerlerinin tümünü ayarlayın:
  • defaultAcl.mode=fallback
  • defaultAcl.public=false
  • defaultAcl.readers.groups=google:group1, group2
  • defaultAcl.readers.users=user1, user2, google:user3
  • defaultAcl.denied.groups=group3
  • defaultAcl.denied.users=user4, user5

    Belirtilen her kullanıcı ve grubun, önünde "google:" (değişmez sabit değer) olmadığı sürece alan adı tanımlı bir kullanıcı/grup olduğu varsayılır.

    Varsayılan kullanıcı veya grup boş bir dizedir. Kullanıcı ve grup seçeneklerini yalnızca defaultAcl.public, false olarak ayarlanmışsa sağlayın. Birden çok grubu ve kullanıcıyı listelemek için virgülle ayrılmış liste kullanın.

    defaultAcl.mode, none olarak ayarlanırsa tanımlanmış bağımsız ACL'ler olmadan kayıtlar aranamaz.

Şema Tanımı

Cloud Search, yapılandırılmış ve yapılandırılmamış içeriklerin dizine eklenmesine ve sunulmasına olanak tanır. Verilerinizde yapılandırılmış veri sorgularını desteklemek amacıyla veri kaynağınız için Şema oluşturmanız gerekir.

Tanımlandıktan sonra CSV Bağlayıcı, tanımlı şemayı dizine ekleme istekleri oluşturmak için kullanabilir. Açıklayıcı bir örnek ve Filmler hakkında bilgi içeren bir CSV dosyası düşünelim.

Girilen CSV dosyasında aşağıdaki içeriğin olduğunu varsayalım.

  1. movieId
  2. movieTitle
  3. açıklama
  4. yıl
  5. releaseDate
  6. aktörler (virgülle (,) ayrılmış birden fazla değer)
  7. tür (birden fazla değer)
  8. değerlendirmeler

Yukarıdaki veri yapısına dayanarak, CSV dosyasındaki verileri dizine eklemek istediğiniz veri kaynağı için şema tanımlayabilirsiniz.

{
  "objectDefinitions": [
    {
      "name": "movie",
      "propertyDefinitions": [
        {
          "name": "actors",
          "isReturnable": true,
          "isRepeatable": true,
          "isFacetable": true,
          "textPropertyOptions": {
            "operatorOptions": {
              "operatorName": "actor"
            }
          }
        },
        {
          "name": "releaseDate",
          "isReturnable": true,
          "isRepeatable": false,
          "isFacetable": false,
          "datePropertyOptions": {
            "operatorOptions": {
              "operatorName": "released",
              "lessThanOperatorName": "releasedbefore",
              "greaterThanOperatorName": "releasedafter"
            }
          }
        },
        {
          "name": "movieTitle",
          "isReturnable": true,
          "isRepeatable": false,
          "isFacetable": false,
          "textPropertyOptions": {
            "retrievalImportance": {
              "importance": "HIGHEST"
            },
            "operatorOptions": {
              "operatorName": "title"
            }
          }
        },
        {
          "name": "genre",
          "isReturnable": true,
          "isRepeatable": true,
          "isFacetable": true,
          "enumPropertyOptions": {
            "operatorOptions": {
              "operatorName": "genre"
            },
            "possibleValues": [
              {
                "stringValue": "Action"
              },
              {
                "stringValue": "Documentary"
              },
              {
                "stringValue": "Drama"
              },
              {
                "stringValue": "Crime"
              },
              {
                "stringValue": "Sci-fi"
              }
            ]
          }
        },
        {
          "name": "userRating",
          "isReturnable": true,
          "isRepeatable": false,
          "isFacetable": true,
          "integerPropertyOptions": {
            "orderedRanking": "ASCENDING",
            "maximumValue": "10",
            "operatorOptions": {
              "operatorName": "score",
              "lessThanOperatorName": "scorebelow",
              "greaterThanOperatorName": "scoreabove"
            }
          }
        }
      ]
    }
  ]
}

Örnek yapılandırma dosyası

Aşağıdaki örnek yapılandırma dosyası, örnek bir bağlayıcının davranışını tanımlayan key=value parametre çiftlerini göstermektedir.

# data source access
api.sourceId=1234567890abcd
api.serviceAccountPrivateKeyFile=./PrivateKey.json

# CSV data structure
csv.filePath=./movie_content.csv
csv.csvColumns=movieId,movieTitle,description,releaseYear,genre,actors,ratings,releaseDate
csv.skipHeaderRecord=true
url.format=https://mymoviesite.com/movies/{0}
url.columns=movieId
csv.datetimeFormat.releaseDate=yyyy-mm-dd
csv.multiValueColumns=genre,actors
csv.multiValue.genre=;
contentTemplate.csv.title=movieTitle

# metadata structured data and content
itemMetadata.title.field=movieTitle
itemMetadata.createTime.field=releaseDate
itemMetadata.contentLanguage.defaultValue=en-US
itemMetadata.objectType.defaultValue=movie
contentTemplate.csv.quality.medium=description
contentTemplate.csv.unmappedColumnsMode=IGNORE

#ACLs
defaultAcl.mode=fallback
defaultAcl.public=true

Her bir parametrenin ayrıntılı açıklamaları için Yapılandırma parametreleri referansına bakın.

Cloud Search CSV bağlayıcısını çalıştırma

Bağlayıcıyı komut satırından çalıştırmak için aşağıdaki komutu yazın:

$ java -jar google-cloudsearch-csv-connector-v1-0.0.3.jar -Dconfig=my.config

Varsayılan olarak, bağlayıcı günlükleri standart çıkışta mevcuttur. logging.properties belirterek dosyalara giriş yapabilirsiniz.