Google tarafından sağlanan yapılandırma parametreleri

Her bağlayıcının, bağlayıcı tarafından kullanılan parametreleri (ör. deponuzun kimliği) içeren ilişkili bir yapılandırma dosyası vardır. Parametreler, api.sourceId=1234567890abcdef gibi anahtar/değer çiftleri olarak tanımlanır.

Google Cloud Search SDK'da, farklı bağlayıcılar tarafından kullanılan, Google tarafından sağlanan çeşitli yapılandırma parametreleri bulunur. Google tarafından sağlanan yapılandırma parametrelerinden yalnızca Veri kaynağı erişimi parametrelerinin yapılandırma dosyanızda tanımlanması gerekir. Varsayılan değerlerini geçersiz kılmak istemediğiniz sürece, Google tarafından sağlanan parametreleri yapılandırma dosyanızda yeniden tanımlamanıza gerek yoktur.

Bu referansta, Google tarafından sağlanan yapılandırma parametreleri açıklanmaktadır.

Yapılandırma dosyası örneği

Aşağıdaki örnekte parametre anahtar/değer çiftleri içeren bir kimlik yapılandırma dosyası gösterilmektedir.

#
# Configuration file sample
#
api.sourceId=1234567890abcdef
api.identitySourceId=0987654321lmnopq
api.serviceAccountPrivateKeyFile= ./PrivateKey.json

#
# Traversal schedules
#
schedule.traversalIntervalSecs=7200
schedule.incrementalTraversalIntervalSecs=600
#
# Default ACLs
#
defaultAcl.mode=fallback
defaultAcl.public=true
  

Sık kullanılan parametreler

Bu bölümde, sık kullanılan ve isteğe bağlı olarak ayarlanmış gerekli ve isteğe bağlı yapılandırma parametreleri listelenmiştir. İsteğe bağlı parametrelerin değerlerini değiştirmezseniz bağlayıcı, SDK tarafından sağlanan varsayılan değerleri kullanır.

Veri kaynağı erişimi

Aşağıdaki tabloda, bir yapılandırma dosyasında görünmesi için gereken tüm parametreler listelenmiştir. Kullandığınız parametreler, oluşturduğunuz bağlayıcı türüne (içerik bağlayıcı veya kimlik bağlayıcı) bağlıdır.

Ayar Parametre
Veri kaynağı kimliği api.sourceId=1234567890abcdef

Bir bağlayıcı, deponuzun konumunu belirlemek için bu parametreye ihtiyaç duyar. Bu değeri, aramaya bir veri kaynağı eklediğinizde elde edersiniz. Bu parametre, bağlayıcı yapılandırma dosyalarında olmalıdır.

Kimlik kaynağı kimliği api.identitySourceId=0987654321lmnopq

Bu parametre, harici bir kimlik kaynağının konumunu tanımlamak için kimlik bağlayıcıları tarafından gereklidir. Bu değeri, Cloud Search'te kullanıcı kimliklerini eşlediğinizde elde ettiniz. Bu parametre, tüm kimlik bağlayıcısı yapılandırma dosyalarında yer almalıdır.

Hizmet hesabı özel anahtar dosyası api.serviceAccountPrivateKeyFile=./PrivateKey.json

Bu parametre, depoya erişmek için gereken özel anahtarı içerir. Bu değeri, Google Cloud Search REST API'ye erişimi yapılandırdığınızda elde etmiş olursunuz. Bu parametre tüm yapılandırma dosyalarında yer almalıdır.

Hizmet hesabı kimliği api.serviceAccountId=123abcdef4567890

Bu parametre, hizmet hesabı kimliğini belirtir. Varsayılan boş dize değerine yalnızca yapılandırma dosyası özel anahtar dosyası parametresi belirtildiğinde izin verilir. Özel anahtar dosyanız bir JSON anahtarı değilse bu parametre gereklidir.

Google Workspace Hesap Kimliği api.customerId=123abcdef4567890

Bu parametre, kuruluşun Google Workspace hesabının hesap kimliğini belirtir. Bu değeri, Cloud Search'te kullanıcı kimliklerini eşlediğinizde elde ettiniz. Bu parametre, kimlik bağlayıcısı kullanarak kullanıcıları senkronize ederken gereklidir.

Kök URL api.rootUrl=baseURLPath

Bu parametre, dizine ekleme hizmetinin temel URL yolunu belirtir.

Bu parametrenin varsayılan değeri, https://cloudsearch.googleapis.com biçimine dönüştürülen boş bir dizedir.

Geçiş planları

Planlama parametreleri, bağlayıcının geçişler arasında ne sıklıkta bekleyeceğini belirler.

Ayar Parametre
Bağlayıcı başlatıldığında tam geçiş schedule.performTraversalOnStart=true|false

Bağlayıcı, ilk aralığın süresinin dolmasını beklemek yerine, bağlayıcı başlatıldığında tam bir geçiş gerçekleştirir. Varsayılan değer: true.

Bir aralıktan sonra tam geçiş schedule.traversalIntervalSecs=intervalInSeconds

Bağlayıcı, belirtilen bir aralıktan sonra tam geçiş gerçekleştirir. Geçişler arasındaki aralığı saniye cinsinden belirtin. Varsayılan değer 86400 (bir gündeki saniye sayısı) şeklindedir.

Tek bir geçişten sonra çıkış connector.runOnce=true|false

Bağlayıcı bir kez tam geçiş çalıştırır ve ardından çıkar. Tam geçiş stratejisi kullanıyorsanız bu parametre yalnızca true olarak ayarlanmalıdır. Listeleme ve grafik stratejileri, değişiklikleri algılamak ve içeriği dizine eklemek için birden fazla geçiş gerektirir. Varsayılan değer false'dir (tek bir geçişten sonra çıkmayın).

Bir aralıktan sonra artımlı geçiş schedule.incrementalTraversalIntervalSecs=intervalInSeconds

Bağlayıcı, belirtilen bir aralıktan sonra artımlı bir geçiş gerçekleştirir. Geçişler arasındaki aralığı saniye cinsinden belirtin. Varsayılan değer 300 (5 dakika içindeki saniye sayısı) şeklindedir.

Planlanmış anket sırası aralıkları schedule.pollQueueIntervalSecs=interval_in_seconds

Planlanmış anket sırası aralıkları arasındaki aralık (saniye cinsinden). Bu yalnızca listeleme bağlayıcısı tarafından kullanılır. Varsayılan değer: 10.

Erişim kontrol listeleri

Bağlayıcı, öğelere erişimi EKL'leri kullanarak kontrol eder. Birden çok parametre, EKL'ler aracılığıyla dizine eklenen kayıtlara kullanıcı erişimini korumanızı sağlar.

Deponuzda her öğeyle ilişkili ayrı EKL bilgileri varsa Cloud Search'teki öğe erişimini kontrol etmek için tüm EKL bilgilerini yükleyin. Deponuz kısmi EKL bilgisi sağlıyor veya hiç EKL bilgisi sağlamıyorsa SDK'nın bağlayıcıya sağladığı aşağıdaki parametrelerle varsayılan EKL bilgilerini sağlayabilirsiniz.

Ayar Parametre
EKL modu defaultAcl.mode=mode

Varsayılan EKL'nin ne zaman uygulanacağını belirler. Geçerli değerler:

  • none: varsayılan EKL'yi kullanma (bu modda, tek tek EKL'ler tanımlamadığınız sürece kayıtlar aranamaz)
  • fallback: Yalnızca halihazırda mevcut EKL yoksa varsayılan EKL kullanılır
  • append: mevcut EKL'ye varsayılan EKL ekle
  • override: Mevcut EKL'yi varsayılan EKL ile değiştir

Varsayılan mod none'tır.

Varsayılan ortak EKL defaultAcl.public=true|false

Tüm depo için kullanılan varsayılan EKL, genel alan erişimi olarak ayarlıdır. Varsayılan değer: false.

Yaygın EKL grubu okuyucuları defaultAcl.readers.groups=google:group1@mydomain.com, group2
Yaygın EKL okuyucuları defaultAcl.readers.users=user1, user2, google:user3@mydomain.com
EKL tarafından reddedilen grup okuyucular defaultAcl.denied.groups=group3
EKL'yi reddedilen okuyucular defaultAcl.denied.users=user4, user5
Alan erişiminin tamamı Dizine eklenen her bir kaydın alan adındaki her kullanıcı tarafından erişilebilir olduğunu belirtmek için aşağıdaki parametrelerin her ikisini de değerlerle ayarlayın:
  • defaultAcl.mode=override
  • defaultACL.public=true
Ortak tanımlı EKL Veri deposunun her kaydı için bir EKL belirtmek için aşağıdaki parametre değerlerinin tümünü ayarlayın:
  • defaultAcl.mode=fallback
  • defaultAcl.public=false
  • defaultAcl.readers.groups=google:group1@mydomain.com, group2 code>
  • defaultAcl.readers.users=user1@mydomain.com, user2, google:user3@mydomain.com
  • defaultAcl.denied.groups=group3
  • defaultAcl.denied.users=user4, user5

    Belirtilen her kullanıcı ve grup, başında "google:" (sabit sabit) olmadığı sürece, yerel alanda tanımlı bir kullanıcı/grup olarak kabul edilir.

    Varsayılan kullanıcı veya grup boş bir dizedir. Kullanıcı ve grup parametrelerini yalnızca defaultAcl.public, false olarak ayarlandıysa sağlayın. Birden çok grup ve kullanıcıyı listelemek için virgülle ayrılmış listeler kullanın.

    defaultAcl.mode, none olarak ayarlanırsa tanımlanmış bağımsız EKL'ler olmadan kayıtlar aranamaz.

Meta veri yapılandırma parametreleri

Bazı öğe meta verileri yapılandırılabilir. Bağlayıcılar, dizine ekleme sırasında yapılandırılabilir meta veri alanları ayarlayabilir. Bağlayıcı bir alan belirtmezse alanı ayarlamak için yapılandırma dosyanızdaki parametreler kullanılır.

Yapılandırma dosyasında, itemMetadata.title.field=movieTitle gibi .field son ekiyle belirtilen bir dizi adlandırılmış meta veri yapılandırma parametresi bulunur. Bu parametreler için bir değer varsa meta veri alanını yapılandırmak için kullanılır. Adlandırılmış meta veri parametresi için değer yoksa meta veriler .defaultValue son ekine sahip bir parametre kullanılarak yapılandırılır.

Aşağıdaki tabloda meta veri yapılandırma parametreleri gösterilmektedir.

Ayar Parametre
Başlık itemMetadata.title.field=movieTitle
itemMetadata.title.defaultValue=Gone with the Wind
Öğe başlığı. title.field bir değere ayarlanmazsa title.defaultValue değeri kullanılır.
Kaynak depo URL'si itemMetadata.sourceRepositoryUrl.field=url
itemMetadata.sourceRepositoryUrl.defaultValue=https://www.imdb.com/title/tt0031381/
Arama sonuçlarında kullanılan öğe URL'si. defaultValue öğesini, deponuzun bir CSV dosyası olduğu ve her öğe için yalnızca bir URL olduğu gibi, tüm depo için bir URL barındıracak şekilde ayarlayabilirsiniz. sourceRepositoryUrl.field bir değere ayarlanmazsa sourceRepositoryUrl.defaultValue değeri kullanılır.
Container adı itemMetadata.containerName.field=containerName
itemMetadata.containerName.defaultValue=myDefaultContainerName
Öğenin kapsayıcısının adı (ör. bir dosya sistemi dizininin veya klasörün adı). containerName.field bir değere ayarlanmazsa containerName.defaultValue değeri kullanılır.
Nesne türü itemMetadata.objectType.field=type
itemMetadata.objectType.defaultValue=movie
Şemada tanımlandığı şekilde, bağlayıcı tarafından kullanılan nesne türü. Bu özellik belirtilmezse bağlayıcı, yapılandırılmış verileri dizine eklemez.
objectType.field bir değere ayarlanmamışsa objectType.defaultValue değeri kullanılır.
Oluşturulma zamanı itemMetadata.createTime.field=releaseDate
itemMetadata.createTime.defaultValue=1940-01-17
Belge oluşturma zaman damgası. createTime.field bir değere ayarlanmazsa createTime.defaultValue değeri kullanılır.
Güncelleme zamanı itemMetadata.updateTime.field=releaseDate
itemMetadata.updateTime.defaultValue=1940-01-17
Öğenin son değişiklik zaman damgası. updateTime.field bir değere ayarlanmazsa updateTime.defaultValue değeri kullanılır.
İçerik dili itemMetadata.contentLanguage.field=languageCode
itemMetadata.contentLanguage.defaultValue=en-US
Dizine eklenen dokümanların içerik dili. contentLanguage.field bir değere ayarlanmazsa contentLanguage.defaultValue değeri kullanılır.
MIME türü itemMetadata.mimeType.field=mimeType
itemMetadata.mimeType.defaultValue=image/bmp
Kaynak depodaki ItemContent.content içeriğinin orijinal mime türü. Maksimum uzunluk 256 karakterdir. mimeType.field bir değere ayarlanmazsa mimeType.defaultValue değeri kullanılır.
Arama kalitesi meta verileri itemMetadata.searchQualityMetadata.quality.field=quality
itemMetadata.searchQualityMetadata.quality.defaultValue=1
Arama kalitesini etkilemek için kullanılan öğenin kalitesinin bir göstergesi. Değer 0,0 (en düşük kalite) ile 1,0 (en yüksek kalite) arasında olmalıdır. Varsayılan değer 0,0'dır. quality.field bir değere ayarlanmazsa quality.defaultValue değeri kullanılır.
Karma itemMetadata.hash.field=hash
itemMetadata.hash.defaultValue=f0fda58630310a6dd91a7d8f0a4ceda2
API çağrısında bulunan karma değeri. Bu, değiştirilmiş durumu hesaplamak için items.push yöntemiyle birlikte kullanılabilir. Maksimum uzunluk 2.048 karakterdir. hash.field bir değere ayarlanmazsa hash.defaultValue değeri kullanılır.

Tarih ve saat biçimleri

Tarih ve saat biçimleri, meta veri özelliklerinde beklenen biçimleri belirtir. Yapılandırma dosyası bu parametreyi içermiyorsa varsayılan değerler kullanılır. Aşağıdaki tabloda bu parametre gösterilmektedir.

Ayar Parametre
Ek tarih ve saat biçimleri structuredData.dateTimePatterns=MM/dd/uuuu HH:mm:ssXXX
Ek java.time.format.DateTimeFormatter kalıplarının noktalı virgülle ayrılmış listesi. Kalıplar, meta verideki veya şemadaki herhangi bir tarih veya tarih-saat alanlarının dize değerlerini ayrıştırırken kullanılır. Varsayılan değer boş bir listedir ancak RFC 3339 ve RFC 1123 biçimleri her zaman desteklenir.

Yapılandırılmış veri

Cloud Search Dizine Ekleme API'si, Cloud Search'ün verilerinizi dizine ekleme ve yayınlama şeklini özelleştirmek için kullanabileceğiniz bir şema hizmeti sunar. Yerel depo şeması kullanıyorsanız yapılandırılmış veri yerel şema adını belirtmeniz gerekir.

Ayar Parametre
Yerel şema adı structuredData.localSchema=mySchemaName

Şema adı veri kaynağından okunur ve depo yapılandırılmış verileri için kullanılır.

Varsayılan değer boş bir dizedir.

İçerik ve arama kalitesi

Kayıt veya alan tabanlı içerik (CRM, CVS veya veritabanı gibi) barındıran depolarda SDK, veri alanlarında otomatik HTML biçimlendirmesine izin verir. Bağlayıcınız, veri alanlarını bağlayıcının yürütmesinin başında tanımlar ve ardından her veri kaydını Cloud Search'e yüklemeden önce biçimlendirmek için bir içerik şablonu kullanır.

İçerik şablonu, arama için her alan değerinin önemini tanımlar. HTML <title> alanı zorunludur ve en yüksek öncelikli olarak tanımlanır. Diğer tüm içerik alanları için arama kalitesi önem düzeyleri belirleyebilirsiniz: yüksek, orta veya düşük. Belirli bir kategoride tanımlanmamış içerik alanları varsayılan olarak düşük öncelikli olur.

Ayar Parametre
İçerik HTML başlığı contentTemplate.templateName.title=myTitleField

İçerik HTML başlığı ve en yüksek arama kalitesi alanı. Bu parametre yalnızca HTML içerik şablonu kullanıyorsanız gereklidir. Varsayılan değer boş bir dizedir.

İçerik alanları için yüksek arama kalitesi contentTemplate.templateName.quality.high=hField1,hField2

Yüksek arama önceliği verilen içerik alanları. Varsayılan değer boş bir dizedir.

İçerik alanları için orta düzeyde arama kalitesi contentTemplate.templateName.quality.medium=mField1,mField2

Arama önceliği orta düzeyde olan içerik alanlarıdır. Varsayılan değer boş bir dizedir.

İçerik alanları için arama kalitesi düşük contentTemplate.templateName.quality.low=lField1,lField2

Düşük arama önceliği verilen içerik alanları. Varsayılan değer boş bir dizedir.

Belirtilmemiş içerik alanları contentTemplate.templateName.unmappedColumnsMode=value

Bağlayıcının belirtilmemiş içerik alanlarını işleme şekli. Valid values are:

  • APPEND: Belirtilmemiş içerik alanlarını şablona ekleyin
  • IGNORE: Belirtilmemiş içerik alanlarını yoksay

    APPEND, varsayılan değerdir.

HTML şablonuna alan adlarını dahil et contentTemplate.templateName.includeFieldName=true|false

HTML şablonunda alan verileriyle birlikte alan adlarının eklenip eklenmeyeceğini belirtir. Varsayılan değer true'dir ve alan adlarının, içerik verileri kapsamında aranabilir olmasına neden olur.

Yaygın olmayan parametreler

Bu bölümde listelenen parametreleri nadiren ayarlamanız gerekir. Parametrelerin varsayılanları, optimum performans için ayarlıdır. Google, bu parametrelerin deponuzdaki belirli gereksinimler olmadan varsayılan değerlerinden farklı değerlere ayarlanmasını önermez.

Proxy yapılandırması

SDK, giden bağlantılar için bir proxy kullanmak üzere bağlayıcınızı yapılandırmanıza olanak tanır.

Proxy aracılığıyla aktarımın mümkün olması için transport.proxy.hostname ve transport.proxy.port parametreleri gereklidir. Proxy'niz kimlik doğrulama gerektiriyorsa veya HTTP yerine SOCKS protokolü üzerinden çalışıyorsa diğer parametreler gerekli olabilir. transport.proxy.hostname ayarlanmazsa SDK, proxy kullanmaz.

Ayar Parametre
Ana makine adı transport.proxy.hostname=hostname

Proxy sunucunun ana makine adı. Proxy kullanırken bu parametre gereklidir.

Bağlantı noktası transport.proxy.port=port

Proxy sunucu için bağlantı noktası numarası. Proxy kullanırken bu parametre gereklidir.

Proxy türü transport.proxy.type=type

Proxy'nin türü. Valid values are:

  • HTTP: Proxy, istekleri HTTP üzerinden kabul eder ve yönlendirir.
  • SOCKS: Proxy, SOCKS protokolü üzerinden paketleri kabul eder ve yönlendirir.

HTTP, varsayılan değerdir.

Kullanıcı adı transport.proxy.username=username

Proxy yetkilendirme jetonu oluştururken kullanılacak kullanıcı adı. Bu parametre isteğe bağlıdır ve yalnızca proxy'niz kimlik doğrulama gerektiriyorsa ayarlanmalıdır.

Şifre transport.proxy.password=password

Bir proxy yetkilendirme jetonu oluştururken kullanılacak şifre. Bu parametre isteğe bağlıdır ve yalnızca proxy'niz kimlik doğrulama gerektiriyorsa ayarlanmalıdır.

Gezginler

SDK, veri deposunda paralel geçişlere izin vermek için birden çok bağımsız bağlayıcı belirtmenize olanak tanır. SDK şablonu bağlayıcıları bu özelliği kullanır.

Ayar Parametre
İş parçacığı havuzu boyutu traverse.threadPoolSize=size

Bağlayıcının paralel işleme için oluşturduğu iş parçacığı sayısı. Tek bir iteratör, işlemleri seri olarak getirir (genellikle RepositoryDoc nesneleridir) ancak API çağrıları bu sayıda iş parçacığını kullanarak paralel olarak işler.

5, varsayılan değerdir.

Bölüm boyutu traverse.partitionSize=batchSize

Ek APIOperation getirilmeden önce toplu olarak işlenecek ApiOperation() sayısı.

50, varsayılan değerdir.

Ziyaretçi anket istekleri

Cloud Search dizine ekleme sırasının temelinde, var olduğu bilinen her öğe için bir giriş içeren bir öncelik sırası yer alır. Giriş bağlayıcısı, dizine ekleme API'sinden öğeleri yoklama isteğinde bulunabilir. Anket istekleri, dizine ekleme sırasından en yüksek öncelikli girişleri alır.

Aşağıdaki parametreler, yoklama parametrelerini tanımlamak için SDK listeleme bağlayıcısı şablonu tarafından kullanılır.

Ayar Parametre
Kod deposu geçiş aracı repository.traversers=t1, t2, t3, ...

Bir veya daha fazla bağımsız bağlayıcı oluşturur. Burada t1, t2, t3, ... her birinin benzersiz adıdır. Adı geçen her bir izleyicinin, traversers.t1.hostload ve traversers.t2.hostload gibi benzersiz adı kullanılarak tanımlanan kendi ayar grubu vardır.

Sorgulanacak sıra traverser.pollRequest.queue=mySpecialQueue

Bu gezinen kişinin anket yaptığı sıra adları. Varsayılan, boş dizedir ("varsayılan" anlamına gelir).

traverser.t1.pollRequest.queue=mySpecialQueue

Birden fazla izleyiciniz olduğunda, her bir yaya için öğenin durumunu ayarlayın (burada t1, belirli bir izleyiciyi temsil eder).

Anket davranışı traverser.pollRequest.limit=maxItems

Yoklama isteğinden döndürülecek maksimum öğe sayısı. Varsayılan değer 0'dir (API maksimum değerini ifade eder).

traverser.t1.pollRequest.limit=limit

Birden fazla izleyiciniz olduğunda, her bir yaya için öğenin durumunu ayarlayın (burada t1, belirli bir izleyiciyi temsil eder).

Öğe durumu traverser.pollRequest.statuses=statuses

Bu gezinen kişinin yokladığı belirli öğenin durumlarıdır. statuses değeri, MODIFIED, NEW_ITEM değerlerinin herhangi bir kombinasyonu (virgülle ayrılmış) olabilir. Varsayılan değer boş bir dizedir (tüm durum değerlerini belirtir).

traverser.t1.pollRequest.statuses=statusesForThisTraverser

Birden fazla izleyiciniz olduğunda, gezinen her kullanıcı için öğenin durumunu ayarlayın (burada t1 , belirli bir izleyiciyi temsil eder).

Ana bilgisayar yükü traverser.hostload=threads

Yoklama için kullanılabilen maksimum etkin paralel iş parçacığı sayısı. Varsayılan değer: 5.

traverser.t1.hostload=threadsForThisTraverser

Birden fazla izleyiciniz olduğunda, gezinen her kullanıcı için öğenin durumunu ayarlayın (burada t1 , belirli bir izleyiciyi temsil eder).

Engelleme traverser.timeout=timeout

Bu izleyici yoklama girişimini kesintiye uğratmak için zaman aşımı değeri.

60, varsayılan değerdir.

traverser.t1.timeout=timeoutForThisTraverser

Birden fazla izleyiciniz olduğunda, gezinen her kullanıcı için öğenin durumunu ayarlayın (burada t1 , belirli bir izleyiciyi temsil eder).

traverser.timeunit=timeoutUunit

Zaman aşımı birimleri. Geçerli değerler: SECONDS, MINUTES,

traverser.t1.timeunit=timeoutUnit

Birden fazla izleyiciniz olduğunda, gezinen her kullanıcı için öğenin durumunu ayarlayın (burada t1 , belirli bir izleyiciyi temsil eder).

Çoğu durumda, SDK listeleme bağlayıcı şablonunu kullanan bir bağlayıcı, yoklama için yalnızca tek bir parametre grubu gerektirir. Bazı durumlarda, geçiş algoritmanız öğe işlemenin farklı sıralar kullanarak ayrılmasını gerektiriyorsa birden fazla yoklama ölçütü tanımlamanız gerekebilir.

Bu durumda, birden fazla yoklama parametresi grubu tanımlayabilirsiniz. repository.traversers ile parametre gruplarının adlarını belirterek başlayın. Tanımlanan her bir gezgin adı için yapılandırma dosyasını, yukarıdaki tabloda yer alan parametrelerle sağlayın. t1 yerine, gezgin adı girin. Bu işlem, tanımlanan her yolcu için bir grup yoklama parametresi oluşturur.

Kontrol noktaları

Kontrol noktası, artımlı geçişin durumunu izlemek için yararlıdır.

Ayar Parametre
Kontrol noktası dizini connector.checkpointDirectory=/path/to/checkpoint

Artımlı ve tam geçiş kontrol noktaları için kullanılacak yerel dizinin yolunu belirtir.

İçerik yüklemeleri

Öğenin boyutu, belirtilen eşiği aşmadığında öğe içeriği, öğeyle birlikte Cloud Search'e yüklenir. İçeriğin boyutu bu eşiği aşarsa içerik, öğenin meta verilerinden ve yapılandırılmış verilerinden ayrı olarak yüklenir.

Ayar Parametre
İçerik eşiği api.contentUploadThresholdBytes=bytes

İçeriğin öğe ile birlikte "satır içi" olarak mı yükleneceğini yoksa ayrı bir yükleme kullanılarak mı yükleneceğini belirleyen eşik.

Varsayılan değer 100000'dir (~100 KB).

Container'lar

Tam bağlayıcı şablonu, veritabanındaki silinmiş kayıtları algılamak için geçici veri kaynağı sırası açma/kapatma kavramını içeren bir algoritma kullanır. Diğer bir deyişle, her tam geçiş sonrasında, yeni bir sırada olan getirilen kayıtlar, önceki geçişten dizine eklenen ve eski bir sırada olan tüm mevcut Cloud Search kayıtlarını değiştirir.

Ayar Parametre
Kapsayıcı ad etiketi traverse.queueTag=instance

Ortak bir veri deposunu (farklı veri depolarında veya ortak bir veri havuzunun ayrı bölümlerinde) dizine eklemek üzere birbirine müdahale etmeden birden çok bağlayıcı örneğini paralel olarak çalıştırmak için bağlayıcının her çalıştırılmasına benzersiz bir kapsayıcı ad etiketi atayın. Benzersiz ad etiketi, bir bağlayıcı örneğinin başka bir kişinin kayıtlarını silmesini engeller.

Ad etiketi, Tam Geçiş Bağlayıcısı açma/kapatma sırası kimliğine eklenir.

Silme algılamayı devre dışı bırak traverse.useQueues=true|false

Bağlayıcının silme algılaması için sıra açma/kapatma mantığı kullanıp kullanmadığını belirtir.

Varsayılan değer olan true, sıraların kullanılması gerektiğini belirtir.

Not: Bu yapılandırma parametresi yalnızca FullTraversalConnector şablonunu uygulayan bağlayıcılar için geçerlidir.

Toplu işlem politikası

SDK, aşağıdaki işlemleri gerçekleştirmenizi sağlayan bir toplu politikayı destekler:

  • Toplu istekler
  • Toplu sıradaki istek sayısını belirtme
  • Eşzamanlı olarak yürütülen grupları yönetme
  • Toplu istekleri boşaltma

SDK, yüklemeler sırasında işleme hızını hızlandırmak için bağlayıcının isteklerini toplu olarak işler. Bir istek grubunu yüklemek için SDK tetikleyicisi, istek sayısına veya zaman aşımına (hangisi önce gelirse) göre yapılır. Örneğin, grup boyutuna ulaşılmadan grup gecikme süresi sona erdiyse veya grup boyutu sayısına gecikme süresi dolmadan önce ulaşılırsa toplu yükleme tetiklenir.

Ayar Parametre
Toplu istekler batch.batchSize=batchSize

Toplu istekleri birlikte gönderin. 10, varsayılan değerdir.

Toplu sıradaki istek sayısı batch.maxQueueLength=maxQueueLength

Toplu bir sıradaki yürütme işlemi için maksimum istek sayısı. Varsayılan değer: 1000.

Grupları eşzamanlı olarak yürütme batch.maxActiveBatches=maxActiveBatches

Aynı anda yürütülen izin verilen grupların sayısı. 20, varsayılan değerdir.

Toplu istekleri otomatik olarak temizle batch.maxBatchDelaySeconds=maxBatchDelay

Toplu isteklerin otomatik olarak boşaltılmasından önce beklenecek saniye sayısı. 5 varsayılan değerdir.

Kapatma sırasında toplu istekleri boşaltma batch.flushOnShutdown=true|false

Hizmet kapatılırken toplu istekleri boşaltın. Varsayılan değer: true

İstisna işleyiciler

İstisna işleyici parametreleri, geçiş yapan kişinin bir istisnayla karşılaştıktan sonra nasıl ilerleyeceğini belirler.

Ayar Parametre
Hata durumunda aktarıcı talimatı traverse.exceptionHandler=exceptions

Bir istisna atıldıktan sonra, geçirenin nasıl ilerlemesi gerektiği. Geçerli değerler aşağıda belirtilmiştir:

  • 0 -- bir istisnayla karşılaştıktan sonra geçişi her zaman iptal eder
  • num_exceptions (örneğin, 10): Gezgin, belirtilen num_exceptions ile karşılaştığında işlemi iptal eder.

    Varsayılan değer 0'tir (her zaman hata sonucu iptal edilir).

  • ignore--hatayı yoksay
İstisnalar arasındaki bekleme süresi abortExceptionHander.backoffMilliSeconds=backoff

Algılanan işleyici istisnaları arasında beklenecek milisaniye cinsinden geri yükleme süresi (genellikle bir depodan geçerken kullanılır). 10, varsayılan değerdir.