Google Cloud Platform'da Yüksek Hacimli Adres Doğrulaması İçin Tasarım Kalıpları

Hedef

Yüksek Hacimli Adres Doğrulama eğitiminde, yüksek hacimli adres doğrulamanın kullanılabileceği farklı senaryolar ele alınmıştır. Bu eğitimde, Yüksek Hacimli Adres Doğrulama'yı çalıştırmak için Google Cloud Platform'daki farklı tasarım kalıplarını tanıtacağız.

İlk olarak, tek seferlik yürütmeler için Google Cloud Platform'da Cloud Run, Compute Engine veya Google Kubernetes Engine ile Yüksek Hacimli Adres Doğrulama'yı çalıştırmaya genel bir bakışla başlayacağız. Ardından, bu özelliğin bir veri hattına nasıl dahil edilebileceğini göreceğiz.

Bu makalenin sonunda, Google Cloud ortamınızda Adres Doğrulama'yı yüksek hacimli çalıştırmaya yönelik farklı seçenekler hakkında iyi bir anlayışa sahip olacaksınız.

Google Cloud Platform'daki referans mimarisi

Bu bölümde, Google Cloud Platform kullanılarak yüksek hacimli adres doğrulama için farklı tasarım kalıpları daha ayrıntılı olarak ele alınmaktadır. Google Cloud Platform'da çalışarak mevcut süreçleriniz ve veri ardışık düzenlerinizle entegre olabilirsiniz.

Google Cloud Platform'da bir kez yüksek hacimli adres doğrulama çalıştırma

Aşağıda, Google Cloud Platform'da tek seferlik işlemler veya testler için daha uygun bir entegrasyonun nasıl oluşturulacağına dair bir referans mimarisi gösterilmektedir.

resim

Bu durumda, CSV dosyasını bir Cloud Storage paketine yüklemenizi öneririz. Yüksek Hacimli Adres Doğrulama komut dosyası daha sonra bir Cloud Run ortamından çalıştırılabilir. Ancak Compute Engine veya Google Kubernetes Engine gibi diğer tüm çalışma zamanı ortamlarında da çalıştırabilirsiniz. Çıkış CSV'si Cloud Storage paketine de yüklenebilir.

Google Cloud Platform veri ardışık düzeni olarak çalıştırma

Önceki bölümde gösterilen dağıtım modeli, tek seferlik kullanım için Yüksek Hacimli Adres Doğrulama'yı hızlı bir şekilde test etmek için idealdir. Ancak bir veri ardışık düzeninin parçası olarak düzenli olarak kullanmanız gerekiyorsa daha sağlam hale getirmek için Google Cloud Platform'un yerel özelliklerinden daha iyi yararlanabilirsiniz. Yapabileceğiniz değişikliklerden bazıları şunlardır:

resim

  • Bu durumda, CSV dosyalarını Cloud Storage paketlerine aktarabilirsiniz.
  • Bir Dataflow işi, işlenecek adresleri alıp BigQuery'de önbelleğe alabilir.
  • Dataflow Python kitaplığı, Dataflow işindeki adresleri doğrulamak için Yüksek Hacimli Adres Doğrulama mantığına sahip olacak şekilde genişletilebilir.

Veri ardışık düzeninden komut dosyasını uzun süreli yinelenen bir işlem olarak çalıştırma

Diğer bir yaygın yaklaşım ise yinelenen bir işlem olarak akış verisi ardışık düzeni kapsamında bir adres grubunu doğrulamaktır. Adresler bir BigQuery veri deposunda da olabilir. Bu yaklaşımda, yinelenen bir veri hattının (günlük/haftalık/aylık olarak tetiklenmesi gerekir) nasıl oluşturulacağını göreceğiz.

resim

  • İlk CSV dosyasını bir Cloud Storage paketine yükleyin.
  • Uzun süren işlemlerin ara durumunu korumak için kalıcı bir veri deposu olarak Memorystore'u kullanın.
  • Son adresleri BigQuery veri deposunda önbelleğe alın.
  • Komut dosyasını düzenli olarak çalıştırmak için Cloud Scheduler'ı ayarlayın.

Bu mimarinin avantajları şunlardır:

  • Cloud Scheduler kullanılarak adres doğrulama düzenli olarak yapılabilir. Adresleri aylık olarak yeniden doğrulayabilir veya yeni adresleri aylık/üç aylık olarak doğrulayabilirsiniz. Bu mimari, söz konusu kullanım alanının çözülmesine yardımcı olur.
  • Müşteri verileri BigQuery'de bulunuyorsa doğrulanmış adresler veya doğrulama işaretleri doğrudan orada önbelleğe alınabilir. Not: Nelerin nasıl önbelleğe alınabileceği Yüksek Hacimli Adres Doğrulama makalesinde ayrıntılı olarak açıklanmaktadır.

  • Memorystore kullanmak daha yüksek esneklik ve daha fazla adres işleme olanağı sağlar. Bu adım, çok büyük adres veri kümelerinin işlenmesi için gereken, işleme ardışık düzeninin tamamına durum bilgisi ekler. Cloud SQL[https://cloud.google.com/sql] gibi diğer veritabanı teknolojileri veya Google Cloud Platform'un sunduğu diğer veritabanı türleri de burada kullanılabilir. Ancak Memorystore'un ölçeklendirme ve basitlik ihtiyaçlarını mükemmel bir şekilde dengelediğini düşünüyoruz. Bu nedenle ilk tercihiniz Memorystore olmalıdır.

Sonuç

Burada açıklanan kalıpları uygulayarak Address Validation API'yi farklı kullanım alanlarında ve Google Cloud Platform'daki farklı kullanım alanlarından kullanabilirsiniz.

Yukarıda açıklanan kullanım alanlarına başlamanıza yardımcı olmak için açık kaynaklı bir Python kitaplığı yazdık. Bilgisayarınızdaki bir komut satırından veya Google Cloud Platform ya da diğer bulut sağlayıcılarından çağrılabilir.

Kitaplığı kullanma hakkında daha fazla bilgiyi bu makalede bulabilirsiniz.

Sonraki Adımlar

Güvenilir adreslerle ödeme, teslimat ve operasyon süreçlerini iyileştirme başlıklı teknik incelemeyi indirin ve Adres Doğrulama ile ödeme, teslimat ve operasyon süreçlerini iyileştirme başlıklı web seminerini izleyin.

Daha fazla bilgi için önerilen kaynaklar:

Katkıda bulunanlar

Bu makale Google tarafından sağlanmaktadır. Bu makale ilk olarak aşağıdaki katkıda bulunanlar tarafından yazılmıştır.
Başlıca yazarlar:

Henrik Valve | Çözüm Mühendisi
Thomas Anglaret | Çözüm Mühendisi
Sarthak Ganguly | Çözüm Mühendisi