Pengelolaan Insiden Google Maps Platform

Saluran komunikasi insiden

Tim Dukungan Google Maps Platform menawarkan saluran komunikasi insiden yang berbeda.

Daftar Issue Tracker Penonaktifan & Insiden Google Maps Platform berisi daftar semua insiden yang diketahui. Anda dapat dengan mudah melihat insiden yang sedang berlangsung, mengikuti progresnya, dan menambahkan komentar untuk membantu investigasi tim kami dengan berlangganan masalah tersebut.

Grup Notifikasi Google Maps Platform adalah tempat pertama yang melaporkan penonaktifan secara luas. Semua pelanggan yang bergabung ke grup tersebut akan menerima notifikasi email setelah penonaktifan terdeteksi dan akan menerima semua info terbaru selanjutnya hingga masalah teratasi.

Saat masalah terdeteksi dan dilaporkan di Issue Tracker, banner juga ditampilkan di halaman Dukungan Google Maps Platform (di Cloud Console). Banner mengidentifikasi produk yang terpengaruh dan menyertakan link ke Issue Tracker.

Siklus proses insiden

Google Maps Platform mematuhi framework Pengelolaan Insiden Google Cloud Platform.

Saat terjadi penonaktifan atau penurunan layanan, tim teknisi produk dan tim Dukungan Google Maps Platform bekerja sama untuk mengatasi insiden tersebut dan menyampaikannya kepada Anda.

siklus proses

Deteksi

Google menggunakan pemantauan kotak hitam dan internal untuk mendeteksi insiden. Untuk informasi selengkapnya, lihat Bab 6 dalam buku Site Reliability Engineering.

Jika Anda mendeteksi insiden yang belum dilaporkan di Issue Tracker, buka halaman Dukungan Google Maps Platform (di Cloud Console) lalu buat kasus dukungan baru.

Respons Awal

Saat insiden terdeteksi, tim Dukungan akan membuka komunikasi dengan Anda. Notifikasi awal tentang insiden biasanya singkat, sering kali hanya menyebutkan produk yang bermasalah. Itu karena kami lebih memprioritaskan notifikasi yang bersifat cepat daripada mendetail. Detail akan diberikan pada info terbaru selanjutnya.

Untuk memberikan jumlah informasi yang sesuai, saluran komunikasi yang berbeda akan digunakan, bergantung pada cakupan dan tingkat keparahan masalah.

respons

Investigasi

Tim teknis produk bertanggung jawab untuk menyelidiki akar penyebab insiden. Pengelolaan insiden sering kali dilakukan oleh Site Reliability Engineer, tetapi bisa dilakukan oleh software engineer atau yang lainnya, bergantung pada situasi dan produk. Untuk informasi selengkapnya, lihat Bab 12 dalam Buku Site Reliability Engineering.

Mitigasi/Perbaikan

Masalah dianggap telah diperbaiki hanya jika perubahan yang dibuat diyakini oleh Google akan meniadakan dampak yang timbul untuk selamanya. Misalnya, perbaikan dapat menghapus perubahan yang memicu insiden.

Saat insiden sedang berlangsung, tim Dukungan dan Produk akan mencoba memitigasi masalah. Mitigasi terjadi jika dampak atau cakupan masalah dapat dikurangi, misalnya dengan menyediakan resource tambahan sementara untuk layanan yang mengalami kelebihan beban.

Jika mitigasi tidak ditemukan, jika memungkinkan, tim Dukungan akan menemukan dan menyampaikan solusinya. Solusinya berupa langkah-langkah yang dapat Anda ambil untuk mengatasi kebutuhan yang mendasari, meskipun terjadi insiden. Solusi mungkin menggunakan setelan yang berbeda untuk panggilan API guna menghindari jalur kode yang bermasalah.

Tindak Lanjut

Saat insiden berlangsung, tim Dukungan akan memberikan info terbaru secara rutin. Info terbaru biasanya berupa:

  • Informasi selengkapnya tentang insiden tersebut, seperti pesan error, fitur mana yang terdampak, dan seberapa luas dampaknya.
  • Progres menuju mitigasi, termasuk semua solusinya.
  • Linimasa komunikasi, yang disesuaikan dengan insiden.
  • Perubahan status, seperti saat insiden diperbaiki.

Postmortem

Semua insiden menghasilkan analisis internal postmortem (pasca-insiden) untuk sepenuhnya memahami insiden dan mengidentifikasi peningkatan keandalan yang dapat dilakukan oleh Google. Penyempurnaan ini kemudian dilacak dan diterapkan. Untuk informasi selengkapnya tentang postmortem di Google, lihat Bab 15 dalam Buku Site Reliability Engineering.

Laporan Insiden

Saat insiden memiliki dampak yang sangat besar dan serius, Google memberikan laporan insiden yang menjelaskan gejala, dampak, penyebab utama, perbaikan, dan pencegahan insiden di masa mendatang. Seperti halnya postmortem, kami memberikan perhatian khusus pada langkah-langkah yang kami ambil untuk belajar dari masalah dan meningkatkan keandalan. Tujuan Google menulis dan merilis postmortem adalah agar transparan dan menunjukkan komitmen kami dalam membangun layanan yang stabil bagi pelanggan.

Pertanyaan Umum (FAQ)

Saya ingin diberi tahu saat terjadi penonaktifan. Apa yang harus saya lakukan?

Bergabunglah ke grup Notifikasi Google Maps Platform untuk mendapatkan notifikasi tentang masalah yang sedang terjadi dan mengikuti progres insiden secara real time. Grup ini juga akan membantu Anda untuk mendapatkan informasi terbaru tentang pengumuman produk dan platform.

Di mana saya dapat memeriksa apakah penonaktifan telah dilaporkan?

Tim Google Maps Platform menawarkan beberapa referensi untuk membantu Anda agar terus mendapatkan informasi saat terjadi penonaktifan. Pilih salah satu yang paling sesuai untuk Anda.

  • Insiden di Issue Tracker: Daftar referensi dari semua insiden yang diketahui. Anda dapat dengan mudah melihat insiden yang sedang terjadi, mengikuti progresnya dengan berlangganan, dan menambahkan komentar untuk membantu investigasi tim kami. Anda dapat menemukan link ke issue tracker umum di dokumentasi dukungan Google Maps Platform.
  • Grup Notifikasi Google Maps Platform: Google Grup tempat pelaporan semua penonaktifan yang terjadi secara luas. Semua pelanggan yang telah bergabung dalam grup akan menerima notifikasi email setelah penonaktifan terdeteksi dan info terbaru selanjutnya hingga masalah teratasi.
  • Halaman Dukungan Google Maps Platform (di Cloud Console): Saat masalah terdeteksi dan dilaporkan di Issue Tracker, halaman Dukungan akan menampilkan banner aktif dengan pemberitahuan tentang masalah dan link ke Issue Tracker.

    penonaktifan

Bagaimana jika saya mengalami masalah, tetapi tidak tercantum dalam grup notifikasi atau Issue Tracker?

Masalah tersebut mungkin hanya terjadi di project Anda, atau mungkin berdampak ke sebagian kecil pelanggan. Jika tidak ada insiden yang diumumkan, buka halaman Dukungan Google Maps Platform (di Cloud Console) dan buat kasus dukungan baru.

Apa perbedaan antara "insiden" dan "penonaktifan"?

Meskipun istilah ini sering digunakan secara bergantian, komunikasi eksternal kami menggunakan "insiden" untuk merujuk ke periode layanan yang mengalami penurunan dan "penonaktifan" untuk merujuk hanya ke masalah yang paling serius dengan kondisi terparah yaitu produk tidak berfungsi.