การเพิ่มประสิทธิภาพการทำงานเริ่มต้นด้วยการระบุเมตริกหลัก ซึ่งมักเกี่ยวข้องกับเวลาในการตอบสนองและอัตราการส่งข้อมูล การเพิ่มการตรวจสอบเพื่อบันทึกและติดตามเมตริกเหล่านี้จะแสดงจุดอ่อนในแอปพลิเคชัน เมตริกช่วยให้คุณดำเนินการ เพิ่มประสิทธิภาพเพื่อปรับปรุงเมตริกประสิทธิภาพได้
นอกจากนี้ ยังมีเครื่องมือการตรวจสอบมากมายที่ให้คุณตั้งค่าการแจ้งเตือนสำหรับเมตริกเพื่อรับการแจ้งเตือนเมื่อถึงเกณฑ์ที่กำหนด เช่น คุณอาจตั้งค่าการแจ้งเตือนให้แจ้งเตือนเมื่อเปอร์เซ็นต์ของคำขอที่ล้มเหลวเพิ่มขึ้นมากกว่า x% ของระดับปกติ เครื่องมือตรวจสอบสามารถช่วยให้คุณระบุได้ว่าประสิทธิภาพการทำงานปกติเป็นอย่างไร และระบุเวลาในการตอบสนองที่เพิ่มขึ้นอย่างผิดปกติ จำนวนข้อผิดพลาด และเมตริกหลักอื่นๆ ความสามารถในการตรวจสอบเมตริกเหล่านี้มีความสำคัญอย่างยิ่งในช่วงกรอบเวลาที่มีความสำคัญต่อธุรกิจ หรือหลังจากที่มีพุชโค้ดใหม่เป็นเวอร์ชันที่ใช้งานจริง
ระบุเมตริกเวลาในการตอบสนอง
ตรวจสอบว่า UI ของคุณตอบสนองได้ดีเท่าที่ทำได้ โดยสังเกตว่าผู้ใช้คาดหวังมาตรฐานที่สูงยิ่งขึ้นจากแอปบนอุปกรณ์เคลื่อนที่ นอกจากนี้ คุณยังควรวัดและติดตามเวลาในการตอบสนองสำหรับบริการแบ็กเอนด์ด้วย โดยเฉพาะอย่างยิ่ง เนื่องจากอาจนำไปสู่ปัญหาอัตราการส่งข้อมูลหากไม่เลือก
เมตริกที่แนะนําที่ควรติดตามมีดังต่อไปนี้
- ระยะเวลาของคำขอ
- ระยะเวลาของคำขอในรายละเอียดของระบบย่อย (เช่น การเรียก API)
- ระยะเวลาในการทำงาน
ระบุเมตริกอัตราการส่งข้อมูล
อัตราการส่งข้อมูลคือการวัดจำนวนคำขอทั้งหมดที่แสดงในช่วงระยะเวลาหนึ่งๆ อัตราการส่งข้อมูลอาจได้รับผลกระทบจากเวลาในการตอบสนองของระบบย่อย คุณจึงอาจต้องเพิ่มประสิทธิภาพเพื่อเวลาในการตอบสนองเพื่อปรับปรุงอัตราการส่งข้อมูล
เมตริกที่ควรติดตามมีดังนี้
- จำนวนคำค้นหาต่อวินาที
- ขนาดของข้อมูลที่โอนต่อวินาที
- จำนวนการดำเนินการ I/O ต่อวินาที
- การใช้งานทรัพยากร เช่น การใช้ CPU หรือหน่วยความจำ
- ขนาดของการประมวลผลข้อมูลค้าง เช่น pub/sub หรือจำนวนชุดข้อความ
ไม่ใช่แค่ค่าเฉลี่ย
ข้อผิดพลาดที่พบบ่อยในการวัดประสิทธิภาพจะดูจากค่าเฉลี่ย (ค่าเฉลี่ย) เท่านั้น แม้ว่าวิธีนี้จะเป็นประโยชน์ แต่ก็ไม่ได้ให้ข้อมูลเชิงลึกเกี่ยวกับการกระจายของเวลาในการตอบสนอง เมตริกที่ดีกว่าในการติดตามคือเปอร์เซ็นต์ไทล์ประสิทธิภาพ เช่น เปอร์เซ็นไทล์ที่ 50/75/90/99 สำหรับเมตริกหนึ่งๆ
โดยทั่วไปแล้ว การเพิ่มประสิทธิภาพสามารถทำได้ใน 2 ขั้นตอน อย่างแรก ให้เพิ่มประสิทธิภาพสำหรับ เวลาในการตอบสนองของเปอร์เซ็นไทล์ที่ 90 จากนั้นพิจารณาเปอร์เซ็นไทล์ที่ 99 หรือที่เรียกอีกอย่างว่าเวลาในการตอบสนองช่วงปลาย ซึ่งเป็นคำขอส่วนน้อยที่ใช้เวลาดำเนินการนานกว่ามาก
การตรวจสอบฝั่งเซิร์ฟเวอร์สำหรับผลลัพธ์โดยละเอียด
โดยทั่วไปแล้ว เราแนะนำให้ใช้การทำโปรไฟล์ฝั่งเซิร์ฟเวอร์สำหรับเมตริกการติดตาม ฝั่งเซิร์ฟเวอร์มักจะใช้เครื่องมือได้ง่ายกว่า ทำให้เข้าถึงข้อมูลได้ละเอียดยิ่งขึ้น และไม่ได้รับผลกระทบจากปัญหาการเชื่อมต่อใดๆ
การตรวจสอบเบราว์เซอร์สำหรับการมองเห็นจากต้นทางถึงปลายทาง
การทำโปรไฟล์เบราว์เซอร์จะให้ข้อมูลเชิงลึกเพิ่มเติมเกี่ยวกับประสบการณ์ของผู้ใช้ปลายทางได้ โดยจะแสดงให้เห็นว่าหน้าใดมีคำขอที่ช้า ซึ่งคุณนำไปเชื่อมโยงกับการตรวจสอบฝั่งเซิร์ฟเวอร์เพื่อวิเคราะห์เพิ่มเติมได้
Google Analytics มีเครื่องมือตรวจสอบเวลาที่ใช้ในการโหลดหน้าเว็บได้ทันทีในรายงานการจับเวลาหน้าเว็บ บทความนี้นำเสนอมุมมองที่เป็นประโยชน์หลายด้านต่อการทำความเข้าใจประสบการณ์ของผู้ใช้ในเว็บไซต์ โดยเฉพาะในเรื่องต่อไปนี้
- เวลาในการโหลดหน้าเว็บ
- เปลี่ยนเส้นทางเวลาที่ใช้ในการโหลด
- เวลาในการตอบกลับของเซิร์ฟเวอร์
การตรวจสอบในระบบคลาวด์
มีเครื่องมือหลายอย่างที่คุณสามารถใช้บันทึกและตรวจสอบเมตริกประสิทธิภาพของแอปพลิเคชัน ตัวอย่างเช่น คุณอาจใช้ Google Cloud Logging เพื่อบันทึกเมตริกประสิทธิภาพไปยังโปรเจ็กต์ Google Cloud จากนั้นตั้งค่าหน้าแดชบอร์ดใน Google Cloud Monitoring เพื่อตรวจสอบและแบ่งกลุ่มเมตริกที่บันทึกไว้
อ่านคู่มือการบันทึกเพื่อดูตัวอย่างของการบันทึกไปยัง Google Cloud Logging จากตัวตรวจจับที่กำหนดเองในไลบรารีไคลเอ็นต์ Python เมื่อมีข้อมูลดังกล่าวใน Google Cloud คุณจะสร้างเมตริกเพิ่มเติมจากข้อมูลที่บันทึก เพื่อให้มองเห็นแอปพลิเคชันผ่าน Google Cloud Monitoring ได้ ทำตามคำแนะนำสำหรับเมตริกตามบันทึกที่ผู้ใช้กำหนดเพื่อสร้างเมตริกโดยใช้บันทึกที่ส่งไปยัง Google Cloud Logging
อีกทางเลือกหนึ่งคือ คุณสามารถใช้ไลบรารีของไคลเอ็นต์ Monitoring เพื่อกำหนดเมตริกในโค้ด และส่งเมตริกเหล่านั้นไปยัง Monitoring โดยตรงแยกต่างหากจากบันทึก
ตัวอย่างเมตริกตามบันทึก
สมมติว่าคุณต้องการตรวจสอบค่า is_fault
เพื่อทำความเข้าใจอัตราข้อผิดพลาดในแอปพลิเคชันของคุณให้ดียิ่งขึ้น คุณแยกค่า is_fault
จากบันทึกไปไว้ในเมตริกตัวนับใหม่ได้ ErrorCount
ใน Cloud Logging ป้ายกำกับจะช่วยให้คุณจัดกลุ่มเมตริกเป็นหมวดหมู่ต่างๆ โดยอิงตามข้อมูลอื่นๆ ในบันทึก คุณกำหนดค่าป้ายกำกับสำหรับช่อง method
ที่ส่งไปยัง Cloud Logging ได้เพื่อดูการแจกแจงจำนวนข้อผิดพลาดตามเมธอดของ Google Ads API
เมื่อกำหนดค่าเมตริก ErrorCount
และป้ายกำกับ Method
แล้ว คุณจะสร้างแผนภูมิใหม่ในแดชบอร์ด Monitoring เพื่อตรวจสอบ ErrorCount
ซึ่งจัดกลุ่มตาม Method
ได้
การแจ้งเตือน
คุณกำหนดค่านโยบายการแจ้งเตือนได้ใน Cloud Monitoring และในเครื่องมืออื่นๆ ซึ่งจะระบุเวลาและวิธีที่เมตริกทริกเกอร์การแจ้งเตือน สำหรับคำแนะนำในการตั้งค่าการแจ้งเตือน Cloud Monitoring โปรดทำตามคู่มือการแจ้งเตือน