วันจันทร์ที่ 21 กันยายน 2020
เมื่อปีที่แล้วเราได้เปิดตัวโปรแกรมแยกวิเคราะห์และเครื่องมือจับคู่ robots.txt ที่เราใช้ในระบบการผลิตในโลกโอเพนซอร์ส ตั้งแต่นั้นมาเราได้เห็นผู้คนสร้างสรรค์เครื่องมือใหม่ๆ ขึ้นมาจากโปรแกรมแยกวิเคราะห์และเครื่องมือจับคู่ดังกล่าว รวมถึงมีส่วนร่วมกับไลบรารีโอเพนซอร์ส (ซึ่งช่วยปรับปรุงระบบการผลิตของเราได้อย่างมีประสิทธิภาพ ต้องขอขอบคุณมา ณ ที่นี้ด้วย) ตลอดจนเปิดตัวเวอร์ชันภาษาใหม่ๆ เช่น golang และ rust ซึ่งช่วยให้นักพัฒนาซอฟต์แวร์สร้างเครื่องมือใหม่ๆ ได้ง่ายขึ้น
ฤดูกาลฝึกงานที่ Google กำลังจะสิ้นสุดลงแล้ว เราจึงอยากไฮไลต์การเปิดตัวเครื่องมือใหม่ 2 อย่างที่เกี่ยวข้องกับ robots.txt ซึ่งเป็นผลงานของพนักงานฝึกงานที่ทำงานในทีมโอเพนซอร์สของ Search อย่าง Andreea Dutulescu และ Ian Dolzhanskii
การทดสอบข้อกําหนดของ robots.txt
อย่างแรก เราจะเปิดตัวกรอบการทดสอบสำหรับนักพัฒนาโปรแกรมแยกวิเคราะห์ robots.txt ซึ่งสร้างโดย Andreea โปรเจ็กต์ดังกล่าวจัดทำเครื่องมือทดสอบที่ตรวจสอบได้ว่าโปรแกรมแยกวิเคราะห์ robots.txt เป็นไปตามโปรโตคอลการยกเว้นสำหรับโรบ็อตหรือไม่ หรือเป็นไปในลักษณะอย่างไร ปัจจุบันยังไม่มีวิธีที่ละเอียดและเป็นทางการในการประเมินความถูกต้องของโปรแกรมแยกวิเคราะห์ Andreea จึงสร้างเครื่องมือที่ใช้สร้างโปรแกรมแยกวิเคราะห์ robots.txt ซึ่งเป็นไปตามโปรโตคอลดังกล่าวขึ้นมา
โปรแกรมแยกวิเคราะห์และเครื่องมือจับคู่ robots.txt ของ Java
อย่างที่ 2 เราจะเปิดตัวพอร์ต Java ในโปรแกรมแยกวิเคราะห์ robots.txt ของ C++ อย่างเป็นทางการซึ่งสร้างขึ้นโดย Ian Java เป็นภาษาโปรแกรมที่ได้รับความนิยมสูงสุดอันดับ 3 ใน GitHub และยังใช้งานกันอย่างแพร่หลายใน Google ด้วย จึงเป็นพอร์ตภาษาที่มีผู้ร้องขอเข้ามามากที่สุด โปรแกรมแยกวิเคราะห์ดังกล่าวเป็นการแปลแบบ 1 ต่อ 1 จากโปรแกรมแยกวิเคราะห์ของ C++ ในแง่ของฟังก์ชันและลักษณะการทำงาน โดยผ่านการทดสอบอย่างละเอียดถี่ถ้วนในด้านความเท่าเทียมกับกฎ robots.txt จำนวนมาก หลายทีมวางแผนที่จะใช้โปรแกรมแยกวิเคราะห์ robots.txt ของ Java ในระบบการผลิตของ Google และเราหวังว่าโปรแกรมแยกวิเคราะห์นี้จะเป็นประโยชน์สำหรับคุณเช่นกัน
และเช่นเคย เรายินดีให้คุณเข้ามามีส่วนร่วมในโปรเจ็กต์เหล่านี้ หากคุณสร้างเครื่องมือใดๆ ด้วยโปรแกรมแยกวิเคราะห์ robots.txt ของ C++ หรือด้วยเครื่องมือที่เปิดตัวใหม่เหล่านี้ โปรดแจ้งให้เราทราบเพื่อที่จะได้ช่วยกระจายข่าว หากพบข้อบกพร่อง โปรดช่วยเราแก้ไขด้วยการเปิดประเด็นใน GitHub หรือมีส่วนร่วมโดยตรงด้วยการดึงคำขอ หากมีข้อสงสัยหรือความคิดเห็นเกี่ยวกับโปรเจ็กต์เหล่านี้ โปรดติดต่อเราทาง Twitter
เรายินดีที่ได้รับ Andreea และ Ian เข้ามาฝึกงานและรู้สึกเศร้าที่การฝึกงานกำลังจะสิ้นสุดลง การมีส่วนร่วมของทั้งสองช่วยให้อินเทอร์เน็ตเป็นที่ที่ดียิ่งขึ้นและเราหวังว่าจะได้ต้อนรับทั้งสองกลับมายัง Google อีกครั้งในอนาคต