הדף הזה מתייחס לגרסת ה-XML של Custom Search JSON API, שזמינה רק לקוחות של Google Site Search.
- סקירה כללית
- פורמט הבקשה של Programmable Search Engine
- תוצאות XML
סקירה כללית
שירות Google WebSearch מפעיל את 'חיפוש באתר' של Google ללקוחות להציג תוצאות חיפוש של Google באתרים שלהם. שירות WebSearch משתמש בפרוטוקול פשוט מבוסס HTTP להצגת חיפוש תוצאות. למנהלי החיפוש יש שליטה מלאה על האופן שבו הם לבקש תוצאות חיפוש ואת הדרך שבה הן מציגות את התוצאות האלה למשתמש קצה. במסמך הזה מתוארים הפרטים הטכניים של פלטפורמת Google של בקשות חיפוש ותוצאות.
כדי לאחזר תוצאות של Google WebSearch, האפליקציה שלך שולחת ב-Google, בקשת HTTP פשוטה. לאחר מכן Google מחזירה תוצאות חיפוש ב-XML הפורמט. תוצאות בפורמט XML מאפשרות לבצע התאמה אישית באופן שבו תוצאות החיפוש מוצגות.
פורמט הבקשה של WebSearch
- בקשה סקירה כללית
- תנאי השאילתה
- הפרמטרים של הבקשה
- שאילתות לדוגמה של WebSearch
- שאילתת WebSearch הגדרות הפרמטרים
- שאילתות עם תמונה לדוגמה
- שאילתת חיפוש באמצעות תמונה הגדרות הפרמטרים
- חיפוש מתקדם
- חיפוש מתקדם הפרמטרים של השאילתות
- תנאים מיוחדים לשאילתה
- הגבלות על בקשות
סקירה כללית של הבקשה
הבקשה של חיפוש Google היא פקודת GET
רגילה של HTTP. הוא
הדוח כולל אוסף של פרמטרים שרלוונטיים
שאילתות. הפרמטרים האלה נכללים בכתובת ה-URL של הבקשה בתור name=value
זוגות שמופרדים באמצעות תווי אמפרסנד (&). הפרמטרים כוללים
נתונים כמו שאילתת החיפוש ומזהה מנוע חיפוש ייחודי (cx
) שמזהה את
שמבצע את בקשת ה-HTTP. השירות WebSearch או Image Search מחזיר
XML התוצאה היא בקשות ה-HTTP שלכם.
מונחי השאילתה
רוב בקשות החיפוש כוללות מונח שאילתה אחד או יותר. מונח שאילתה מופיע כערך של פרמטר בבקשת החיפוש.
מונחי השאילתה יכולים לציין מספר סוגי מידע לסינון לארגן את תוצאות החיפוש ש-Google תחזיר. השאילתות יכולות לציין:
- מילים או ביטויים להכללה או
לא לכלול
- כל המילים בשאילתת החיפוש (ברירת מחדל)
- ביטוי מדויק בשאילתת החיפוש
- כל מילה או ביטוי בשאילתת חיפוש
- איפה במסמך מחפשים את
מונחי חיפוש
- במקום כלשהו במסמך (ברירת מחדל)
- רק בגוף המסמך
- רק בכותרת המסמך
- רק בכתובת ה-URL של המסמך
- רק בקישורים במסמך
- הגבלות על המסמכים עצמם
- הכללה או החרגה של מסמכים מסוגי קבצים מסוימים (כמו קובצי PDF או מסמכי Word)
- שאילתות מיוחדות על כתובות URL שמחזירות
מידע על כתובת URL מסוימת, במקום לבצע חיפוש
- שאילתות שמחזירות מידע כללי על כתובת URL, כמו הקטגוריה, קטע הטקסט או השפה של הספרייה הפתוחה
- שאילתות המחזירות קבוצה של דפי אינטרנט המקשרים לכתובת URL
- שאילתות שמחזירות קבוצה של דפי אינטרנט שדומים לכתובת URL נתונה
חיפוש ברירת המחדל
ערכי הפרמטרים של שאילתות החיפוש צריכים להיות מסומנים בתווי בריחה (escape) בכתובת URL. שימו לב: יחליף את סימן הפלוס ("+") בכל רצף של רווח לבן שאילתת החיפוש. הנושא הזה מוסבר בפירוט בקטע הסרת כתובת URL מ-URL במסמך הזה.
מונח שאילתת החיפוש נשלח לשירות WebSearch באמצעות הפרמטר q. א' מונח שאילתת החיפוש לדוגמה הוא:
q=horses+cows+pigs
כברירת מחדל, שירות Google WebSearch מחזיר רק מסמכים לכלול את כל המונחים בשאילתת החיפוש.
הפרמטרים של הבקשה
בקטע הזה מפורטים הפרמטרים שבהם אפשר להשתמש כדי ליצור לבקשת החיפוש. הפרמטרים מחולקים לשתי רשימות. הרשימה הראשונה כוללת פרמטרים שרלוונטיים לכל בקשות החיפוש. הרשימה השנייה מכילה פרמטרים הן רלוונטיות רק לבקשות חיפוש מתקדם.
נדרשים שלושה פרמטרים של הבקשה:
- יש להגדיר את הפרמטר client כ-
google-csbe
- הפרמטר output מציין את
פורמט של תוצאות ה-XML המוחזרות; ניתן להחזיר תוצאות עם (xml)
או ללא (
xml_no_dtd
) הפניה למספר DTD של Google. ההמלצות שלנו הגדרת הערך הזה ל-xml_no_dtd
. הערה: אם לא מציינים את הפרמטר הזה, התוצאות יוחזרו HTML במקום XML.
- הפרמטר cx שמייצג את הערך
מזהה המנוע.
הפרמטרים הנפוצים ביותר של בקשות, מלבד הפרמטרים שהוזכרו למעלה הן:
שאילתות לדוגמה ב-WebSearch
הדוגמאות הבאות מראות שתי בקשות HTTP של WebSearch כדי תמחיש איך משתמשים בפרמטרים שונים של שאילתה. הגדרות של פרמטרים שונים של שאילתות מספקים בשאילתת WebSearch הגדרות פרמטרים ושאילתת חיפוש מתקדמת פרמטרים של המסמך הזה.
בבקשה הזו מבקשת את 10 התוצאות הראשונות (start=0&num=10
)
עבור מונח השאילתה 'רד סוקס' (q=red+sox
). השאילתה גם
מציין שהתוצאות צריכות להגיע מאתרי אינטרנט קנדיים (cr=countryCA
)
וצריך לכתוב אותן בצרפתית (lr=lang_fr
). לבסוף,
מציין ערכים עבור הלקוח, פלט,
ו-cx, וכל שלושת הפרמטרים האלה נדרשים.
http://www.google.com/search?
start=0
&num=10
&q=red+sox
&cr=countryCA
&lr=lang_fr
&client=google-csbe
&output=xml_no_dtd
&cx=00255077836266642015:u-scht7a-8i
בדוגמה הזו נשתמש בחלק משאילתת החיפוש המתקדם
כדי להתאים אישית עוד יותר את שאילתת החיפוש. הבקשה הזו משתמשת בפונקציה as_q
הפרמטר (as_q=red+sox
) במקום הפרמטר q. הוא גם משתמש
as_eq כדי להחריג מסמכים שמכילים את המילה 'Yankees' מ-
תוצאות החיפוש (as_eq=yankees
).
http://www.google.com/search?
start=0
&num=10
&as_q=red+sox
&as_eq=Yankees
&client=google-csbe
&output=xml_no_dtd
&cx=00255077836266642015:u-scht7a-8i
הגדרות פרמטרים של שאילתת WebSearch
c2coff | |||||||
---|---|---|---|---|---|---|---|
תיאור | אופציונלי. הפרמטר c2coff מפעיל או משבית את התכונה פשוטה וחיפוש בסינית מסורתית. ערך ברירת המחדל של הפרמטר הזה הוא
|
||||||
דוגמאות | q=google&c2coff=1 |
לקוח | |
---|---|
תיאור | נדרש. יש להגדיר את הפרמטר |
דוגמאות | q=google&client=google-csbe |
cr | |
---|---|
תיאור | אופציונלי. הפרמטר Google WebSearch קובע את המדינה של מסמך לפי בתהליך ניתוח:
ראו את הפרמטר 'מדינה (cr)' ערכים עבור רשימה של הערכים החוקיים לפרמטר הזה. |
דוגמאות | q=Frodo&cr=countryNZ |
CX | |
---|---|
תיאור | נדרש. הפרמטר |
דוגמאות | q=Frodo&cx=00255077836266642015:u-scht7a-8i |
סינון | |||||||
---|---|---|---|---|---|---|---|
תיאור | אופציונלי. הפרמטר filter מפעיל או משבית את הסינון האוטומטי של תוצאות החיפוש ב-Google. קראו את הקטע סינון אוטומטי במאמר הזה. המסמך הזה כדי לקבל מידע נוסף על מסנני תוצאות החיפוש של Google. ערך ברירת המחדל של הפרמטר
הערה: כברירת מחדל, Google מחילה את הסינון על כל המשתמשים כדי לשפר את האיכות של התוצאות האלה. |
||||||
דוגמאות | q=google&filter=0 |
gl | |
---|---|
תיאור | אופציונלי. ערך הפרמטר ציון ערך פרמטר של |
דוגמאות | הבקשה הזו מקדמת מסמכים שנכתבו בבריטניה
תוצאות חיפוש ב-WebSearch: |
hl | |
---|---|
תיאור | אופציונלי. הפרמטר ראה את הקטע שפות ממשק של שאילתות בינלאומיות ומצגות תוצאות למידע נוסף ולשפות ממשק נתמכות לרשימת השפות הנתמכות. |
דוגמאות | הבקשה הזו מטרגטת מודעות שמקדמות יין בצרפתית. (מספר זיהוי הרכב הוא את המונח בצרפתית ליין.) q=vin&ip=10.10.10.10&ad=w5&hl=fr |
מטרופולין | |
---|---|
תיאור | אופציונלי. הפרמטר |
דוגמאות | הבקשה הזו מחפשת 'פיצה' וגם 'גבינה'. הביטוי זהה ל-
|
ie | |
---|---|
תיאור | אופציונלי. הפרמטר בקטע קידוד תווים מוסבר מתי כדאי להשתמש בפרמטר. לפרטים נוספים, אפשר לעיין בקטע קידוד תווים
סעיף סכימות לרשימת ערכי |
דוגמאות | q=google&ie=utf8&oe=utf8 |
lr | |
---|---|
תיאור | אופציונלי. הפרמטר מערכת Google WebSearch קובעת את השפה של מסמך לפי בתהליך ניתוח:
להצגת השפה ( |
דוגמאות | q=Frodo&lr=lang_en |
מספר | |
---|---|
תיאור | אופציונלי. הפרמטר ערך ברירת המחדל של הערה: אם המספר הכולל של תוצאות החיפוש נמוך יותר ממספר התוצאות המבוקש, כל תוצאות החיפוש הזמינות שיוחזר. |
דוגמאות | q=google&num=10 |
או | |
---|---|
תיאור | אופציונלי. הפרמטר בקטע קידוד תווים מוסבר מתי כדאי להשתמש בפרמטר. לפרטים נוספים, אפשר לעיין בקטע קידוד תווים
סעיף סכימות לרשימת ערכי |
דוגמאות | q=google&ie=utf8&oe=utf8 |
output | |||||||
---|---|---|---|---|---|---|---|
תיאור | נדרש. הפרמטר
|
||||||
דוגמאות | output=xml_no_dtd |
q | |
---|---|
תיאור | אופציונלי. הפרמטר יש גם כמה מונחי שאילתה מיוחדים שיכולים
משמש כחלק מהפרמטר לוח הבקרה של חיפוש Google כולל דוח לגבי
שאילתות שנשלחו באמצעות הפרמטר הערה: הערך שצוין לפרמטר q חייב להיות מסומנים בתו בריחה (escape) בכתובת URL. |
דוגמאות | q=vacation&as_oq=london+paris |
בטיחות | |||||||||
---|---|---|---|---|---|---|---|---|---|
תיאור | אופציונלי. הפרמטר
ראו סינון תוכן למבוגרים בלבד עם חיפוש בטוח לקבלת פרטים נוספים על התכונה הזו. |
||||||||
דוגמאות | q=adult&safe=high |
התחלה | |
---|---|
תיאור | אופציונלי. הפרמטר הפרמטר |
דוגמאות | start=10 |
מיון | |
---|---|
תיאור | אופציונלי. הפרמטר |
דוגמאות |
|
U | |
---|---|
תיאור | אופציונלי. הפרמטר http://www.花井鮨.com הערכים החוקיים לפרמטר הזה הם אם הפרמטר http://www.xn--elq438j.com. הערה: זוהי תכונת בטא. |
דוגמאות | q=google&ud=1 |
חיפוש מתקדם
הפרמטרים הנוספים של שאילתות שמפורטים מתחת לתמונה רלוונטיים לשאילתות של חיפוש מתקדם. כששולחים חיפוש מתקדם, הערכים של כמה פרמטרים (למשל, as_eq, as_epq, as_oq וכדומה) משוקללים בשאילתה מונחים לחיפוש. תמונה שבה מוצג הדף 'חיפוש מתקדם' של Google. בתמונה מופיע השם של פרמטר החיפוש המתקדם כתוב בטקסט אדום בתוך או לידו השדה בדף שאליו הפרמטר תואם.
פרמטרים של שאילתות חיפוש מתקדם
as_dt | |
---|---|
תיאור | אופציונלי. הפרמטר |
דוגמאות | as_dt=i,as_dt=e |
as_epq | |
---|---|
תיאור | אופציונלי. הפרמטר |
דוגמאות | as_epq=abraham+lincoln |
as_eq | |
---|---|
תיאור | אופציונלי. הפרמטר |
דוגמאות |
|
as_lq | |
---|---|
תיאור | אופציונלי. הפרמטר |
דוגמאות |
|
as_nlo | |
---|---|
תיאור | אופציונלי. הפרמטר |
דוגמאות | טווח החיפוש שמגדירים הוא 5 עד 10, כולל:
|
as_nhi | |
---|---|
תיאור | אופציונלי. הפרמטר |
דוגמאות | טווח החיפוש שמגדירים הוא 5 עד 10, כולל:
|
as_oq | |
---|---|
תיאור | אופציונלי. הפרמטר |
דוגמאות |
|
as_q | |
---|---|
תיאור | אופציונלי. הפרמטר |
דוגמאות |
|
as_qdr | |
---|---|
תיאור | אופציונלי. הפרמטר
התוצאות של |
דוגמאות |
בדוגמה הבאה אנחנו מבקשים תוצאות מהשנה האחרונה:
בדוגמה הבאה מבקשים תוצאות מ-10 הימים האחרונים:
|
as_sitesearch | |
---|---|
תיאור | אופציונלי. הפרמטר |
דוגמאות |
|
תנאים מיוחדים לשאילתות
Google WebSearch מאפשר להשתמש במספר מונחי שאילתה מיוחדים
גישה ליכולות נוספות של מנוע החיפוש של Google. האלה
צריך לכלול מונחי שאילתות מיוחדים בערך של פרמטר הבקשה q. כמו מונחי שאילתה אחרים,
מונחי שאילתה מיוחדים צריכים להיות מסומנים בתו בריחה (escape) בכתובת URL. א'
מספר מונחי השאילתה המיוחדים מכילים נקודתיים (:). התו הזה
חייב להיות גם בכתובת URL עם תו בריחה (escape), הערך של כתובת ה-URL שמסומנת בתו בריחה (escape) הוא %3A
.
קישורים חוזרים [link:] | |
---|---|
תיאור | מונח השאילתה הגרסה של אפשר גם להשתמש בבקשה as_lq
כדי לשלוח בקשת הערה: לא ניתן לציין מונחי שאילתה אחרים כאשר
באמצעות |
דוגמאות |
|
חיפוש בוליאני OR [ או ] | |
---|---|
תיאור | מונח השאילתה אפשר גם להשתמש בבקשה as_oq פרמטר לחיפוש של מונח כלשהו בקבוצת מונחים. הערה: אם בקשת החיפוש מציין את השאילתה "לונדון+OR+פריז", תוצאות החיפוש יכללו מסמכים שמכילים לפחות אחת משתי המילים האלה. במקרים מסוימים, מסמכים שבתוצאות החיפוש עשויים להכיל את שתי המילים. |
דוגמאות | מחפשים את לונדון או פריז: קלט של משתמשים:
london OR
paris מונח השאילתה:q=london+OR+paris מחפשים חופשה וגם את לונדון או פריז: מונח השאילתה:
q=vacation+london+OR+paris מחפשים חופשה ואחת מלונדון, פריז או שוקולדים: מונח השאילתה:
q=vacation+london+OR+paris+OR+chocolates מחפשים חופשה ושוקולדים וגם לונדון או פריז, עם המשקל הקטן ביותר שניתן לשוקולדים: מונח השאילתה:
q=vacation+london+OR+paris+chocolates חיפוש חופשה, שוקולדים ופרחים במסמכים לכלול גם את לונדון או פריז: מונח השאילתה:
q=vacation+london+OR+paris+chocolates+flowers מחפשים חופשה ואחת מלונדון או פריז וגם מחפשים לאחד משוקולד או לפרחים: מונח השאילתה: q=vacation+london+OR+paris+chocolates+OR+flowers |
החרגת מונח שאילתה [-] | |
---|---|
תיאור | מונח השאילתה 'החרגה ( הגרסה של מונח השאילתה מוחרג שימושי כאשר למונח החיפוש יש יותר ממשמעות אחת. לדוגמה, המילה "בס" יכול להחזיר תוצאות על דגים או על מוזיקה. אם חיפשת מסמכים על דג, ניתן להחריג מסמכים על מוזיקה בתוצאות החיפוש באמצעות המונח 'החרגת שאילתה'. אפשר גם להשתמש בבקשה as_eq פרמטר להחרגה של מסמכים שתואמים למילה מסוימת או לביטוי מסוים מתוצאות החיפוש. |
דוגמאות | קלט של משתמשים: bass -music מונח השאילתה: q=bass+%2Dmusic |
החרגת סוגי קבצים [ -filetype: ] | |
---|---|
תיאור | מונח השאילתה הגרסה של הערה: אפשר להחריג כמה
סוגי קבצים מתוצאות החיפוש על ידי הוספת עוד שאילתת סוגי הקבצים ש-Google תומכת בהם:
יכול להיות שבעתיד יתווספו סוגי קבצים נוספים. גרסה עדכנית תמיד אפשר למצוא את הרשימה בשאלות הנפוצות על סוגי קבצים של Google. |
דוגמאות | בדוגמה הזו הוחזרו מסמכים שמוזכרים בהם "Google" אבל זה
אינם מסמכי PDF: בדוגמה הזו הוחזרו מסמכים שמוזכרים בהם "Google" אבל
לא כולל מסמכי PDF ו-Word: |
סינון סוגי קבצים [ filetype: ] | |
---|---|
תיאור | מונח השאילתה הגרסה של אפשר להגביל את החיפוש
תוצאות למסמכים התואמים לאחת מסיומות הקבצים של כמה סיומות באמצעות הוספת
עוד מונחי שאילתה כברירת מחדל, תוצאות החיפוש כוללים מסמכים עם סיומת קובץ כלשהי. סוגי הקבצים ש-Google תומכת בהם:
יכול להיות שבעתיד יתווספו סוגי קבצים נוספים. גרסה עדכנית תמיד אפשר למצוא את הרשימה בשאלות הנפוצות על סוגי קבצים של Google. |
דוגמאות | בדוגמה הזו מוחזרות מסמכי PDF שבהם מצוין "Google": בדוגמה הזו מוחזרות מסמכי PDF ו-Word שמזכירים
"Google": |
הכללת מונח השאילתה [+] | |
---|---|
תיאור | מונח השאילתה (+) מציין שמילה או ביטוי חייבת להתרחש בכל המסמכים שכלולים בתוצאות החיפוש. כדי להשתמש כלול מונח שאילתה, עליך להקדים את המילה או הביטוי שחייבים להיות נכלל בכל תוצאות החיפוש עם הסימן "+" (סימן פלוס). הגרסה של צריך להשתמש במילה |
דוגמאות | קלט של משתמשים: Star Wars Episode +I מונח השאילתה: q=Star+Wars+Episode+%2BI |
קישורים בלבד חיפוש, כל המונחים [ allinlinks: ] | |
---|---|
תיאור | עבור מונח השאילתה אם שאילתת החיפוש כוללת את השאילתה הגרסה של |
דוגמאות | קלט של משתמשים:allinlinks: Google search מונח השאילתה: q=allinlinks%3A+Google+search |
חיפוש ביטויים | |
---|---|
תיאור | מונח השאילתה לחיפוש (") מאפשר לכם לחפש של משפטים מלאים על ידי הקפצת הביטויים במירכאות או באמצעות לחבר אותם באמצעות מקפים. הגרסה של חיפושי ביטויים שימושיים במיוחד אם אתה מבצע חיפוש ציטוטים מפורסמים או שמות עצם פרטיים. אפשר גם להשתמש בבקשה as_epq כדי לשלוח חיפוש של ביטוי. |
דוגמאות | קלט של משתמשים:"Abraham Lincoln" מונח השאילתה: q=%22Abraham+Lincoln%22 |
חיפוש טקסט בלבד, כל המונחים [allintext:] | |
---|---|
תיאור | עבור מונח השאילתה אם שאילתת החיפוש כוללת את השאילתה הגרסה של |
דוגמאות | הדוגמה הזו מציינת שהמילים
"Google" ועל 'חיפוש' חייב להופיע בגוף כל המסמכים הכלולים
בתוצאות החיפוש: קלט של משתמשים: allintext:Google search מונח השאילתה: q=allintext%3AGoogle+search |
חיפוש כותרת, מונח יחיד [intitle:] | |
---|---|
תיאור | מונח השאילתה הערה: אפשר לציין עוד
ממילה אחת שחייבת להיכלל בכותרת המסמך באמצעות הצבת
מונח השאילתה הגרסה של |
דוגמאות | הדוגמה הזו מציינת שהמילה "Google" חייב להופיע ב:
הכותרות של כל מסמך בתוצאות החיפוש, והמילה
"search" חייב להופיע במקום כלשהו בכותרות, בכתובות URL, בקישורים או בגוף הטקסט
מהמסמכים האלה: |
חיפוש כותרת, כל המונחים [allintitle:] | |
---|---|
תיאור | מונח השאילתה הערה: ההוספה של הגרסה של |
דוגמאות | הדוגמה הזו מציינת שהמילים Google ועל 'חיפוש'
חייבות להופיע בכותרות של כל המסמכים בתוצאות החיפוש: |
URL Search, מונח יחיד [inurl:] | |
---|---|
תיאור | מונח השאילתה השאילתה הגרסה של |
דוגמאות | הדוגמה הזו מציינת שהמילה "Google" חייב להופיע ב:
כתובות ה-URL של מסמכים כלשהם בתוצאות החיפוש, והמילה "חיפוש"
חייב להופיע במקום כלשהו בכותרות, בכתובות ה-URL, בקישורים או בגוף הטקסט
מסמכים: |
חיפוש כתובות URL, כל המונחים [allinurl:] | |
---|---|
תיאור | מונח השאילתה מונח השאילתה הגרסה של |
דוגמאות | הדוגמה הזו מציינת שהמילים Google ועל 'חיפוש'
חייבות להופיע בכתובות ה-URL של כל המסמכים בתוצאות החיפוש: |
פרטי מסמך אינטרנט [info:] | |
---|---|
תיאור | מונח השאילתה הגרסה של הערה: לא ניתן לציין מונחי שאילתה אחרים כאשר
באמצעות |
דוגמאות | קלט של משתמשים: info:www.google.com מונח השאילתה: q=info%3Awww.google.com |
שאילתות תמונה לדוגמה
הדוגמאות הבאות מראות כמה בקשות HTTP של תמונות כדי להמחיש את אופן השימוש בפרמטרים שונים של שאילתה. ההגדרות לפרמטרים השונים של השאילתה מופיעות בקטעים 'הגדרות פרמטרים של שאילתות תמונה' במסמך זה.
הבקשה הזו מבקשת את 5 התוצאות הראשונות (start=0&num=5
) עבור מונח השאילתה "קוף" (q=monkey
), מסוג קובץ .png לבסוף, השאילתה מציינת ערכים לפרמטרים client
, output
ו-cx
, וכל שלושתם נדרשים.
http://www.google.com/cse? searchtype=image start=0 &num=5 &q=monkey &as_filetype=png &client=google-csbe &output=xml_no_dtd &cx=00255077836266642015:u-scht7a-8i
פרמטרים של שאילתת חיפוש תמונות
as_filetype | |
---|---|
תיאור | אופציונלי. מחזירה תמונות מסוג שצוין. הערכים המותרים הם: |
דוגמאות | q=google&as_filetype=png |
imgsz | |
---|---|
תיאור | אופציונלי. החזרת תמונות בגודל שצוין, כשהגודל יכול להיות אחד מהערכים הבאים:
|
דוגמאות | q=google&as_filetype=png&imgsz=icon |
סוג תמונה | |
---|---|
תיאור | אופציונלי. מחזירה תמונות מסוג, שיכולות להיות אחת מהאפשרויות הבאות:
|
דוגמאות | q=google&as_filetype=png&imgtype=photo |
imgc | |
---|---|
תיאור | אופציונלי. מחזירה תמונות בשחור-לבן, גווני אפור או תמונות צבעוניות:
|
דוגמאות | q=google&as_filetype=png&imgc=gray |
imgcolor | |
---|---|
תיאור | אופציונלי. מחזירה תמונות של צבע דומיננטי ספציפי:
|
דוגמאות | q=google&as_filetype=png&imgcolor=yellow |
as_rights | |
---|---|
תיאור | אופציונלי. מסננים בהתאם לרישוי. הערכים הנתמכים כוללים:
|
דוגמאות | q=cats&as_filetype=png&as_rights=cc_attribute |
מגבלות של בקשות
התרשים הבא מפרט את המגבלות על בקשות החיפוש שליחה ל-Google:
רכיב | הגבלה | תגובה |
---|---|---|
אורך בקשת החיפוש | 2,048 בייטים | |
מספר מונחי השאילתה | 10 | כוללת מונחים בפרמטרים הבאים: q, as_epq, as_eq, as_lq, as_oq, as_q |
מספר התוצאות | 20 | אם תגדירו את הפרמטר num למספר גדול מ-20, יוחזרו רק 20 תוצאות. שפת תרגום כדי לקבל עוד תוצאות, צריך לשלוח כמה בקשות מעלים את הערך של הפרמטר start ב- בכל בקשה. |
הצגת שאילתות ותוצאות בינלאומיות
שירות Google WebSearch מאפשר לך לחפש מסמכים בשפות מרובות. אפשר לציין את קידוד התווים לשמש לפירוש בקשת ה-HTTP ולקידוד תגובת ה-XML (באמצעות החיפוש ie ו-oe ). אפשר גם לסנן את התוצאות כך שיכללו מסמכים בלבד שכתוב בשפות מסוימות.
בקטעים הבאים נדון בבעיות שקשורות לחיפוש ב- במספר שפות:
קידוד תווים
השרתים שולחים נתונים, כמו דפי אינטרנט, לסוכני משתמש כמו בדפדפנים בתור רצף של בייטים מקודדים. סוכן המשתמש מפענח אותו לאחר מכן את הבייטים לרצף של תווים. כששולחים בקשות אל שירות WebSearch, ניתן לציין את סכימות הקידוד עבור את שאילתת החיפוש ואת תגובת ה-XML שתקבלו.
אפשר להשתמש בפרמטר של הבקשה ie כדי לציין
את מנגנון הקידוד של התווים בבקשת ה-HTTP. אפשר
להשתמש גם בפרמטר oe כדי לציין את הקידוד
ש-Google צריכה להשתמש בה כדי לקודד את תגובת ה-XML. אם אתם
באמצעות סכימת קידוד אחרת מ-ISO-8859-1
(או latin1
), חשוב לציין את הערכים הנכונים
לפרמטרים ie ו-oe.
הערה: אם אתם מספקים פונקציונליות חיפוש עבור כמה
שפות, מומלץ להשתמש בערך הקידוד utf8
(UTF-8)
גם לפרמטר ie וגם לפרמטר oe.
אפשר לעיין בקטע התו נספח בנושא סכימות קידוד לרשימה מלאה של הערכים אפשר להשתמש בהם בפרמטרים ie ו-oe.
מידע כללי נוסף על קידוד תווים זמין בכתובת http://www.w3.org/TR/REC-html40/charset.html.
שפות ממשק
אפשר להשתמש בפרמטר של הבקשה hl כדי לזהות את השפה של הממשק הגרפי. ערך הפרמטר hl עשוי להשפיע על תוצאות החיפוש ב-XML, במיוחד שאילתות בינלאומיות כאשר הגבלת השפה (באמצעות הפרמטר lr) לא מצוינת באופן מפורש. בתרחישים כאלה במקרים מסוימים, הפרמטר hl עשוי לקדם תוצאות חיפוש באותה שפה כמו שפת הקלט של המשתמש.
מומלץ להגדיר במפורש את הפרמטר hl בתוצאות החיפוש כדי להבטיח ש-Google תבחר תוצאות חיפוש לכל שאילתה.
כאן מפורטים ממשק נתמך. הקטע 'שפות' מציג רשימה מלאה של הערכים החוקיים לפרמטר hl.
חיפוש מסמכים שנכתבו בשפות מסוימות
אפשר להשתמש בפרמטר הבקשה lr כדי להגביל את תוצאות החיפוש למסמכים שנכתבות בשפה מסוימת שפה או קבוצת שפות.
הפרמטר lr תומך באופרטורים בוליאניים כדי לאפשר לציין שפות מרובות שצריך לכלול (או לא לכלול) בחיפוש תוצאות.
הדוגמאות הבאות מראות כיצד ניתן להשתמש באופרטורים בוליאניים כדי לבקש מסמכים ב בשפות שונות.
עבור מסמכים שנכתבו ביפנית:
lr=lang_jp
למסמכים שנכתבו באיטלקית או בגרמנית:
lr=lang_it|lang_de
עבור מסמכים שלא נכתבו בהונגרית או בצ'כית:
lr=(-lang_hu).(-lang_cs)
ניתן לעיין באוסף השפות הקטע 'ערכים' לעיון ברשימה מלאה של הערכים האפשריים לפרמטר lr ולפרמטר בוליאני קטע אופרטורים לדיון מקיף לגבי השימוש אופרטורים.
חיפוש בסינית פשוטה ומסורתית
סינית פשוטה וסינית מסורתית הן שתי גרסאות כתיבה של השפה הסינית. אפשר לכתוב את אותו קונספט אחר באופן שונה לכל וריאנט. בהינתן שאילתה באחת מהווריאנטים, שירות WebSearch יכול להחזיר תוצאות שכוללות דפים בשני וריאציות של אותו מודל.
כדי להשתמש בתכונה הזו:
- מגדירים את פרמטר הבקשה c2coff ל-0
וגם - מבצעים את אחת מהפעולות האלה:
בדוגמה הבאה מוצגים הפרמטרים של השאילתה שצריך לכלול בבקשה לקבלת תוצאות. גם בסינית פשוטה וגם בסינית מסורתית. (שים לב שהמידע הנדרש נוסף, כגון בתור client, לא נכלל בדוגמה).
search?hl=zh-CN &lr=lang_zh-TW|lang_zh-CN &c2coff=0
סינון תוצאות
Google WebSearch מספק כמה דרכים לסנן את החיפוש תוצאות:
סינון אוטומטי של תוצאות החיפוש
במסגרת המאמצים שלנו לספק את תוצאות החיפוש הרלוונטיות ביותר, Google משתמשת בשתי שיטות לסינון אוטומטי של תוצאות חיפוש נחשבות בדרך כלל לא רצויות:
-
תוכן כפול – אם כמה מסמכים מכילים את אותו מידע, רק המסמך הרלוונטי ביותר באותה קבוצה הוא כלולים בתוצאות החיפוש.
-
עומס ממארח – אם יש הרבה תוצאות חיפוש באותו אתר, ייתכן ש-Google לא תציג את כל התוצאות מהאתר הזה, או הצגת התוצאות במיקום נמוך יותר ב
את הדירוג בהשוואה למה שהיה יכול להיות.
מומלץ להשאיר את המסננים האלה מופעלים לבקשות חיפוש אופייניות כיוון שהמסננים משפרים באופן משמעותי את איכות רוב תוצאות החיפוש תוצאות. אבל אפשר לעקוף את המסננים האוטומטיים האלה על ידי הגדרת הערך 0 בפרמטר השאילתה filter לבקשת החיפוש.
סינון לפי שפה ומדינה
שירות Google WebSearch מחזיר תוצאות מאינדקס ראשי של כל מסמכי האינטרנט. האינדקס הראשי מכיל אוספי משנה של מסמכים שמקובצים לפי מאפיינים מסוימים, כולל שפה ומדינת המוצא.
ניתן להשתמש בפרמטרים של הבקשה lr ו-cr כדי להגביל את תוצאות החיפוש אוספי משנה של מסמכים שנכתבו בשפות מסוימות או מקורם במדינות מסוימות, בהתאמה.
מערכת Google WebSearch קובעת את השפה של מסמך באמצעות ניתוח של:
- הדומיין ברמה העליונה (TLD) של כתובת ה-URL של המסמך
- מטא תגים של שפה בתוך המסמך
- השפה הראשית שבה כתוב הטקסט במסמך
מומלץ לעיין גם בהגדרה של הפרמטר lr, בקטע חיפוש
מסמכים שנכתבו בשפות ספציפיות והערכים באוסף השפות שיכולים להיות
משמש כערכים לפרמטר lr
מידע על הגבלת תוצאות על סמך שפה.
מערכת Google WebSearch קובעת את המדינה של מסמך באמצעות ניתוח של:
- הדומיין ברמה העליונה (TLD) של כתובת ה-URL של המסמך
- המיקום הגיאוגרפי של כתובת ה-IP של שרת האינטרנט
מומלץ לעיין גם בהגדרה של הפרמטר cr ובאוסף המדינה ערכים שיכולים לשמש כערכים לפרמטר cr לקבלת מידע נוסף על הגבלת התוצאות לפי מדינה המקור.
הערה: אפשר לשלב שפות וערכי מדינה כדי להתאים אישית את תוצאות החיפוש. עבור למשל, אפשר לבקש מסמכים שנכתבו בצרפתית מגיעים מצרפת או קנדה, או לבקש מסמכים מהולנד ולא כתובות באנגלית. הפרמטרים lr ו-cr תומכים שניהם באופרטורים בוליאניים.
סינון תוכן למבוגרים בלבד באמצעות חיפוש בטוח
לקוחות רבים של Google לא רוצים להציג תוצאות חיפוש עבור אתרים שמכילים תוכן למבוגרים בלבד. באמצעות מסנן החיפוש הבטוח שלנו, ניתן לסנן לתוצאות חיפוש שמכילות תוכן למבוגרים בלבד כדי להסיר אותן. המסננים של Google מתבססים על טכנולוגיה קניינית כדי לבדוק מילות מפתח, ביטויים וכתובות URL. אמנם אין מסננים מדויקים ב-100 אחוז, אבל החיפוש הבטוח להסיר מהחיפוש את רוב התוכן למבוגרים בלבד תוצאות.
Google שואפת לשמור על חיפוש בטוח עדכני ומקיף באמצעות סריקה מתמשכת של האינטרנט ושילוב של עדכונים מהצעות של משתמשים.
תכונת החיפוש הבטוח זמינה בשפות הבאות:
הולנדית אנגלית צרפתית גרמנית |
איטלקית פורטוגזית (ברזילאית) ספרדית סינית מסורתית |
אפשר לשנות את מידת הסינון של Google בתוצאות תוכן למבוגרים בלבד באמצעות פרמטר השאילתה safe. הטבלה הבאה מסבירה את הגדרות החיפוש הבטוח של Google ואיך הן ההגדרות ישפיעו על תוצאות החיפוש שלך:
רמת החיפוש הבטוח | תיאור |
---|---|
גבוה | הפעלת גרסה מחמירה יותר של החיפוש הבטוח. |
בינונית | חסימת דפי אינטרנט שמכילים פורנוגרפיה ותוכן מיני בוטה אחר. |
מושבתת | ללא סינון לפי 'למבוגרים בלבד' תוכן מתוצאות החיפוש. |
* הגדרת ברירת המחדל של החיפוש הבטוח מושבתת.
אם החיפוש הבטוח מופעל ומוצאים אתרים שכוללים כדי להציג תוכן פוגעני בתוצאות החיפוש, יש לשלוח אימייל לכתובת safesearch@google.com. יחקור את האתר.
תוצאות XML
- קובץ XML של Google תוצאות DTD
- מידע על תגובת ה-XML
- XML תוצאות של שאילתות חיפוש רגילות ומתקדם
- חיפוש רגיל/מתקדם: שאילתה לדוגמה ותוצאת XML
- חיפוש רגיל/מתקדם: תגי XML
תוצאות Google XML DTD
Google משתמשת באותו DTD כדי לתאר את פורמט ה-XML לכל הסוגים של תוצאות החיפוש. רבים מהתגים והמאפיינים רלוונטיים לכל סוגי המשתמשים בסוגי החיפוש. עם זאת, חלק מהתגים רלוונטיים רק לסוגים מסוימים בסוגי החיפוש. כתוצאה מכך, ההגדרות ב-DTD עשויות להיות פחות מגבילות יותר מההגדרות שמפורטות במסמך הזה.
מסמך זה מתאר את ההיבטים הרלוונטיים של DTD ל-WebSearch. כשבוחנים את חותמת הזמן, אם ב-WebSearch, תוכל להתעלם מתגים וממאפיינים שאינם מתועד כאן. אם ההגדרה שונה בין ה-DTD כי העובדה הזו מצוינת במסמך הזה.
Google יכולה להחזיר תוצאות XML עם או בלי הפניה אל את חותמת הזמן העדכנית ביותר DTD הוא מדריך לסיוע למנהלי חיפוש ומנתחי XML מבינים את תוצאות ה-XML של Google. כי ה-XML של Google הדקדוק עשוי להשתנות מעת לעת, לא כדאי להגדיר המנתח להשתמש ב-DTD כדי לאמת כל תוצאת XML.
בנוסף, אל תגדירו את מנתח ה-XML כך שיאחזר את DTD בכל פעם ששולחים בקשת חיפוש. Google מעדכנת את DTD לעיתים רחוקות, והבקשות האלה גורמות לעיכוב ולרוחב פס מיותרים בדרישות שלנו.
Google ממליצה להשתמש בפורמט הפלט xml_no_dtd כדי לקבל תוצאות XML. אם מציינים את פורמט XML פלט בבקשת החיפוש, ההבדל היחיד הוא הכללת השורה הבאה בתוצאות ה-XML:
<!DOCTYPE GSP SYSTEM "google.dtd">
אפשר לגשת למספר DTD העדכני בכתובת http://www.google.com/google.dtd.
לתשומת ליבכם: יכול להיות שלא כל התכונות ב-DTD יהיו זמינות או נתמכות בשלב זה.
מידע על תגובת XML
- כל ערכי הרכיבים הם HTML תקין שמתאים להצגה, אלא אם צוין אחרת בהגדרות של תגי XML.
- חלק מערכי הרכיבים הם כתובות URL שצריך לקודד ב-HTML לפני כן הם מוצגים.
- מנתח ה-XML צריך להתעלם ממאפיינים ומתגים לא מתועדים. כך האפליקציה יכולה להמשיך לפעול ללא שינויים למשל, אם Google מוסיפה עוד תכונות לפלט ה-XML.
- יש תווים שצריך לסמן בתו בריחה (escape) כשהם נכללים כערכים ב-
תגי XML. מעבד ה-XML שלכם צריך להמיר את הישויות האלה בחזרה
את התווים המתאימים. אם לא תמירו ישויות באופן תקין,
לדוגמה, הדפדפן עשוי לעבד את & בתו '&'.
ה-XML
מסמכים סטנדרטיים של התווים האלה. התווים האלה
בטבלה הבאה:
תו טפסים מילוט ישות קוד תו סימן 'גם' (אמפרסנד) & & & גרש ' ' ' מירכאות כפולות " " " גדול מ- > > > קטן מ- < < <
תוצאות XML לשאילתות חיפוש רגילות ומתקדם
חיפוש רגיל/מתקדם: שאילתה לדוגמה ותוצאת XML
בבקשת WebSearch לדוגמה הזו יש 10 תוצאות (num=10
)
על מונח החיפוש "socer" (q=socer
), זו המילה
'כדורגל' איות שגוי בכוונה עבור הדוגמה הזו).
http://www.google.com/search?
q=socer
&hl=en
&start=10
&num=10
&output=xml
&client=google-csbe
&cx=00255077836266642015:u-scht7a-8i
הבקשה הזו מניבה את תוצאת ה-XML הבאה. שימו לב שיש מספר הערות בתוצאת ה-XML שמציינות היכן תגים מסוימים יופיעו בתוצאה.
<?xml version="1.0" encoding="ISO-8859-1" standalone="no" ?>
<GSP VER="3.2">
<TM>0.452923</TM>
<Q>socer</Q>
<PARAM name="cx" value="00255077836266642015:u-scht7a-8i" original_value="00255077836266642015%3Au-scht7a-8i"/>
<PARAM name="hl" value="en" original_value="en"/>
<PARAM name="q" value="socer" original_value="socer"/>
<PARAM name="output" value="xml" original_value="xml"/>
<PARAM name="client" value="google-csbe" original_value="google-csbe"/>
<PARAM name="num" value="10" original_value="10"/>
<Spelling>
<Suggestion q="soccer"><b><i>soccer</i></b></Suggestion>
</Spelling>
<Context>
<title>Sample Vacation CSE</title>
<Facet>
<FacetItem>
<label>restaurants</label>
<anchor_text>restaurants</anchor_text>
</FacetItem>
<FacetItem>
<label>wineries</label>
<anchor_text>wineries</anchor_text>
</FacetItem>
</Facet>
<Facet>
<FacetItem>
<label>golf_courses</label>
<anchor_text>golf courses</anchor_text>
</FacetItem>
</Facet>
<Facet>
<FacetItem>
<label>hotels</label>
<anchor_text>hotels</anchor_text>
</FacetItem>
</Facet>
<Facet>
<FacetItem>
<label>nightlife</label>
<anchor_text>nightlife</anchor_text>
</FacetItem>
</Facet>
<Facet>
<FacetItem>
<label>soccer_sites</label>
<anchor_text>soccer sites</anchor_text>
</FacetItem>
</Facet>
</Context>
<RES SN="1" EN="10">
<M>6080</M>
/*
* The FI tag after the comment indicates that the result
* set has been filtered. If the number of results were exact, the
* FI tag would be replaced by an XT tag in the same format.
*/
<FI />
<NB>
/*
* Since the request is for the first page of results, the PU tag,
* which contains a link to the previous page of search results,
* is not included in this XML result. If the sample result did include
* a previous page of results, it would be listed here, in the same format
* as the NU tag on the following line
*/
<NU>/search?q=socer&hl=en&lr=&ie=UTF-8&output=xml&client=test&start=10&sa=N</NU>
</NB>
<R N="1">
<U>http://www.soccerconnection.net/</U>
<UE>http://www.soccerconnection.net/</UE>
<T>SoccerConnection.net</T>
<CRAWLDATE>May 21, 2007</CRAWLDATE>
<S><b>soccer</b>; players; coaches; ball; world cup;<b>...</b></S>
<Label>transcodable_pages</Label>
<Label>accessible</Label>
<Label>soccer_sites</Label>
<LANG>en</LANG>
<HAS>
<DI>
<DT>SoccerConnection.net</DT>
<DS>Post your <b>soccer</b> resume directly on the Internet.</DS>
</DI>
<L/>
<C SZ="8k" CID="kWAPoYw1xIUJ"/>
<RT/>
</HAS>
</R>
/*
* The result includes nine more results, each enclosed by an R tag.
*/
</RES>
</GSP>
חיפוש רגיל/מתקדם: תגי XML
תגובות XML לבקשות חיפוש רגילות ולחיפוש מתקדם שתי הבקשות משתמשות באותה קבוצה של תגי XML. תגי ה-XML האלה מוצגים את קוד ה-XML שלמעלה, ומוסבר בטבלאות שלמטה.
תגי ה-XML שבהמשך מסודרים לפי שם התג בסדר אלפביתי, וכל אחד מהם הגדרת התג מכילה תיאור של התג, דוגמה שממחישה איך התג יופיע בתוצאת XML והפורמט של התג תוכן. אם התג הוא תג משנה של תג XML אחר או אם התג כולל תגי משנה או מאפיינים משלו, שהמידע מסופק בו גם בטבלת ההגדרות של התג.
ייתכן שסמלים מסוימים יוצגו לצד תגי משנה מסוימים ב הגדרות בהמשך. לפניכם פירוט של הסמלים והמשמעויות שלהם:
* = אפס מופעים או יותר של תג המשנה
+ = מופע אחד או יותר של תג המשנה
א | ב | מ | י | G | מחצית | ט | ל | נ | צפ' | פ | שאלה | R | דר' | ג | U | X |
anchor_text | |
---|---|
הגדרה | התג <anchor_text> מציין את הטקסט שעליך להציג למשתמשים כדי לזהות חידוד התיוג המשויך לקבוצת תוצאות חיפוש. מאז תוויות חידוד להחליף תווים שאינם אלפאנומריים בקווים תחתונים, מציג את הערך של התג <label> בממשק המשתמש. במקום זאת, צריך להציג את הערך התג <anchor_text>. |
דוגמה | <linked_text>גולף קורסים</linked_text> |
תג משנה של | FacetItem |
פורמט התוכן | טקסט |
חסום | |
---|---|
הגדרה | תג זה כולל את התוכן של בלוק בשורת גוף של תוצאת קידום מכירות. לכל בלוק יש תגי משנה T , U ו-L. תג T שאינו ריק מציין שהבלוק מכיל טקסט. התגים U ו-L שלא ריקים מציינים שהבלוק מכיל קישור (עם כתובת ה-URL שצוינה בתג המשנה U ובטקסט המקושר בתג המשנה L). |
תגי משנה | T, U, L |
תג משנה של | BODY_LINE |
פורמט התוכן | ריק |
BODY_LINE | |
---|---|
הגדרה | תג זה כולל את התוכן של שורה בגוף התוצאה שמקודמת. כל שורת גוף מורכבת מכמה תגי BLOCK, שמכילים טקסט או קישור עם כתובת URL וטקסט מקושר. |
תגי משנה | חסימה* |
תג משנה של | SL_MAIN |
פורמט התוכן | ריק |
C | ||||||||||
---|---|---|---|---|---|---|---|---|---|---|
הגדרה | התג <C> מציין ששירות WebSearch
יכול לאחזר גרסה שנשמרה במטמון של כתובת ה-URL של תוצאת החיפוש הזו. אי אפשר
לאחזר דפים שנשמרו במטמון באמצעות API בפורמט XML, אבל אפשר להפנות משתמשים לכתובת אחרת
אל www.google.com בשביל זה
תוכן. |
|||||||||
מאפיינים |
|
|||||||||
דוגמה | <C SZ="6k" CID="kvOXK_cYSSgJ" /> | |||||||||
תג משנה של | יש | |||||||||
פורמט התוכן | ריק |
C2C | |
---|---|
הגדרה | התג <C2C> מציין התוצאה מתייחסת לדף בסינית מסורתית. התג הזה מופיעה רק כאשר 'פשוטה' ו'מסורתית' חיפוש סינית מופעל. אפשר לקרוא מידע נוסף על הפעלה של הפרמטר c2coff בהגדרת פרמטר השאילתה. השבתת התכונה הזו. |
פורמט התוכן | טקסט |
הקשר | |
---|---|
הגדרה | התג <Context> כולל רשימה של תוויות חידוד המשויכות לקבוצה של תוצאות חיפוש. |
דוגמה | <Context> |
תגי משנה | title, Facet+ |
פורמט התוכן | מאגר |
תכנון | |
---|---|
הגדרה | התג <CRAWLDATE> מזהה את התאריך שבו
הדף נסרק לאחרונה. לא מוחזר |
דוגמה | <CRAWLDATE>21 במאי, 2005</CRAWLDATE> |
תג משנה של | R |
פורמט התוכן | טקסט |
DI | |
---|---|
הגדרה | התג <DI> כולל את פרויקט Open Directory פרטי הקטגוריה (ODP) לתוצאת חיפוש יחידה. |
דוגמה | <DI> |
תגי משנה | DT?, DS? |
תג משנה של | יש |
פורמט התוכן | ריק |
DS | |
---|---|
הגדרה | התג <DS> מספק את הסיכום שרשום עבור בקטגוריה אחת בספריית ה-ODP. |
דוגמה | <DS>פרסם את <b>soccer</b> להמשיך ישירות במכשיר אינטרנט.</DS> |
תג משנה של | DI |
פורמט התוכן | טקסט (עשוי להכיל HTML) |
DT | |
---|---|
הגדרה | התג <DT> מספק את הכותרת של רכיב הקטגוריה שמופיעה בספריית ODP. |
דוגמה | <DT>SoccerConnection.net</DT> |
תג משנה של | DI |
פורמט התוכן | טקסט (עשוי להכיל HTML) |
מאפיין | |
---|---|
הגדרה | התג <Facet> מכיל קיבוץ לוגי של תגי <FacetItem>. אפשר יוצרים הקבוצות האלה באמצעות Programmable Search Engine פורמט של מפרט XML של המנוע. אם לא תיצור את התגים האלה קיבוצים, התוצאות_xml_tag_Context><Context> התג להכיל לארבעה תגי <Facet>. הפריטים שבתוך כל תג <Facet> יקובצו למטרות תצוגה, אבל יכול להיות שלא יהיה להם ערך לוגי. קשר גומלין. |
דוגמה | <Facet> |
תגי משנה | FacetItem+, title+ |
תג משנה של | הֶקשר |
פורמט התוכן | מאגר |
FacetItem | |
---|---|
הגדרה | התג <FacetItem> כולל את המידע על תווית חידוד שמשויכת לקבוצה של תוצאות חיפוש. |
דוגמה | <FacetItem> |
תגי משנה | label, anchor_text+ |
תג משנה של | היבט |
פורמט התוכן | FacetItem |
FI | |
---|---|
הגדרה | התג <FI> משמש כדגל שמציין אם בוצע סינון מסמכים עבור החיפוש. פרטים נוספים זמינים בקטע סינון אוטומטי במסמך הזה לקבלת מידע נוסף על תוצאות החיפוש של Google מסננים. |
דוגמה | <FI / |
תג משנה של | רזולוציה |
פורמט התוכן | ריק |
GSP | |||||||
---|---|---|---|---|---|---|---|
הגדרה | התג <GSP> כולל את כל הנתונים שמוחזרים בתוצאות חיפוש XML ב-Google. 'GSP' תואם לערך ראשי תיבות של 'פרוטוקול החיפוש של Google'. |
||||||
מאפיינים |
|
||||||
דוגמה | <GSP VER="3.2"> | ||||||
תגי משנה | PARAM+, Q, RES?, TM | ||||||
פורמט התוכן | ריק |
יש | |
---|---|
הגדרה | התג <HAS> כולל
מידע על כל חיפוש מיוחד
פרמטרים של בקשה שנתמכים בכתובת URL מסוימת.
הערה: ההגדרה של <HAS> עבור WebSearch מגביל יותר מאשר ב-DTD. |
תגי משנה | DI?, L?, C?, RT? |
תג משנה של | R |
ISURL | |
---|---|
הגדרה | Google מחזירה את התג <ISURL> אם שאילתת החיפוש המשויכת היא כתובת URL. |
תג משנה של | GSP |
פורמט התוכן | ריק |
L | |
---|---|
הגדרה | נוכחות התג <L> מציין ששירות WebSearch יכול למצוא אתרים אחרים שמקשרים אל כתובת ה-URL הזו של תוצאת החיפוש. כדי למצוא אתרים כאלה, אפשר להשתמש במונח השאילתה המיוחד link:. |
תג משנה של | יש |
פורמט התוכן | ריק |
תווית | |
---|---|
הגדרה | התג <label> מציין תווית חידוד שבעזרתו אפשר לסנן את תוצאות החיפוש שמקבלים. כדי להשתמש ב- תווית חידוד, מוסיפים את המחרוזת עוד:[[label tag value]] אל הערך של הפרמטר q בבקשת ה-HTTP שנשלחת ל-Google בתור אפשר לראות בדוגמה הבאה. שימו לב שהערך הזה חייב להיות כתובת ה-URL סומנה בתו בריחה (escape) לפני שליחת השאילתה ל-Google. This example uses the refinement label golf_courses to הערה: התג <label> אינו זהה לתג התג <Label>, שמזהה תווית חידוד שמשויכת לכתובת URL מסוימת בתוצאות החיפוש. |
דוגמה | <label>golf_courses</label> |
תג משנה של | FacetItem |
פורמט התוכן | טקסט |
LANG | |
---|---|
הגדרה | התג <LANG> מכיל את הניחוש הטוב ביותר של Google לגבי השפה של תוצאת החיפוש. |
דוגמה | <LANG>iw</LANG> |
תג משנה של | R |
פורמט התוכן | טקסט |
M | |
---|---|
הגדרה | התג <M> מזהה את הסכום הכולל המשוער מספר התוצאות לחיפוש. הערה: יכול להיות שהאומדן לא מדויק. |
דוגמה | <M>16200000</M> |
תג משנה של | רזולוציה |
פורמט התוכן | טקסט |
NB | |
---|---|
הגדרה | התג <NB> כולל פרטי ניווט — מקשר לדף הבא של תוצאות החיפוש או לדף הקודם של תוצאות חיפוש - לקבוצת התוצאות. הערה: התג הזה קיים רק אם יש תוצאות נוספות. |
דוגמה | <NB> |
תגי משנה | NU?, PU? |
תג משנה של | רזולוציה |
פורמט התוכן | ריק |
NU | |
---|---|
הגדרה | התג <NU> מכיל קישור יחסי בדף הבא בתוצאות החיפוש. |
דוגמה | <NU>/search?q=flowers&num=10&hl=iw&ie=UTF-8 &output=xml&client=test&start=10</NU> |
תג משנה של | NB |
פורמט התוכן | טקסט (כתובת URL יחסית) |
פרמטר | |||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|
הגדרה | התג <PARAM> מזהה פרמטר קלט שנשלח בבקשת ה-HTTP המשויכת עם תוצאת ה-XML. מידע על הפרמטר נמצא ב- של מאפייני התג - שם, ערך, source_value - ויהיו תג PARAM אחד לכל פרמטר שנשלח בבקשת ה-HTTP. |
||||||||||||
מאפיינים |
|
||||||||||||
דוגמה | <PARAM name="cr" value="countryNZ" source_value="countryNZ" /> | ||||||||||||
תג משנה של | GSP | ||||||||||||
פורמט התוכן | רמה למתקדמים מאוד |
PU | |
---|---|
הגדרה | התג <PU> מספק קישור יחסי הדף הקודם בתוצאות החיפוש. |
דוגמה | <PU>/search?q=flowers&num=10&hl=iw&output=xml &client=test&start=10</PU> |
תג משנה של | NB |
פורמט התוכן | טקסט (כתובת URL יחסית) |
Q | |
---|---|
הגדרה | התג <Q> מזהה את שאילתת החיפוש נשלח בבקשת ה-HTTP שמשויכת לתוצאת ה-XML. |
דוגמה | <Q>פיצה</Q> |
תג משנה של | GSP |
פורמט התוכן | טקסט |
R | ||||||||||
---|---|---|---|---|---|---|---|---|---|---|
הגדרה | התג <R> כולל את הפרטים של תוצאת חיפוש בודדת. הערה: ההגדרה של התג <R> עבור WebSearch מגביל יותר מאשר ב-DTD. |
|||||||||
מאפיינים |
|
|||||||||
תגי משנה | U, UE, T?, CRAWLDATE, S?, LANG?, יש | |||||||||
תג משנה של | רזולוציה |
תגובה מחדש | ||||||||||
---|---|---|---|---|---|---|---|---|---|---|
הגדרה | התג <RES> כולל את קבוצת הערכים תוצאות חיפוש ופרטים על התוצאות האלה. |
|||||||||
מאפיינים |
|
|||||||||
דוגמה | <RES SN="1" EN="10"> | |||||||||
תגי משנה | M, FI?, XT?, NB?, R* | |||||||||
תג משנה של | GSP | |||||||||
פורמט התוכן | ריק |
S | |
---|---|
הגדרה | התג <S> מכיל קטע עבור חיפוש תוצאה שמציגה מונחי שאילתה שמודגשים בגופן מודגש. מעברי השורה הם נכלל בקטע כדי לאפשר גלישת טקסט מתאימה. |
דוגמה | <S>וושינגטון (CNN) -- הצעת מחיר לסיום עימות בסנאט מעל הנשיא <b>Bush's</b> הבחירות המשפטיות לאפשר לחמישה מועמדים להתקדם להצבעה סופית, תוך שמירה על <b>...<b>...</b><S> |
תג משנה של | R |
פורמט התוכן | טקסט (HTML) |
SL_MAIN | |
---|---|
הגדרה | תג זה כולל את התוכן של תוצאת קידום מכירות. משמש לניתוח מבצעים. הטקסט המקושר וכתובת ה-URL של קישור הכותרת נמצאים בתגי המשנה T ו-U בהתאמה. השורות של הטקסט והקישורים נמצאות בתגי משנה של BODY_LINE. |
תגי משנה | BODY_LINE*, T, U |
תג משנה של | SL_RESULTS |
פורמט התוכן | ריק |
SL_RESULTS | |
---|---|
הגדרה | תג מאגר לתוצאות שמקודמות. אחד מהיעדים האלה יופיע בכל פעם שיהיה לכם קידום מכירות בתוצאות החיפוש. תג המשנה SL_MAIN מכיל את נתוני התוצאה הראשית. |
תגי משנה | SL_MAIN* |
תג משנה של | R |
פורמט התוכן | ריק |
איות | |
---|---|
הגדרה | התג <איות> כולל חלופה הצעת איות לשאילתה שנשלחה. התג הזה מופיע רק ב- בדף הראשון של תוצאות החיפוש. הצעות איות זמינות ב אנגלית, סינית, יפנית וקוריאנית. הערה: Google תחזיר הצעות איות רק עבור שאילתות שבהן ערך הפרמטר gl נמצא אותיות קטנות. |
דוגמה | <איות> |
תגי משנה | הצעה |
תג משנה של | GSP |
פורמט התוכן | ריק |
הצעה | |||||||
---|---|---|---|---|---|---|---|
הגדרה | התג <Suggestion> מכיל הצעת איות חלופית לשאילתה שנשלחה. אפשר להשתמש כדי להציע את האיות החלופי למשתמש בחיפוש. הערך של המאפיין q הוא הצעת איות עם קוד בריחה (escape) בכתובת URL, שאפשר להשתמש בה כמונח שאילתה. | ||||||
מאפיינים |
|
||||||
דוגמה | <הצעה q="soccer">&lt;b&gt;&lt;i&gt;soccer&lt;/i&gt;&lt;/b&gt;</Suggestion> | ||||||
תג משנה של | איות | ||||||
פורמט התוכן | טקסט (HTML) |
T | |
---|---|
הגדרה | התג <T> מכיל את הכותרת של התוצאה. |
דוגמה | <T>החוף המזרחי של אמיצי פיצה</T> |
תג משנה של | R |
פורמט התוכן | טקסט (HTML) |
title | |
---|---|
הגדרה | כצאצא של <Context>, התג <Context> מכיל את השם של Programmable Search Engine. כצאצא של <Facet>, התג <title> מספק כותרת לקבוצת מאפיינים. |
דוגמה | כצאצא של <Context>: <title>My Search Engine</title> כילד/ה של <Facet>: <title>Facet title</title> |
תג משנה של | Context, Facet |
פורמט התוכן | טקסט |
TM | |
---|---|
הגדרה | התג <TM> מזהה את הזמן הכולל של השרת שנדרשת כדי להחזיר תוצאות חיפוש, שנמדדות בשניות. |
דוגמה | <TM>0.100445</TM> |
תג משנה של | GSP |
פורמט התוכן | טקסט (מספר נקודה צפה) |
בחינה | |
---|---|
הגדרה | התג <TT> מספק חיפוש טיפ. |
דוגמה | <TT><i>טיפ: לרוב דפדפנים, לחיצה על מקש Return מפיקה את אותן תוצאות כמו לחיצה הלחצן 'חיפוש'.</i></TT> |
תג משנה של | GSP |
U | |
---|---|
הגדרה | התג <U> מספק את כתובת ה-URL של תוצאת החיפוש. |
דוגמה | <U>http://www.dominos.com/</U> |
תג משנה של | R |
פורמט התוכן | טקסט (כתובת URL מוחלטת) |
UD | |
---|---|
הגדרה | התג <UD> מספק את הקוד בקידוד IDN (שם דומיין בינלאומי) לתוצאת החיפוש. הערך מאפשר יוצגו בשפות מקומיות. לדוגמה, ניתן לפענח כתובת URL בקידוד IDN http://www.%E8%8A%B1%E4%BA%95.com ולהציג אותה כך: http://www.花鮨.com. תג <UD> זה ייכלל בתוצאות החיפוש של בקשות שכללו את הפרמטר ud. הערה: זוהי תכונת בטא. |
דוגמה | <UD>http://www.%E8%8A%B1%E4%BA%95.com/</UD> |
תג משנה של | R |
פורמט התוכן | טקסט (כתובת URL בקידוד IDN) |
UE | |
---|---|
הגדרה | התג <UE> מספק את כתובת ה-URL של תוצאת החיפוש. הערך מסומן בתו בריחה (escape) בכתובת URL כדי שהוא מתאים להעברה כפרמטר של שאילתה בכתובת URL. |
דוגמה | <UE>http://www.dominos.com/</UE> |
תג משנה של | R |
פורמט התוכן | טקסט (כתובת URL שמסומנת בתו בריחה (escape)) |
XT | |
---|---|
הגדרה | התג <XT> מציין המספר הכולל המשוער של התוצאות, כפי שמצוין בתג M, מייצג למעשה את המספר המדויק סך כל התוצאות. עיין בקטע אוטומטי מידע נוסף על הסינון במסמך הזה. |
דוגמה | <XT /> |
תג משנה של | רזולוציה |
פורמט התוכן | ריק |
תוצאות XML לשאילתות של חיפוש תמונות
בבקשת התמונה לדוגמה הזו מוצגות 5 תוצאות (מספר=5) לגבי מונח החיפוש "קוף" (q=monkey).
http://www.google.com/cse? searchtype=image &num=2 &q=monkey &client=google-csbe &output=xml_no_dtd &cx=00255077836266642015:u-scht7a-8i
הבקשה הזו מניבה את תוצאת ה-XML הבאה.
<GSP VER="3.2"> <TM>0.395037</TM> <Q>monkeys</Q> <PARAM name="cx" value="011737558837375720776:mbfrjmyam1g" original_value="011737558837375720776:mbfrjmyam1g" url_<escaped_value="011737558837375720776%3Ambfrjmyam1g" js_escaped_value="011737558837375720776:mbfrjmyam1g"/> <PARAM name="client" value="google-csbe" original_value="google-csbe" url_escaped_value="google-csbe" js_escaped_value="google-csbe"/> <PARAM name="q" value="monkeys" original_value="monkeys" url_escaped_value="monkeys" js_escaped_value="monkeys"/> <PARAM name="num" value="2" original_value="2" url_escaped_value="2" js_escaped_value="2"/> <PARAM name="output" value="xml_no_dtd" original_value="xml_no_dtd" url_escaped_value="xml_no_dtd" js_escaped_value="xml_no_dtd"/> <PARAM name="adkw" value="AELymgUP4VYSok20wy9SeYczEZ5UXxpBmRsJH4oC4aXhVuZgwGKuponcNXjrYkkw2bRv1BylIm89ndJ-Q4vxvyW0tcbiqipcQC9op_cBG84T12WMvX8660A" original_value="AELymgUP4VYSok20wy9SeYczEZ5UXxpBmRsJH4oC4aXhVuZgwGKuponcNXjrYkkw2bRv1BylIm89ndJ-Q4vxvyW0tcbiqipcQC9op_cBG84T12WMvX8660A" url_escaped_value="AELymgUP4VYSok20wy9SeYczEZ5UXxpBmRsJH4oC4aXhVuZgwGKuponcNXjrYkkw2bRv1BylIm89ndJ-Q4vxvyW0tcbiqipcQC9op_cBG84T12WMvX8660A" js_escaped_value="AELymgUP4VYSok20wy9SeYczEZ5UXxpBmRsJH4oC4aXhVuZgwGKuponcNXjrYkkw2bRv1BylIm89ndJ-Q4vxvyW0tcbiqipcQC9op_cBG84T12WMvX8660A"/> <PARAM name="hl" value="en" original_value="en" url_escaped_value="en" js_escaped_value="en"/> <PARAM name="oe" value="UTF-8" original_value="UTF-8" url_escaped_value="UTF-8" js_escaped_value="UTF-8"/> <PARAM name="ie" value="UTF-8" original_value="UTF-8" url_escaped_value="UTF-8" js_escaped_value="UTF-8"/> <PARAM name="boostcse" value="0" original_value="0" url_escaped_value="0" js_escaped_value="0"/> <Context> <title>domestigeek</title> </Context> <ARES/> <RES SN="1" EN="2"> <M>2500000</M> <NB> <NU>/images?q=monkeys&num=2&hl=en&client=google-csbe&cx=011737558837375720776:mbfrjmyam1g&boostcse=0&output=xml_no_dtd &ie=UTF-8&oe=UTF-8&tbm=isch&ei=786oTsLiJaaFiALKrPChBg&start=2&sa=N </NU> </NB> <RG START="1" SIZE="2"/> <R N="1" MIME="image/jpeg"> <RU>http://www.flickr.com/photos/fncll/135465558/</RU> <U> http://farm1.static.flickr.com/46/135465558_123402af8c.jpg </U> <UE> http://farm1.static.flickr.com/46/135465558_123402af8c.jpg </UE> <T>Computer <b>Monkeys</b> | Flickr - Photo Sharing!</T> <RK>0</RK> <BYLINEDATE>1146034800</BYLINEDATE> <S>Computer <b>Monkeys</b> | Flickr</S> <LANG>en</LANG> <IMG WH="500" HT="305" IID="ANd9GcQARKLwzi-t4lpWi2AERV3kJb4ansaQzTn3MNDZR9fD_JDiktPKByKUBLs"> <SZ>88386</SZ> <IN/> </IMG> <TBN TYPE="0" WH="130" HT="79" URL="http://t0.gstatic.com/images?q=tbn:ANd9GcQARKLwzi- t4lpWi2AERV3kJb4ansaQzTn3MNDZR9fD_JDiktPKByKUBLs"/> </R> <R N="2" MIME="image/jpeg"> <RU> http://www.flickr.com/photos/flickerbulb/187044366/ </RU> <U> http://farm1.static.flickr.com/73/187044366_506a1933f4.jpg </U> <UE> http://farm1.static.flickr.com/73/187044366_506a1933f4.jpg </UE> <T> one. ugly. <b>monkey</b>. | Flickr - Photo Sharing! </T> <RK>0</RK> <BYLINEDATE>1152514800</BYLINEDATE> <S>one. ugly. <b>monkey</b>.</S> <LANG>en</LANG> <IMG WH="400" HT="481" IID="ANd9GcQ3Qom0bYbee4fThCQVi96jMEwMU6IvVf2b8K5vERKVw- EF4tQQnDDKOq0"><SZ>58339</SZ> <IN/> </IMG> <TBN TYPE="0" WH="107" HT="129" URL="http://t1.gstatic.com/images?q=tbn:ANd9GcQ3Qom0bYbee4fThCQ Vi96jMEwMU6IvVf2b8K5vERKVw-EF4tQQnDDKOq0"/> </R> </RES> </GSP>
חיפוש באמצעות תמונות: תגי XML
הטבלה הבאה מציגה תגי XML נוספים בתשובות XML לשאילתות של חיפוש תמונות.
ייתכן שסמלים מסוימים יוצגו לצד תגי משנה מסוימים ב הגדרות בהמשך. לפניכם פירוט של הסמלים והמשמעויות שלהם:
* = אפס מופעים או יותר של תג המשנה
+ = מופע אחד או יותר של תג המשנה
RG | ||||||||||
---|---|---|---|---|---|---|---|---|---|---|
הגדרה | התג <RG> כולל את הפרטים של תוצאת חיפוש של תמונה יחידה. |
|||||||||
מאפיינים |
| |||||||||
תג משנה של | רזולוציה |
RU | |
---|---|
הגדרה | התג <RU tag> כולל את הפרטים של כל תוצאת חיפוש של תמונה. |
תג משנה של | R |