เขียนการค้นหาของ Places Insights

หากต้องการเข้าถึงข้อมูลเชิงลึกของสถานที่ คุณต้องเขียนแบบสอบถาม SQL ใน BigQuery ที่จะส่งคืนข้อมูลเชิงลึกแบบรวมเกี่ยวกับสถานที่ ระบบจะแสดงผลลัพธ์จาก ชุดข้อมูลสำหรับเกณฑ์การค้นหาที่ระบุในคำค้นหา

พื้นฐานการค้นหา

รูปภาพต่อไปนี้แสดงรูปแบบพื้นฐานของคำค้นหา

รูปแบบพื้นฐานของคำค้นหา

เราจะอธิบายแต่ละส่วนของคำค้นหาโดยละเอียดที่ด้านล่าง

ข้อกำหนดในการค้นหา

คำสั่ง SELECT ในแบบสอบถามต้องมี WITH AGGREGATION_THRESHOLD และระบุชุดข้อมูล เช่น

SELECT WITH AGGREGATION_THRESHOLD
COUNT(*) AS count
FROM `PROJECT_NAME.places_insights___us.places`

ในตัวอย่างนี้ คุณใช้ FROM เพื่อระบุชุดข้อมูล places_insights___us.places สำหรับสหรัฐอเมริกา

ระบุชื่อโปรเจ็กต์ (ไม่บังคับ)

คุณสามารถเลือกที่จะรวมชื่อโครงการของคุณในการสอบถามได้ หากคุณไม่ ระบุชื่อโปรเจ็กต์ คำค้นหาจะใช้โปรเจ็กต์ที่ใช้งานอยู่โดยค่าเริ่มต้น

คุณอาจต้องการรวมชื่อโครงการของคุณหากคุณมีชุดข้อมูลที่เชื่อมโยงที่มีชื่อเดียวกันในโครงการที่แตกต่างกันหรือหากคุณกำลังสอบถามตารางนอกโครงการที่ใช้งานอยู่

เช่น [project name].[dataset name].places

ระบุฟังก์ชันการรวมข้อมูล

ตัวอย่างด้านล่างแสดงฟังก์ชันการรวม BigQuery ที่รองรับ แบบสอบถามนี้จะรวบรวมคะแนนของสถานที่ทั้งหมดที่อยู่ในรัศมี 1,000 เมตรจากตึกเอ็มไพร์สเตทในนิวยอร์กซิตี้เพื่อสร้างสถิติคะแนน:

SELECT WITH AGGREGATION_THRESHOLD
  COUNT(id) AS place_count,
  APPROX_COUNT_DISTINCT(rating) as distinct_ratings,
  COUNTIF(rating > 4.0) as good_rating_count,
  LOGICAL_AND(rating <= 5) as all_ratings_equal_or_below_five,
  LOGICAL_OR(rating = 5) as any_rating_exactly_five,
  AVG(rating) as avg_rating,
  SUM(user_rating_count) as rating_count,
  COVAR_POP(rating, user_rating_count) as rating_covar_pop,
  COVAR_SAMP(rating, user_rating_count) as rating_covar_samp,
  STDDEV_POP(rating) as rating_stddev_pop,
  STDDEV_SAMP(rating) as rating_stddev_samp,
  VAR_POP(rating) as rating_var_pop,
  VAR_SAMP(rating) as rating_var_samp,
FROM
  `PROJECT_NAME.places_insights___us.places`
WHERE
  ST_DWITHIN(ST_GEOGPOINT(-73.9857, 40.7484), point, 1000)
  AND business_status = "OPERATIONAL"

ระบุการจำกัดสถานที่

หากคุณไม่ได้ระบุข้อจำกัดด้านสถานที่ ระบบจะใช้การรวบรวมข้อมูลกับชุดข้อมูลทั้งหมด โดยปกติแล้ว คุณจะระบุการจำกัดตำแหน่งเพื่อค้นหา พื้นที่ที่เฉพาะเจาะจง เช่น ที่แสดงด้านล่าง

SELECT WITH AGGREGATION_THRESHOLD
COUNT(*) AS count
FROM `PROJECT_NAME.places_insights___us.places`
WHERE
ST_DWITHIN(ST_GEOGPOINT(-73.9857, 40.7484), point, 1000)

ในตัวอย่างนี้ คำค้นหาของคุณจะระบุข้อจำกัดเป้าหมายที่มุ่งเน้นไปที่ ตึกเอ็มไพร์สเตตในนิวยอร์กซิตี้ โดยมีรัศมี 1,000 เมตร

คุณสามารถใช้รูปหลายเหลี่ยมเพื่อระบุพื้นที่การค้นหาได้ เมื่อใช้รูปหลายเหลี่ยม จุดของรูปหลายเหลี่ยมต้องกำหนดลูปปิด โดยจุดแรกในรูปหลายเหลี่ยมต้องเหมือนกับจุดสุดท้าย

SELECT WITH AGGREGATION_THRESHOLD
COUNT(*) AS count
FROM `PROJECT_NAME.places_insights___us.places`
WHERE
ST_CONTAINS(ST_GEOGFROMTEXT("""POLYGON((-73.985708 40.75773,-73.993324 40.750298,
                                      -73.9857 40.7484,-73.9785 40.7575,
                                      -73.985708 40.75773))"""), point)

ในตัวอย่างถัดไป คุณกำหนดพื้นที่การค้นหาโดยใช้เส้นของจุดเชื่อมต่อ เส้นทางดังกล่าวจะคล้ายกับเส้นทางการเดินทางที่คำนวณโดย Routes API เส้นทางนี้อาจจะเป็นสำหรับรถยนต์ จักรยาน หรือคนเดินเท้า:

DECLARE route GEOGRAPHY;

SET route = ST_GEOGFROMTEXT("""LINESTRING(-73.98903537033028 40.73655649223003,
                                          -73.93580216278471 40.80955538843361)""");

SELECT WITH AGGREGATION_THRESHOLD
  COUNT(*) AS count
FROM `PROJECT_NAME.places_insights___us.places`
WHERE
  ST_DWITHIN(route, point, 100)

ในตัวอย่างนี้ คุณตั้งค่ารัศมีการค้นหาเป็น 100 เมตรรอบเส้น

กรองตามช่องชุดข้อมูลสถานที่

ปรับแต่งการค้นหาของคุณตามฟิลด์ที่กำหนดโดยโครงร่างชุดข้อมูล กรองผลลัพธ์ตามฟิลด์ชุดข้อมูล เช่น สถานที่ regular_opening_hours, price_level และลูกค้า rating

อ้างอิงฟิลด์ใดก็ได้ในชุดข้อมูลที่กำหนดโดยสคีมาชุดข้อมูลสำหรับประเทศที่คุณสนใจ สคีมาชุดข้อมูลของแต่ละประเทศประกอบด้วย 2 ส่วน ดังนี้

ตัวอย่างเช่น แบบสอบถามของคุณสามารถรวมคำสั่ง WHERE ที่กำหนดเกณฑ์การกรองสำหรับแบบสอบถามได้ ในตัวอย่างต่อไปนี้ คุณจะส่งคืนข้อมูลรวมสำหรับสถานที่ประเภท tourist_attraction ที่มี business_status เป็น OPERATIONAL ซึ่งมี rating มากกว่าหรือเท่ากับ 4.0 และมีการตั้งค่า allows_dogs เป็น true:

SELECT WITH AGGREGATION_THRESHOLD
COUNT(*) AS count
FROM `PROJECT_NAME.places_insights___us.places`
WHERE
ST_DWITHIN(ST_GEOGPOINT(-73.9857, 40.7484), point, 1000)
AND 'tourist_attraction' IN UNNEST(types)
AND business_status = "OPERATIONAL"
AND rating >= 4.0
AND allows_dogs = true

การค้นหาถัดไปจะแสดงผลลัพธ์สำหรับสถานที่ที่มีสถานีชาร์จ EV อย่างน้อย 8 แห่ง

SELECT WITH AGGREGATION_THRESHOLD
  COUNT(*) AS count
FROM
  `PROJECT_NAME.places_insights___us.places`
WHERE
  ev_charge_options.connector_count > 8;

กรองตามประเภทหลักของสถานที่และประเภทสถานที่

แต่ละสถานที่ในชุดข้อมูลสามารถมี:

  • ประเภทหลักเดียวที่เชื่อมโยงกับประเภทที่กำหนดโดยประเภทสถานที่ ตัวอย่างเช่น ประเภทหลักอาจเป็น mexican_restaurant หรือ steak_house ใช้ primary_type ในการค้นหาเพื่อกรองผลลัพธ์ตามประเภทหลักของสถานที่

  • ค่าประเภทหลายค่าที่เชื่อมโยงกับค่าดังกล่าวจากประเภทที่กำหนดโดย ประเภทสถานที่ ตัวอย่างเช่น ร้านอาหารอาจมีประเภทต่อไปนี้: seafood_restaurant, restaurant, food, point_of_interest, establishment ใช้ types ในแบบสอบถามเพื่อกรองผลลัพธ์ในรายการประเภทที่เชื่อมโยงกับสถานที่

แบบสอบถามต่อไปนี้ส่งคืนผลลัพธ์สำหรับทุกสถานที่ที่มีประเภทหลักเป็น skin_care_clinic ซึ่งยังทำหน้าที่เป็น spa ด้วย:

SELECT WITH AGGREGATION_THRESHOLD
  COUNT(*) AS count
FROM
  `PROJECT_NAME.places_insights___us.places`
WHERE
  'spa' IN UNNEST(types)
  AND 'skin_care_clinic' = primary_type

กรองตามรหัสสถานที่

ตัวอย่างด้านล่างจะคำนวณคะแนนเฉลี่ยของสถานที่ 5 แห่ง สถานที่ต่างๆ จะระบุด้วยplace_id

DECLARE place_ids ARRAY<STRING>;
SET place_ids = ['ChIJPQOh8YVZwokRE2WsbZI4tOk', 'ChIJibtT3ohZwokR7tX0gp0nG8U',
                 'ChIJdfD8moVZwokRO6vxjXAtoWs', 'ChIJsdNONuFbwokRLM-yuifjb8k',
                 'ChIJp0gKoClawokR0txqrcaEkFc'];
SELECT WITH AGGREGATION_THRESHOLD
 AVG(rating) as avg_rating,
FROM
  `PROJECT_NAME.places_insights___us.places`,
  UNNEST(place_ids) place_id
WHERE
  id = place_id;

กรองรหัสสถานที่บางรายการออก

นอกจากนี้ คุณยังยกเว้นอาร์เรย์ของ Place IDs จากการค้นหาได้ด้วย

คุณค้นหารหัสสถานที่ที่ต้องการได้โดยใช้เครื่องมือค้นหารหัสสถานที่ หรือ ใช้ Places API เพื่อส่งคำขอ Text Search (ใหม่)โดยอัตโนมัติ

ในตัวอย่างด้านล่างนี้ คำค้นหาจะนับจำนวนคาเฟ่ในรหัสไปรษณีย์ 2000 ของซิดนีย์ ออสเตรเลีย ซึ่งไม่ปรากฏในอาร์เรย์ excluded_cafes คำถามดังกล่าวอาจเป็นประโยชน์สำหรับเจ้าของธุรกิจที่ต้องการยกเว้นธุรกิจของตนเองจากการนับ

WITH excluded_cafes AS (
  -- List the specific place IDs to exclude from the final count
  SELECT * FROM UNNEST([
    'ChIJLTcYGz-uEmsRmazk9oMnP5w', 'ChIJeWDDDNOvEmsRF8SMPUwPbhw',
    'ChIJKdaKHbmvEmsRSdxq_1O05bU'
  ]) AS place_id
)

SELECT WITH AGGREGATION_THRESHOLD
  COUNT(*) AS count
FROM
  `places_insights___au.places` AS places
-- Perform a LEFT JOIN to identify which places are in the exclusion list
LEFT JOIN
  excluded_cafes ON places.id = excluded_cafes.place_id
WHERE
  -- Filter for specific place type and postal code
  places.primary_type = 'cafe'
  AND '2000' IN UNNEST(places.postal_code_names)
  -- Keep only the rows where the join failed (meaning the ID was NOT in the list)
  AND excluded_cafes.place_id IS NULL;

กรองตามค่าข้อมูลที่กำหนดไว้ล่วงหน้า

ฟิลด์ชุดข้อมูลจำนวนมากมีค่าที่กำหนดไว้ล่วงหน้า เช่น

  • ฟิลด์ price_level รองรับค่าที่กำหนดไว้ล่วงหน้าต่อไปนี้

    • PRICE_LEVEL_FREE
    • PRICE_LEVEL_INEXPENSIVE
    • PRICE_LEVEL_MODERATE
    • PRICE_LEVEL_EXPENSIVE
    • PRICE_LEVEL_VERY_EXPENSIVE
  • ฟิลด์ business_status รองรับค่าที่กำหนดไว้ล่วงหน้าต่อไปนี้

    • OPERATIONAL
    • CLOSED_TEMPORARILY
    • CLOSED_PERMANENTLY

ในตัวอย่างนี้ แบบสอบถามจะส่งคืนจำนวนร้านดอกไม้ทั้งหมดที่มี business_status เท่ากับ OPERATIONAL ภายในรัศมี 1, 000 เมตรจากตึกเอ็มไพร์สเตทในนิวยอร์กซิตี้:

SELECT WITH AGGREGATION_THRESHOLD
COUNT(*) AS count
FROM `PROJECT_NAME.places_insights___us.places`
WHERE
ST_DWITHIN(ST_GEOGPOINT(-73.9857, 40.7484), point, 1000)
AND business_status = "OPERATIONAL"
AND 'florist' IN UNNEST(types)

กรองตามเวลาทำการ

ในตัวอย่างนี้ ให้แสดงจำนวนสถานที่ทั้งหมดในพื้นที่ทางภูมิศาสตร์ที่มีช่วงเวลา แฮปปี้อาวร์ในวันศุกร์

SELECT WITH AGGREGATION_THRESHOLD COUNT(*) AS count
FROM `PROJECT_NAME.places_insights___us.places`,
UNNEST(regular_opening_hours_happy_hour.friday) AS friday_hours
WHERE '17:00:00' BETWEEN friday_hours.start_time AND friday_hours.end_time
AND ST_DWITHIN(ST_GEOGPOINT(-73.9857, 40.7484), point, 1000);

กรองตามภูมิภาค (คอมโพเนนต์ที่อยู่)

ชุดข้อมูลสถานที่ของเรายังมีชุดคอมโพเนนต์ที่อยู่ซึ่งมีประโยชน์สำหรับ การกรองผลลัพธ์ตามขอบเขตทางการเมือง คอมโพเนนต์ที่อยู่แต่ละรายการจะ ระบุด้วยชื่อรหัสข้อความ (10002 สำหรับรหัสไปรษณีย์ในนิวยอร์ก) หรือรหัสสถานที่ (ChIJm5NfgIBZwokR6jLqucW0ipg) สำหรับรหัสไปรษณีย์ที่เทียบเท่า

SELECT WITH AGGREGATION_THRESHOLD
  COUNT(*) AS count
FROM
  `PROJECT_NAME.places_insights___us.places`
WHERE
  '10002' IN UNNEST(postal_code_names)
  --- 'ChIJm5NfgIBZwokR6jLqucW0ipg'  IN UNNEST(postal_code_ids) -- same filter as above using postal code ID

กรองตามการชาร์จ EV

ตัวอย่างนี้แสดงจำนวนสถานที่ที่มีเครื่องชาร์จ EV อย่างน้อย 8 เครื่อง

SELECT WITH AGGREGATION_THRESHOLD
  COUNT(*) AS count
FROM
  `PROJECT_NAME.places_insights___us.places`
WHERE
  ev_charge_options.connector_count > 8;

ตัวอย่างนี้จะนับจำนวนสถานที่ที่มีเครื่องชาร์จ Tesla อย่างน้อย 10 เครื่อง ที่รองรับการชาร์จเร็ว

SELECT WITH AGGREGATION_THRESHOLD
  COUNT(*) AS count
FROM
  `PROJECT_NAME.places_insights___us.places`, UNNEST(ev_charge_options.connector_aggregation) as connectors
WHERE
  connectors.type ='EV_CONNECTOR_TYPE_TESLA'
  AND connectors.max_charge_rate_kw >= 50
  AND connectors.count >= 10

ส่งคืนกลุ่มผลลัพธ์

คําค้นหาที่แสดงจนถึงตอนนี้จะแสดงผลแถวเดียวในผลลัพธ์ที่มี จํานวนการรวมสําหรับคําค้นหา นอกจากนี้ คุณยังใช้ตัวดำเนินการ GROUP BY เพื่อ แสดงผลหลายแถวในการตอบกลับตามเกณฑ์การจัดกลุ่มได้ด้วย

ตัวอย่างเช่น การค้นหาต่อไปนี้จะแสดงผลลัพธ์ที่จัดกลุ่มตามประเภทหลักของ แต่ละสถานที่ในพื้นที่ค้นหา

SELECT WITH AGGREGATION_THRESHOLD
  primary_type,
  COUNT(*) AS count
FROM
  `PROJECT_NAME.places_insights___us.places`
WHERE
  ST_DWITHIN(ST_GEOGPOINT(-73.99992071622756, 40.71818785986936), point, 1000)
GROUP BY primary_type

รูปภาพต่อไปนี้แสดงตัวอย่างเอาต์พุตของการค้นหานี้

ผลการค้นหาของคำค้นหาสำหรับการจัดกลุ่มผลลัพธ์ตามประเภทหลัก

ในตัวอย่างนี้ คุณจะกำหนดตารางสถานที่ตั้ง จากนั้นสำหรับแต่ละสถานที่ตั้ง ให้ คำนวณจำนวนร้านอาหารที่อยู่ใกล้เคียง ซึ่งหมายถึงร้านอาหารที่อยู่ภายใน 1, 000 เมตร

WITH my_locations AS (
  SELECT 'Location 1' AS name, ST_GEOGPOINT(-74.00776440888504, 40.70932825380786) AS location
  UNION ALL
  SELECT 'Location 2' AS name, ST_GEOGPOINT(-73.98257192833559, 40.750738934863215) AS location
  UNION ALL
  SELECT 'Location 3' AS name, ST_GEOGPOINT(-73.94701794263223, 40.80792954838445)  AS location
)
SELECT WITH AGGREGATION_THRESHOLD
  l.name,
  COUNT(*) as count
FROM
  `PROJECT_NAME.places_insights___us.places`
JOIN
   my_locations l
ON
  ST_DWITHIN(l.location, p.point, 1000)
WHERE
  primary_type = "restaurant"
  AND business_status = "OPERATIONAL"
GROUP BY
  l.name

รูปภาพต่อไปนี้แสดงตัวอย่างเอาต์พุตของการค้นหานี้

ผลการค้นหาสำหรับจัดกลุ่มผลลัพธ์ตามสถานที่ตั้ง