ভূমিকা
এই দস্তাবেজটি বর্ণনা করে যে কীভাবে স্থানের অন্তর্দৃষ্টি ডেটাসেট, BigQuery-এ সর্বজনীন ভূ-স্থানিক ডেটা এবং স্থানের বিবরণ API-কে একত্রিত করে একটি সাইট নির্বাচন সমাধান তৈরি করা যায়।
এটি Google ক্লাউড নেক্সট 2025-এ দেওয়া একটি ডেমোর উপর ভিত্তি করে তৈরি, যা YouTube-এ দেখার জন্য উপলব্ধ ।
ব্যবসায়িক চ্যালেঞ্জ
কল্পনা করুন যে আপনি কফি শপের একটি সফল চেইনের মালিক এবং নেভাদার মতো একটি নতুন রাজ্যে প্রসারিত করতে চান, যেখানে আপনার কোনো উপস্থিতি নেই। একটি নতুন অবস্থান খোলা একটি উল্লেখযোগ্য বিনিয়োগ, এবং একটি ডেটা-চালিত সিদ্ধান্ত নেওয়া সাফল্যের জন্য গুরুত্বপূর্ণ। আপনি এমনকি কোথায় শুরু করবেন?
একটি নতুন কফি শপের জন্য সর্বোত্তম অবস্থানটি চিহ্নিত করতে এই নির্দেশিকাটি আপনাকে বহু-স্তরযুক্ত বিশ্লেষণের মাধ্যমে নিয়ে যায়। আমরা একটি রাজ্য-ব্যাপী দৃষ্টিভঙ্গি দিয়ে শুরু করব, ক্রমান্বয়ে আমাদের অনুসন্ধানকে একটি নির্দিষ্ট কাউন্টি এবং বাণিজ্যিক অঞ্চলে সংকুচিত করব এবং শেষ পর্যন্ত স্বতন্ত্র এলাকা স্কোর করার জন্য এবং প্রতিযোগীদের ম্যাপ করে বাজারের ব্যবধান চিহ্নিত করার জন্য একটি হাইপার-লোকাল বিশ্লেষণ সম্পাদন করব।
সমাধান কর্মপ্রবাহ
এই প্রক্রিয়াটি একটি যৌক্তিক ফানেল অনুসরণ করে, বিস্তৃত থেকে শুরু করে এবং অনুসন্ধানের এলাকাকে পরিমার্জিত করতে এবং চূড়ান্ত সাইট নির্বাচনের প্রতি আস্থা বাড়াতে ক্রমান্বয়ে আরও দানাদার হয়ে উঠছে।
পূর্বশর্ত এবং পরিবেশ সেটআপ
বিশ্লেষণে ডুব দেওয়ার আগে, আপনার কয়েকটি মূল ক্ষমতা সহ একটি পরিবেশ প্রয়োজন। যদিও এই নির্দেশিকাটি SQL এবং Python ব্যবহার করে একটি বাস্তবায়নের মধ্য দিয়ে যাবে, সাধারণ নীতিগুলি অন্যান্য প্রযুক্তির স্ট্যাকগুলিতে প্রয়োগ করা যেতে পারে।
পূর্বশর্ত হিসাবে, আপনার পরিবেশ নিশ্চিত করতে পারে:
- BigQuery-এ প্রশ্নগুলি চালান।
- স্থানের অন্তর্দৃষ্টি অ্যাক্সেস করুন, আরও তথ্যের জন্য সেটআপ স্থান অন্তর্দৃষ্টি দেখুন
-
bigquery-public-data
এবং US সেন্সাস ব্যুরো কাউন্টি জনসংখ্যা মোট থেকে পাবলিক ডেটাসেটগুলিতে সদস্যতা নিন
আপনাকে একটি মানচিত্রে ভূ-স্থানিক ডেটা কল্পনা করতেও সক্ষম হতে হবে, যা প্রতিটি বিশ্লেষণমূলক পদক্ষেপের ফলাফল ব্যাখ্যা করার জন্য অত্যন্ত গুরুত্বপূর্ণ। এই অর্জন করার অনেক উপায় আছে. আপনি লুকার স্টুডিওর মতো BI টুলগুলি ব্যবহার করতে পারেন যা সরাসরি BigQuery-এর সাথে সংযোগ করে, অথবা আপনি পাইথনের মতো ডেটা সায়েন্স ভাষা ব্যবহার করতে পারেন।
রাজ্য-স্তরের বিশ্লেষণ: সেরা কাউন্টি খুঁজুন
নেভাদার সবচেয়ে প্রতিশ্রুতিশীল কাউন্টি সনাক্ত করার জন্য আমাদের প্রথম পদক্ষেপটি একটি বিস্তৃত বিশ্লেষণ। আমরা উচ্চ জনসংখ্যা এবং বিদ্যমান রেস্তোরাঁর উচ্চ ঘনত্বের সংমিশ্রণ হিসাবে প্রতিশ্রুতিশীলকে সংজ্ঞায়িত করব, যা একটি শক্তিশালী খাদ্য ও পানীয় সংস্কৃতি নির্দেশ করে।
আমাদের BigQuery ক্যোয়ারী Places Insights ডেটাসেটের মধ্যে উপলব্ধ বিল্ট-ইন অ্যাড্রেস উপাদানগুলিকে কাজে লাগিয়ে এটি সম্পন্ন করে। administrative_area_level_1_name
ক্ষেত্র ব্যবহার করে শুধুমাত্র নেভাদা রাজ্যের মধ্যে স্থানগুলিকে অন্তর্ভুক্ত করার জন্য প্রথমে ডেটা ফিল্টার করে কোয়েরি রেস্তোরাঁগুলিকে গণনা করে৷ এটি তারপর এই সেটটিকে আরও পরিমার্জিত করে শুধুমাত্র সেই স্থানগুলিকে অন্তর্ভুক্ত করতে যেখানে প্রকার অ্যারেতে ' restaurant
' রয়েছে। অবশেষে, এটি প্রতিটি কাউন্টির জন্য একটি গণনা তৈরি করতে কাউন্টির নাম ( administrative_area_level_2_name
) দ্বারা এই ফলাফলগুলিকে গোষ্ঠীভুক্ত করে। এই পদ্ধতিটি ডেটাসেটের অন্তর্নির্মিত, পূর্ব-সূচীকৃত ঠিকানা কাঠামো ব্যবহার করে।
এই উদ্ধৃতিটি দেখায় কিভাবে আমরা স্থানের অন্তর্দৃষ্টি সহ কাউন্টি জ্যামিতিতে যোগদান করি এবং একটি নির্দিষ্ট স্থানের ধরন, restaurant
জন্য ফিল্টার করি:
SELECT WITH AGGREGATION_THRESHOLD
administrative_area_level_2_name,
COUNT(*) AS restaurant_count
FROM
`places_insights___us.places`
WHERE
-- Filter for the state of Nevada
administrative_area_level_1_name = 'Nevada'
-- Filter for places that are restaurants
AND 'restaurant' IN UNNEST(types)
-- Filter for operational places only
AND business_status = 'OPERATIONAL'
-- Exclude rows where the county name is null
AND administrative_area_level_2_name IS NOT NULL
GROUP BY
administrative_area_level_2_name
ORDER BY
restaurant_count DESC
রেস্তোরাঁর একটি কাঁচা গণনা যথেষ্ট নয়; বাজারের স্যাচুরেশন এবং সুযোগের প্রকৃত অর্থ পেতে আমাদের জনসংখ্যার তথ্যের সাথে এটির ভারসাম্য বজায় রাখতে হবে। আমরা ইউএস সেন্সাস ব্যুরো কাউন্টি পপুলেশন টোটাল থেকে জনসংখ্যার ডেটা ব্যবহার করব।
এই দুটি খুব ভিন্ন মেট্রিক্স (একটি স্থান গণনা বনাম একটি বৃহৎ জনসংখ্যা সংখ্যা) তুলনা করতে, আমরা সর্বনিম্ন-সর্বোচ্চ স্বাভাবিককরণ ব্যবহার করি। এই কৌশলটি উভয় মেট্রিককে একটি সাধারণ পরিসরে (0 থেকে 1) স্কেল করে। তারপরে আমরা সেগুলিকে একটি একক normalized_score
একত্রিত করি, একটি সুষম তুলনার জন্য প্রতিটি মেট্রিককে 50% ওজন প্রদান করি।
এই অংশটি স্কোর গণনার জন্য মূল যুক্তি দেখায়। এটি স্বাভাবিক জনসংখ্যা এবং রেস্তোরাঁর সংখ্যাকে একত্রিত করে:
(
-- Normalize restaurant count (scales to a 0-1 value) and apply 50% weight
SAFE_DIVIDE(restaurant_count - min_restaurants, max_restaurants - min_restaurants) * 0.5
+
-- Normalize population (scales to a 0-1 value) and apply 50% weight
SAFE_DIVIDE(population_2023 - min_pop, max_pop - min_pop) * 0.5
) AS normalized_score
সম্পূর্ণ ক্যোয়ারী চালানোর পরে, কাউন্টির একটি তালিকা, রেস্টুরেন্টের গণনা, জনসংখ্যা এবং স্বাভাবিক স্কোর ফেরত দেওয়া হয়। normalized_score DESC
দ্বারা অর্ডার করা ক্লার্ক কাউন্টিকে শীর্ষ প্রতিযোগী হিসাবে আরও তদন্তের জন্য স্পষ্ট বিজয়ী হিসাবে প্রকাশ করে।
এই স্ক্রিনশটটি স্বাভাবিক স্কোর দ্বারা শীর্ষ 4টি কাউন্টি দেখায়। এই উদাহরণ থেকে কাঁচা জনসংখ্যার গণনা উদ্দেশ্যমূলকভাবে বাদ দেওয়া হয়েছে।
কাউন্টি-স্তরের বিশ্লেষণ: ব্যস্ততম বাণিজ্যিক অঞ্চল খুঁজুন
এখন যেহেতু আমরা ক্লার্ক কাউন্টি শনাক্ত করেছি, পরবর্তী ধাপ হল সর্বোচ্চ বাণিজ্যিক কার্যকলাপ সহ জিপ কোডগুলি খুঁজে পেতে জুম ইন করা৷ আমাদের বিদ্যমান কফি শপগুলির ডেটার উপর ভিত্তি করে, আমরা জানি যে প্রধান ব্র্যান্ডগুলির উচ্চ ঘনত্বের কাছাকাছি অবস্থান করলে কর্মক্ষমতা আরও ভাল হয়, তাই আমরা এটিকে উচ্চ পায়ের ট্রাফিকের জন্য একটি প্রক্সি হিসাবে ব্যবহার করব৷
এই ক্যোয়ারীটি Places Insights-এর মধ্যে brands
টেবিল ব্যবহার করে, যাতে নির্দিষ্ট ব্র্যান্ডের তথ্য থাকে। সমর্থিত ব্র্যান্ডের তালিকা আবিষ্কার করতে এই টেবিলটি জিজ্ঞাসা করা যেতে পারে । আমরা প্রথমে আমাদের টার্গেট ব্র্যান্ডগুলির একটি তালিকা সংজ্ঞায়িত করি এবং তারপরে ক্লার্ক কাউন্টির প্রতিটি জিপ কোডের মধ্যে এই নির্দিষ্ট স্টোরগুলির কতগুলি পড়ে তা গণনা করতে প্রধান স্থানগুলির অন্তর্দৃষ্টি ডেটাসেটের সাথে এটিতে যোগদান করি৷
এটি অর্জনের সবচেয়ে কার্যকর উপায় হল একটি দ্বি-পদক্ষেপ পদ্ধতির সাথে:
- প্রথমত, আমরা প্রতিটি পোস্টাল কোডের মধ্যে ব্র্যান্ডগুলি গণনা করার জন্য একটি দ্রুত, নন-জিওস্পেশিয়াল অ্যাগ্রিগেশন করব।
- দ্বিতীয়ত, ভিজ্যুয়ালাইজেশনের জন্য মানচিত্রের সীমানা পেতে আমরা সেই ফলাফলগুলিকে একটি সর্বজনীন ডেটাসেটে যোগ দেব।
পোস্টাল_কোড_নাম ক্ষেত্র ব্যবহার করে ব্র্যান্ড গণনা করুন
এই প্রথম প্রশ্নটি মূল গণনা যুক্তি সঞ্চালন করে। এটি ক্লার্ক কাউন্টির স্থানগুলির জন্য ফিল্টার করে এবং তারপর পোস্টাল কোড দ্বারা ব্র্যান্ডের গণনাগুলিকে গোষ্ঠীভুক্ত করতে postal_code_names অ্যারে আননেস্ট করে৷
WITH brand_names AS (
-- First, select the chains we are interested in by name
SELECT
id,
name
FROM
`places_insights___us.brands`
WHERE
name IN ('7-Eleven', 'CVS', 'Walgreens', 'Subway Restaurants', "McDonald's")
)
SELECT WITH AGGREGATION_THRESHOLD
postal_code,
COUNT(*) AS total_brand_count
FROM
`places_insights___us.places` AS places_table,
-- Unnest the built-in postal code and brand ID arrays
UNNEST(places_table.postal_code_names) AS postal_code,
UNNEST(places_table.brand_ids) AS brand_id
JOIN
brand_names
ON brand_names.id = brand_id
WHERE
-- Filter directly on the administrative area fields in the places table
places_table.administrative_area_level_2_name = 'Clark County'
AND places_table.administrative_area_level_1_name = 'Nevada'
GROUP BY
postal_code
ORDER BY
total_brand_count DESC
আউটপুট হল পোস্টাল কোডের একটি টেবিল এবং তাদের সংশ্লিষ্ট ব্র্যান্ডের সংখ্যা।
ম্যাপিংয়ের জন্য জিপ কোড জ্যামিতি সংযুক্ত করুন
এখন যেহেতু আমাদের গণনা আছে, আমরা ভিজ্যুয়ালাইজেশনের জন্য প্রয়োজনীয় বহুভুজ আকার পেতে পারি। এই দ্বিতীয় ক্যোয়ারীটি আমাদের প্রথম ক্যোয়ারীটি নেয়, এটিকে brand_counts_by_zip
নামে একটি কমন টেবিল এক্সপ্রেশন (CTE) এ মোড়ানো হয় এবং এর ফলাফলগুলিকে সর্বজনীন geo_us_boundaries.zip_codes table
যোগ করে। এটি দক্ষতার সাথে জ্যামিতিকে আমাদের প্রাক-গণনা করা গণনার সাথে সংযুক্ত করে।
WITH brand_counts_by_zip AS (
-- This will be the entire query from the previous step, without the final ORDER BY (excluded for brevity).
. . .
)
-- Now, join the aggregated results to the boundaries table
SELECT
counts.postal_code,
counts.total_brand_count,
-- Simplify the geometry for faster rendering in maps
ST_SIMPLIFY(zip_boundaries.zip_code_geom, 100) AS geography
FROM
brand_counts_by_zip AS counts
JOIN
`bigquery-public-data.geo_us_boundaries.zip_codes` AS zip_boundaries
ON counts.postal_code = zip_boundaries.zip_code
ORDER BY
counts.total_brand_count DESC
আউটপুট হল পোস্টাল কোডের একটি টেবিল, তাদের সংশ্লিষ্ট ব্র্যান্ডের সংখ্যা এবং পোস্টাল কোড জ্যামিতি।
আমরা এই ডেটাকে হিটম্যাপ হিসাবে কল্পনা করতে পারি। গাঢ় লাল অঞ্চলগুলি আমাদের লক্ষ্য ব্র্যান্ডগুলির একটি উচ্চ ঘনত্ব নির্দেশ করে, যা আমাদের লাস ভেগাসের মধ্যে সবচেয়ে বাণিজ্যিকভাবে ঘন অঞ্চলের দিকে নির্দেশ করে৷
হাইপার-লোকাল অ্যানালাইসিস: স্কোর স্বতন্ত্র গ্রিড এলাকা
লাস ভেগাসের সাধারণ এলাকা চিহ্নিত করার পরে, এটি একটি দানাদার বিশ্লেষণের সময়। এখানেই আমরা আমাদের নির্দিষ্ট ব্যবসায়িক জ্ঞানের স্তর রাখি। আমরা জানি যে একটি দুর্দান্ত কফি শপ অন্যান্য ব্যবসার কাছাকাছি বিকশিত হয় যেগুলি আমাদের পিক আওয়ারে ব্যস্ত থাকে, যেমন দেরী-সকাল এবং দুপুরের খাবারের জানালা।
আমাদের পরবর্তী প্রশ্ন সত্যিই নির্দিষ্ট পায়. এটি লাস ভেগাস মেট্রোপলিটন এলাকার উপর একটি সূক্ষ্ম-দানাযুক্ত ষড়ভুজ গ্রিড তৈরি করে একটি মাইক্রো-লেভেলে এলাকা বিশ্লেষণ করার জন্য স্ট্যান্ডার্ড H3 জিওস্পেশিয়াল ইনডেক্স (রেজোলিউশন 8 এ) ব্যবহার করে শুরু হয়। ক্যোয়ারীটি প্রথমে সমস্ত পরিপূরক ব্যবসাগুলিকে চিহ্নিত করে যা আমাদের সর্বোচ্চ উইন্ডোর সময় খোলা থাকে (সোমবার, সকাল 10 AM থেকে 2 PM)।
তারপরে আমরা প্রতিটি স্থানের প্রকারে একটি ওজনযুক্ত স্কোর প্রয়োগ করি। একটি আশেপাশের রেস্তোরাঁ আমাদের কাছে একটি সুবিধার দোকানের চেয়ে বেশি মূল্যবান, তাই এটি একটি উচ্চ গুণক পায়৷ এটি আমাদের প্রতিটি ছোট এলাকার জন্য একটি কাস্টম suitability_score
দেয়।
এই উদ্ধৃতিটি ওজনযুক্ত স্কোরিং যুক্তিকে হাইলাইট করে, যা খোলার সময় পরীক্ষা করার জন্য একটি প্রাক-গণনা করা পতাকা ( is_open_monday_window
) উল্লেখ করে:
. . .
(
COUNTIF('restaurant' IN UNNEST(types) AND is_open_monday_window) * 8 +
COUNTIF('convenience_store' IN UNNEST(types) AND is_open_monday_window) * 3 +
COUNTIF('bar' IN UNNEST(types) AND is_open_monday_window) * 7 +
COUNTIF('tourist_attraction' IN UNNEST(types) AND is_open_monday_window) * 6 +
COUNTIF('casino' IN UNNEST(types) AND is_open_monday_window) * 7
) AS suitability_score
. . .
সম্পূর্ণ প্রশ্নের জন্য প্রসারিত করুন
-- This query calculates a custom 'suitability score' for different areas in the Las Vegas -- metropolitan area to identify prime commercial zones. It uses a weighted model based -- on the density of specific business types that are open during a target time window. -- Step 1: Pre-filter the dataset to only include relevant places. -- This CTE finds all places in our target localities (Las Vegas, Spring Valley, etc.) and -- adds a boolean flag 'is_open_monday_window' for those open during the target time. WITH PlacesInTargetAreaWithOpenFlag AS ( SELECT point, types, EXISTS( SELECT 1 FROM UNNEST(regular_opening_hours.monday) AS monday_hours WHERE monday_hours.start_time <= TIME '10:00:00' AND monday_hours.end_time >= TIME '14:00:00' ) AS is_open_monday_window FROM `places_insights___us.places` WHERE EXISTS ( SELECT 1 FROM UNNEST(locality_names) AS locality WHERE locality IN ('Las Vegas', 'Spring Valley', 'Paradise', 'North Las Vegas', 'Winchester') ) AND administrative_area_level_1_name = 'Nevada' ), -- Step 2: Aggregate the filtered places into H3 cells and calculate the suitability score. -- Each place's location is converted to an H3 index (at resolution 8). The query then -- calculates a weighted 'suitability_score' and individual counts for each business type -- within that cell. TileScores AS ( SELECT WITH AGGREGATION_THRESHOLD -- Convert each place's geographic point into an H3 cell index. `carto-os.carto.H3_FROMGEOGPOINT`(point, 8) AS h3_index, -- Calculate the weighted score based on the count of places of each type -- that are open during the target window. ( COUNTIF('restaurant' IN UNNEST(types) AND is_open_monday_window) * 8 + COUNTIF('convenience_store' IN UNNEST(types) AND is_open_monday_window) * 3 + COUNTIF('bar' IN UNNEST(types) AND is_open_monday_window) * 7 + COUNTIF('tourist_attraction' IN UNNEST(types) AND is_open_monday_window) * 6 + COUNTIF('casino' IN UNNEST(types) AND is_open_monday_window) * 7 ) AS suitability_score, -- Also return the individual counts for each category for detailed analysis. COUNTIF('restaurant' IN UNNEST(types) AND is_open_monday_window) AS restaurant_count, COUNTIF('convenience_store' IN UNNEST(types) AND is_open_monday_window) AS convenience_store_count, COUNTIF('bar' IN UNNEST(types) AND is_open_monday_window) AS bar_count, COUNTIF('tourist_attraction' IN UNNEST(types) AND is_open_monday_window) AS tourist_attraction_count, COUNTIF('casino' IN UNNEST(types) AND is_open_monday_window) AS casino_count FROM -- CHANGED: This now references the CTE with the expanded area. PlacesInTargetAreaWithOpenFlag -- Group by the H3 index to ensure all calculations are per-cell. GROUP BY h3_index ), -- Step 3: Find the maximum suitability score across all cells. -- This value is used in the next step to normalize the scores to a consistent scale (e.g., 0-10). MaxScore AS ( SELECT MAX(suitability_score) AS max_score FROM TileScores ) -- Step 4: Assemble the final results. -- This joins the scored tiles with the max score, calculates the normalized score, -- generates the H3 cell's polygon geometry for mapping, and orders the results. SELECT ts.h3_index, -- Generate the hexagonal polygon for the H3 cell for visualization. `carto-os.carto.H3_BOUNDARY`(ts.h3_index) AS h3_geography, ts.restaurant_count, ts.convenience_store_count, ts.bar_count, ts.tourist_attraction_count, ts.casino_count, ts.suitability_score, -- Normalize the score to a 0-10 scale for easier interpretation. ROUND( CASE WHEN ms.max_score = 0 THEN 0 ELSE (ts.suitability_score / ms.max_score) * 10 END, 2 ) AS normalized_suitability_score FROM -- A cross join is efficient here as MaxScore contains only one row. TileScores ts, MaxScore ms -- Display the highest-scoring locations first. ORDER BY normalized_suitability_score DESC;
একটি মানচিত্রে এই স্কোরগুলিকে ভিজ্যুয়ালাইজ করা স্পষ্ট বিজয়ী অবস্থানগুলি প্রকাশ করে৷ গাঢ় বেগুনি টাইলস, প্রাথমিকভাবে লাস ভেগাস স্ট্রিপ এবং ডাউনটাউনের কাছাকাছি, আমাদের নতুন কফি শপের জন্য সর্বোচ্চ সম্ভাবনার এলাকা।
প্রতিযোগী বিশ্লেষণ: বিদ্যমান কফি শপ শনাক্ত করুন
আমাদের উপযুক্ততা মডেল সফলভাবে সবচেয়ে প্রতিশ্রুতিশীল অঞ্চল চিহ্নিত করেছে, কিন্তু একা উচ্চ স্কোর সাফল্যের নিশ্চয়তা দেয় না। আমাদের এখন প্রতিযোগী ডেটা দিয়ে এটিকে ওভারলে করতে হবে। আদর্শ অবস্থান হল একটি উচ্চ-সম্ভাব্য এলাকা যেখানে বিদ্যমান কফি শপগুলির ঘনত্ব কম, কারণ আমরা একটি পরিষ্কার বাজারের ব্যবধান খুঁজছি।
এটি অর্জন করতে, আমরা PLACES_COUNT_PER_H3
ফাংশন ব্যবহার করি। এই ফাংশনটি H3 সেল দ্বারা একটি নির্দিষ্ট ভূগোলের মধ্যে স্থান গণনা দক্ষতার সাথে ফেরত দেওয়ার জন্য ডিজাইন করা হয়েছে।
প্রথমত, আমরা গতিশীলভাবে সমগ্র লাস ভেগাস মেট্রো এলাকার জন্য ভূগোল সংজ্ঞায়িত করি। একটি একক লোকালয়ের উপর নির্ভর করার পরিবর্তে, আমরা লাস ভেগাস এবং এর মূল আশেপাশের এলাকার সীমানা পেতে পাবলিক ওভারচার ম্যাপ ডেটাসেটকে জিজ্ঞাসা করি, সেগুলিকে ST_UNION_AGG
সাথে একক বহুভুজে একত্রিত করি। তারপরে আমরা এই অঞ্চলটিকে ফাংশনে পাস করি, এটিকে সমস্ত কর্মক্ষম কফি শপ গণনা করতে বলে।
এই ক্যোয়ারীটি মেট্রো এলাকা সংজ্ঞায়িত করে এবং H3 কক্ষে কফি শপের সংখ্যা পেতে ফাংশনটিকে কল করে:
-- Define a variable to hold the combined geography for the Las Vegas metro area.
DECLARE las_vegas_metro_area GEOGRAPHY;
-- Set the variable by fetching the shapes for the five localities from Overture Maps
-- and merging them into a single polygon using ST_UNION_AGG.
SET las_vegas_metro_area = (
SELECT
ST_UNION_AGG(geometry)
FROM
`bigquery-public-data.overture_maps.division_area`
WHERE
country = 'US'
AND region = 'US-NV'
AND names.primary IN ('Las Vegas', 'Spring Valley', 'Paradise', 'North Las Vegas', 'Winchester')
);
-- Call the PLACES_COUNT_PER_H3 function with our defined area and parameters.
SELECT
*
FROM
`places_insights___us.PLACES_COUNT_PER_H3`(
JSON_OBJECT(
-- Use the metro area geography we just created.
'geography', las_vegas_metro_area,
-- Specify 'coffee_shop' as the place type to count.
'types', ["coffee_shop"],
-- Best practice: Only count places that are currently operational.
'business_status', ['OPERATIONAL'],
-- Set the H3 grid resolution to 8.
'h3_resolution', 8
)
);
ফাংশনটি H3 সেল সূচক, এর জ্যামিতি, কফি শপের মোট গণনা এবং তাদের প্লেস আইডিগুলির একটি নমুনা অন্তর্ভুক্ত করে এমন একটি টেবিল প্রদান করে:
যদিও সামগ্রিক গণনা কার্যকর, প্রকৃত প্রতিযোগীদের দেখা অপরিহার্য। এখানেই আমরা Places Insights ডেটাসেট থেকে Places API- এ রূপান্তর করি। সর্বোচ্চ স্বাভাবিককৃত উপযুক্ততা স্কোর সহ সেলগুলি থেকে sample_place_ids
বের করে, আমরা প্রতিটি প্রতিযোগীর জন্য তাদের নাম, ঠিকানা, রেটিং এবং অবস্থানের মতো সমৃদ্ধ বিশদ পুনরুদ্ধার করতে Place Details API কল করতে পারি।
এর জন্য পূর্ববর্তী কোয়েরির ফলাফলের তুলনা করা প্রয়োজন, যেখানে উপযুক্ততা স্কোর তৈরি করা হয়েছিল এবং PLACES_COUNT_PER_H3
ক্যোয়ারী। H3 সেল সূচক সর্বোচ্চ স্বাভাবিককৃত উপযুক্ততা স্কোর সহ কফি শপের সংখ্যা এবং কক্ষ থেকে আইডি পেতে ব্যবহার করা যেতে পারে।
এই পাইথন কোডটি দেখায় কিভাবে এই তুলনা করা যেতে পারে।
# Isolate the Top 5 Most Suitable H3 Cells
top_suitability_cells = gdf_suitability.head(5)
# Extract the 'h3_index' values from these top 5 cells into a list.
top_h3_indexes = top_suitability_cells['h3_index'].tolist()
print(f"The top 5 H3 indexes are: {top_h3_indexes}")
# Now, we find the rows in our DataFrame where the
# 'h3_cell_index' matches one of the indexes from our top 5 list.
coffee_counts_in_top_zones = gdf_coffee_shops[
gdf_coffee_shops['h3_cell_index'].isin(top_h3_indexes)
]
এখন আমাদের কাছে কফি শপগুলির জন্য প্লেস আইডিগুলির তালিকা রয়েছে যা ইতিমধ্যেই সর্বোচ্চ উপযুক্ততা স্কোর সহ H3 কক্ষের মধ্যে বিদ্যমান, প্রতিটি স্থান সম্পর্কে আরও বিশদ অনুরোধ করা যেতে পারে।
এটি হয় প্রতিটি স্থান আইডির জন্য সরাসরি স্থানের বিবরণ API- এ একটি অনুরোধ পাঠিয়ে বা কলটি সম্পাদন করার জন্য একটি ক্লায়েন্ট লাইব্রেরি ব্যবহার করে করা যেতে পারে। আপনার প্রয়োজনীয় ডেটার অনুরোধ করার জন্য FieldMask
প্যারামিটার সেট করতে ভুলবেন না।
অবশেষে, আমরা সবকিছুকে একক, শক্তিশালী ভিজ্যুয়ালাইজেশনে একত্রিত করি। আমরা বেস লেয়ার হিসাবে আমাদের বেগুনি উপযুক্ততা choropleth মানচিত্র প্লট করি এবং তারপর Places API থেকে পুনরুদ্ধার করা প্রতিটি পৃথক কফি শপের জন্য পিন যোগ করি। এই চূড়ান্ত মানচিত্রটি এক নজরে একটি দৃশ্য প্রদান করে যা আমাদের সম্পূর্ণ বিশ্লেষণকে সংশ্লেষ করে: গাঢ় বেগুনি অঞ্চলগুলি সম্ভাব্যতা দেখায় এবং সবুজ পিনগুলি বর্তমান বাজারের বাস্তবতা দেখায়৷
কিছু বা কোন পিন সহ গাঢ় বেগুনি কক্ষগুলি সন্ধান করে, আমরা আত্মবিশ্বাসের সাথে সঠিক এলাকাগুলি চিহ্নিত করতে পারি যা আমাদের নতুন অবস্থানের জন্য সেরা সুযোগের প্রতিনিধিত্ব করে৷
উপরের দুটি কক্ষের একটি উচ্চ উপযুক্ততা স্কোর আছে, কিন্তু কিছু স্পষ্ট ফাঁক যা আমাদের নতুন কফি শপের জন্য সম্ভাব্য অবস্থান হতে পারে।
উপসংহার
এই নথিতে, আমরা একটি রাজ্যব্যাপী প্রশ্ন থেকে সরেছি যেখানে প্রসারিত করতে হবে? একটি ডেটা-ব্যাকড, স্থানীয় উত্তরে। বিভিন্ন ডেটাসেট লেয়ারিং করে এবং কাস্টম ব্যবসায়িক যুক্তি প্রয়োগ করে, আপনি একটি বড় ব্যবসায়িক সিদ্ধান্তের সাথে যুক্ত ঝুঁকিকে পদ্ধতিগতভাবে কমাতে পারেন। এই ওয়ার্কফ্লো, BigQuery-এর স্কেল, Places Insights-এর সমৃদ্ধি এবং Places API-এর রিয়েল-টাইম বিশদ সমন্বয় করে, কৌশলগত বৃদ্ধির জন্য লোকেশন ইন্টেলিজেন্স ব্যবহার করতে চায় এমন যে কোনও সংস্থার জন্য একটি শক্তিশালী টেমপ্লেট প্রদান করে।
পরবর্তী পদক্ষেপ
- আপনার নিজস্ব ব্যবসার যুক্তি, লক্ষ্য ভৌগলিক এবং মালিকানাধীন ডেটাসেটের সাথে এই কর্মপ্রবাহকে মানিয়ে নিন।
- আপনার মডেলকে আরও সমৃদ্ধ করতে স্থানের অন্তর্দৃষ্টি ডেটাসেটের অন্যান্য ডেটা ক্ষেত্রগুলি অন্বেষণ করুন, যেমন পর্যালোচনার সংখ্যা, মূল্য স্তর এবং ব্যবহারকারীর রেটিং৷
- একটি অভ্যন্তরীণ সাইট নির্বাচন ড্যাশবোর্ড তৈরি করতে এই প্রক্রিয়াটিকে স্বয়ংক্রিয় করুন যা গতিশীলভাবে নতুন বাজার মূল্যায়ন করতে ব্যবহার করা যেতে পারে।
ডকুমেন্টেশনের আরও গভীরে যান:
অবদানকারী
হেনরিক ভালভ | ডেভএক্স ইঞ্জিনিয়ার