এম্বেডিংয়ের উদাহরণ তৈরি করা হচ্ছে

এই উদাহরণটি দেখায় কিভাবে একটি তত্ত্বাবধানে থাকা সাদৃশ্য পরিমাপে ব্যবহৃত এমবেডিংগুলি তৈরি করতে হয়।

কল্পনা করুন আপনার কাছে একই হাউজিং ডেটা সেট আছে যা আপনি ম্যানুয়াল সাদৃশ্য পরিমাপ তৈরি করার সময় ব্যবহার করেছিলেন:

বৈশিষ্ট্য টাইপ
দাম ধনাত্নক পূর্ণসংখ্যা
আকার বর্গ মিটারের এককে ধনাত্মক ফ্লোটিং-পয়েন্ট মান
পোস্ট অফিসের নাম্বার পূর্ণসংখ্যা
বেডরুমের সংখ্যা পূর্ণসংখ্যা
বাড়ির টাইপ "একক_পরিবার," "মাল্টি-ফ্যামিলি," "অ্যাপার্টমেন্ট," "কন্ডো" থেকে একটি পাঠ্য মান
গ্যারেজ না/হ্যাঁর জন্য 0/1
রং মাল্টিভ্যালেন্ট ক্যাটাগরিকাল: স্ট্যান্ডার্ড রং থেকে এক বা একাধিক মান “সাদা,” “হলুদ,” “সবুজ” ইত্যাদি।

প্রিপ্রসেসিং ডেটা

আপনি ইনপুট হিসাবে বৈশিষ্ট্য ডেটা ব্যবহার করার আগে, আপনাকে ডেটা প্রিপ্রসেস করতে হবে। একটি ম্যানুয়াল সাদৃশ্য পরিমাপ তৈরি করার সময় আপনি যে পদক্ষেপগুলি নিয়েছিলেন তার উপর ভিত্তি করে প্রিপ্রসেসিং পদক্ষেপগুলি। এখানে একটি সারসংক্ষেপ:

বৈশিষ্ট্য প্রকার বা বিতরণ কর্ম
দাম বিষ বিতরণ পরিমাপ করুন এবং স্কেল করুন [0,1]।
আকার বিষ বিতরণ পরিমাপ করুন এবং স্কেল করুন [0,1]।
পোস্ট অফিসের নাম্বার শ্রেণীবদ্ধ দ্রাঘিমাংশ এবং অক্ষাংশে রূপান্তর করুন, পরিমাপ করুন এবং স্কেল করুন [0,1]।
বেডরুমের সংখ্যা পূর্ণসংখ্যা আউটলার ক্লিপ করুন এবং স্কেল করুন [0,1]।
বাড়ির টাইপ শ্রেণীবদ্ধ এক-হট এনকোডিং-এ রূপান্তর করুন। .
গ্যারেজ 0 বা 1 ত্যাগ করার মত.
রং শ্রেণীবদ্ধ আরজিবি মানগুলিতে রূপান্তর করুন এবং সংখ্যাসূচক ডেটা হিসাবে প্রক্রিয়া করুন।

এক-হট এনকোডিং সম্পর্কে আরও তথ্যের জন্য, এম্বেডিংগুলি দেখুন: শ্রেণীগত ইনপুট ডেটা

ভবিষ্যদ্বাণী বা অটোএনকোডার চয়ন করুন

এমবেডিং তৈরি করতে, আপনি একটি অটোএনকোডার বা একটি ভবিষ্যদ্বাণী করতে পারেন। মনে রাখবেন, আপনার ডিফল্ট পছন্দ একটি অটোএনকোডার। যদি আপনার ডেটাসেটের নির্দিষ্ট বৈশিষ্ট্যের মিল নির্ধারণ করে তাহলে আপনি পরিবর্তে একটি ভবিষ্যদ্বাণী বেছে নিন। সম্পূর্ণতার জন্য, আসুন উভয় ক্ষেত্রেই তাকাই।

একটি ভবিষ্যদ্বাণী প্রশিক্ষণ

আপনাকে সেই বৈশিষ্ট্যগুলিকে আপনার DNN-এর প্রশিক্ষণ লেবেল হিসাবে বেছে নিতে হবে যা আপনার উদাহরণগুলির মধ্যে সাদৃশ্য নির্ধারণে গুরুত্বপূর্ণ। বাড়ির মধ্যে মিল নির্ণয় করার ক্ষেত্রে মূল্য সবচেয়ে গুরুত্বপূর্ণ।

প্রশিক্ষণ লেবেল হিসাবে মূল্য চয়ন করুন, এবং এটিকে ইনপুট বৈশিষ্ট্য ডেটা থেকে DNN-এ সরান৷ ইনপুট ডেটা হিসাবে অন্যান্য সমস্ত বৈশিষ্ট্য ব্যবহার করে DNN কে প্রশিক্ষণ দিন। প্রশিক্ষণের জন্য, ক্ষতির ফাংশনটি কেবল পূর্বাভাসিত এবং প্রকৃত মূল্যের মধ্যে MSE। কিভাবে একটি DNN প্রশিক্ষণ দিতে হয় তা জানতে, প্রশিক্ষণ নিউরাল নেটওয়ার্ক দেখুন।

একটি অটোএনকোডারকে প্রশিক্ষণ দিন

এই পদক্ষেপগুলি অনুসরণ করে আমাদের ডেটাসেটে একটি অটোএনকোডারকে প্রশিক্ষণ দিন:

  1. অটোএনকোডারের লুকানো স্তরগুলি ইনপুট এবং আউটপুট স্তরগুলির চেয়ে ছোট তা নিশ্চিত করুন৷
  2. তত্ত্বাবধানে থাকা সাদৃশ্য পরিমাপে বর্ণিত প্রতিটি আউটপুটের ক্ষতি গণনা করুন।
  3. প্রতিটি আউটপুটের জন্য ক্ষতি যোগ করে ক্ষতি ফাংশন তৈরি করুন। প্রতিটি বৈশিষ্ট্যের জন্য সমানভাবে ওজন হ্রাস নিশ্চিত করুন। উদাহরণস্বরূপ, যেহেতু রঙিন ডেটা RGB-তে প্রক্রিয়া করা হয়, তাই প্রতিটি RGB আউটপুটকে 1/3 য় ওজন করুন।
  4. DNN কে প্রশিক্ষণ দিন।

DNN থেকে এম্বেডিং বের করা হচ্ছে

আপনার DNN প্রশিক্ষণের পরে, ভবিষ্যদ্বাণীকারী বা অটোএনকোডার যাই হোক না কেন, DNN থেকে উদাহরণের জন্য এমবেডিং বের করুন। ইনপুট হিসাবে উদাহরণের বৈশিষ্ট্য ডেটা ব্যবহার করে এমবেডিংটি বের করুন এবং চূড়ান্ত লুকানো স্তরের আউটপুটগুলি পড়ুন। এই আউটপুটগুলি এমবেডিং ভেক্টর গঠন করে। মনে রাখবেন, অনুরূপ বাড়ির ভেক্টরগুলি ভিন্ন বাড়ির জন্য ভেক্টরের চেয়ে কাছাকাছি হওয়া উচিত।

এর পরে, আপনি তাদের এমবেডিং ভেক্টর ব্যবহার করে উদাহরণগুলির জোড়ার জন্য মিলের পরিমাণ কীভাবে নির্ধারণ করবেন তা দেখতে পাবেন।