تعبیه فضای نسبتاً کم بعدی است که می توانید بردارهای با ابعاد بالا را در آن ترجمه کنید. جاسازیها انجام یادگیری ماشینی را در ورودیهای بزرگ مانند بردارهای پراکنده که کلمات را نشان میدهند، آسانتر میکنند. در حالت ایدهآل، تعبیه برخی از معنایی ورودی را با قرار دادن ورودیهای معنایی مشابه نزدیک به هم در فضای تعبیهسازی به تصویر میکشد. تعبیه را می توان آموخت و مجدداً در مدل ها استفاده کرد.
جاسازی ها
انگیزه از فیلتر مشارکتی
- ورودی: 1,000,000 فیلم که 500,000 کاربر برای تماشا انتخاب کرده اند
- وظیفه: فیلم ها را به کاربران توصیه کنید
برای حل این مشکل به روشی نیاز است تا مشخص شود کدام فیلم ها شبیه یکدیگر هستند.
سازماندهی فیلم ها بر اساس شباهت (1d)
سازماندهی فیلم ها بر اساس شباهت (2d)
تعبیه دو بعدی
تعبیه دو بعدی
تعبیههای d-Dimensional
- فرض می کند علاقه کاربر به فیلم ها را می توان تقریباً با جنبه های d توضیح داد
- هر فیلم تبدیل به یک نقطه d بعدی می شود که در آن مقدار در بعد d نشان دهنده میزان تناسب فیلم با آن جنبه است.
- جاسازی ها را می توان از داده ها یاد گرفت
آموزش جاسازی در یک شبکه عمیق
- هیچ فرآیند آموزشی جداگانه ای لازم نیست -- لایه جاسازی فقط یک لایه پنهان با یک واحد در هر بعد است
- اطلاعات نظارت شده (مثلاً کاربران همان دو فیلم را تماشا کردند) جاسازی های آموخته شده را برای کار مورد نظر تنظیم می کند.
- به طور شهودی واحدهای پنهان کشف می کنند که چگونه موارد را در فضای d- بعدی سازماندهی کنند تا به بهترین نحو هدف نهایی را بهینه کنند.
نمایش ورودی
- هر مثال (یک ردیف در این ماتریس) یک بردار پراکنده از ویژگی ها (فیلم) است که توسط کاربر تماشا شده است.
- نمایش متراکم این مثال به صورت: (0، 1، 0، 1، 0، 0، 0، 1)
از نظر مکان و زمان کارآمد نیست.
نمایش ورودی
- یک فرهنگ لغت بسازید که هر ویژگی را به یک عدد صحیح از 0، ...، # فیلم - 1 نگاشت کنید
- به طور موثر بردار پراکنده را فقط به عنوان فیلم هایی که کاربر تماشا کرده است نشان دهید. این ممکن است به صورت زیر نمایش داده شود:
یک لایه جاسازی شده در یک شبکه عمیق
مشکل رگرسیون برای پیش بینی قیمت فروش مسکن:
یک لایه جاسازی شده در یک شبکه عمیق
مشکل رگرسیون برای پیش بینی قیمت فروش مسکن:
یک لایه جاسازی شده در یک شبکه عمیق
مشکل رگرسیون برای پیش بینی قیمت فروش مسکن:
یک لایه جاسازی شده در یک شبکه عمیق
مشکل رگرسیون برای پیش بینی قیمت فروش مسکن:
یک لایه جاسازی شده در یک شبکه عمیق
مشکل رگرسیون برای پیش بینی قیمت فروش مسکن:
یک لایه جاسازی شده در یک شبکه عمیق
مشکل رگرسیون برای پیش بینی قیمت فروش مسکن:
یک لایه جاسازی شده در یک شبکه عمیق
طبقه بندی چند کلاسه برای پیش بینی یک رقم دست نویس:
یک لایه جاسازی شده در یک شبکه عمیق
طبقه بندی چند کلاسه برای پیش بینی یک رقم دست نویس:
یک لایه جاسازی شده در یک شبکه عمیق
طبقه بندی چند کلاسه برای پیش بینی یک رقم دست نویس:
یک لایه جاسازی شده در یک شبکه عمیق
طبقه بندی چند کلاسه برای پیش بینی یک رقم دست نویس:
یک لایه جاسازی شده در یک شبکه عمیق
طبقه بندی چند کلاسه برای پیش بینی یک رقم دست نویس:
یک لایه جاسازی شده در یک شبکه عمیق
طبقه بندی چند کلاسه برای پیش بینی یک رقم دست نویس:
یک لایه جاسازی شده در یک شبکه عمیق
طبقه بندی چند کلاسه برای پیش بینی یک رقم دست نویس:
یک لایه جاسازی شده در یک شبکه عمیق
فیلتر مشارکتی برای پیشبینی فیلمهای پیشنهادی:
یک لایه جاسازی شده در یک شبکه عمیق
فیلتر مشارکتی برای پیشبینی فیلمهای پیشنهادی:
یک لایه جاسازی شده در یک شبکه عمیق
فیلتر مشارکتی برای پیشبینی فیلمهای پیشنهادی:
یک لایه جاسازی شده در یک شبکه عمیق
فیلتر مشارکتی برای پیشبینی فیلمهای پیشنهادی:
یک لایه جاسازی شده در یک شبکه عمیق
فیلتر مشارکتی برای پیشبینی فیلمهای پیشنهادی:
یک لایه جاسازی شده در یک شبکه عمیق
فیلتر مشارکتی برای پیشبینی فیلمهای پیشنهادی:
یک لایه جاسازی شده در یک شبکه عمیق
فیلتر مشارکتی برای پیشبینی فیلمهای پیشنهادی:
مطابقت با نمای هندسی
شبکه عمیق
- هر یک از واحدهای پنهان مربوط به یک بعد (ویژگی پنهان) است.
- وزن لبه بین فیلم و لایه پنهان مقادیر مختصاتی هستند
نمای هندسی تعبیه یک فیلم واحد
انتخاب تعداد تعبیههای کم نور
- تعبیههای با ابعاد بالاتر میتوانند روابط بین مقادیر ورودی را با دقت بیشتری نشان دهند
- اما ابعاد بیشتر، شانس بیش از حد تناسب را افزایش می دهد و منجر به تمرین کندتر می شود
- قانون تجربی تجربی (نقطه شروع خوبی است اما باید با استفاده از داده های اعتبارسنجی تنظیم شود): $$ dimensions \approx \sqrt[4]{possible\;values} $$
جاسازی ها به عنوان یک ابزار
- جاسازی ها آیتم ها (مانند فیلم، متن،...) را به بردارهای واقعی با ابعاد پایین به گونه ای ترسیم می کند که موارد مشابه به یکدیگر نزدیک باشند.
- تعبیهها همچنین میتوانند برای دادههای متراکم (مثلاً صدا) اعمال شوند تا یک معیار تشابه معنیدار ایجاد کنند
- جاسازی مشترک انواع داده ها (مانند متن، تصاویر، صدا، ...) شباهت بین آنها را مشخص می کند.