این صفحه به‌وسیله ‏Cloud Translation API‏ ترجمه شده است.

اندازه‌گیری شباهت از تعبیه‌ها

اکنون برای هر جفت نمونه جاسازی دارید. یک معیار شباهت نظارت شده این جاسازی ها را می گیرد و عددی را با اندازه گیری شباهت آنها برمی گرداند. به یاد داشته باشید که جاسازی ها بردار اعداد هستند. برای یافتن شباهت بین دو بردار \(A = [a_1,a_2,...,a_n]\) و \(B = [b_1,b_2,...,b_n]\)، یکی از این سه معیار تشابه را انتخاب کنید:

اندازه گیری کنید	معنی	فرمول	با افزایش شباهت، این معیار ...
فاصله اقلیدسی	فاصله بین انتهای بردارها	\(\sqrt{(a_1-b_1)^2+(a_2-b_2)^2+...+(a_N-b_N)^2}\)	کاهش می یابد
کسینوس	کسینوس زاویه \(\theta\) بین بردارها	\(\frac{a^T b}{\|a\| \cdot \|b\|}\)	افزایش می دهد
محصول نقطه ای	کسینوس ضرب در طول هر دو بردار	\(a_1b_1+a_2b_2+...+a_nb_n\) \(=\|a\|\|b\|cos(\theta)\)	افزایش می دهد. همچنین با طول بردارها افزایش می یابد.

انتخاب معیار تشابه

بر خلاف کسینوس، حاصل ضرب نقطه ای متناسب با طول برداری است. این مهم است زیرا نمونه‌هایی که اغلب در مجموعه آموزشی ظاهر می‌شوند (مثلاً ویدیوهای محبوب YouTube) معمولاً دارای بردارهای جاسازی شده با طول زیاد هستند.اگر می خواهید محبوبیت کسب کنید، محصول نقطه ای را انتخاب کنید. با این حال، خطر این است که نمونه های رایج ممکن است معیار تشابه را منحرف کنند. برای متعادل کردن این انحراف، می توانید طول را تا یک توان افزایش دهید \(\alpha\ < 1\) برای محاسبه حاصل ضرب نقطه ای به عنوان \(|a|^{\alpha}|b|^{\alpha}\cos(\theta)\).

برای درک بهتر اینکه چگونه طول بردار معیار تشابه را تغییر می دهد، طول بردارها را به 1 نرمال کنید و توجه کنید که این سه اندازه با یکدیگر متناسب می شوند.

اثبات: تناسب معیارهای تشابه

پس از عادی سازی a و b به گونه ای که \(||a||=1\) و \(||b||=1\)، این سه معیار به شرح زیر است:

فاصله اقلیدسی = \(||a-b|| = \sqrt{||a||^2 + ||b||^2 - 2a^{T}b} = \sqrt{2-2\cos(\theta_{ab})}\).
محصول نقطه ای = \( |a||b| \cos(\theta_{ab}) = 1\cdot1\cdot \cos(\theta_{ab}) = cos(\theta_{ab})\).
کسینوس = \(\cos(\theta_{ab})\).

بنابراین، هر سه معیار تشابه معادل هستند زیرا با آنها متناسب هستند \(cos(\theta_{ab})\).

بررسی معیارهای تشابه

معیار تشابه شباهت بین یک جفت مثال را نسبت به جفت مثال های دیگر کمیت می دهد. دو نوع دستی و تحت نظارت در زیر با هم مقایسه می شوند:

تایپ کنید	نحوه ایجاد	بهترین برای	مفاهیم
دستی	ترکیب دستی داده های ویژگی	مجموعه داده های کوچک با ویژگی هایی که ترکیب آنها ساده است.	بینشی در مورد نتایج محاسبات شباهت می دهد. اگر داده‌های ویژگی تغییر کرد، باید معیار تشابه را به‌صورت دستی به‌روزرسانی کنید.
تحت نظارت	فاصله بین جاسازی‌های ایجاد شده توسط DNN تحت نظارت را اندازه‌گیری کنید.	مجموعه داده های بزرگ با ویژگی هایی که ترکیب آنها سخت است.	هیچ بینشی در مورد نتایج نمی دهد. با این حال، یک DNN می تواند به طور خودکار با تغییر داده های ویژگی سازگار شود.

قبلی

رمزگذارهای خودکار، پیش بینی کننده ها و جاسازی ها

بعدی

درک خود را بررسی کنید

اندازه‌گیری شباهت از تعبیه‌ها با مجموعه‌ها، منظم بمانید ذخیره و طبقه‌بندی محتوا براساس اولویت‌های شما.

انتخاب معیار تشابه

بررسی معیارهای تشابه

اندازه‌گیری شباهت از تعبیه‌ها