این صفحه به‌وسیله ‏Cloud Translation API‏ ترجمه شده است.

داده های دسته بندی: تلاقی ویژگی ها

تلاقی ویژگی ها با تلاقی (با گرفتن حاصل ضرب دکارتی از) دو یا چند ویژگی طبقه بندی شده یا سطلی از مجموعه داده ایجاد می شود. مانند تبدیل های چند جمله ای ، تلاقی ویژگی ها به مدل های خطی اجازه می دهد تا غیرخطی ها را مدیریت کنند. تلاقی ویژگی ها همچنین تعامل بین ویژگی ها را رمزگذاری می کند.

به عنوان مثال، یک مجموعه داده برگ را با ویژگی های دسته بندی در نظر بگیرید:

edges ، حاوی مقادیر smooth ، toothed و lobed
arrangement ، حاوی مقادیر opposite و alternate

فرض کنید ترتیب بالا ترتیب ستون‌های ویژگی در یک نمایش تک داغ است، به طوری که یک برگ با لبه‌های smooth و آرایش opposite به صورت {(1, 0, 0), (1, 0)} نشان داده می‌شود.

متقاطع ویژگی، یا محصول دکارتی، از این دو ویژگی خواهد بود:

{Smooth_Opposite, Smooth_Alternate, Toothed_Opposite, Toothed_Alternate, Lobed_Opposite, Lobed_Alternate}

که در آن مقدار هر عبارت حاصل ضرب مقادیر ویژگی پایه است، به این صورت که:

Smooth_Opposite = edges[0] * arrangement[0]
Smooth_Alternate = edges[0] * arrangement[1]
Toothed_Opposite = edges[1] * arrangement[0]
Toothed_Alternate = edges[1] * arrangement[1]
Lobed_Opposite = edges[2] * arrangement[0]
Lobed_Alternate = edges[2] * arrangement[1]

به عنوان مثال، اگر یک برگ دارای یک لبه lobed و یک آرایش alternate باشد، بردار ویژگی متقاطع مقدار 1 برای Lobed_Alternate و مقدار 0 برای همه عبارت‌های دیگر خواهد داشت:

{0, 0, 0, 0, 0, 1}

این مجموعه داده می تواند برای طبقه بندی برگ ها بر اساس گونه های درختی استفاده شود، زیرا این ویژگی ها در یک گونه متفاوت نیست.

برای مقایسه تبدیل های چند جمله ای با تلاقی ویژگی ها اینجا را کلیک کنید

تلاقی های ویژگی تا حدودی مشابه تبدیل های چند جمله ای هستند. هر دو ویژگی های متعدد را در یک ویژگی مصنوعی جدید ترکیب می کنند که مدل می تواند برای یادگیری غیرخطی ها آموزش دهد. تبدیل‌های چند جمله‌ای معمولاً داده‌های عددی را ترکیب می‌کنند، در حالی که تلاقی ویژگی‌ها داده‌های طبقه‌بندی را ترکیب می‌کنند.

زمان استفاده از صلیب های ویژگی

دانش دامنه می تواند ترکیب مفیدی از ویژگی ها را برای عبور پیشنهاد دهد. بدون آن دانش دامنه، تعیین تلاقی ویژگی های موثر یا تبدیل های چند جمله ای با دست می تواند دشوار باشد. اغلب ممکن است، اگر از نظر محاسباتی گران باشد، از شبکه های عصبی برای یافتن و به کارگیری ترکیبات ویژگی های مفید در طول آموزش به طور خودکار استفاده شود.

مراقب باشید- عبور از دو ویژگی پراکنده یک ویژگی جدید حتی کم‌تر از دو ویژگی اصلی ایجاد می‌کند. به عنوان مثال، اگر ویژگی A یک ویژگی پراکنده 100 عنصری و ویژگی B یک ویژگی پراکنده 200 عنصری باشد، تلاقی ویژگی A و B یک ویژگی پراکنده 20000 عنصری را به دست می‌دهد.

قبلی

مشکلات رایج با داده های طبقه بندی شده (5 دقیقه)

بعدی

تمرینات متقابل ویژه (15 دقیقه)

داده های دسته بندی: تلاقی ویژگی ها با مجموعه‌ها، منظم بمانید ذخیره و طبقه‌بندی محتوا براساس اولویت‌های شما.

زمان استفاده از صلیب های ویژگی

داده های دسته بندی: تلاقی ویژگی ها