يتم إنشاء تداخل الميزات بواسطة معاملين (أي ناتج ضرب الديكارتي في) معاملين أو أكثر فئويين أو مقسمين. ميزات مجموعة البيانات. مثل متعدد الحدود التحويلات، تسمح تقاطعات الخصائص للنماذج الخطية بمعالجة العناصر غير الخطية. تداخل الميزات وأيضًا ترميز التفاعلات بين الميزات.
على سبيل المثال، بالنظر إلى مجموعة بيانات ورقة الشجر ذات الخصائص الفئوية:
edges
يحتوي على القيمsmooth
وtoothed
وlobed
arrangement
، تحتوي على القيمتينopposite
وalternate
افترض أن الترتيب أعلاه هو ترتيب أعمدة الميزات في نقطة واحدة
بحيث يكون ورقة الشجر ذات الحواف smooth
والترتيب opposite
يتم تمثيلها بهذا الشكل {(1, 0, 0), (1, 0)}
.
يكون ناتج الميزة الصليبية، أو الديكارتية، لهاتين الميزتين:
{Smooth_Opposite, Smooth_Alternate, Toothed_Opposite, Toothed_Alternate,
Lobed_Opposite, Lobed_Alternate}
حيث تكون قيمة كل مصطلح هي حاصل ضرب قيم الخصائص الأساسية، مثل الذي:
Smooth_Opposite = edges[0] * arrangement[0]
Toothed_Opposite = edges[1] * arrangement[0]
Lobed_Alternate = edges[2] * arrangement[1]
بالنسبة لأي مثال محدد في مجموعة البيانات، فإن تقاطع الميزة سوف يساوي 1 فقط إذا
كلا الميزتين الأساسيتين المتجهات الأصلية أحادية الاتجاه كانت 1 للفئات المتقاطعة.
وهذا يعني أن ورقة خشب البلوط ذات الحافة المفصّصة والترتيب البديل قد يكون لها
بقيمة 1 فقط لـ Lobed_Alternate
، وسيكون تقاطع الميزات أعلاه هو:
{0, 0, 0, 0, 0, 1}
ويمكن استخدام مجموعة البيانات هذه لتصنيف الأوراق حسب أنواع الأشجار، حيث إن هذه وخصائصها داخل النوع.
متى نستخدم علامات تقاطع الخصائص
يمكن أن تقترح معرفة المجال مجموعة مفيدة من الميزات عبرها. بدون هذه المعرفة بالمجال، قد يكون من الصعب تحديد تداخل الخصائص الفعالة أو التحويلات متعددة الحدود يدويًا. غالبًا ما يكون ذلك ممكنًا، إذا كان مكلفًا من الناحية الحسابية، فيمكن استخدام الشبكات العصبونية البحث تلقائيًا عن مجموعات الميزات المفيدة وتطبيقها أثناء التدريب
انتبه، فاستخدام ميزتين متفرقتين يؤدي إلى ظهور معلومات جديدة من الميزتين الأصليتين. فعلى سبيل المثال، إذا كانت الميزة أ الخاصية B هي خاصية متفرقة مكونة من 100 عنصر وتضم 200 عنصر، ينتج عن تقاطع الخصائص A وB خاصية متفرقة مكونة من 20,000 عنصر.