البيانات الفئوية: تداخل الميزات

يتم إنشاء تداخل الميزات بواسطة معاملين (أي ناتج ضرب الديكارتي في) معاملين أو أكثر فئويين أو مقسمين. ميزات مجموعة البيانات. مثل متعدد الحدود التحويلات، تسمح تقاطعات الخصائص للنماذج الخطية بمعالجة العناصر غير الخطية. تداخل الميزات وأيضًا ترميز التفاعلات بين الميزات.

على سبيل المثال، بالنظر إلى مجموعة بيانات ورقة الشجر ذات الخصائص الفئوية:

  • edges يحتوي على القيم smooth وtoothed وlobed
  • arrangement، تحتوي على القيمتين opposite وalternate

افترض أن الترتيب أعلاه هو ترتيب أعمدة الميزات في نقطة واحدة بحيث يكون شكل ورقة شجر بحواف smooth وترتيب opposite يتم تمثيلها بهذا الشكل {(1, 0, 0), (1, 0)}.

يكون ناتج الميزة الصليبية، أو الديكارتية، لهاتين الميزتين:

{Smooth_Opposite, Smooth_Alternate, Toothed_Opposite, Toothed_Alternate, Lobed_Opposite, Lobed_Alternate}

حيث تكون قيمة كل مصطلح هي حاصل ضرب قيم الخصائص الأساسية، مثل الذي:

  • Smooth_Opposite = edges[0] * arrangement[0]
  • Toothed_Opposite = edges[1] * arrangement[0]
  • Lobed_Alternate = edges[2] * arrangement[1]

بالنسبة لأي مثال محدد في مجموعة البيانات، فإن تقاطع الميزة سوف يساوي 1 فقط إذا كلا الميزتين الأساسيتين المتجهات الأصلية أحادية الاتجاه كانت 1 للفئات المتقاطعة. وهذا يعني أن ورقة شجر البلوط ذات الحافة المفصّصة والترتيب البديل قد يكون لها بقيمة 1 فقط لـ Lobed_Alternate، وسيكون تقاطع الميزات أعلاه هو:

{0, 0, 0, 0, 0, 1}

ويمكن استخدام مجموعة البيانات هذه لتصنيف الأوراق حسب أنواع الأشجار، حيث إن هذه وخصائصها داخل النوع.

متى نستخدم علامات تقاطع الخصائص

يمكن أن تقترح معرفة المجال مجموعة مفيدة من الميزات عبرها. بدون هذه المعرفة بالمجال، قد يكون من الصعب تحديد تداخل الخصائص الفعالة أو التحويلات متعددة الحدود يدويًا. غالبًا ما يكون ذلك ممكنًا، إذا كان مكلفًا من الناحية الحسابية، فيمكن استخدام الشبكات العصبونية البحث تلقائيًا عن مجموعات الميزات المفيدة وتطبيقها أثناء التدريب

انتبه، فاستخدام ميزتين متفرقتين يؤدي إلى ظهور معلومات جديدة من الميزتين الأصليتين. فعلى سبيل المثال، إذا كانت الميزة A الخاصية B هي خاصية متفرقة مكونة من 100 عنصر وتضم 200 عنصر، ينتج عن تقاطع الخصائص A وB خاصية متفرقة مكونة من 20,000 عنصر.