العمل على البيانات الفئوية

تتضمن البيانات الفئوية مجموعة محددة من القيم المحتملة. على سبيل المثال:

  • أنواع مختلفة من الحيوانات في حديقة وطنية
  • أسماء الشوارع في مدينة معينة
  • ما إذا كانت الرسالة الإلكترونية رسالة غير مرغوب فيها
  • الألوان التي يتم طلاء التصميمات الخارجية فيها
  • الأرقام المرفقة، الموضحة في العمل باستخدام الأرقام الرقمية وحدة البيانات

يمكن أن تكون الأرقام أيضًا بيانات فئوية

بيانات رقمية صحيحة ويمكن ضربه بشكل هادف. على سبيل المثال، ضع في اعتبارك يتنبأ بقيمة أي منزل بناءً على مساحته. تجدر الإشارة إلى أنّ النموذج المفيد لتقييم أسعار المنازل يعتمد عادةً على مئات الميزات. ومع ذلك، في حال تساوى جميع الأمور الأخرى، سيكون منزلاً من 200 مربع أن يكون حجم المنزل المتماثل 100 متر مربع تقريبًا متر.

في كثير من الأحيان، يجب عليك تمثيل الميزات التي تحتوي على قيم أعداد صحيحة مثل بيانات فئوية بدلاً من البيانات الرقمية. على سبيل المثال، ضع في الاعتبار الرمز البريدي ميزة التعليمات البرمجية التي تكون فيها القيم أعدادً صحيحة. إذا كنت تمثّل هذه الجهة رقميًا وليس بشكل فئوي، فأنت تسأل النموذج لإيجاد علاقة رقمية بين الرموز البريدية المختلفة. أي أنك تخبر النموذج التعامل مع الرمز البريدي 20004 كضعف (أو نصف) حجم الإشارة كرمز بريدي 10002. وعند تمثيل الرموز البريدية كبيانات فئوية، يتيح النموذج الوزن لكل رمز بريدي فردي على حدة.

الترميز

يعني الترميز تحويل البيانات الفئوية أو البيانات الأخرى إلى متجهات رقمية. التي يمكن أن يتدرب عليها النموذج. وتُعدّ هذه الإحالة الناجحة ضرورية لأنّ النماذج التدرّب على قيم النقاط العائمة فقط فلا يمكن أن تتدرب النماذج على سلاسل مثل "dog" أو "maple" تشرح هذه الوحدة أساليب وأساليب تشفير البيانات الفئوية.