جمع البيانات: التحقّق من مدى فهمك

بالنسبة إلى الأسئلة التالية، انقر على السهم المطلوب للتحقق من إجابتك:

لنفترض أنك تعمل على نموذج تعلُّم الآلة المرتبط بالإعلانات وتريد توقّع إنفاق المعلن لشهر كانون الثاني (يناير). هناك قيود على مقدار البيانات التي يمكنك تخزينها على القرص، لذا يجب استخدام مجموعة فرعية من البيانات المتاحة فقط. يمكنك استخدام أحدث البيانات ، وهي من الشهر السابق من كانون الأول (ديسمبر). يقترح أحد المستخدمين الآخرين عيّنة بيانات على مدار العام الماضي. أيهما أفضل، ولماذا؟
البيانات من الشهر السابق (كانون الأول (ديسمبر))
ومع أنّ هذه البيانات حديثة، قد تتأثر بالتأثيرات الموسمية لإنفاق المعلن قبل عطلة كانون الأول (ديسمبر).
البيانات المستندة إلى عينات على مدار العام
ومع أنّ هذه البيانات قديمة، من غير المرجّح أن تتأثر بالتأثيرات الموسمية لإنفاق المعلن قبل عطلة كانون الأول (ديسمبر).
تريد عرض الفيديوهات التي يريد المستخدمون مشاهدتها. وتستخدم الفيديوهات التي شاهدها المستخدمون على YouTube كتصنيف. هل هذه العلامة مباشرة أو مشتقة؟
مشتق
تم اشتقاق هذا التصنيف لأنه ليس التوقع الدقيق الذي تريد إجراؤه. من المحتمل أنّ المستخدم فتح الفيديو وأغلقه بعد ذلك بفترة قصيرة. سيتم احتساب هذه الفعالية على أنّها مشاهدة حتى إذا لم يشاهد المستخدم الفيديو. في بعض الحالات، قد يكون الدليل الإرشادي مثل هذا هو الخيار الوحيد لك، ولكن يُرجى الانتباه إلى نوع تصنيفك (مباشر أو مشتق) وكيفية تأثيره في التوقعات.
مباشر
قد يكون لذلك التصنيف توقّع دقيق في معظم الأحيان، ولكنّه ليس هو التوقع المحدّد الذي تريد تنفيذه.