التصنيف: تحيز التنبؤ
تنظيم صفحاتك في مجموعات
يمكنك حفظ المحتوى وتصنيفه حسب إعداداتك المفضّلة.
كما ذُكر في قسم
الانحدار الخطي
الوحدة، حساب
تحيز التوقع
هو فحص سريع يمكنه الإبلاغ عن أي مشاكل في النموذج أو بيانات التدريب
مبكرًا.
إن تحيز التنبؤ هو الفرق بين متوسط تنبؤ
التوقّعات
ومتوسط
تصنيفات الحقيقة في قسم
البيانات. يشير هذا المصطلح إلى نموذج مدرَّب على مجموعة بيانات.
حيث تكون 5٪ من الرسائل الإلكترونية غير مرغوب فيها ينبغي التنبؤ، في المتوسط، أن 5٪ من
رسائل البريد الإلكتروني التي يصنفها هي رسائل غير مرغوب فيها. أو بعبارةٍ أخرى، يعني متوسط التسميات في
تساوي 0.05 في مجموعة بيانات الحقيقة، ومن المفترض أن يكون متوسّط
سيكون أيضًا 0.05. فإذا كان الأمر كذلك، فإن النموذج ليس له تحيز للتنبؤ صفر. من
بالطبع، فقد لا يزال النموذج يواجه مشكلات أخرى.
إذا توقع النموذج بدلاً من ذلك أن تكون الرسالة الإلكترونية غير مرغوب فيها بنسبة 50% من الوقت،
هناك خطأ في مجموعة بيانات التطبيق، فإن مجموعة البيانات الجديدة
أو باستخدامه على النموذج نفسه. أي تقييم
يشير الاختلاف الكبير بين الوسيلتين إلى أن النموذج يحتوي على
بعض التحيز في التنبؤ.
قد ينتج تحيز التنبؤ عن:
- التحيزات أو التشويش في البيانات، بما في ذلك العينات المتحيزة لمجموعة التدريب
- تسوية عالية جدًا، ما يعني أن النموذج قد تم اختصاره بشكل مبالغ فيه وتم فقدانه
بعض التعقيدات اللازمة
- الأخطاء في مسار تدريب النماذج
- مجموعة الميزات المقدمة للنموذج غير كافية للمهمة
إنّ محتوى هذه الصفحة مرخّص بموجب ترخيص Creative Commons Attribution 4.0 ما لم يُنصّ على خلاف ذلك، ونماذج الرموز مرخّصة بموجب ترخيص Apache 2.0. للاطّلاع على التفاصيل، يُرجى مراجعة سياسات موقع Google Developers. إنّ Java هي علامة تجارية مسجَّلة لشركة Oracle و/أو شركائها التابعين.
تاريخ التعديل الأخير: 2024-08-13 (حسب التوقيت العالمي المتفَّق عليه)
[null,null,["تاريخ التعديل الأخير: 2024-08-13 (حسب التوقيت العالمي المتفَّق عليه)"],[[["\u003cp\u003ePrediction bias, calculated as the difference between the average prediction and the average ground truth, is a quick check for model or data issues.\u003c/p\u003e\n"],["\u003cp\u003eA model with zero prediction bias ideally predicts the same average outcome as observed in the ground truth data, such as a spam detection model predicting the same percentage of spam emails as actually present in the dataset.\u003c/p\u003e\n"],["\u003cp\u003eSignificant prediction bias can indicate problems in the training data, the model itself, or the new data being applied to the model.\u003c/p\u003e\n"],["\u003cp\u003eCommon causes of prediction bias include biased data, excessive regularization, bugs in the training process, and insufficient features provided to the model.\u003c/p\u003e\n"]]],[],null,["# Classification: Prediction bias\n\nAs mentioned in the\n[Linear regression](/machine-learning/crash-course/linear-regression)\nmodule, calculating\n[**prediction bias**](/machine-learning/glossary#prediction_bias)\nis a quick check that can flag issues with the model or training data\nearly on.\n\nPrediction bias is the difference between the mean of a model's\n[**predictions**](/machine-learning/glossary#prediction)\nand the mean of\n[**ground-truth**](/machine-learning/glossary#ground-truth) labels in the\ndata. A model trained on a dataset\nwhere 5% of the emails are spam should predict, on average, that 5% of the\nemails it classifies are spam. In other words, the mean of the labels in the\nground-truth dataset is 0.05, and the mean of the model's predictions should\nalso be 0.05. If this is the case, the model has zero prediction bias. Of\ncourse, the model might still have other problems.\n\nIf the model instead predicts 50% of the time that an email is spam, then\nsomething is wrong with the training dataset, the new dataset the model is\napplied to, or with the model itself. Any\nsignificant difference between the two means suggests that the model has\nsome prediction bias.\n\nPrediction bias can be caused by:\n\n- Biases or noise in the data, including biased sampling for the training set\n- Too-strong regularization, meaning that the model was oversimplified and lost some necessary complexity\n- Bugs in the model training pipeline\n- The set of features provided to the model being insufficient for the task\n\n| **Key terms:**\n|\n| - [Ground truth](/machine-learning/glossary#ground-truth)\n| - [Prediction](/machine-learning/glossary#prediction)\n- [Prediction bias](/machine-learning/glossary#prediction_bias) \n[Help Center](https://support.google.com/machinelearningeducation)"]]