کار با داده های عددی: دانش خود را آزمایش کنید

  1. کدام یک از تکنیک های زیر نوعی مهندسی ویژگی نیست ؟

  2. شما در حال آموزش مدلی بر روی داده های سلامت نوزاد هستید. یکی از ویژگی های شما birth_weight است. شما می‌خواهید این مقادیر birth_weight را عادی کنید تا مدل را کارآمدتر آموزش دهید. کدام یک از تکنیک های عادی سازی زیر احتمالا بهترین انتخاب خواهد بود؟

  3. درست یا غلط: Binning تکنیکی برای تبدیل داده های طبقه بندی شده به داده های عددی است.

  4. داده های آموزشی شما برای یک مدل پیشنهادی کفش حاوی ویژگی shoe_size است که باید مقادیری بین 6 تا 16 داشته باشد. جدول زیر مقادیر shoe_size را برای شش نمونه در مجموعه داده نشان می دهد:

    مثال shoe_size
    1 8.5
    2 9
    3 N/A
    4 105
    5 11
    6 9

    چه نمونه هایی را باید قبل از آموزش پاکسازی از مجموعه داده ها در نظر بگیرید؟ (همه موارد مورد نظر را انتخاب کنید.)

    هر تعداد پاسخ را که مناسب می‌دانید انتخاب کنید.

  5. جای خالی عبارت زیر را پر کنید:
    در طول مهندسی ویژگی، ویژگی های مصنوعی را می توان برای ___ ایجاد کرد.