یادگیری ماشینی چیست؟

یادگیری ماشینی (ML) به برخی از مهم‌ترین فناوری‌هایی که ما استفاده می‌کنیم، از برنامه‌های ترجمه گرفته تا وسایل نقلیه خودران، قدرت می‌دهد. این دوره مفاهیم اصلی ML را توضیح می دهد.

ML راه جدیدی برای حل مشکلات، پاسخ به سوالات پیچیده و ایجاد محتوای جدید ارائه می دهد. ML می‌تواند آب و هوا را پیش‌بینی کند، زمان سفر را تخمین بزند، آهنگ‌ها را توصیه کند، جملات را به‌طور خودکار تکمیل کند، مقالات را خلاصه کند و تصاویری که قبلاً دیده نشده‌اند تولید کند.

در اصطلاح اولیه، ML فرآیند آموزش یک نرم‌افزار است که مدل نامیده می‌شود تا پیش‌بینی‌های مفید یا تولید محتوا از داده‌ها را انجام دهد.

به عنوان مثال، فرض کنید می‌خواهیم اپلیکیشنی برای پیش‌بینی بارندگی ایجاد کنیم. ما می توانیم از یک رویکرد سنتی یا یک رویکرد ML استفاده کنیم. با استفاده از یک رویکرد سنتی، ما یک نمایش مبتنی بر فیزیک از جو و سطح زمین ایجاد می‌کنیم و مقادیر زیادی معادلات دینامیک سیالات را محاسبه می‌کنیم. این فوق العاده دشوار است.

با استفاده از رویکرد ML، ما به مدل ML مقادیر زیادی داده آب و هوا می دهیم تا زمانی که مدل ML در نهایت رابطه ریاضی بین الگوهای آب و هوایی را که مقادیر متفاوتی از باران تولید می کنند را یاد بگیرد . سپس داده های آب و هوای فعلی را به مدل می دهیم و مقدار باران را پیش بینی می کند.

درک خود را بررسی کنید

"مدل" در یادگیری ماشین چیست؟
یک مدل یک رابطه ریاضی است که از داده هایی به دست می آید که یک سیستم ML از آن برای پیش بینی استفاده می کند
مدل یک قطعه سخت افزار کامپیوتر است
یک مدل نمایش کوچکتری از چیزی است که شما در حال مطالعه آن هستید.

انواع سیستم های ML

سیستم های ML بر اساس نحوه یادگیری پیش بینی یا تولید محتوا در یک یا چند دسته از دسته های زیر قرار می گیرند:

  • یادگیری تحت نظارت
  • یادگیری بدون نظارت
  • یادگیری تقویتی
  • هوش مصنوعی مولد

یادگیری تحت نظارت

مدل‌های یادگیری نظارت شده می‌توانند پس از دیدن داده‌های زیاد با پاسخ‌های صحیح و سپس کشف ارتباط بین عناصر موجود در داده‌ها که پاسخ‌های صحیح را تولید می‌کنند، پیش‌بینی کنند. این مانند دانش آموزی است که با مطالعه امتحانات قدیمی که شامل سؤال و پاسخ است، مطالب جدیدی را یاد می گیرد. هنگامی که دانش آموز به اندازه کافی در امتحانات قدیمی آموزش دید، دانش آموز به خوبی برای شرکت در امتحان جدید آماده می شود. این سیستم‌های ML تحت نظارت هستند به این معنا که یک انسان داده‌های سیستم ML را با نتایج صحیح شناخته شده می‌دهد.

دو مورد از رایج ترین موارد استفاده برای یادگیری تحت نظارت، رگرسیون و طبقه بندی هستند.

رگرسیون

یک مدل رگرسیون یک مقدار عددی را پیش بینی می کند. به عنوان مثال، یک مدل آب و هوا که میزان بارندگی را بر حسب اینچ یا میلی متر پیش بینی می کند، یک مدل رگرسیونی است.

برای نمونه های بیشتر از مدل های رگرسیون به جدول زیر مراجعه کنید:

سناریو داده های ورودی احتمالی پیش بینی عددی
قیمت خانه آینده متراژ مربع، کد پستی، تعداد اتاق خواب و حمام، اندازه زمین، نرخ بهره وام مسکن، نرخ مالیات بر دارایی، هزینه های ساخت و ساز و تعداد خانه های برای فروش در منطقه. قیمت خانه.
زمان سواری آینده شرایط ترافیکی تاریخی (جمع آوری شده از تلفن های هوشمند، حسگرهای ترافیک، سواری-تگرگ و سایر برنامه های ناوبری)، فاصله از مقصد، و شرایط آب و هوایی. زمان بر حسب دقیقه و ثانیه برای رسیدن به مقصد.

طبقه بندی

مدل‌های طبقه‌بندی احتمال تعلق چیزی به یک دسته را پیش‌بینی می‌کنند. بر خلاف مدل‌های رگرسیون که خروجی آنها عدد است، مدل‌های طبقه‌بندی مقداری را به دست می‌دهند که بیان می‌کند آیا چیزی به یک دسته خاص تعلق دارد یا نه. برای مثال، مدل‌های طبقه‌بندی برای پیش‌بینی هرزنامه بودن ایمیل یا عکس حاوی گربه استفاده می‌شود.

مدل های طبقه بندی به دو گروه تقسیم می شوند: طبقه بندی باینری و طبقه بندی چند طبقه. مدل‌های طبقه‌بندی باینری مقداری را از کلاسی که فقط شامل دو مقدار است، خروجی می‌دهد، برای مثال، مدلی که خروجی rain یا no rain را دارد. مدل‌های طبقه‌بندی چند کلاسه مقداری را از کلاسی که بیش از دو مقدار دارد، خروجی می‌دهد، برای مثال، مدلی که می‌تواند rain ، hail ، snow یا sleet را خروجی دهد.

درک خود را بررسی کنید

اگر بخواهید از مدل ML برای پیش‌بینی مصرف انرژی برای ساختمان‌های تجاری استفاده کنید، از چه مدلی استفاده می‌کنید؟
رگرسیون
مصرف انرژی بر حسب کیلووات ساعت (کیلووات ساعت) اندازه گیری می شود که یک عدد است، بنابراین شما می خواهید از یک مدل رگرسیون استفاده کنید.
طبقه بندی
مدل های طبقه بندی پیش بینی می کنند که آیا چیزی به یک دسته تعلق دارد یا نه، در حالی که مدل های رگرسیون یک عدد را پیش بینی می کنند. از آنجایی که مصرف انرژی بر حسب کیلووات ساعت (کیلووات ساعت) اندازه گیری می شود، که یک عدد است، شما می خواهید از یک مدل رگرسیون استفاده کنید.

یادگیری بدون نظارت

مدل‌های یادگیری بدون نظارت با داده‌هایی که حاوی هیچ پاسخ صحیحی نیستند، پیش‌بینی می‌کنند. هدف یک مدل یادگیری بدون نظارت، شناسایی الگوهای معنادار در میان داده ها است. به عبارت دیگر، مدل هیچ راهنمایی در مورد نحوه طبقه بندی هر قطعه از داده ها ندارد، اما در عوض باید قوانین خود را استنباط کند.

یک مدل یادگیری بدون نظارت متداول از تکنیکی به نام خوشه بندی استفاده می کند. مدل نقاط داده ای را پیدا می کند که گروه بندی های طبیعی را مشخص می کند.

تصویری که نقاط رنگی را در خوشه نشان می دهد.

شکل 1 . یک مدل ML که نقاط داده مشابه را خوشه بندی می کند.

تصویری که نقاط رنگی را در خوشه‌هایی نشان می‌دهد که در یک شکل محصور شده‌اند و با یکدیگر مرز دارند.

شکل 2 . گروه هایی از خوشه ها با مرزبندی های طبیعی.

خوشه بندی با طبقه بندی متفاوت است زیرا دسته ها توسط شما تعریف نشده اند. به عنوان مثال، یک مدل بدون نظارت ممکن است مجموعه داده های آب و هوا را بر اساس دما دسته بندی کند و بخش بندی هایی را که فصل ها را تعریف می کنند، آشکار کند. سپس ممکن است سعی کنید آن خوشه ها را بر اساس درک خود از مجموعه داده نام گذاری کنید.

تصویری که نقاط رنگی را در خوشه‌هایی نشان می‌دهد که برف، باران، تگرگ و بدون باران برچسب‌گذاری شده‌اند.

شکل 3 . یک مدل ML که الگوهای آب و هوایی مشابه را خوشه بندی می کند.

تصویری که نقاط رنگی را در خوشه‌هایی نشان می‌دهد که به‌عنوان برف، باران، تگرگ و بدون باران برچسب‌گذاری شده‌اند که به شکلی محصور شده‌اند و هم مرز با یکدیگر هستند.

شکل 4 . خوشه هایی از الگوهای آب و هوایی با برچسب برف، برف، باران، و بدون باران.

درک خود را بررسی کنید

چه چیزی یک رویکرد نظارت شده را از یک رویکرد بدون نظارت متمایز می کند؟
یک رویکرد نظارت شده به داده هایی داده می شود که حاوی پاسخ صحیح است.
یک رویکرد نظارت شده به داده هایی داده می شود که حاوی پاسخ صحیح است. وظیفه مدل یافتن اتصالاتی در داده هایی است که پاسخ صحیح را تولید می کنند. یک رویکرد بدون نظارت، داده هایی بدون پاسخ صحیح داده می شود. وظیفه آن یافتن گروه بندی در داده ها است.
یک رویکرد نظارت شده معمولاً از خوشه بندی استفاده می کند.
یک رویکرد بدون نظارت از خوشه بندی استفاده می کند.
یک رویکرد بدون نظارت می داند که چگونه خوشه های داده را برچسب گذاری کند.
یک رویکرد بدون نظارت نمی داند که خوشه های داده به چه معنا هستند. بر اساس درک شما از داده ها، این شما هستید که آنها را تعریف کنید.

یادگیری تقویتی

مدل های یادگیری تقویتی با دریافت پاداش یا جریمه بر اساس اقدامات انجام شده در یک محیط، پیش بینی می کنند. یک سیستم یادگیری تقویتی سیاستی را ایجاد می کند که بهترین استراتژی را برای دریافت بیشترین پاداش تعریف می کند.

یادگیری تقویتی برای آموزش روبات‌ها برای انجام وظایفی مانند راه رفتن در اتاق و برنامه‌های نرم‌افزاری مانند AlphaGo برای انجام بازی Go استفاده می‌شود.

هوش مصنوعی مولد

هوش مصنوعی مولد کلاسی از مدل‌ها است که محتوا را از ورودی کاربر ایجاد می‌کند. برای مثال، هوش مصنوعی مولد می‌تواند تصاویر، ترکیب‌های موسیقی و جوک‌های منحصربه‌فردی ایجاد کند. می تواند مقالات را خلاصه کند، نحوه انجام یک کار را توضیح دهد، یا یک عکس را ویرایش کند.

هوش مصنوعی مولد می‌تواند ورودی‌های مختلفی را دریافت کند و خروجی‌های مختلفی مانند متن، تصویر، صدا و ویدئو ایجاد کند. همچنین می تواند ترکیبی از اینها را بگیرد و ایجاد کند. به عنوان مثال، یک مدل می تواند یک تصویر را به عنوان ورودی بگیرد و یک تصویر و متن را به عنوان خروجی ایجاد کند، یا یک تصویر و متن را به عنوان ورودی بگیرد و یک ویدیو را به عنوان خروجی ایجاد کند.

ما می‌توانیم مدل‌های مولد را با ورودی‌ها و خروجی‌هایشان، که معمولاً به صورت «نوع ورودی» تا «نوع خروجی» نوشته می‌شوند، مورد بحث قرار دهیم. به عنوان مثال، در زیر فهرستی جزئی از برخی ورودی ها و خروجی ها برای مدل های تولیدی آمده است:

  • متن به متن
  • متن به تصویر
  • متن به ویدئو
  • متن به کد
  • تبدیل متن به گفتار
  • تصویر و متن به تصویر

جدول زیر نمونه هایی از مدل های مولد، ورودی آنها و نمونه ای از خروجی احتمالی آنها را فهرست می کند:

مدل ورودی خروجی نمونه
متن به متن چه کسی مسابقه لمانز را اختراع کرد؟ 24 ساعت لمانز توسط Automobile Club de l'Ouest (ACO)، یک سازمان اتومبیلرانی که در سال 1906 تأسیس شد، تأسیس شد. اولین مسابقه در 26 و 27 مه 1923 در پیست Sarthe برگزار شد، به طول 13.426 کیلومتر (8.345-). مایل) مدار جاده واقع در نزدیکی شهر لومان در فرانسه. این مسابقه در ابتدا به عنوان راهی برای ترویج ACO و منطقه Sarthe در نظر گرفته شد.
منبع: بارد
متن به تصویر یک اختاپوس بیگانه در حین خواندن روزنامه از طریق یک درگاه شناور می شود. تصویر اختاپوس کارتونی.
منبع: Imagen
متن به ویدئو یک خرس عروسکی واقعی در حال شنا در اقیانوس در سانفرانسیسکو است. خرس عروسکی زیر آب می رود. خرس عروسکی با ماهی های رنگارنگ زیر آب شنا می کند. یک خرس پاندا زیر آب شنا می کند. ویدئویی از شنا کردن یک خرس عروسکی در زیر آب.
منبع: فنکی
متن به کد یک حلقه پایتون بنویسید که روی فهرستی از اعداد حلقه زده و اعداد اول را چاپ کند.
for number in numbers:
  # Check if the number is prime.
  is_prime = True
  for i in range(2, number):
    if number % i == 0:
        is_prime = False
        break
  # If the number is prime, print it.
  if is_prime:
    print(number)

منبع: بارد
تصویر به متن تصویر فلامینگو این فلامینگو است. آنها در دریای کارائیب یافت می شوند.
منبع: Google DeepMind

هوش مصنوعی مولد چگونه کار می کند؟ در سطح بالا، مدل‌های مولد الگوهایی را در داده‌ها با هدف تولید داده‌های جدید اما مشابه یاد می‌گیرند. مدل های مولد مانند زیر هستند:

  • کمدین هایی که با مشاهده رفتارها و سبک حرف زدن افراد یاد می گیرند که از دیگران تقلید کنند
  • هنرمندانی که با مطالعه تعداد زیادی نقاشی در آن سبک نقاشی را در سبک خاصی یاد می گیرند
  • گروه‌هایی را پوشش دهید که یاد می‌گیرند مانند یک گروه موسیقی خاص با گوش دادن به موسیقی زیاد آن گروه صدا کنند

برای تولید خروجی‌های منحصربه‌فرد و خلاقانه، مدل‌های مولد در ابتدا با استفاده از رویکردی بدون نظارت آموزش داده می‌شوند، جایی که مدل یاد می‌گیرد داده‌هایی را که روی آن آموزش داده شده است تقلید کند. این مدل گاهی اوقات با استفاده از یادگیری تحت نظارت یا تقویتی بر روی داده‌های خاص مرتبط با وظایفی که ممکن است از مدل خواسته شود، آموزش داده می‌شود، برای مثال، خلاصه کردن یک مقاله یا ویرایش یک عکس.

هوش مصنوعی مولد یک فناوری به سرعت در حال تکامل است که موارد استفاده جدید دائماً کشف می شود. برای مثال، مدل‌های مولد به کسب‌وکارها کمک می‌کنند تا با حذف خودکار پس‌زمینه‌های مزاحم یا بهبود کیفیت تصاویر با وضوح پایین، تصاویر محصولات تجارت الکترونیک خود را اصلاح کنند.