ওভারফিটিং: ক্ষতি বক্ররেখা ব্যাখ্যা করা

মেশিন লার্নিং অনেক সহজ হবে যদি আপনি প্রথমবার আপনার মডেলকে প্রশিক্ষণ দেওয়ার সময় আপনার সমস্ত ক্ষতির বক্ররেখা এইরকম দেখায়:

চিত্র 20. একটি মেশিন লার্নিং মডেল প্রশিক্ষণের সময় আদর্শ ক্ষতির বক্ররেখা দেখানো একটি প্লট। লস বক্ররেখা x-অক্ষে প্রশিক্ষণের ধাপের সংখ্যার বিপরীতে y-অক্ষে লস প্লট করে। প্রশিক্ষণের ধাপের সংখ্যা বাড়ার সাথে সাথে ক্ষতি বেশি হতে শুরু করে, তারপরে দ্রুত হ্রাস পায় এবং শেষ পর্যন্ত ন্যূনতম ক্ষতিতে পৌঁছাতে সমতল হয়।
চিত্র 20. একটি আদর্শ ক্ষতি বক্ররেখা।

দুর্ভাগ্যবশত, ক্ষতি বক্ররেখা প্রায়ই ব্যাখ্যা করা চ্যালেঞ্জিং হয়. এই পৃষ্ঠায় ব্যায়াম সমাধান করতে ক্ষতি বক্ররেখা সম্পর্কে আপনার অন্তর্দৃষ্টি ব্যবহার করুন.

ব্যায়াম 1: দোদুল্যমান ক্ষতি বক্ররেখা

চিত্র 21. একটি ক্ষতির বক্ররেখা (y-অক্ষের ক্ষতি; x-অক্ষে প্রশিক্ষণের ধাপের সংখ্যা) যেখানে ক্ষতি সমতল হয় না।             পরিবর্তে, ক্ষতি অনিয়মিতভাবে oscillates.
চিত্র 21. দোদুল্যমান ক্ষতি বক্ররেখা।
চিত্র 21-এ দেখানো ক্ষতির বক্ররেখা উন্নত করার চেষ্টা করার জন্য আপনি কী তিনটি জিনিস করতে পারেন।
খারাপ উদাহরণ সনাক্ত করতে একটি ডেটা স্কিমার বিরুদ্ধে আপনার ডেটা পরীক্ষা করুন এবং তারপর প্রশিক্ষণ সেট থেকে খারাপ উদাহরণগুলি সরিয়ে দিন।
হ্যাঁ, এটি সমস্ত মডেলের জন্য একটি ভাল অনুশীলন।
শেখার হার কমিয়ে দিন।
হ্যাঁ, প্রশিক্ষণের সমস্যা ডিবাগ করার সময় শেখার হার হ্রাস করা প্রায়শই একটি ভাল ধারণা।
অল্প সংখ্যক বিশ্বস্ত উদাহরণে প্রশিক্ষণ সেট কমিয়ে দিন।
যদিও এই কৌশলটি কৃত্রিম মনে হয়, এটি আসলে একটি ভাল ধারণা। অনুমান করে যে মডেলটি বিশ্বাসযোগ্য উদাহরণের ছোট সেটে একত্রিত হয়, আপনি ধীরে ধীরে আরও উদাহরণ যোগ করতে পারেন, সম্ভবত কোন উদাহরণগুলি ক্ষতির বক্ররেখাকে দোদুল্যমান করে তা আবিষ্কার করতে পারেন।
প্রশিক্ষণ সেটে উদাহরণের সংখ্যা বাড়ান।
এটি একটি প্রলোভনসঙ্কুল ধারণা, কিন্তু এটি সমস্যার সমাধান করার সম্ভাবনা খুবই কম।
শেখার হার বাড়ান।
সাধারণভাবে, যখন কোনো মডেলের শেখার বক্ররেখা কোনো সমস্যা নির্দেশ করে তখন শেখার হার বাড়ানো এড়িয়ে চলুন।

ব্যায়াম 2. একটি ধারালো লাফ দিয়ে ক্ষতি বক্ররেখা

চিত্র 22. একটি ক্ষতির বক্ররেখার প্লট যা দেখায় যে ক্ষয়ক্ষতি একটি নির্দিষ্ট সংখ্যক প্রশিক্ষণের ধাপ পর্যন্ত হ্রাস পাচ্ছে এবং তারপরে আরও প্রশিক্ষণের ধাপগুলির সাথে হঠাৎ বৃদ্ধি পাচ্ছে।
চিত্র 22. ক্ষতির তীব্র বৃদ্ধি।
নিচের কোন দুটি বিবৃতি চিত্র 22-এ দেখানো বিস্ফোরণ ক্ষতির সম্ভাব্য কারণ চিহ্নিত করে।
ইনপুট ডেটাতে এক বা একাধিক NaN থাকে—উদাহরণস্বরূপ, শূন্য দ্বারা বিভাজনের কারণে একটি মান।
এটি আপনার প্রত্যাশার চেয়ে বেশি সাধারণ।
ইনপুট ডেটাতে আউটলায়ারগুলির একটি বিস্ফোরণ রয়েছে৷
কখনও কখনও, ব্যাচগুলির অনুপযুক্ত পরিবর্তনের কারণে, একটি ব্যাচে প্রচুর আউটলায়ার থাকতে পারে।
শেখার হার খুবই কম।
খুব কম শেখার হার প্রশিক্ষণের সময় বাড়াতে পারে, কিন্তু এটি অদ্ভুত ক্ষতির বক্ররেখার কারণ নয়।
নিয়মিতকরণের হার খুব বেশি।
সত্য, একটি খুব উচ্চ নিয়মিতকরণ একটি মডেলকে একত্রিত হতে বাধা দিতে পারে; যাইহোক, এটি চিত্র 22-এ দেখানো অদ্ভুত ক্ষতির বক্ররেখা সৃষ্টি করবে না।

অনুশীলন 3. পরীক্ষার ক্ষতি প্রশিক্ষণের ক্ষতি থেকে বিচ্ছিন্ন হয়

চিত্র 23. প্রশিক্ষণের ক্ষতির বক্ররেখা একত্রিত হতে দেখা যায়, তবে একটি নির্দিষ্ট সংখ্যক প্রশিক্ষণের পদক্ষেপের পরে বৈধতা ক্ষতি বাড়তে শুরু করে।
চিত্র 23. বৈধতা ক্ষতির তীব্র বৃদ্ধি।
নিচের কোন বিবৃতিটি প্রশিক্ষণ এবং পরীক্ষার সেটের ক্ষতির বক্ররেখার মধ্যে এই পার্থক্যের কারণটি সবচেয়ে ভালোভাবে চিহ্নিত করে?
মডেল প্রশিক্ষণ সেট overfitting হয়.
হ্যাঁ, এটা সম্ভবত. সম্ভাব্য সমাধান:
  • মডেলটিকে সহজ করুন, সম্ভবত বৈশিষ্ট্যের সংখ্যা হ্রাস করে৷
  • নিয়মিতকরণের হার বাড়ান।
  • নিশ্চিত করুন যে প্রশিক্ষণ সেট এবং পরীক্ষার সেট পরিসংখ্যানগতভাবে সমতুল্য।
শেখার হার খুব বেশি।
শেখার হার খুব বেশি হলে, প্রশিক্ষণ সেটের ক্ষতির বক্ররেখা সম্ভবত এটির মতো আচরণ করত না।

ব্যায়াম 4. ক্ষতির বক্ররেখা আটকে যায়

চিত্র 24. একটি ক্ষতি বক্ররেখার একটি প্লট যা দেখায় যে ক্ষতিটি প্রশিক্ষণের সাথে একত্রিত হতে শুরু করে কিন্তু তারপরে একটি আয়তক্ষেত্রাকার তরঙ্গের মতো দেখতে বারবার প্যাটার্ন প্রদর্শন করে।
চিত্র 24. একটি নির্দিষ্ট সংখ্যক ধাপের পরে বিশৃঙ্খল ক্ষতি।
চিত্র 24-এ দেখানো অনিয়মিত ক্ষতি বক্ররেখার জন্য নিম্নলিখিত বিবৃতিগুলির মধ্যে কোনটি সম্ভাব্য ব্যাখ্যা?
প্রশিক্ষণ সেটে উদাহরণের পুনরাবৃত্তিমূলক ক্রম রয়েছে।
এটি একটি সম্ভাবনা। আপনি যথেষ্ট উদাহরণ এলোমেলো করা হয় তা নিশ্চিত করুন.
নিয়মিতকরণের হার খুব বেশি।
এই কারণ হতে অসম্ভাব্য.
প্রশিক্ষণ সেটে অনেকগুলি বৈশিষ্ট্য রয়েছে৷
এই কারণ হতে অসম্ভাব্য.