মেশিন লার্নিং অনেক সহজ হবে যদি আপনি প্রথমবার আপনার মডেলকে প্রশিক্ষণ দেওয়ার সময় আপনার সমস্ত ক্ষতির বক্ররেখা এইরকম দেখায়:
দুর্ভাগ্যবশত, ক্ষতি বক্ররেখা প্রায়ই ব্যাখ্যা করা চ্যালেঞ্জিং হয়. এই পৃষ্ঠায় ব্যায়াম সমাধান করতে ক্ষতি বক্ররেখা সম্পর্কে আপনার অন্তর্দৃষ্টি ব্যবহার করুন.
ব্যায়াম 1: দোদুল্যমান ক্ষতি বক্ররেখা
চিত্র 21-এ দেখানো ক্ষতির বক্ররেখা উন্নত করার চেষ্টা করার জন্য আপনি কী তিনটি জিনিস করতে পারেন।
খারাপ উদাহরণ সনাক্ত করতে একটি ডেটা স্কিমার বিরুদ্ধে আপনার ডেটা পরীক্ষা করুন এবং তারপর প্রশিক্ষণ সেট থেকে খারাপ উদাহরণগুলি সরিয়ে দিন।
হ্যাঁ, এটি সমস্ত মডেলের জন্য একটি ভাল অনুশীলন।
শেখার হার কমিয়ে দিন।
হ্যাঁ, প্রশিক্ষণের সমস্যা ডিবাগ করার সময় শেখার হার হ্রাস করা প্রায়শই একটি ভাল ধারণা।
অল্প সংখ্যক বিশ্বস্ত উদাহরণে প্রশিক্ষণ সেট কমিয়ে দিন।
যদিও এই কৌশলটি কৃত্রিম মনে হয়, এটি আসলে একটি ভাল ধারণা। অনুমান করে যে মডেলটি বিশ্বাসযোগ্য উদাহরণের ছোট সেটে একত্রিত হয়, আপনি ধীরে ধীরে আরও উদাহরণ যোগ করতে পারেন, সম্ভবত কোন উদাহরণগুলি ক্ষতির বক্ররেখাকে দোদুল্যমান করে তা আবিষ্কার করতে পারেন।
প্রশিক্ষণ সেটে উদাহরণের সংখ্যা বাড়ান।
এটি একটি প্রলোভনসঙ্কুল ধারণা, কিন্তু এটি সমস্যার সমাধান করার সম্ভাবনা খুবই কম।
শেখার হার বাড়ান।
সাধারণভাবে, যখন কোনো মডেলের শেখার বক্ররেখা কোনো সমস্যা নির্দেশ করে তখন শেখার হার বাড়ানো এড়িয়ে চলুন।
ব্যায়াম 2. একটি ধারালো লাফ দিয়ে ক্ষতি বক্ররেখা
নিচের কোন দুটি বিবৃতি চিত্র 22-এ দেখানো বিস্ফোরণ ক্ষতির সম্ভাব্য কারণ চিহ্নিত করে।
ইনপুট ডেটাতে এক বা একাধিক NaN থাকে—উদাহরণস্বরূপ, শূন্য দ্বারা বিভাজনের কারণে একটি মান।
এটি আপনার প্রত্যাশার চেয়ে বেশি সাধারণ।
ইনপুট ডেটাতে আউটলায়ারগুলির একটি বিস্ফোরণ রয়েছে৷
কখনও কখনও, ব্যাচগুলির অনুপযুক্ত পরিবর্তনের কারণে, একটি ব্যাচে প্রচুর আউটলায়ার থাকতে পারে।
শেখার হার খুবই কম।
খুব কম শেখার হার প্রশিক্ষণের সময় বাড়াতে পারে, কিন্তু এটি অদ্ভুত ক্ষতির বক্ররেখার কারণ নয়।
নিয়মিতকরণের হার খুব বেশি।
সত্য, একটি খুব উচ্চ নিয়মিতকরণ একটি মডেলকে একত্রিত হতে বাধা দিতে পারে; যাইহোক, এটি চিত্র 22-এ দেখানো অদ্ভুত ক্ষতির বক্ররেখা সৃষ্টি করবে না।
অনুশীলন 3. পরীক্ষার ক্ষতি প্রশিক্ষণের ক্ষতি থেকে বিচ্ছিন্ন হয়
নিচের কোন বিবৃতিটি প্রশিক্ষণ এবং পরীক্ষার সেটের ক্ষতির বক্ররেখার মধ্যে এই পার্থক্যের কারণটি সবচেয়ে ভালোভাবে চিহ্নিত করে?
মডেল প্রশিক্ষণ সেট overfitting হয়.
হ্যাঁ, এটা সম্ভবত. সম্ভাব্য সমাধান:
- মডেলটিকে সহজ করুন, সম্ভবত বৈশিষ্ট্যের সংখ্যা হ্রাস করে৷
- নিয়মিতকরণের হার বাড়ান।
- নিশ্চিত করুন যে প্রশিক্ষণ সেট এবং পরীক্ষার সেট পরিসংখ্যানগতভাবে সমতুল্য।
শেখার হার খুব বেশি।
শেখার হার খুব বেশি হলে, প্রশিক্ষণ সেটের ক্ষতির বক্ররেখা সম্ভবত এটির মতো আচরণ করত না।
ব্যায়াম 4. ক্ষতির বক্ররেখা আটকে যায়
চিত্র 24-এ দেখানো অনিয়মিত ক্ষতি বক্ররেখার জন্য নিম্নলিখিত বিবৃতিগুলির মধ্যে কোনটি সম্ভাব্য ব্যাখ্যা?
প্রশিক্ষণ সেটে উদাহরণের পুনরাবৃত্তিমূলক ক্রম রয়েছে।
এটি একটি সম্ভাবনা। আপনি যথেষ্ট উদাহরণ এলোমেলো করা হয় তা নিশ্চিত করুন.
নিয়মিতকরণের হার খুব বেশি।
এই কারণ হতে অসম্ভাব্য.
প্রশিক্ষণ সেটে অনেকগুলি বৈশিষ্ট্য রয়েছে৷
এই কারণ হতে অসম্ভাব্য.