নিরাপত্তা নির্দেশিকা

জেনারেটিভ কৃত্রিম বুদ্ধিমত্তা মডেলগুলি শক্তিশালী সরঞ্জাম, কিন্তু তারা তাদের সীমাবদ্ধতা ছাড়া নয়। তাদের বহুমুখিতা এবং প্রযোজ্যতা কখনও কখনও অপ্রত্যাশিত আউটপুটের দিকে নিয়ে যেতে পারে, যেমন আউটপুটগুলি ভুল, পক্ষপাতদুষ্ট বা আপত্তিকর। এই ধরনের আউটপুট থেকে ক্ষতির ঝুঁকি সীমিত করার জন্য পোস্ট-প্রসেসিং, এবং কঠোর ম্যানুয়াল মূল্যায়ন অপরিহার্য।

জেমিনি API দ্বারা প্রদত্ত মডেলগুলি বিভিন্ন ধরণের জেনারেটিভ এআই এবং প্রাকৃতিক ভাষা প্রক্রিয়াকরণ (NLP) অ্যাপ্লিকেশনের জন্য ব্যবহার করা যেতে পারে। এই ফাংশনগুলির ব্যবহার শুধুমাত্র Gemini API বা Google AI Studio ওয়েব অ্যাপের মাধ্যমে উপলব্ধ। আপনার জেমিনি API-এর ব্যবহার জেনারেটিভ AI নিষিদ্ধ ব্যবহারের নীতি এবং জেমিনি API পরিষেবার শর্তাবলীর অধীন৷

বড় ল্যাঙ্গুয়েজ মডেল (LLMs) কে এতটা উপযোগী করে তোলে তার একটা অংশ হল সেগুলি হল সৃজনশীল টুল যা বিভিন্ন ভাষার কাজগুলিকে সমাধান করতে পারে। দুর্ভাগ্যবশত, এর মানে হল যে বড় ভাষার মডেলগুলি এমন আউটপুট তৈরি করতে পারে যা আপনি আশা করেন না, আপত্তিকর, সংবেদনশীল, বা বাস্তবিকভাবে ভুল পাঠ্য সহ। আরও কী, এই মডেলগুলির অবিশ্বাস্য বহুমুখিতাও এটি যা তারা ঠিক কী ধরণের অবাঞ্ছিত আউটপুট তৈরি করতে পারে তা অনুমান করা কঠিন করে তোলে। যদিও Gemini API-কে Google-এর AI নীতিগুলি মাথায় রেখে ডিজাইন করা হয়েছে, এই মডেলগুলিকে দায়িত্বশীলভাবে প্রয়োগ করার দায়িত্ব ডেভেলপারদের উপর। নিরাপদ, দায়িত্বশীল অ্যাপ্লিকেশন তৈরিতে ডেভেলপারদের সাহায্য করার জন্য, Gemini API-তে কিছু অন্তর্নির্মিত সামগ্রী ফিল্টারিং এবং সেইসাথে ক্ষতির 4 মাত্রা জুড়ে সামঞ্জস্যযোগ্য নিরাপত্তা সেটিংস রয়েছে। আরও জানতে নিরাপত্তা সেটিংস নির্দেশিকা পড়ুন।

এই নথিটি আপনাকে কিছু নিরাপত্তা ঝুঁকির সাথে পরিচয় করিয়ে দেওয়ার জন্য যা এলএলএম ব্যবহার করার সময় উদ্ভূত হতে পারে এবং উদীয়মান সুরক্ষা নকশা এবং উন্নয়নের সুপারিশগুলি সুপারিশ করে৷ (উল্লেখ্য যে আইন এবং প্রবিধানগুলিও বিধিনিষেধ আরোপ করতে পারে, তবে এই ধরনের বিবেচনাগুলি এই গাইডের সুযোগের বাইরে।)

এলএলএম-এর মাধ্যমে অ্যাপ্লিকেশন তৈরি করার সময় নিম্নলিখিত পদক্ষেপগুলি সুপারিশ করা হয়:

আপনার আবেদনের নিরাপত্তা ঝুঁকি বোঝা
নিরাপত্তা ঝুঁকি প্রশমিত করার জন্য সমন্বয় বিবেচনা করা
আপনার ব্যবহারের ক্ষেত্রে উপযুক্ত নিরাপত্তা পরীক্ষা করা
ব্যবহারকারীদের কাছ থেকে প্রতিক্রিয়া চাওয়া এবং ব্যবহার পর্যবেক্ষণ করা

সামঞ্জস্য এবং পরীক্ষার পর্যায়গুলি পুনরাবৃত্তিমূলক হওয়া উচিত যতক্ষণ না আপনি আপনার অ্যাপ্লিকেশনের জন্য উপযুক্ত কর্মক্ষমতা পৌঁছান।

মডেল বাস্তবায়ন চক্র

আপনার আবেদনের নিরাপত্তা ঝুঁকি বুঝতে

এই প্রেক্ষাপটে, নিরাপত্তাকে সংজ্ঞায়িত করা হচ্ছে LLM-এর ক্ষমতা হিসেবে ব্যবহারকারীদের ক্ষতি না করার জন্য, উদাহরণস্বরূপ, বিষাক্ত ভাষা বা বিষয়বস্তু তৈরি করে যা স্টেরিওটাইপ প্রচার করে। Gemini API-এর মাধ্যমে উপলব্ধ মডেলগুলি Google-এর AI নীতিগুলিকে মাথায় রেখে ডিজাইন করা হয়েছে এবং আপনার এটি ব্যবহার জেনারেটিভ AI নিষিদ্ধ ব্যবহারের নীতির অধীন৷ এপিআই কিছু সাধারণ ভাষার মডেল সমস্যা যেমন বিষাক্ত ভাষা এবং ঘৃণাত্মক বক্তৃতা মোকাবেলায় সহায়তা করার জন্য অন্তর্নির্মিত নিরাপত্তা ফিল্টার সরবরাহ করে এবং অন্তর্ভুক্তি এবং স্টেরিওটাইপগুলি এড়ানোর জন্য প্রচেষ্টা করে। যাইহোক, প্রতিটি অ্যাপ্লিকেশন তার ব্যবহারকারীদের জন্য বিভিন্ন ঝুঁকি তৈরি করতে পারে। তাই অ্যাপ্লিকেশানের মালিক হিসাবে, আপনি আপনার ব্যবহারকারীদের জানার জন্য এবং আপনার অ্যাপ্লিকেশানের কারণে হতে পারে এমন সম্ভাব্য ক্ষতিগুলি জানার জন্য এবং আপনার অ্যাপ্লিকেশানটি নিরাপদে এবং দায়িত্বের সাথে LLM ব্যবহার করছে তা নিশ্চিত করার জন্য দায়ী৷

এই মূল্যায়নের অংশ হিসাবে, আপনার ক্ষতি হওয়ার সম্ভাবনা বিবেচনা করা উচিত এবং এর গুরুতরতা এবং প্রশমনের পদক্ষেপগুলি নির্ধারণ করা উচিত। উদাহরণ স্বরূপ, একটি অ্যাপ যেটি বাস্তব ঘটনার উপর ভিত্তি করে প্রবন্ধ তৈরি করে তাকে ভুল তথ্য এড়াতে আরও সতর্ক হতে হবে, এমন একটি অ্যাপের তুলনায় যা বিনোদনের জন্য কাল্পনিক গল্প তৈরি করে। সম্ভাব্য নিরাপত্তা ঝুঁকিগুলি অন্বেষণ শুরু করার একটি ভাল উপায় হল আপনার শেষ ব্যবহারকারীদের এবং আপনার অ্যাপ্লিকেশনের ফলাফল দ্বারা প্রভাবিত হতে পারে এমন অন্যদের গবেষণা করা৷ এটি আপনার অ্যাপ ডোমেনের অত্যাধুনিক অধ্যয়নের গবেষণা, লোকেরা কীভাবে অনুরূপ অ্যাপগুলি ব্যবহার করছে তা পর্যবেক্ষণ করা, বা ব্যবহারকারীর অধ্যয়ন চালানো, সমীক্ষা চালানো বা সম্ভাব্য ব্যবহারকারীদের সাথে অনানুষ্ঠানিক সাক্ষাৎকার পরিচালনা সহ অনেকগুলি রূপ নিতে পারে৷

উন্নত টিপস

আপনার আবেদন এবং এর উদ্দিষ্ট উদ্দেশ্য সম্পর্কে আপনার লক্ষ্য জনসংখ্যার মধ্যে সম্ভাব্য ব্যবহারকারীদের একটি বৈচিত্র্যময় মিশ্রণের সাথে কথা বলুন যাতে সম্ভাব্য ঝুঁকিগুলির উপর একটি বিস্তৃত দৃষ্টিভঙ্গি পেতে এবং প্রয়োজন অনুসারে বৈচিত্র্যের মানদণ্ড সামঞ্জস্য করতে।
মার্কিন সরকারের ন্যাশনাল ইনস্টিটিউট অফ স্ট্যান্ডার্ডস অ্যান্ড টেকনোলজি (এনআইএসটি) দ্বারা প্রকাশিত এআই রিস্ক ম্যানেজমেন্ট ফ্রেমওয়ার্ক এআই ঝুঁকি ব্যবস্থাপনার জন্য আরও বিশদ নির্দেশিকা এবং অতিরিক্ত শিক্ষার সংস্থান সরবরাহ করে।
ভাষা মডেল থেকে ক্ষতির নৈতিক এবং সামাজিক ঝুঁকির উপর DeepMind-এর প্রকাশনা ভাষা মডেল অ্যাপ্লিকেশন ক্ষতির কারণ হতে পারে এমন উপায়গুলি বিশদভাবে বর্ণনা করে।

নিরাপত্তা ঝুঁকি কমাতে সমন্বয় বিবেচনা করুন

এখন যেহেতু আপনি ঝুঁকিগুলি বুঝতে পেরেছেন, আপনি কীভাবে সেগুলি প্রশমিত করবেন তা নির্ধারণ করতে পারেন৷ কোন ঝুঁকিগুলিকে প্রাধান্য দিতে হবে এবং সেগুলি প্রতিরোধ করার জন্য আপনার কতটা চেষ্টা করা উচিত তা নির্ধারণ করা একটি সফ্টওয়্যার প্রকল্পে ট্রাইজিং বাগগুলির মতোই একটি গুরুত্বপূর্ণ সিদ্ধান্ত। একবার আপনি অগ্রাধিকার নির্ধারণ করে নিলে, আপনি কোন ধরনের প্রশমনের ধরনগুলি সম্পর্কে চিন্তা করা শুরু করতে পারেন যা সবচেয়ে উপযুক্ত হবে। প্রায়শই সাধারণ পরিবর্তনগুলি একটি পার্থক্য করতে পারে এবং ঝুঁকি কমাতে পারে।

উদাহরণস্বরূপ, একটি অ্যাপ্লিকেশন ডিজাইন করার সময় বিবেচনা করুন:

আপনার অ্যাপ্লিকেশন প্রসঙ্গে কী গ্রহণযোগ্য তা আরও ভালভাবে প্রতিফলিত করতে মডেল আউটপুট টিউন করা হচ্ছে । টিউনিং মডেলের আউটপুটকে আরও অনুমানযোগ্য এবং সামঞ্জস্যপূর্ণ করে তুলতে পারে এবং তাই কিছু ঝুঁকি কমাতে সাহায্য করতে পারে।
একটি ইনপুট পদ্ধতি প্রদান করা যা নিরাপদ আউটপুট সুবিধা দেয়। আপনি একটি LLM-কে যে সঠিক ইনপুট দেন তা আউটপুটের গুণমানে পার্থক্য আনতে পারে। আপনার ব্যবহারের ক্ষেত্রে সবচেয়ে নিরাপদে কী কাজ করে তা খুঁজে বের করার জন্য ইনপুট প্রম্পটগুলির সাথে পরীক্ষা করা প্রচেষ্টার মূল্যবান, কারণ আপনি তখন একটি UX প্রদান করতে পারেন যা এটিকে সহজ করে তোলে। উদাহরণস্বরূপ, আপনি ব্যবহারকারীদের শুধুমাত্র ইনপুট প্রম্পটগুলির একটি ড্রপ-ডাউন তালিকা থেকে চয়ন করতে সীমাবদ্ধ করতে পারেন, অথবা বর্ণনামূলক বাক্যাংশগুলির সাথে পপ-আপ প্রস্তাবনা অফার করতে পারেন যা আপনি আপনার অ্যাপ্লিকেশন প্রসঙ্গে নিরাপদে সম্পাদন করতে পেয়েছেন৷
ব্যবহারকারীকে দেখানোর আগে অনিরাপদ ইনপুট ব্লক করা এবং আউটপুট ফিল্টার করা। সাধারণ পরিস্থিতিতে, প্রম্পট বা প্রতিক্রিয়াগুলিতে অনিরাপদ শব্দ বা বাক্যাংশগুলি সনাক্ত করতে এবং ব্লক করতে ব্লকলিস্ট ব্যবহার করা যেতে পারে, অথবা মানব পর্যালোচকদের এই ধরনের সামগ্রী ম্যানুয়ালি পরিবর্তন বা ব্লক করতে হবে।
দ্রষ্টব্য: একটি স্থির তালিকার উপর ভিত্তি করে স্বয়ংক্রিয়ভাবে ব্লক করা অনিচ্ছাকৃত ফলাফল হতে পারে যেমন একটি নির্দিষ্ট গোষ্ঠীকে লক্ষ্য করে যা সাধারণত ব্লকলিস্টে শব্দভান্ডার ব্যবহার করে।
সম্ভাব্য ক্ষতি বা প্রতিকূল সংকেত সহ প্রতিটি প্রম্পটকে লেবেল করতে প্রশিক্ষিত শ্রেণীবদ্ধকারী ব্যবহার করে। তারপরে সনাক্ত করা ক্ষতির ধরণের উপর ভিত্তি করে অনুরোধটি কীভাবে পরিচালনা করা যায় সে সম্পর্কে বিভিন্ন কৌশল অবলম্বন করা যেতে পারে। উদাহরণস্বরূপ, যদি ইনপুটটি স্পষ্টতই প্রতিপক্ষ বা অপমানজনক প্রকৃতির হয়, তবে এটিকে অবরুদ্ধ করা যেতে পারে এবং পরিবর্তে একটি প্রি-স্ক্রিপ্টেড প্রতিক্রিয়া আউটপুট করা যেতে পারে।
উন্নত টিপ
- যদি সংকেতগুলি আউটপুটকে ক্ষতিকারক বলে নির্ধারণ করে, তবে অ্যাপ্লিকেশনটি নিম্নলিখিত বিকল্পগুলি নিয়োগ করতে পারে:
  - একটি ত্রুটি বার্তা বা প্রি-স্ক্রিপ্টেড আউটপুট প্রদান করুন।
  - প্রম্পটটি আবার চেষ্টা করুন, যদি একটি বিকল্প নিরাপদ আউটপুট তৈরি করা হয়, যেহেতু কখনও কখনও একই প্রম্পট বিভিন্ন আউটপুট বের করে।
ইচ্ছাকৃত অপব্যবহারের বিরুদ্ধে সুরক্ষা ব্যবস্থা রাখা যেমন প্রতিটি ব্যবহারকারীকে একটি অনন্য আইডি বরাদ্দ করা এবং একটি নির্দিষ্ট সময়ের মধ্যে জমা দেওয়া যেতে পারে এমন ব্যবহারকারীর প্রশ্নের পরিমাণের উপর একটি সীমা আরোপ করা। আরেকটি সুরক্ষা হল সম্ভাব্য প্রম্পট ইনজেকশনের বিরুদ্ধে চেষ্টা করা এবং রক্ষা করা। প্রম্পট ইনজেকশন, অনেকটা এসকিউএল ইনজেকশনের মতো, দূষিত ব্যবহারকারীদের জন্য একটি ইনপুট প্রম্পট ডিজাইন করার একটি উপায় যা মডেলের আউটপুট ম্যানিপুলেট করে, উদাহরণস্বরূপ, একটি ইনপুট প্রম্পট পাঠানোর মাধ্যমে যা মডেলটিকে পূর্ববর্তী কোনো উদাহরণ উপেক্ষা করার নির্দেশ দেয়। ইচ্ছাকৃত অপব্যবহার সম্পর্কে বিস্তারিত জানার জন্য জেনারেটিভ এআই নিষিদ্ধ ব্যবহারের নীতি দেখুন।
এমন কিছুর সাথে কার্যকারিতা সামঞ্জস্য করা যা সহজাতভাবে কম ঝুঁকিপূর্ণ। যে কাজগুলি পরিধিতে সংকীর্ণ (যেমন, পাঠ্যের প্যাসেজ থেকে কীওয়ার্ড বের করা) বা যেগুলির মানবিক তত্ত্বাবধান বেশি (যেমন, সংক্ষিপ্ত আকারের সামগ্রী তৈরি করা যা একজন মানুষের দ্বারা পর্যালোচনা করা হবে), প্রায়শই কম ঝুঁকি তৈরি করে। সুতরাং উদাহরণস্বরূপ, স্ক্র্যাচ থেকে একটি ইমেল উত্তর লেখার জন্য একটি অ্যাপ্লিকেশন তৈরি করার পরিবর্তে, আপনি এটিকে একটি রূপরেখা বা বিকল্প বাক্যাংশের পরামর্শ দেওয়ার পরিবর্তে এটিকে সীমাবদ্ধ করতে পারেন।

আপনার ব্যবহারের ক্ষেত্রে উপযুক্ত নিরাপত্তা পরীক্ষা করুন

দৃঢ় এবং নিরাপদ অ্যাপ্লিকেশন তৈরির জন্য পরীক্ষা একটি মূল অংশ, তবে পরীক্ষার জন্য পরিধি, সুযোগ এবং কৌশলগুলি পরিবর্তিত হবে। উদাহরণ স্বরূপ, শুধুমাত্র মজার জন্য হাইকু জেনারেটর সম্ভবত কম গুরুতর ঝুঁকি তৈরি করতে পারে, বলুন, আইনী নথিগুলির সংক্ষিপ্তসার এবং খসড়া চুক্তিতে সহায়তা করার জন্য আইন সংস্থাগুলির দ্বারা ব্যবহারের জন্য ডিজাইন করা একটি অ্যাপ্লিকেশন। কিন্তু হাইকু জেনারেটরটি বিস্তৃত ব্যবহারকারীদের দ্বারা ব্যবহার করা যেতে পারে যার অর্থ প্রতিপক্ষের প্রচেষ্টা বা এমনকি অনিচ্ছাকৃত ক্ষতিকারক ইনপুটগুলির সম্ভাবনা বেশি হতে পারে। বাস্তবায়নের প্রেক্ষাপটও গুরুত্বপূর্ণ। উদাহরণস্বরূপ, আউটপুট সহ একটি অ্যাপ্লিকেশন যা মানব বিশেষজ্ঞদের দ্বারা পর্যালোচনা করা হয় কোনো পদক্ষেপ নেওয়ার আগে সেগুলিকে এই ধরনের তদারকি ছাড়া অভিন্ন অ্যাপ্লিকেশনের চেয়ে ক্ষতিকারক আউটপুট তৈরি করার সম্ভাবনা কম বলে মনে করা যেতে পারে।

এটা অস্বাভাবিক নয় যে আপনি লঞ্চ করার জন্য প্রস্তুত এমন আত্মবিশ্বাসী বোধ করার আগে পরিবর্তন এবং পরীক্ষার বিভিন্ন পুনরাবৃত্তির মধ্য দিয়ে যাওয়া, এমনকি এমন অ্যাপ্লিকেশনগুলির জন্যও যা অপেক্ষাকৃত কম ঝুঁকিপূর্ণ। এআই অ্যাপ্লিকেশনের জন্য দুটি ধরণের পরীক্ষা বিশেষভাবে কার্যকর:

সেফটি বেঞ্চমার্কিং এর মধ্যে নিরাপত্তা মেট্রিক্স ডিজাইন করা জড়িত যা আপনার অ্যাপ্লিকেশনটি কীভাবে ব্যবহার করা যেতে পারে তার পরিপ্রেক্ষিতে কীভাবে অনিরাপদ হতে পারে তা প্রতিফলিত করে, তারপরে মূল্যায়ন ডেটাসেট ব্যবহার করে আপনার অ্যাপ্লিকেশনটি মেট্রিক্সে কতটা ভাল কাজ করে তা পরীক্ষা করে। পরীক্ষার আগে নিরাপত্তা মেট্রিকগুলির ন্যূনতম গ্রহণযোগ্য স্তরগুলি সম্পর্কে চিন্তা করা ভাল অভ্যাস যাতে 1) আপনি সেই প্রত্যাশাগুলির বিপরীতে পরীক্ষার ফলাফলগুলি মূল্যায়ন করতে পারেন এবং 2) আপনি যে সমস্ত মেট্রিকগুলিকে সবচেয়ে বেশি গুরুত্ব দেন তার মূল্যায়ন করে এমন পরীক্ষার উপর ভিত্তি করে আপনি মূল্যায়ন ডেটাসেট সংগ্রহ করতে পারেন৷
উন্নত টিপস
- "শেল্ফের বাইরে" পন্থাগুলির উপর অত্যধিক নির্ভর করা থেকে সতর্ক থাকুন কারণ এটি সম্ভবত আপনার অ্যাপ্লিকেশনের প্রেক্ষাপটের সাথে পুরোপুরি মানানসই করার জন্য মানব রেটার ব্যবহার করে আপনার নিজস্ব টেস্টিং ডেটাসেট তৈরি করতে হবে৷
- আপনার যদি একাধিক মেট্রিক থাকে তবে আপনাকে সিদ্ধান্ত নিতে হবে যে আপনি কীভাবে লেনদেন করবেন যদি একটি পরিবর্তনের ফলে একটি মেট্রিকের উন্নতি অন্যটির ক্ষতি হয়। অন্যান্য পারফরম্যান্স ইঞ্জিনিয়ারিংয়ের মতো, আপনি গড় পারফরম্যান্সের পরিবর্তে আপনার মূল্যায়ন সেট জুড়ে সবচেয়ে খারাপ-কেস পারফরম্যান্সের উপর ফোকাস করতে চাইতে পারেন।
প্রতিকূল পরীক্ষায় সক্রিয়ভাবে আপনার আবেদন ভাঙ্গার চেষ্টা জড়িত। লক্ষ্য হল দুর্বলতার পয়েন্টগুলি চিহ্নিত করা যাতে আপনি যথাযথভাবে তাদের প্রতিকারের জন্য পদক্ষেপ নিতে পারেন। প্রতিকূল পরীক্ষা আপনার অ্যাপ্লিকেশনে দক্ষতার সাথে মূল্যায়নকারীদের কাছ থেকে উল্লেখযোগ্য সময়/প্রচেষ্টা নিতে পারে — কিন্তু আপনি যত বেশি করবেন, আপনার সমস্যাগুলি চিহ্নিত করার সম্ভাবনা তত বেশি হবে, বিশেষ করে যেগুলি খুব কমই বা অ্যাপ্লিকেশনটি বারবার চালানোর পরে ঘটে।
- প্রতিকূল পরীক্ষা হল দূষিত বা অসাবধানতাবশত ক্ষতিকারক ইনপুট দেওয়া হলে এটি কীভাবে আচরণ করে তা শেখার অভিপ্রায়ে একটি এমএল মডেলকে পদ্ধতিগতভাবে মূল্যায়ন করার একটি পদ্ধতি:
  - একটি ইনপুট দূষিত হতে পারে যখন ইনপুটটি পরিষ্কারভাবে একটি অনিরাপদ বা ক্ষতিকারক আউটপুট তৈরি করার জন্য ডিজাইন করা হয়-- উদাহরণস্বরূপ, একটি পাঠ্য প্রজন্মের মডেলকে একটি নির্দিষ্ট ধর্ম সম্পর্কে ঘৃণাপূর্ণ রটনা তৈরি করতে বলা৷
  - একটি ইনপুট অসাবধানতাবশত ক্ষতিকারক হয় যখন ইনপুট নিজেই নিরীহ হতে পারে, কিন্তু ক্ষতিকারক আউটপুট তৈরি করে -- উদাহরণস্বরূপ, একটি পাঠ্য প্রজন্মের মডেলকে একটি নির্দিষ্ট জাতিসত্তার ব্যক্তিকে বর্ণনা করতে বলা এবং একটি বর্ণবাদী আউটপুট গ্রহণ করা।
- একটি আদর্শ মূল্যায়ন থেকে একটি প্রতিকূল পরীক্ষাকে যা আলাদা করে তা হল পরীক্ষার জন্য ব্যবহৃত ডেটার সংমিশ্রণ। প্রতিকূল পরীক্ষার জন্য, পরীক্ষার ডেটা নির্বাচন করুন যা মডেল থেকে সমস্যাযুক্ত আউটপুট বের করার সম্ভাবনা বেশি। এর অর্থ হল সম্ভাব্য সমস্ত ধরণের ক্ষতির জন্য মডেলের আচরণ পরীক্ষা করা, যার মধ্যে বিরল বা অস্বাভাবিক উদাহরণ এবং এজ-কেসগুলি রয়েছে যা নিরাপত্তা নীতির সাথে প্রাসঙ্গিক। এটি একটি বাক্যের বিভিন্ন মাত্রা যেমন গঠন, অর্থ এবং দৈর্ঘ্যের মধ্যে বৈচিত্র্য অন্তর্ভুক্ত করা উচিত। পরীক্ষার ডেটাসেট তৈরি করার সময় কী বিবেচনা করতে হবে সে সম্পর্কে আরও বিশদ বিবরণের জন্য আপনি ন্যায্যতার সাথে Google-এর দায়িত্বশীল AI অনুশীলনগুলি উল্লেখ করতে পারেন।
  উন্নত টিপস
  - 'লাল দলে' লোকেদের তালিকাভুক্ত করার ঐতিহ্যগত পদ্ধতির পরিবর্তে স্বয়ংক্রিয় পরীক্ষা ব্যবহার করুন এবং আপনার আবেদনটি ভাঙার চেষ্টা করুন। স্বয়ংক্রিয় পরীক্ষায়, 'লাল দল' হল আরেকটি ভাষার মডেল যা ইনপুট পাঠ্য খুঁজে পায় যা পরীক্ষা করা মডেল থেকে ক্ষতিকারক আউটপুট বের করে।
দ্রষ্টব্য: এলএলএম কখনও কখনও একই ইনপুট প্রম্পটের জন্য বিভিন্ন আউটপুট তৈরি করতে পরিচিত। আরও সমস্যাযুক্ত আউটপুট ধরার জন্য একাধিক রাউন্ড পরীক্ষার প্রয়োজন হতে পারে।

সমস্যার জন্য মনিটর

আপনি যতই পরীক্ষা করুন এবং প্রশমিত করুন না কেন, আপনি কখনই পরিপূর্ণতার গ্যারান্টি দিতে পারবেন না, তাই আগে থেকেই পরিকল্পনা করুন যে আপনি কীভাবে চিহ্নিত করবেন এবং উদ্ভূত সমস্যাগুলি মোকাবেলা করবেন। সাধারণ পন্থাগুলির মধ্যে রয়েছে ব্যবহারকারীদের প্রতিক্রিয়া শেয়ার করার জন্য একটি পর্যবেক্ষণ করা চ্যানেল সেট আপ করা (যেমন, থাম্বস আপ/ডাউন রেটিং) এবং ব্যবহারকারীদের বিভিন্ন মিশ্রণ থেকে সক্রিয়ভাবে প্রতিক্রিয়া চাওয়ার জন্য একটি ব্যবহারকারী অধ্যয়ন চালানো — বিশেষত মূল্যবান যদি ব্যবহারের ধরণগুলি প্রত্যাশার থেকে ভিন্ন হয়।

উন্নত টিপস

যখন ব্যবহারকারীরা AI পণ্যগুলিতে প্রতিক্রিয়া জানায়, এটি সময়ের সাথে সাথে AI কার্যকারিতা এবং ব্যবহারকারীর অভিজ্ঞতাকে ব্যাপকভাবে উন্নত করতে পারে, উদাহরণস্বরূপ, প্রম্পট টিউনিংয়ের জন্য আপনাকে আরও ভাল উদাহরণ বেছে নিতে সহায়তা করে। Google-এর পিপল এবং এআই গাইডবুকের ফিডব্যাক এবং কন্ট্রোল অধ্যায় ফিডব্যাক মেকানিজম ডিজাইন করার সময় বিবেচনায় নেওয়া গুরুত্বপূর্ণ বিষয়গুলো হাইলাইট করে।

পরবর্তী পদক্ষেপ

Gemini API-এর মাধ্যমে উপলব্ধ সামঞ্জস্যযোগ্য নিরাপত্তা সেটিংস সম্পর্কে জানতে নিরাপত্তা সেটিংস নির্দেশিকা পড়ুন।
আপনার প্রথম প্রম্পট লেখা শুরু করতে প্রম্পট করার ভূমিকা দেখুন।