তথ্য লগ যোগদান

একটি প্রশিক্ষণ সেট একত্রিত করার সময়, আপনাকে কখনও কখনও ডেটার একাধিক উত্সে যোগদান করতে হবে।

লগের ধরন

আপনি নিম্নলিখিত ধরণের ইনপুট ডেটার সাথে কাজ করতে পারেন:

  • লেনদেন লগ
  • বৈশিষ্ট্য তথ্য
  • সামগ্রিক পরিসংখ্যান

লেনদেন লগ একটি নির্দিষ্ট ঘটনা রেকর্ড. উদাহরণস্বরূপ, একটি লেনদেন লগ একটি আইপি ঠিকানা একটি ক্যোয়ারী তৈরি করে এবং যে তারিখ এবং সময় কোয়েরি করা হয়েছিল তা রেকর্ড করতে পারে। লেনদেনের ঘটনাগুলি একটি নির্দিষ্ট ঘটনার সাথে মিলে যায়।

অ্যাট্রিবিউট ডেটাতে তথ্যের স্ন্যাপশট থাকে। উদাহরণ স্বরূপ:

  • ব্যবহারকারীর জনসংখ্যা
  • অনুসন্ধানের সময় অনুসন্ধান ইতিহাস

অ্যাট্রিবিউট ডেটা একটি ইভেন্ট বা সময়ের একটি মুহুর্তের জন্য নির্দিষ্ট নয়, তবে ভবিষ্যদ্বাণী করার জন্য এখনও কার্যকর হতে পারে। একটি নির্দিষ্ট ইভেন্টের সাথে আবদ্ধ না ভবিষ্যদ্বাণীমূলক কাজগুলির জন্য (উদাহরণস্বরূপ, ব্যবহারকারীর মন্থন ভবিষ্যদ্বাণী করা, যা একটি পৃথক মুহুর্তের পরিবর্তে সময়ের একটি পরিসীমা জড়িত), বৈশিষ্ট্য ডেটা একমাত্র প্রকারের ডেটা হতে পারে।

অ্যাট্রিবিউট ডেটা এবং লেনদেন লগ সম্পর্কিত। উদাহরণস্বরূপ, আপনি বেশ কয়েকটি লেনদেন লগ একত্রিত করে, সামগ্রিক পরিসংখ্যান তৈরি করে এক ধরণের বৈশিষ্ট্য ডেটা তৈরি করতে পারেন। এই ক্ষেত্রে, আপনি একটি ব্যবহারকারীর জন্য একটি একক বৈশিষ্ট্য তৈরি করতে অনেক লেনদেন লগ দেখতে পারেন।

সমষ্টিগত পরিসংখ্যান একাধিক লেনদেন লগ থেকে একটি বৈশিষ্ট্য তৈরি করে। উদাহরণ স্বরূপ:

  • ব্যবহারকারীর প্রশ্নের ফ্রিকোয়েন্সি
  • একটি নির্দিষ্ট বিজ্ঞাপনে গড় ক্লিক হার

লগ উত্স যোগদান

প্রতিটি ধরনের লগ একটি ভিন্ন অবস্থানে থাকে। আপনার মেশিন লার্নিং মডেলের জন্য ডেটা সংগ্রহ করার সময়, আপনার ডেটা সেট তৈরি করতে আপনাকে অবশ্যই বিভিন্ন উত্সের সাথে যোগ দিতে হবে। কিছু উদাহরণ:

  • ইভেন্টের সময় ব্যবহারকারীর বৈশিষ্ট্যগুলি দেখতে লেনদেন লগগুলিতে ব্যবহারকারীর আইডি এবং টাইমস্ট্যাম্প ব্যবহার করুন৷
  • ক্যোয়ারী করার সময় অনুসন্ধানের ইতিহাস নির্বাচন করতে লেনদেন টাইমস্ট্যাম্প ব্যবহার করুন।

ভবিষ্যদ্বাণী ডেটা উত্স — অনলাইন বনাম অফলাইন

মেশিন লার্নিং ক্র্যাশ কোর্সে আপনি অনলাইন বনাম অফলাইন পরিবেশন সম্পর্কে শিখেছেন। পছন্দটি আপনার সিস্টেম কীভাবে ডেটা সংগ্রহ করে তা প্রভাবিত করে:

  • অনলাইন — লেটেন্সি একটি উদ্বেগের বিষয়, তাই আপনার সিস্টেমকে অবশ্যই দ্রুত ইনপুট তৈরি করতে হবে৷
  • অফলাইন—আপনার সম্ভবত কোনো গণনা বিধিনিষেধ নেই, তাই প্রশিক্ষণ ডেটা তৈরির মতো জটিল ক্রিয়াকলাপও করতে পারেন।

উদাহরণস্বরূপ, অ্যাট্রিবিউট ডেটাকে প্রায়শই অন্য কোনও সিস্টেম থেকে সন্ধান করা প্রয়োজন, যা লেটেন্সি উদ্বেগের পরিচয় দিতে পারে। একইভাবে, সমষ্টিগত পরিসংখ্যান ফ্লাইতে গণনা করা ব্যয়বহুল হতে পারে। যদি লেটেন্সি একটি ব্লকার হয়, একটি সম্ভাবনা হল এই পরিসংখ্যানগুলিকে প্রাক গণনা করা।