ডেটা কমন্স প্রকল্প

এই পৃষ্ঠায় Google সিজন অফ ডক্সের জন্য গৃহীত প্রযুক্তিগত লেখার প্রকল্পের বিশদ বিবরণ রয়েছে৷

প্রকল্পের সারসংক্ষেপ

ওপেন সোর্স সংস্থা:
ডেটা কমন্স
কৌশলী লেখক:
কিলিম আন্নেজারো
প্রকল্পের নাম:
DataComons উন্নতি ডকুমেন্টেশন শুরু করা
প্রকল্পের দৈর্ঘ্য:
স্ট্যান্ডার্ড দৈর্ঘ্য (3 মাস)

প্রকল্প বর্ণনা

একজন সফ্টওয়্যার প্রকৌশলী হিসাবে আমার কর্মজীবনে, আমি বারবার নিজেকে একটি নতুন দল বা প্রকল্পে যোগদানের অভিজ্ঞতার দ্বারা হতাশ হয়েছি, একটি কোড সংগ্রহস্থল টেনে আনা, এটি চালানো এবং সফ্টওয়্যার বিরতি দেখেছি যখন ডকুমেন্টেশন থেকে মূল পদক্ষেপগুলি অনুপস্থিত ছিল। আমি দ্রুত বুঝতে পেরেছিলাম যে আমি এই চাহিদাগুলির জন্য লেখা এবং রচনার জন্য আমার আজীবন আবেগ প্রয়োগ করতে পারি, এই প্রক্রিয়ায় আমি যে বিকাশকারীদের সাথে কাজ করেছি তাদের জন্য একটি সহায়ক পরিবেশ তৈরি করতে পারি যা পরিচিত উত্তরগুলির সাথে সমস্যাগুলি সমাধান করার পরিবর্তে প্রযুক্তিগত উদ্ভাবন এবং সৃজনশীলতার উপর ফোকাস করার জন্য।

এই প্রযুক্তিগত উদ্ভাবন এবং সৃজনশীলতা জরুরীভাবে সমাজের অনেক অংশে প্রয়োজন, বিশেষ করে সরকার এবং অলাভজনক সেক্টরের নেতারা তাদের সমস্যার জায়গায় ডেটাসেট বিশ্লেষণ করতে চাইছেন। এই ডেটাটিকে একটি পরিষেবা হিসাবে সহজেই উপলব্ধ করার মাধ্যমে, ডেটাকমন্স বিশ্লেষকদের প্রবেশের বাধা কমিয়ে দেয় যা অ্যাক্সেস করা সহজ এবং তাদের ভূমিকার জন্য প্রয়োজনীয় বিন্যাসের কাছাকাছি। DataCommons এটি যে ডেটা গ্রহণ করে তার একটি নলেজ গ্রাফ তৈরি করে, এই প্রক্রিয়ায় ওপেন সোর্সের প্রেক্ষাপটে ডেটার গুণমান এবং পরিচালনা সম্পর্কে আকর্ষণীয় প্রশ্ন উত্থাপন করে। DataCommons সংস্থার জন্য একটি প্রস্তাব সহ Google Summer of Docs-এ আবেদন করার মাধ্যমে, আমি জনস্বার্থে খোলা ডেটা স্পেসে এই প্রযুক্তিগত প্রচেষ্টাগুলিকে সমর্থন ও অগ্রসর করার আশা করি৷

প্রস্তাবিত সমাধানগুলির সাথে ডকুমেন্টেশনে বর্তমান ব্যথার পয়েন্টগুলি যদিও ডেটাকমন্স ওয়েবসাইটে ডেটাসেটগুলি ডেটাসেট যোগ করার জন্য নির্দেশাবলী রয়েছে, দিকনির্দেশগুলি খুব সংক্ষিপ্ত এবং অস্পষ্ট, এতে বেশ কয়েকটি বুলেট পয়েন্ট রয়েছে যা schema.org মার্কআপ ব্যবহার করার জন্য ডেটা দাতাকে নির্দেশ করে৷ এই প্রকল্পের অংশ হিসেবে, আমি dataCommons.org-এর 'Get Involved' বিভাগটি পরিষ্কার করার প্রস্তাব করছি। আমি নতুন ডেটাসেট যোগ করার জন্য একটি টিউটোরিয়াল তৈরি করব, ব্যাখ্যা করব কীভাবে ডেটাসেটগুলি স্ক্র্যাপ করা হয় এবং ডেটাকমন্স নলেজ গ্রাফে অন্তর্ভুক্ত করা হয়। একজন ডেটাসেট মালিক যখন সহায়তার জন্য dataCommons রক্ষণাবেক্ষণকারীদের কাছে পৌঁছায় তখন আমি প্রস্তাবিত সাধারণ সমাধানগুলির জন্য একটি FAQ বিভাগ যোগ করব৷

ডেটা ক্যোয়ারী করার জন্য বর্তমান উদাহরণের সেটের দিকে তাকানো, ডেটাকমন্স শুধুমাত্র চারটি ইন্টারেক্টিভ কোড উদাহরণ অফার করে, সবগুলোই পাইথন নোটবুক। এই প্রকল্পের অংশ হিসাবে, আমি এই নোটবুকগুলিকে R-এ অনুবাদ করব এবং Google পত্রক এবং REST API-এর জন্য বর্তমান উদাহরণগুলির ইন্টারেক্টিভ ডেমো সংস্করণ তৈরি করব, এই ডেমোগুলিকে বর্তমান ডকুমেন্টেশনে এম্বেড করব৷

অবশেষে, ডকুমেন্টেশন সত্যিই কোন উদাহরণ প্রদান করে না কিভাবে ডেটাকমন্স জ্ঞান গ্রাফ সফ্টওয়্যারে অ্যাপ্লিকেশন তৈরি করতে ব্যবহার করা যেতে পারে। এই প্রকল্পের অংশ হিসাবে, আমি পাইথনে একটি নমুনা টুল তৈরি, স্থাপন এবং নথিভুক্ত করব যা ডেটাকমন্স API ব্যবহার করে শেষ ব্যবহারকারীকে জ্ঞান গ্রাফের মধ্যে সংযুক্ত যেকোনো দুটি পরিমাণের সাথে সম্পর্কিত গ্রাফিকাল ভিজ্যুয়ালাইজেশন তৈরি করতে সক্ষম করে। উদাহরণস্বরূপ, সাধারণ ব্যবসার নিদর্শন তথ্যের সাথে আবহাওয়ার ডেটা সম্পর্কিত একটি রৈখিক রিগ্রেশন আঁকতে কেউ এই টুলটি ব্যবহার করতে সক্ষম হতে পারে। একটি প্রসারিত লক্ষ্য হিসাবে, আমি এই টুলটিকে অন্যান্য ধরণের ভিজ্যুয়ালাইজেশনে প্রসারিত করার আশা করি, যেমন পাই চার্ট এবং ভেন ডায়াগ্রাম।

সময়সূচী 14 সেপ্টেম্বর থেকে 30 নভেম্বর পর্যন্ত ঋতু চলে, তাই এই প্রকল্পটি সম্পূর্ণ করার জন্য আমার পরিকল্পনাটি এরকম দেখাচ্ছে:

সেপ্টেম্বর: গেট ইনভলভড বিভাগটি পুনরায় লেখার সাথে শুরু করুন; বেশিরভাগই সেপ্টেম্বরের শেষে এই কাজটি শেষ করুন।

অক্টোবর: Get Involved বিভাগটি গুটিয়ে নিন এবং ইন্টারেক্টিভ কোডের নমুনা তৈরি করুন।

নভেম্বর: নমুনা ভিজ্যুয়ালাইজেশন টুল তৈরি করুন।