این صفحه حاوی جزئیات یک پروژه نگارش فنی است که برای فصل اسناد Google پذیرفته شده است.
خلاصه ی پروژه
- سازمان منبع باز:
- داده های مشترک
- نویسنده فنی:
- کلیم آنجارو
- نام پروژه:
- بهبود اسناد شروع DataCommons
- طول پروژه:
- طول استاندارد (3 ماه)
شرح پروژه
در حرفهام بهعنوان یک مهندس نرمافزار، بارها از تجربه پیوستن به یک تیم یا پروژه جدید، پایین کشیدن یک مخزن کد، اجرای آن و تماشای شکستن نرمافزار زمانی که مراحل کلیدی در مستندات وجود نداشت، ناامید شدهام. من به سرعت متوجه شدم که می توانم اشتیاق مادام العمر خود را برای نوشتن و آهنگسازی در این نیازها به کار ببرم و در این فرآیند یک محیط حمایتی برای توسعه دهندگانی که با آنها کار کردم ایجاد کنم تا به جای حل مشکلات با پاسخ های شناخته شده، بر نوآوری فنی و خلاقیت تمرکز کنند.
این نوآوری فنی و خلاقیت در بسیاری از بخشهای جامعه، به ویژه توسط رهبران دولت و بخش غیرانتفاعی که به دنبال تجزیه و تحلیل مجموعه دادهها در فضاهای مشکل خود هستند، به فوریت مورد نیاز است. با در دسترس قرار دادن این دادهها بهعنوان یک سرویس، DataCommons مانع ورود تحلیلگرانی که به دنبال دادههایی هستند که دسترسی آسان و نزدیک به فرمت مورد نیاز برای نقشهایشان است را کاهش میدهد. DataCommons این کار را با ایجاد یک نمودار دانش از دادههایی که دریافت میکند، انجام میدهد، در این فرآیند سؤالات جالبی در مورد کیفیت داده و حاکمیت در زمینه منبع باز ایجاد میکند. با درخواست در Google Summer of Docs با پیشنهادی برای سازمان DataCommons، امیدوارم بتوانم از این تلاشهای فنی در فضای باز دادههای باز منافع عمومی حمایت و پیش ببرم.
نقاط دردناک کنونی در مستندات با راهحلهای پیشنهادی در حالی که وبسایت dataCommons حاوی دستورالعملهایی برای افزودن مجموعه دادهها به dataCommons است، دستورالعملها بسیار کوتاه و نامشخص هستند و شامل چندین نقطه هستند که اهداکننده داده را به استفاده از نشانهگذاری schema.org هدایت میکنند. به عنوان بخشی از این پروژه، من پیشنهاد میکنم بخش «درگیر شوید» در dataCommons.org پاکسازی شود. من یک آموزش برای افزودن مجموعه داده های جدید ایجاد خواهم کرد و توضیح می دهم که چگونه مجموعه داده ها خراشیده می شوند و در نمودار دانش dataCommons گنجانده می شوند. من همچنین یک بخش پرسشهای متداول را برای راهحلهای رایجی که زمانی که صاحب مجموعه داده برای کمک به نگهبانان dataCommons مراجعه میکند، پیشنهاد میشود، اضافه میکنم.
با نگاهی به مجموعه نمونه های فعلی برای پرس و جو داده ها، dataCommons تنها چهار نمونه کد تعاملی را ارائه می دهد که همه آنها نوت بوک پایتون هستند. به عنوان بخشی از این پروژه، من این نوتبوکها را به R ترجمه میکنم و همچنین نسخههای آزمایشی تعاملی نمونههای حاضر را برای Google Sheets و REST API ایجاد میکنم، و این نسخههای نمایشی را در مستندات فعلی جاسازی میکنم.
در نهایت، مستندات واقعاً هیچ نمونه ای از نحوه استفاده از نمودار دانش dataCommons برای ساخت برنامه های کاربردی در نرم افزار ارائه نمی دهد. به عنوان بخشی از این پروژه، من یک ابزار نمونه در پایتون ایجاد، استقرار و مستند میکنم که از dataCommons API استفاده میکند تا کاربر نهایی را قادر میسازد تا تجسمهای گرافیکی مربوط به هر دو کمیت متصل به گراف دانش را بسازد. برای مثال، ممکن است بتوان از این ابزار برای ترسیم یک رگرسیون خطی که داده های آب و هوا را به اطلاعات الگوهای تجاری رایج مرتبط می کند، استفاده کرد. به عنوان یک هدف کششی، امیدوارم بتوانم این ابزار را به انواع دیگر تجسم ها، مانند نمودارهای دایره ای و نمودارهای ون گسترش دهم.
زمانبندی فصل از 14 سپتامبر تا 30 نوامبر اجرا می شود، بنابراین برنامه من برای تکمیل این پروژه به این صورت است:
سپتامبر: با بازنویسی بخش Get Involved شروع کنید. اکثراً این کار را تا پایان سپتامبر به پایان برسانید.
اکتبر: بخش Get Involved را جمع کنید و نمونه کدهای تعاملی را ایجاد کنید.
نوامبر: ابزار تجسم نمونه را ایجاد کنید.