이 페이지에는 Google Season of Docs에 선정된 기술 문서 프로젝트의 세부정보가 포함되어 있습니다.
프로젝트 요약
- 오픈소스 조직:
- 데이터 커먼즈
- 테크니컬 라이터:
- KilimAnnejaro
- 프로젝트 이름:
- DataCommons 시작 문서 개선
- 프로젝트 길이:
- 표준 기간 (3개월)
Project description
소프트웨어 엔지니어로 일하면서 새로운 팀이나 프로젝트에 합류하고, 코드 저장소를 가져와 실행하고, 문서에서 주요 단계가 누락되었을 때 소프트웨어가 중단되는 것을 지켜보는 경험으로 인해 반복적으로 좌절감을 느꼈습니다. 나는 글쓰기와 작곡에 대한 저의 평생 열정을 이러한 니즈에 적용할 수 있다는 것을 금세 깨달았습니다. 그 과정에서 알려진 해답이 있는 문제를 해결하기보다는 함께 일했던 개발자를 위한 지원 환경을 조성하는 과정에서 기술 혁신과 창의성에 집중하게 되는 것입니다.
이러한 기술 혁신과 창의력은 특히 문제 공간에서 데이터 세트를 분석하려는 정부 및 비영리 부문의 리더를 비롯한 사회의 여러 부문에서 긴급히 필요합니다. 이러한 데이터를 서비스로 쉽게 제공함으로써 DataCommons는 액세스가 쉽고 역할에 필요한 형식에 가까운 데이터를 찾는 분석가의 진입 장벽을 낮춥니다. DataCommons는 이를 위해 수집한 데이터의 지식 그래프를 생성함으로써 오픈소스 맥락에서 데이터 품질과 거버넌스에 대한 흥미로운 질문을 제기합니다. DataCommons 조직에 대한 제안서를 포함하여 Google Summer of Docs에 신청함으로써 공익을 위한 개방형 데이터 공간에서 이러한 기술적 노력을 지원하고 발전시키고자 합니다.
제안된 솔루션 관련 문서의 현재 고충 dataCommons 웹사이트에 dataCommons에 데이터 세트를 추가하는 방법에 대한 지침이 포함되어 있지만 지침은 매우 짧고 명확하지 않으며 데이터 기부자가 schema.org 마크업을 사용하도록 안내하는 몇 가지 글머리 기호로 구성되어 있습니다. 이 프로젝트의 일환으로 dataCommons.org의 '참여하기' 섹션을 정리할 것을 제안합니다. 데이터 세트를 스크래핑하고 dataCommons 지식 그래프에 통합하는 방법을 설명하는 새 데이터 세트 추가 튜토리얼을 만들겠습니다. 데이터 세트 소유자가 dataCommons 유지보수자에게 지원을 요청할 때 제안되는 일반적인 해결 방법에 관한 FAQ 섹션도 추가할 예정입니다.
데이터 쿼리에 관한 현재 예시를 살펴보면 dataCommons는 모두 Python 노트북인 대화형 코드 예시를 4개만 제공합니다. 이 프로젝트의 일환으로 이러한 노트북을 R로 변환하고 Google Sheets 및 REST API의 현재 예시의 대화형 데모 버전을 만들어 이러한 데모를 현재 문서에 삽입할 예정입니다.
마지막으로 문서에서는 dataCommons 지식 그래프를 사용하여 소프트웨어에서 애플리케이션을 빌드하는 방법에 관한 예시를 제공하지 않습니다. 이 프로젝트에서는 dataCommons API를 활용하여 최종 사용자가 지식 그래프 내에 연결된 두 개 양의 관계를 그래픽으로 시각화할 수 있도록 하는 Python 샘플 도구를 만들고, 배포하고, 문서화합니다. 예를 들어 이 도구를 사용하여 날씨 데이터와 일반적인 비즈니스 패턴 정보를 연결하는 선형 회귀를 그릴 수 있습니다. 장기 목표로는 이 도구를 원형 차트, 벤 다이어그램과 같은 다른 유형의 시각화로 확장하고자 합니다.
일정 시즌은 9월 14일부터 11월 30일까지 진행되므로 이 프로젝트를 완료하기 위한 계획은 다음과 같습니다.
9월: 참여하기 섹션을 다시 작성하는 것으로 시작합니다. 9월 말까지 대부분의 작업을 완료합니다.
10월: 참여하기 섹션을 마무리하고 양방향 코드 샘플을 만듭니다.
11월: 샘플 시각화 도구를 만듭니다.