지상에서 운영되는 차량의 거의 실시간 신호는 여러 가지 방법으로 비즈니스에 유용합니다. 예를 들어 비즈니스에서 다음 작업을 할 수 있습니다.
- 차량의 성능을 모니터링하고 잠재적인 문제를 조기에 식별
- 정확한 예상 도착 시간 및 추적 정보를 제공하여 고객 서비스 개선
- 비효율성을 식별하고 해결하여 비용 절감
- 운전자 행동을 모니터링하고 잠재적 위험을 식별하여 안전성 개선
- 운전자 경로와 일정을 최적화하여 효율성 개선
- 차량 위치 및 운행 시간을 추적하여 규정 준수
이 문서에서는 개발자가 Google 지도 플랫폼의 '이동 서비스'('라스트마일 차량 관리 솔루션'(LMFS) 또는 '주문형 차량 및 배송 솔루션'(ODRD))의 신호를 실행 가능한 맞춤 이벤트로 전환하는 방법을 설명합니다. GitHub에서 제공되는 Fleet Events Reference Solution의 주요 개념과 설계 결정도 다룹니다.
이 문서는 다음 사용자에게 적용됩니다.
- Google Maps Platform의 '모빌리티 서비스' 및 핵심 구성요소 중 하나인 'Fleet Engine'에 익숙한 설계자 '모빌리티 서비스'를 처음 사용하는 경우 필요에 따라 라스트 마일 Fleet 솔루션 또는 주문형 차량 및 배송 솔루션을 숙지하는 것이 좋습니다.
- Google Cloud에 익숙한 설계자 Google Cloud를 처음 사용하는 경우 Google Cloud에서 스트리밍 데이터 파이프라인 빌드를 미리 읽어보는 것이 좋습니다.
- 다른 환경이나 소프트웨어 스택을 타겟팅하는 경우 여전히 적용 가능한 Fleet Engine의 통합 지점과 주요 고려사항을 이해하는 데 집중하세요.
- 함대의 이벤트가 생성되고 활용되는 방식에 관심이 있는 사용자
이 문서를 끝까지 읽으면 스트리밍 시스템의 주요 요소와 고려사항은 물론 차량 관리 이벤트 참조 솔루션을 구성하는 Google 지도 플랫폼 및 Google Cloud의 빌딩 블록에 대한 기본적인 이해를 갖추게 됩니다.
Fleet Events 참조 솔루션 개요
Fleet Events 참조 솔루션은 모빌리티 고객과 파트너가 Fleet Engine 및 Google Cloud 구성요소를 기반으로 주요 이벤트를 생성할 수 있도록 지원하는 오픈소스 솔루션입니다. 현재 참조 솔루션은 주문형 차량 공유 및 배송 지원을 통해 Last Mile Fleet 솔루션을 사용하는 고객을 지원합니다.
이 솔루션은 작업 또는 이동과 연결된 특정 데이터의 변경사항을 기반으로 이벤트를 자동으로 생성합니다. 이러한 이벤트를 사용하여 이해관계자에게 다음과 같은 알림을 보내거나 Fleet에 대한 다른 작업을 트리거할 수 있습니다.
- 작업 도착 예정 시간 변경
- 작업 도착의 상대적 ETA 변경
- 작업 도착까지 남은 시간
- 작업 도착까지 남은 거리
- TaskOutcome 상태 변경
참조 솔루션의 각 구성요소는 비즈니스 요구사항에 맞게 맞춤설정할 수 있습니다.
논리적 구성 요소
다이어그램 : 다음 다이어그램은 Fleet Events 참조 솔루션을 구성하는 상위 수준 구성요소를 보여줍니다.
참조 솔루션에는 다음 구성요소가 포함됩니다.
- 이벤트 소스: 원래 이벤트 스트림이 제공되는 위치입니다. 'Last Mile Fleet 솔루션'과 '주문형 차량 및 배송 솔루션' 모두 Cloud Logging과 통합되어 Fleet Engine RPC 호출 로그를 개발자가 사용할 수 있는 이벤트 스트림으로 변환할 수 있습니다. 소비할 핵심 소스입니다.
- 처리: 원시 RPC 호출 로그는 로그 이벤트 스트림을 통해 계산하는 이 블록 내에서 상태 변경 이벤트로 변환됩니다. 이러한 변경사항을 감지하려면 이 구성요소에 상태 저장소가 필요합니다. 그래야 새로운 수신 이벤트를 이전 이벤트와 비교하여 변경사항을 감지할 수 있습니다. 이벤트에 관심 있는 정보가 모두 포함되지 않을 수 있습니다. 이 경우 이 블록은 필요에 따라 백엔드에 대한 조회 호출을 실행할 수 있습니다.
- 상태 저장소: 일부 처리 프레임워크는 자체적으로 지속되는 중간 데이터를 제공합니다. 그렇지 않은 경우 상태를 직접 저장하려면 차량 및 이벤트 유형에 고유해야 하므로 K-V 유형 데이터 지속성 서비스가 적합합니다.
- 싱크 (맞춤 이벤트): 감지된 상태 변경은 이를 활용할 수 있는 애플리케이션이나 서비스에서 사용할 수 있어야 합니다. 따라서 이 맞춤 이벤트를 다운스트림 소비를 위해 이벤트 전송 시스템에 게시하는 것이 자연스러운 선택입니다.
- 다운스트림 서비스: 생성된 이벤트를 소비하고 사용 사례에 고유한 작업을 실행하는 코드입니다.
서비스 선택
'Last Mile Fleet 솔루션' 또는 '주문형 차량 및 배송 솔루션'(2023년 3분기 말 출시 예정)의 참조 솔루션을 구현할 때 '소스' 및 '싱크'의 기술 선택은 간단합니다. 반면 '처리'에는 다양한 옵션이 있습니다. 참조 솔루션에서는 다음 Google 서비스를 선택했습니다.
다이어그램 : 다음 다이어그램은 참조 솔루션을 구현하는 Google Cloud 서비스를 보여줍니다.
Cloud 프로젝트 레이아웃
기본적으로 다중 프로젝트 배포를 사용하는 것이 좋습니다. 이렇게 하면 Google Maps Platform과 Google Cloud 사용량을 명확하게 분리하고 원하는 결제 방식에 연결할 수 있습니다.
이벤트 소스
'Last Mile Fleet 솔루션'과 '주문형 차량 공유 및 배송 솔루션'은 API 요청 및 응답 페이로드를 Cloud Logging에 씁니다. Cloud Logging은 선택한 하나 이상의 서비스에 로그를 전송합니다. 여기서는 Cloud Pub/Sub로 라우팅하는 것이 완벽한 선택이며 코딩 없이 로그를 이벤트 스트림으로 변환할 수 있습니다.
- 로깅 | Fleet 성능(LMFS 사용자용)
- 로깅 | 여정 및 주문 진행 상황(ODRD 사용자용)
- Pub/Sub로 라우팅된 로그 보기 : 로깅 → Pub/Sub 통합 개요
싱크
Google Cloud에서 Cloud Pub/Sub은 거의 실시간 메시지 전송 시스템입니다. 소스의 이벤트가 Pub/Sub에 전송된 것과 마찬가지로 커스텀 이벤트도 다운스트림 소비를 위해 Pub/Sub에 게시됩니다.
처리 중
다음 구성요소는 이벤트 처리에 역할을 합니다. 다른 빌딩 블록과 마찬가지로 처리 구성요소는 완전히 서버리스이며 위아래로 잘 확장됩니다.
- 초기 출시를 위한 컴퓨팅 플랫폼으로 Cloud Functions (*)
- 서버리스, 확장 제어를 통해 비용을 관리하기 위해 확장 및 축소
- 구현의 용이성에 기여하는 Fleet Engine 관련 API용 클라이언트 라이브러리의 가용성을 고려할 때 프로그래밍 언어는 Java입니다.
- Cloud Firestore를 상태 저장소로 사용
- 서버리스 키-값 스토어
- 상류 및 하류 구성요소와의 통합 지점으로 Cloud Pub/Sub
- 느슨하게 결합된 거의 실시간 통합
함수는 기본 설정으로 그대로 사용할 수도 있지만 재구성할 수도 있습니다. 구성 매개변수는 배포 스크립트를 통해 설정되며 해당 Terraform 모듈 리드미에 자세히 설명되어 있습니다.
*참고: 이 참조 솔루션은 다양한 요구사항을 충족하는 데 도움이 되는 대체 구현을 출시할 계획입니다.
배포
참조 솔루션 배포 프로세스를 반복 가능하고, 맞춤설정 가능하며, 소스 코드 제어 가능하고, 안전하게 만들기 위해 Terraform이 자동화 도구로 선택됩니다. Terraform은 Google Cloud를 풍부하게 지원하는 널리 사용되는 IaC (코드형 인프라) 도구입니다.
- Google Cloud Platform 제공업체: 'Google Cloud Platform 제공업체'에서 지원하는 리소스에 관한 문서
- Terraform 사용 권장사항: Google Cloud에서 가장 효과적으로 채택하는 방법에 관한 풍부한 안내
- Terraform 레지스트리: Google 및 커뮤니티에서 지원하는 추가 모듈
Terraform 모듈
하나의 대규모 모놀리식 참조 솔루션 배포 모듈을 만드는 대신 재사용 가능한 자동화 블록이 독립적으로 사용할 수 있는 Terraform 모듈로 구현됩니다. 모듈은 다양한 구성 가능한 변수를 제공하며, 대부분의 변수에는 기본값이 있어 빠르게 시작할 수 있을 뿐만 아니라 필요와 선호도에 따라 맞춤설정할 수 있는 유연성도 제공합니다.
참조 솔루션에 포함된 모듈:
- Fleet Engine 로깅 구성: Fleet Engine과 함께 사용할 Cloud Logging 관련 구성을 자동화합니다. 참조 솔루션에서는 Fleet Engine 관련 로그를 지정된 Pub/Sub 주제로 라우팅하는 데 사용됩니다.
- Fleet Events Cloud Functions 배포: 샘플 함수 코드 배포를 포함하며 보안 교차 프로젝트 통합에 필요한 권한 설정의 자동화를 처리합니다.
- 전체 참조 솔루션 배포: 이전 두 모듈을 호출하고 전체 솔루션을 래핑합니다.
보안
IAM은 서비스 계정 가장과 같은 Google Cloud의 보안 권장사항과 함께 최소 권한 원칙을 적용하기 위해 채택됩니다. 다음 도움말을 참고하여 Google Cloud에서 보안을 더 효과적으로 제어할 수 있도록 제공하는 기능을 자세히 알아보세요.
다음 작업
이제 Fleet Events Reference Solution에 액세스하여 자세히 살펴볼 수 있습니다. GitHub로 이동하여 시작하세요.
부록
요구사항 수집
프로세스 초기에 요구사항을 수집하는 것이 좋습니다.
먼저 거의 실시간 이벤트에 관심이 있거나 이를 사용해야 하는 이유에 관한 세부정보를 캡처합니다. 다음은 요구사항을 명확히 하는 데 도움이 되는 몇 가지 질문입니다.
- 이벤트 스트림이 유용하려면 어떤 정보가 필요하나요?
- 결과가 Google 서비스에서 캡처되거나 생성된 데이터에서만 도출될 수 있나요? 통합된 외부 시스템을 사용한 데이터 보강이 필요한가요? 그렇다면 이러한 시스템은 무엇이며 어떤 통합 인터페이스를 제공하나요?
- 비즈니스에서 측정하고 싶은 측정항목은 무엇인가요? 어떻게 정의되나요?
- 이벤트 전반에서 측정항목을 계산해야 하는 경우 어떤 종류의 집계가 필요할까요? 논리적 단계를 배치해 보세요. 예를 들어 피크 시간대에 일부 차량의 ETA/ATA를 SLO와 비교하여 리소스 제약 조건 하에서 성능을 계산합니다.)
- 일괄 처리 대신 이벤트 기반 모델에 관심이 있는 이유는 무엇인가요? 지연 시간 (시간-행동)을 줄이기 위한 것인가요 아니면 느슨하게 결합된 통합(민첩성)을 위한 것인가요?
- 짧은 지연 시간의 경우 'low'를 정의합니다. 분? 초? 1초 미만인가요? 지연 시간은 어느 정도인가요?
- 팀에서 이미 기술 스택과 관련 기술에 투자했나요? 그렇다면 무엇이며 어떤 통합 지점을 제공하나요?
- 현재 시스템이 충족할 수 없거나 차량에서 발생하는 이벤트를 처리할 때 어려움을 겪을 수 있는 요구사항이 있나요?
디자인 원칙
따라야 할 사고 과정이 있으면 항상 유용합니다. 이를 통해 특히 다양한 옵션 중에서 선택해야 할 때 일관된 디자인 결정을 내릴 수 있습니다.
- 더 간단한 옵션을 기본값으로 설정합니다.
- 가치 실현 시간을 단축하는 것이 기본값입니다. 코드가 적고 학습 곡선이 낮습니다.
- 지연 시간과 성능의 경우 최대 최적화가 아닌 설정한 기준을 충족하는 것을 목표로 합니다. 또한 극단적인 최적화는 복잡성을 추가하는 경우가 많으므로 피하세요.
- 비용도 마찬가지입니다. 비용을 적절하게 유지합니다. 아직 가치가 높지만 상대적으로 더 비싼 서비스를 사용하기로 약정할 수 있는 상태가 아닐 수 있습니다.
- 실험 단계에서는 축소가 확장만큼 중요할 수 있습니다. 아무것도 하지 않을 때 비용이 발생하지 않도록 상한을 설정하여 확장하고 축소 (이상적으로는 0까지)할 수 있는 유연성을 제공하는 플랫폼을 고려하세요. 항상 사용 설정 인프라를 통한 고성능은 필요에 대한 확신이 있을 때 여정의 후반부에 고려할 수 있습니다.
- 나중에 추가로 작업할 부분을 식별할 수 있도록 관찰하고 측정합니다.
- 서비스를 느슨하게 결합된 상태로 유지합니다. 이렇게 하면 나중에 조각을 하나씩 바꾸기가 더 쉬워집니다.
- 마지막으로 보안이 허술해서는 안 됩니다. 공용 클라우드 환경에서 실행되는 서비스이므로 시스템에 보안이 설정되지 않은 문이 있어서는 안 됩니다.
스트리밍 개념
이벤트 기반 또는 스트리밍을 처음 접하는 경우 알아두면 좋은 주요 개념이 있으며, 그중 일부는 일괄 처리와 매우 다를 수 있습니다.
- 규모 : 일반적으로 처리할 데이터의 양을 잘 파악할 수 있는 일괄 처리와 달리 스트리밍에서는 그럴 수 없습니다. 도시의 교통 체증으로 인해 특정 지역에서 갑자기 많은 이벤트가 발생할 수 있으며, 이러한 이벤트를 계속 처리할 수 있어야 합니다.
- 윈도우화 : 이벤트를 하나씩 처리하는 대신 타임라인의 이벤트를 계산 단위로 더 작은 '윈도우'로 그룹화하는 것이 좋습니다. '고정 윈도우 (예: 매일)', '슬라이딩 윈도우 (지난 5분)', '세션 윈도우 (이번 여행 중)'과 같은 다양한 윈도우 전략이 있으며, 이 중에서 선택해야 합니다. 기간이 길수록 결과를 생성하는 데 걸리는 시간이 길어집니다. 요구사항을 충족하는 적절한 모델과 구성을 선택하세요.
- 트리거링 : 비교적 긴 기간을 설정할 수밖에 없는 경우가 있습니다. 하지만 윈도우가 끝날 때까지 기다려 이벤트를 생성하는 대신 중간 결과를 내보내는 것이 좋습니다. 이 개념은 빠른 결과를 먼저 반환한 다음 나중에 수정하는 것이 가치 있는 사용 사례에 구현할 수 있습니다. 배송이 25%, 50%, 75% 완료될 때 중간 상태를 내보낸다고 가정해 보세요.
- 순서 : 이벤트가 생성된 순서대로 시스템에 도달하지 않을 수 있습니다. 특히 지연과 복잡한 라우팅 경로를 추가하는 모바일 네트워크를 통한 통신이 포함된 사용 사례의 경우 '이벤트 시간' (이벤트가 실제로 발생한 시간)과 '처리 시간' (이벤트가 시스템에 도달한 시간)의 차이를 인식하고 이에 따라 이벤트를 처리해야 합니다. 일반적으로 '이벤트 시간'을 기준으로 이벤트를 처리하는 것이 좋습니다.
- 메시지 전송 - 최소 1회와 정확히 1회: 이벤트 플랫폼마다 지원이 다릅니다. 사용 사례에 따라 재시도 또는 중복 삭제 전략을 고려해야 합니다.
- 완전성 : 순서 변경과 마찬가지로 메시지가 손실될 수 있습니다. 이는 기기의 배터리 수명으로 인한 애플리케이션 및 기기 종료, 의도치 않은 휴대전화 손상, 터널 내에서 연결이 끊김, 허용되는 시간 외에 수신된 메시지 때문일 수 있습니다. 불완전한 데이터가 결과에 어떤 영향을 미치나요?
이 목록은 일부에 불과하며, 더 많은 대상이 포함될 수 있습니다. 각각을 더 자세히 이해하는 데 도움이 되는 추천 자료를 소개합니다.
참여자
Google에서 이 문서를 유지관리합니다. 다음 참여자가 원래 작성했습니다.
주요 저자:
- Mary Pishny | Google Maps Platform 제품 관리자
- 에셀 바오| 소프트웨어 엔지니어, Google Maps Platform
- 모하나드 알미스키 | Google Maps Platform 소프트웨어 엔지니어
- 모리타니 나오야 | 솔루션 엔지니어, Google Maps Platform