지상에서 운행되는 차량의 실시간에 가까운 신호는 기업에 여러 가지 면에서 유용합니다. 예를 들어 비즈니스는 다음과 같은 용도로 사용할 수 있습니다.
- 차량의 성능을 모니터링하고 잠재적인 문제를 조기에 식별합니다.
- 정확한 도착 예정 시간 및 추적 정보를 제공하여 고객 서비스 개선
- 비효율성을 파악하고 해결하여 비용 절감
- 운전자 행동을 모니터링하고 잠재적 위험을 파악하여 안전을 개선합니다.
- 운전자 경로와 일정을 최적화하여 효율성 향상
- 차량 위치 및 영업시간을 추적하여 규정을 준수하세요.
이 문서에서는 개발자가 Google 지도 플랫폼의 '모빌리티 서비스'('라스트 마일 차량 솔루션'(LMFS) 또는 '주문형 이동 및 배송 솔루션'(ODRD))의 신호를 실행 가능한 맞춤 이벤트로 전환하는 방법을 보여줍니다. GitHub에서 제공되는 Fleet Events Reference Solution의 주요 개념과 설계 결정도 다룹니다.
이 문서는 다음과 관련이 있습니다.
- Google Maps Platform의 '모빌리티 서비스' 및 핵심 구성요소 중 하나인 'Fleet Engine'에 익숙한 설계자 '모빌리티 서비스'를 처음 사용하는 경우 필요에 따라 라스트 마일 Fleet 솔루션 또는 주문형 차량 공유 및 배송 솔루션을 숙지하는 것이 좋습니다.
- Google Cloud에 익숙한 설계자 Google Cloud를 처음 사용하는 경우 Google Cloud에서 스트리밍 데이터 파이프라인 빌드를 먼저 읽어 보시기 바랍니다.
- 다른 환경 또는 소프트웨어 스택을 타겟팅하는 경우 Fleet Engine의 통합 지점과 여전히 적용 가능한 주요 고려사항을 이해하는 데 집중하세요.
- 함대의 이벤트를 생성하고 활용하는 방법을 알아보는 데 관심이 있는 사용자
이 문서를 마치면 스트리밍 시스템의 주요 요소와 고려사항을 비롯하여 차량 이벤트 참조 솔루션을 구성하는 Google 지도 플랫폼 및 Google Cloud의 빌드 블록에 대한 기본적인 이해를 갖게 됩니다.
Fleet 이벤트 참조 솔루션 개요
Fleet 이벤트 참조 솔루션은 이동성 고객과 파트너가 Fleet Engine 및 Google Cloud 구성요소를 기반으로 주요 이벤트를 생성할 수 있는 오픈소스 솔루션입니다. 현재 참조 솔루션은 주문형 차량 공유 및 배송을 지원하는 라스트 마일 Fleet 솔루션을 사용하는 고객을 지원하며, 향후 더 많은 기능이 추가될 예정입니다.
솔루션은 작업 또는 이동과 관련된 특정 데이터의 변경사항에 따라 이벤트를 자동으로 생성합니다. 이러한 이벤트를 사용하여 이해관계자에게 다음과 같은 알림을 보내거나 차량에 다른 작업을 트리거할 수 있습니다.
- 할 일 도착 시간 변경
- 작업 도착의 상대적 ETA 변경사항
- 할 일 도착까지 남은 시간
- 작업 도착까지의 남은 거리
- TaskOutcome 상태 변경
참조 솔루션의 각 구성요소는 비즈니스 요구에 맞게 맞춤설정할 수 있습니다.
논리적 구성 요소
다이어그램 : 다음 다이어그램은 Fleet Events 참조 솔루션을 구성하는 상위 구성요소를 보여줍니다.
참조 솔루션에는 다음 구성요소가 포함됩니다.
- 이벤트 소스: 원본 이벤트 스트림의 출처입니다. 'Last Mile Fleet 솔루션' 또는 'On-demand Rides and Deliveries 솔루션'은 모두 Fleet Engine RPC 호출 로그를 개발자가 사용할 수 있는 이벤트 스트림으로 변환하는 데 도움이 되는 Cloud Logging과 통합되어 있습니다. 이는 소비할 핵심 소스입니다.
- 처리: 원시 RPC 호출 로그는 로그 이벤트 스트림을 통해 계산하는 이 블록 내에서 상태 변경 이벤트로 변환됩니다. 이러한 변경사항을 감지하려면 새 수신 이벤트를 이전 이벤트와 비교하여 변경사항을 감지할 수 있도록 상태 저장소가 필요합니다. 이벤트에 항상 관심 있는 모든 정보가 포함되는 것은 아닙니다. 이러한 경우 이 블록은 필요에 따라 백엔드 호출을 조회할 수 있습니다.
- 상태 저장소: 일부 처리 프레임워크는 자체적으로 지속되는 중간 데이터를 제공합니다. 하지만 그렇지 않은 경우 상태를 직접 저장하려면 차량 및 이벤트 유형에 고유해야 하므로 K-V 유형 데이터 지속성 서비스가 적합합니다.
- 싱크 (맞춤 이벤트): 감지된 상태 변경은 이로부터 이점을 얻을 수 있는 모든 애플리케이션 또는 서비스에서 사용할 수 있어야 합니다. 따라서 다운스트림 소비를 위해 이 맞춤 이벤트를 이벤트 전송 시스템에 게시하는 것이 자연스러운 선택입니다.
- 다운스트림 서비스: 생성된 이벤트를 소비하고 사용 사례에 고유한 작업을 실행하는 코드입니다.
서비스 선택
'Last Mile Fleet 솔루션' 또는 '주문형 차량 공유 및 배송 솔루션'(2023년 3분기 말 출시 예정)의 참조 솔루션을 구현할 때 '소스'와 '싱크'의 기술 선택은 간단합니다. 반면에 '처리'에는 다양한 옵션이 있습니다. 참조 솔루션에서 선택한 Google 서비스는 다음과 같습니다.
다이어그램 : 다음 다이어그램은 참조 솔루션을 구현하는 Google Cloud 서비스를 보여줍니다.
Cloud 프로젝트 레이아웃
기본적으로 다중 프로젝트 배포를 사용하는 것이 좋습니다. 이렇게 하면 Google Maps Platform 및 Google Cloud 사용량을 명확하게 구분하고 원하는 결제 방식에 연결할 수 있습니다.
이벤트 소스
'Last Mile Fleet Solution' 및 'On-demand Rides and Deliveries Solution'은 API 요청 및 응답 페이로드를 Cloud Logging에 작성합니다. Cloud Logging은 선택한 하나 이상의 서비스에 로그를 전송합니다. Cloud Pub/Sub로 라우팅하는 것이 가장 적합하며 코딩 없이 로그를 이벤트 스트림으로 변환할 수 있습니다.
- Logging | Fleet 성능(LMFS 사용자용)
- 로깅 | 이동 및 주문 진행 상황(ODRD 사용자용)
- Pub/Sub로 라우팅된 로그 보기 : 로깅 → Pub/Sub 통합 개요
싱크
Google Cloud에서는 Cloud Pub/Sub가 거의 실시간 메시지 전송 시스템으로 사용됩니다. 소스의 이벤트가 Pub/Sub에 전송되는 것처럼 커스텀 이벤트도 다운스트림에서 소비할 수 있도록 Pub/Sub에 게시됩니다.
처리 중
이벤트 처리에서 중요한 역할을 하는 구성요소는 다음과 같습니다. 다른 구성요소와 마찬가지로 처리 구성요소는 완전히 서버리스이며 위아래로 모두 잘 확장됩니다.
- 초기 출시의 컴퓨팅 플랫폼으로 Cloud Functions를 사용합니다 (*).
- 서버리스: 확장 제어를 사용하여 비용을 관리하면서 확장 및 축소
- 프로그래밍 언어로서의 Java 사용(Fleet Engine 관련 API용 클라이언트 라이브러리 제공 시 구현 용이성에 기여)
- 상태 저장소로 Cloud Firestore 사용
- 서버리스 키-값 스토어
- 업스트림 및 다운스트림 구성요소가 있는 통합 지점으로서의 Cloud Pub/Sub
- 거의 실시간으로 느슨하게 결합된 통합
이 함수는 기본 설정으로 있는 그대로 사용할 수 있지만 재구성할 수도 있습니다. 구성 매개변수는 배포 스크립트를 통해 설정되며 상응하는 Terraform 모듈 리드미에 자세히 설명되어 있습니다.
*참고: 이 참조 솔루션은 다양한 요구사항을 충족하는 데 도움이 되는 대체 구현을 출시할 계획입니다.
배포
참조 솔루션 배포 프로세스를 반복 가능하고, 맞춤설정 가능하며, 소스 코드를 제어 가능하고, 안전하게 만들기 위해 Terraform이 자동화 도구로 선택되었습니다. Terraform은 Google Cloud에 대한 풍부한 지원을 제공하며 널리 채택되는 IaC (코드형 인프라) 도구입니다.
- Google Cloud Platform 제공업체: 'Google Cloud Platform 제공업체'에서 지원하는 리소스에 관한 문서
- Terraform 사용 권장사항: Google Cloud에서 가장 효과적으로 도입하는 방법에 관한 풍부한 안내
- Terraform 레지스트리: Google 및 커뮤니티에서 지원하는 추가 모듈
Terraform 모듈
대규모 모놀리식 참조 솔루션 배포 모듈을 하나 만드는 대신 재사용 가능한 자동화 블록을 독립적으로 사용할 수 있는 Terraform 모듈로 구현합니다. 모듈은 구성 가능한 다양한 변수를 제공하며, 대부분의 경우 기본값이 있으므로 빠르게 시작할 수 있을 뿐만 아니라 요구사항과 환경설정에 따라 유연하게 맞춤설정할 수도 있습니다.
참조 솔루션에 포함된 모듈:
- Fleet Engine 로깅 구성: Fleet Engine에서 사용할 Cloud Logging 관련 구성을 자동화합니다. 참조 솔루션에서는 Fleet Engine 관련 로그를 지정된 Pub/Sub 주제로 라우팅하는 데 사용됩니다.
- Fleet 이벤트 클라우드 함수 배포: 샘플 함수 코드 배포를 포함하고 안전한 프로젝트 간 통합에 필요한 권한 설정 자동화도 처리합니다.
- 전체 참조 솔루션 배포: 앞의 두 모듈을 호출하고 전체 솔루션을 래핑합니다.
보안
IAM은 서비스 계정 명의 도용과 같은 Google Cloud의 보안 권장사항과 함께 최소 권한 원칙을 적용하기 위해 채택되었습니다. 다음 문서를 참조하여 보안을 보다 세밀하게 제어할 수 있도록 지원하는 Google Cloud 기능에 대해 알아보세요.
다음 작업
이제 Fleet 이벤트 참조 솔루션에 액세스하여 자세히 살펴볼 수 있습니다. 시작하려면 GitHub로 이동하세요.
부록
요구사항 수집
프로세스 초기에 요구사항을 수집하는 것이 좋습니다.
먼저 실시간에 가까운 이벤트에 관심이 있거나 사용해야 하는 이유에 대한 세부정보를 캡처합니다. 다음은 요구사항을 구체화하는 데 도움이 되는 몇 가지 질문입니다.
- 이벤트 스트림이 유용하려면 어떤 정보가 필요한가요?
- 결과를 Google 서비스에서 캡처하거나 생성한 데이터에서만 파생할 수 있나요? 아니면 통합된 외부 시스템을 통한 데이터 보강이 필요한가요? 그렇다면 어떤 시스템이며 어떤 통합 인터페이스를 제공하나요?
- 비즈니스에서 측정하려는 측정항목은 무엇인가요? 어떻게 정의되나요?
- 이벤트 전반에서 측정항목을 계산해야 하는 경우 어떤 종류의 집계가 필요하나요? 논리적 단계의 배치를 시도합니다. (예: 사용량이 많을 때 Fleet의 하위 부문에서 SLO와 ETA/ATA를 비교하여 리소스 제약조건 하에서 성능을 계산합니다.)
- 일괄 처리 대신 이벤트 기반 모델에 관심이 있는 이유는 무엇인가요? 지연 시간 단축 (실행 시간)인가요, 아니면 느슨하게 결합된 통합(민첩성)을 위해서인가요?
- 지연 시간이 짧은 경우 '낮음'으로 정의합니다. 분? 몇 초, 1초 미만인가요? 지연 시간은 얼마인가요?
- 이미 팀으로서 기술 스택과 관련 기술에 투자했나요? 그렇다면 무엇이며 어떤 통합 지점을 제공할까요?
- 현재 시스템이 충족할 수 없거나 차량에서 발생하는 이벤트를 처리할 때 어려움을 겪을 수 있는 요구사항이 있나요?
디자인 원칙
따라야 할 사고 과정을 마련하는 것이 항상 유용합니다. 이렇게 하면 특히 다양한 옵션 중에서 선택할 수 있는 경우 일관된 설계 결정을 내리는 데 도움이 됩니다.
- 더 간단한 옵션을 기본값으로 설정합니다.
- 기본값은 더 짧은 가치 창출 시간입니다. 코드가 적고 학습 곡선이 완만합니다.
- 지연 시간과 성능의 경우 최대 최적화가 아닌 설정한 기준을 충족하는 것을 목표로 합니다. 또한 지나치게 최적화하면 복잡성이 가중되는 경우가 많으므로 최적화하지 마세요.
- 비용도 마찬가지입니다. 비용을 합리적으로 유지합니다. 가치가 높지만 상대적으로 더 비싼 서비스를 사용하기로 약속할 수 있는 상태가 되지 않았을 수도 있습니다.
- 실험 단계에서는 확장만큼이나 축소도 중요할 수 있습니다. 상한에 따라 수직 확장하고 축소 (0으로 축소)하는 유연성을 제공하여 아무것도 하지 않을 때 비용을 지출하지 않도록 하는 플랫폼을 고려하세요. 항상 사용 설정된 인프라를 통한 고성능은 필요성을 확신할 수 있을 때 나중에 고려할 수 있습니다.
- 나중에 개선할 부분을 파악할 수 있도록 관찰하고 측정합니다.
- 서비스를 느슨하게 결합된 상태로 유지합니다. 이렇게 하면 나중에 하나씩 교체하기가 더 쉬워집니다.
- 마지막으로 보안은 느슨해서는 안 됩니다. 퍼블릭 클라우드 환경에서 실행되는 서비스이므로 시스템에 안전하지 않은 문이 있을 수 없습니다.
스트리밍 개념
이벤트 기반 또는 스트리밍이 비교적 익숙하지 않은 경우 알아두면 좋은 주요 개념이 있으며, 이 중 일부는 일괄 처리와 매우 다를 수 있습니다.
- 규모 : 일반적으로 처리할 데이터의 양을 잘 알고 있는 일괄 처리와 달리 스트리밍에서는 이를 알 수 없습니다. 도시의 교통 체증으로 인해 특정 지역에서 갑자기 많은 이벤트가 발생할 수 있지만 이를 처리해야 합니다.
- 기간 설정 : 이벤트를 하나씩 처리하는 대신 타임라인의 이벤트를 계산 단위로 더 작은 '기간'으로 그룹화하려는 경우가 많습니다. '고정 기간 (예: 모든 캘린더 날짜)', '슬라이딩 기간 (지난 5분)', '세션 기간 (이 이동 중)'과 같은 다양한 기간 전략이 있으므로 선택해야 합니다. 기간이 길수록 결과가 지연되는 시간이 길어집니다. 요구사항에 맞는 적절한 모델과 구성을 선택합니다.
- 트리거 : 상대적으로 긴 기간을 두는 수밖에 없는 경우가 있습니다. 하지만 이벤트를 생성하기 위해 기간이 끝날 때까지 기다리는 대신 그 사이에 중간 결과를 내보내는 것이 좋습니다. 이 개념은 빠른 결과를 먼저 반환한 다음 나중에 수정하는 값인 사용 사례에 구현할 수 있습니다. 전송 25%, 50%, 75% 완료 시점에 중간 상태를 방출한다고 가정해 보겠습니다.
- 순서 지정 : 이벤트가 생성된 순서대로 시스템에 도달하지는 않습니다. 특히 지연 및 복잡한 라우팅 경로가 추가되는 모바일 네트워크를 통한 통신과 관련된 사용 사례에 유용합니다. '이벤트 시간'(이벤트가 실제로 발생한 시점)과 '처리 시간'(이벤트가 시스템에 도달한 시점)의 차이를 알고 적절하게 이벤트를 처리해야 합니다. 일반적으로 '이벤트 시간'을 기준으로 이벤트를 처리합니다.
- 메시지 전송 - 최소 1회 전송과 1회만 전송 비교: 이벤트 플랫폼마다 이에 대한 지원이 다릅니다. 사용 사례에 따라 재시도 또는 중복 삭제 전략을 고려해야 합니다.
- 완전성 : 순서 변경과 마찬가지로 메시지가 손실될 가능성이 있습니다. 기기의 배터리 수명, 의도하지 않은 휴대전화 손상, 터널에 있는 동안 연결 끊김, 수신된 메시지가 허용 가능한 기간을 벗어났기 때문에 애플리케이션과 기기가 종료되었을 수 있습니다. 불완전성이 결과에 어떤 영향을 미칠까요?
이 목록은 일부에 불과하며 소개에 불과합니다. 다음은 각 항목에 대한 이해를 높이는 데 도움이 되는 권장 도서입니다.
참여자
Google에서 이 문서를 유지관리합니다. 다음 참여자가 원래 작성했습니다.
주요 저자:
- 메리 피시니 | Google Maps Platform 제품 관리자
- 에델 바오| Google 지도 플랫폼 소프트웨어 엔지니어
- Mohanad Almiski | Google Maps Platform 소프트웨어 엔지니어
- 나오야 모리타니 | Google Maps Platform 솔루션 엔지니어