Fleet Engine 및 Fleet 이벤트 참조 솔루션으로 실시간에 가까운 이벤트 생성

현장에서 작동하는 차량의 거의 실시간 신호는 비즈니스에 여러 가지로 유용합니다. 예를 들어 비즈니스는 다음과 같은 작업을 할 수 있습니다.

  • 차량의 성능을 모니터링하고 잠재적인 문제를 조기에 식별합니다.
  • 정확한 도착 예정 시간 및 추적 정보를 제공하여 고객 서비스 개선
  • 비효율성을 식별하고 해결하여 비용 절감
  • 운전자 행동을 모니터링하고 잠재적 위험을 파악하여 안전을 개선합니다.
  • 운전자 경로 및 일정을 최적화하여 효율성 개선
  • 차량 위치 및 영업시간을 추적하여 규정을 준수하세요.

이 문서에서는 개발자가 Google 지도 플랫폼의 '모빌리티 서비스'('라스트 마일 차량 솔루션'(LMFS) 또는 '주문형 이동 및 배송 솔루션'(ODRD))의 신호를 실행 가능한 맞춤 이벤트로 전환하는 방법을 보여줍니다. GitHub에서 제공되는 Fleet Events Reference Solution의 주요 개념과 설계 결정도 다룹니다.

이 문서는 다음과 관련이 있습니다.

  • Google Maps Platform의 '모빌리티 서비스' 및 핵심 구성요소 중 하나인 'Fleet Engine'에 익숙한 설계자 '모빌리티 서비스'를 처음 사용하는 경우 필요에 따라 라스트 마일 Fleet 솔루션 또는 주문형 이동 및 배송 솔루션을 숙지하는 것이 좋습니다.
  • Google Cloud에 익숙한 설계자 Google Cloud를 처음 사용하는 경우 Google Cloud에서 스트리밍 데이터 파이프라인 빌드를 먼저 읽어 보시기 바랍니다.
  • 다른 환경이나 소프트웨어 스택을 타겟팅하는 경우 Fleet Engine의 통합 지점과 주요 고려사항을 이해하는 데 집중하세요. 이는 여전히 적용될 수 있습니다.
  • 함대의 이벤트를 생성하고 활용하는 방법을 알아보는 데 관심이 있는 사용자

이 문서를 마치면 스트리밍 시스템의 주요 요소와 고려사항을 비롯하여 차량 이벤트 참조 솔루션을 구성하는 Google 지도 플랫폼 및 Google Cloud의 빌드 블록에 대한 기본적인 이해를 갖게 됩니다.

Fleet Events 참조 솔루션 개요

Fleet Events Reference Solution은 이동통신사 고객과 파트너가 Fleet Engine 및 Google Cloud 구성요소를 기반으로 주요 이벤트를 생성할 수 있는 오픈소스 솔루션입니다. 현재 참조 솔루션은 주문형 차량 공유 및 배송을 지원하는 라스트 마일 Fleet 솔루션을 사용하는 고객을 지원하며, 향후 더 많은 기능이 추가될 예정입니다.

이 솔루션은 작업 또는 이동과 연결된 특정 데이터의 변경사항을 기반으로 이벤트를 자동으로 생성합니다. 이러한 이벤트를 사용하여 이해관계자에게 다음과 같은 알림을 보내거나 차량에 다른 작업을 트리거할 수 있습니다.

  • 할 일 도착 시간 변경
  • 작업 도착의 상대적 ETA 변경
  • 할 일 도착까지 남은 시간
  • 작업 도착까지의 남은 거리
  • TaskOutcome 상태 변경

참조 솔루션의 각 구성요소는 비즈니스 요구사항에 맞게 맞춤설정할 수 있습니다.

논리적 구성 요소

다이어그램 : 다음 다이어그램은 Fleet Events 참조 솔루션을 구성하는 대략적인 구성요소를 보여줍니다.

Fleet 이벤트 개요 및 논리적 구성 블록

참조 솔루션에는 다음 구성요소가 포함됩니다.

  • 이벤트 소스: 원본 이벤트 스트림의 출처입니다. 'Last Mile Fleet 솔루션' 또는 'On-demand Rides and Deliveries 솔루션'은 모두 Fleet Engine RPC 호출 로그를 개발자가 사용할 수 있는 이벤트 스트림으로 전환하는 데 도움이 되는 Cloud Logging과 통합되어 있습니다. 이는 소비할 핵심 소스입니다.
  • 처리: 원시 RPC 호출 로그는 로그 이벤트 스트림을 통해 계산하는 이 블록 내에서 상태 변경 이벤트로 변환됩니다. 이러한 변경사항을 감지하려면 새 수신 이벤트를 이전 이벤트와 비교하여 변경사항을 감지할 수 있도록 상태 저장소가 필요합니다. 이벤트에 항상 관심 있는 모든 정보가 포함되는 것은 아닙니다. 이 경우 이 블록은 필요에 따라 백엔드에 대한 조회 호출을 실행할 수 있습니다.
    • 상태 저장소: 일부 처리 프레임워크는 자체적으로 지속되는 중간 데이터를 제공합니다. 그렇지 않은 경우 상태를 직접 저장하려면 차량 및 이벤트 유형에 고유해야 하므로 K-V 유형 데이터 지속성 서비스를 사용하는 것이 좋습니다.
  • 싱크 (맞춤 이벤트): 감지된 상태 변경은 이로부터 이점을 얻을 수 있는 모든 애플리케이션 또는 서비스에 제공되어야 합니다. 따라서 다운스트림 소비를 위해 이 맞춤 이벤트를 이벤트 전송 시스템에 게시하는 것이 자연스러운 선택입니다.
  • 다운스트림 서비스: 생성된 이벤트를 소비하고 사용 사례에 고유한 작업을 실행하는 코드입니다.

서비스 선택

'Last Mile Fleet 솔루션' 또는 '주문형 이동 및 배송 솔루션'(2023년 3분기 말 출시 예정)의 참조 솔루션을 구현할 때 '소스' 및 '싱크'의 기술 선택은 간단합니다. 반면에 '처리'에는 다양한 옵션이 있습니다. 참조 솔루션에서는 다음 Google 서비스를 선택했습니다.

다이어그램 : 다음 다이어그램은 참조 솔루션을 구현하는 Google Cloud 서비스를 보여줍니다.

Fleet Events 참조 솔루션 빌드 블록

Cloud 프로젝트 레이아웃

기본적으로 다중 프로젝트 배포를 사용하는 것이 좋습니다. 이렇게 하면 Google Maps Platform 사용량과 Google Cloud 사용량을 명확하게 분리하고 선택한 결제 조건에 연결할 수 있습니다.

이벤트 소스

'Last Mile Fleet Solution' 및 'On-demand Rides and Deliveries Solution'은 API 요청 및 응답 페이로드를 Cloud Logging에 작성합니다. Cloud Logging은 선택한 하나 이상의 서비스에 로그를 전송합니다. Cloud Pub/Sub로 라우팅하는 것이 가장 적합하며 코딩 없이 로그를 이벤트 스트림으로 변환할 수 있습니다.

싱크

Google Cloud에서는 Cloud Pub/Sub가 거의 실시간 메시지 전송 시스템으로 사용됩니다. 소스의 이벤트가 Pub/Sub에 전송되는 것처럼 커스텀 이벤트도 다운스트림에서 소비할 수 있도록 Pub/Sub에 게시됩니다.

처리 중

다음 구성요소는 이벤트 처리에 관여합니다. 다른 구성요소와 마찬가지로 처리 구성요소는 완전히 서버리스이며 위아래로 모두 잘 확장됩니다.

  • 초기 출시의 컴퓨팅 플랫폼으로 Cloud Functions를 사용합니다 (*).
    • 서버리스: 확장 제어를 사용하여 비용을 관리하면서 확장 및 축소
    • 구현 용이성에 기여하는 Fleet Engine 관련 API용 클라이언트 라이브러리를 사용할 수 있으므로 프로그래밍 언어로 Java를 사용합니다.
  • 상태 저장소로 Cloud Firestore 사용
    • 서버리스 키-값 스토어
  • 업스트림 및 다운스트림 구성요소와의 통합 지점으로서의 Cloud Pub/Sub
    • 느슨하게 결합된 준실시간 통합

이 함수는 기본 설정으로 있는 그대로 사용할 수 있지만 재구성할 수도 있습니다. 구성 매개변수는 배포 스크립트를 통해 설정되며 상응하는 Terraform 모듈 리드미에 자세히 설명되어 있습니다.

*참고: 이 참조 솔루션은 다양한 요구사항을 충족하는 데 도움이 되는 대체 구현을 출시할 계획입니다.

배포

참조 솔루션 배포 프로세스를 반복 가능하고, 맞춤설정 가능하며, 소스 코드를 제어할 수 있고, 안전하게 만들기 위해 Terraform이 자동화 도구로 선택되었습니다. Terraform은 Google Cloud를 폭넓게 지원하는 IaC (코드형 인프라) 도구로 널리 사용되고 있습니다.

Terraform 모듈

대규모 모놀리식 참조 솔루션 배포 모듈을 하나 만드는 대신 재사용 가능한 자동화 블록을 독립적으로 사용할 수 있는 Terraform 모듈로 구현합니다. 모듈은 다양한 구성 가능한 변수를 제공합니다. 대부분의 변수에는 기본값이 있으므로 빠르게 시작할 수 있지만 필요와 환경설정에 따라 유연하게 맞춤설정할 수도 있습니다.

참조 솔루션에 포함된 모듈:

  • Fleet Engine 로깅 구성: Fleet Engine에서 사용할 Cloud Logging 관련 구성을 자동화합니다. 참조 솔루션에서는 Fleet Engine 관련 로그를 지정된 Pub/Sub 주제로 라우팅하는 데 사용됩니다.
  • Fleet Events Cloud Functions 배포: 샘플 함수 코드 배포를 포함하고 있으며 안전한 교차 프로젝트 통합에 필요한 권한 설정 자동화도 처리합니다.
  • 전체 참조 솔루션 배포: 이전 두 모듈을 호출하고 전체 솔루션을 래핑합니다.

보안

IAM은 서비스 계정 명의 도용과 같은 Google Cloud의 보안 권장사항과 함께 최소 권한 원칙을 적용하기 위해 채택되었습니다. 다음 도움말을 참고하여 Google Cloud에서 제공하는 보안 관리 기능을 자세히 알아보세요.

다음 조치

이제 Fleet 이벤트 참조 솔루션에 액세스하여 자세히 살펴볼 수 있습니다. 시작하려면 GitHub로 이동하세요.

부록

요구사항 수집

프로세스 초기에 요구사항을 수집하는 것이 좋습니다.

먼저 준실시간 이벤트에 관심이 있거나 이를 사용해야 하는 이유에 관한 세부정보를 파악합니다. 다음은 요구사항을 구체화하는 데 도움이 되는 몇 가지 질문입니다.

  • 이벤트 스트림이 유용하려면 어떤 정보가 필요한가요?
    • 결과를 Google 서비스에서 캡처하거나 생성한 데이터에서만 파생할 수 있나요? 또는 통합된 외부 시스템으로 데이터를 보강해야 하나요? 그렇다면 어떤 시스템이며 어떤 통합 인터페이스를 제공하나요?
    • 비즈니스에서 측정하려는 측정항목은 무엇인가요? 어떻게 정의되나요?
    • 이벤트 전반에서 측정항목을 계산해야 하는 경우 어떤 종류의 집계가 필요하나요? 논리적인 단계를 배치해 보세요. (예: 사용량이 많은 시간에 전체 서비스의 하위 집합에서 ETA/ATA를 SLO와 비교하여 리소스 제약 조건에서 성능을 계산합니다.)
  • 일괄 처리가 아닌 이벤트 기반 모델에 관심이 있는 이유는 무엇인가요? 지연 시간 (time-to-action)을 줄이기 위한 것인가요, 아니면 느슨하게 결합된 통합(민첩성)을 위한 것인가요?
    • 지연 시간이 짧은 경우 '낮음'으로 정의합니다. 분? 초? 1초 미만인가요? 지연 시간은 얼마인가요?
  • 이미 팀으로서 기술 스택과 관련 기술에 투자했나요? 그렇다면 어떤 기능이며 어떤 통합 지점을 제공하나요?
    • 현재 시스템이 충족할 수 없거나 차량에서 발생하는 이벤트를 처리할 때 어려움을 겪을 수 있는 요구사항이 있나요?

디자인 원칙

따라야 할 사고 과정을 마련하는 것이 항상 유용합니다. 특히 다양한 옵션 중에서 선택해야 하는 경우 일관된 설계 결정을 내리는 데 도움이 됩니다.

  • 더 간단한 옵션을 기본값으로 설정합니다.
  • 기본값은 더 짧은 가치 창출 시간입니다. 코드가 적고 학습 곡선이 완만합니다.
  • 지연 시간과 성능의 경우 최대 최적화가 아닌 설정한 기준을 충족하는 것을 목표로 합니다. 또한 과도한 최적화는 복잡성을 증가시키는 경우가 많으므로 피하세요.
  • 비용도 마찬가지입니다. 합리적인 비용을 유지합니다. 가치가 높지만 상대적으로 비용이 더 많이 드는 서비스를 사용할 수 있는 상태가 아닐 수 있습니다.
  • 실험 단계에서는 확장만큼이나 축소도 중요할 수 있습니다. 한도 내에서 유연하게 확장하고, 아무것도 하지 않을 때 비용이 들지 않도록 축소 (0으로 축소하는 것이 이상적)할 수 있는 플랫폼을 고려하세요. 항상 사용 설정된 인프라를 통한 고성능은 필요성을 확신할 수 있을 때 나중에 고려할 수 있습니다.
  • 나중에 개선할 부분을 파악할 수 있도록 관찰하고 측정합니다.
  • 서비스를 느슨하게 결합합니다. 이렇게 하면 나중에 하나씩 교체하기가 더 쉬워집니다.
  • 마지막으로 보안은 느슨해서는 안 됩니다. 퍼블릭 클라우드 환경에서 실행되는 서비스이므로 시스템에 안전하지 않은 문이 있을 수 없습니다.

스트리밍 개념

이벤트 기반 또는 스트리밍에 비교적 익숙하지 않은 경우 알아두어야 할 주요 개념이 있으며, 그중 일부는 일괄 처리와 매우 다를 수 있습니다.

  • 규모 : 일반적으로 처리할 데이터의 양을 잘 알고 있는 일괄 처리와 달리 스트리밍에서는 이를 알 수 없습니다. 도시의 교통 체증으로 인해 특정 지역에서 갑자기 많은 이벤트가 발생할 수 있지만 이를 처리해야 합니다.
  • : 이벤트를 하나씩 처리하는 대신 계산 단위로 타임라인의 이벤트를 더 작은 '창'으로 그룹화하는 경우가 많습니다. '고정 기간 (예: 모든 캘린더 날짜)', '슬라이딩 기간 (지난 5분)', '세션 기간 (이 이동 중)'과 같은 다양한 기간 전략이 있으므로 선택해야 합니다. 기간이 길수록 결과가 지연되는 시간이 길어집니다. 요구사항에 맞는 적절한 모델과 구성을 선택합니다.
  • 트리거 : 비교적 긴 기간을 두는 수밖에 없는 경우가 있습니다. 하지만 이벤트를 생성하기 위해 기간이 끝날 때까지 기다리는 대신 그 사이에 중간 결과를 내보내는 것이 좋습니다. 이 개념은 먼저 빠른 결과를 반환한 다음 나중에 수정하는 것이 유용한 사용 사례에 구현할 수 있습니다. 전송 완료의 25%, 50%, 75% 지점에서 중간 상태를 내보낸다고 가정해 보겠습니다.
  • 순서 지정 : 이벤트가 생성된 순서대로 시스템에 도달하지는 않습니다. 특히 지연 시간과 복잡한 라우팅 경로를 추가하는 모바일 네트워크를 통한 통신이 포함된 사용 사례에 적합합니다. '이벤트 시간' (이벤트가 실제로 발생한 시간)과 '프로세스 시간' (이벤트가 시스템에 도달한 시간)의 차이를 인식하고 그에 따라 이벤트를 처리해야 합니다. 일반적으로 '이벤트 시간'을 기준으로 이벤트를 처리합니다.
  • 메시지 전송 - 최소 1회 전송과 정확히 1회 전송 비교: 이벤트 플랫폼마다 이에 대한 지원이 다릅니다. 사용 사례에 따라 재시도 또는 중복 삭제 전략을 고려해야 합니다.
  • 완성도 : 순서 변경과 마찬가지로 메시지가 손실될 수 있습니다. 기기의 배터리 수명, 의도하지 않은 휴대전화 손상, 터널에 있는 동안 연결 끊김, 수신된 메시지가 허용 가능한 기간을 벗어났기 때문에 애플리케이션과 기기가 종료되었을 수 있습니다. 불완전성이 결과에 어떤 영향을 미치나요?

이 목록은 일부에 불과하며, 더 많은 대상이 포함될 수 있습니다. 다음은 각 항목에 대한 이해를 높이는 데 도움이 되는 권장 도서입니다.

참여자

Google에서 이 문서를 유지 관리합니다. 다음 참여자가 원래 작성했습니다.

주요 저자: