컬렉션을 사용해 정리하기 내 환경설정을 기준으로 콘텐츠를 저장하고 분류하세요. GPU의 AI 모델 소개 퀴즈 경로로 돌아가기 학습과 추론의 주요 차이점은 무엇인가요? 학습은 순방향 패스만 사용하고 추론은 순방향 + 역방향을 사용합니다. 학습은 가중치를 업데이트하지만 추론은 가중치를 업데이트하지 않습니다. 추론에는 학습보다 큰 데이터 세트가 필요합니다. 추론은 항상 CPU를 사용합니다. 모델 형식은 주로 무엇을 정의하나요? 학습 로그의 압축 비율 가중치, 편향, 메타데이터가 직렬화되는 방식 모델이 생성할 수 있는 토큰 수 GPU 예약 방법 TensorRT 엔진을 가장 잘 설명하는 것은 무엇인가요? 연구를 위한 휴대용 체크포인트 공급업체에 구애받지 않는 교환 형식 특정 하드웨어용으로 컴파일된 GPU 최적화 바이너리 경량 커뮤니티 기반 형식 CPU와 비교했을 때 GPU가 추론에 적합한 이유는 무엇인가요? 코어를 더 적게 사용합니다. 행렬 수학에 최적화된 수천 개의 병렬 코어가 있습니다. 코어당 전력 소비량이 많습니다. 더 다양한 명령어를 처리합니다. 성능 최적화에서 '무릎 지점'이란 무엇인가요? 처리량이 급감하는 지연 시간 값 지연 시간을 너무 많이 늘리지 않고 처리량을 개선할 수 있는 지점 관찰된 가장 느린 지연 시간 성능 트레이드 오프와 관계없이 모델에서 달성할 수 있는 최소 메모리 사용량 답변 제출 error_outline 퀴즈를 채점하는 중에 오류가 발생했습니다. 다시 시도해 주세요.