주요 최적화 기술
- 모델 구조 최적화
- 모델 압축
- 가지치기: 덜 중요한 뉴런이나 가중치를 제거하여 모델 크기를 줄입니다.
- 양자화: 32비트 부동 소수점 연산을 16비트 또는 8비트 정수로 변환하여 모델 크기와 계산량을 줄입니다.
- 경량 모델 디자인
- 경량 신경망 구조 설계.
- 계층적 설계를 통해 정확성과 속도 사이의 균형을 유지합니다.
- 모델 압축
- 하드웨어 최적화
- GPU/TPU 활용도
- 하드웨어 가속 라이브러리를 사용합니다.
- 엣지 디바이스 최적화
- 제한된 컴퓨팅 환경에 최적화되었습니다.
- 각 하드웨어에 대한 맞춤형 모델 배포.
- GPU/TPU 활용도
- 학습 최적화
- 초매개변수 조정
- 매개변수를 최적화하여 학습 효율성과 성과를 향상시킵니다.
- 지능형 학습 기술
- 전이 학습: 사전 훈련된 모델을 활용하여 학습 시간을 단축합니다.
- 지식 증류: 대형 모델의 지식을 경량 모델로 이전합니다.
- 초매개변수 조정
- 배포 및 실행 최적화
- 모델 변환 및 런타임 최적화
- 다양한 플랫폼에서 모델을 실행 가능한 모델로 변환합니다.
- 경량 모델 배포.
- 모델 변환 및 런타임 최적화
테스트된 장치: Jetson Orin Nano, Jetson Orin NX, Jetson AGX Orin, Hailo
성능: 적용된 최적화 기술, 모델 유형 및 대상 하드웨어에 따라 3배에서 20배 이상까지 다양합니다.

