model compression

[Model Compression] 모델 양자화(Model Optimization) with Tensorflow

2024.05.21

딥러닝 모델을 경량화하는 것은 모델 학습 이후 실제 문제에 딥러닝 해법을 적용하는 과정에 있어서 실행 시간, 예측에 필요한 리소스 소모량을 줄이기 위해서 필요한 과정이다.모델 경량화에는 (내가 알고 있기로는) 세 가지 방법이 있는데,모델 양자화(비트 수를 줄이는 방식)모델 pruning(중요하지 않은 부분을 버리는 방식)그냥 모델 설계를 잘하기중에 이미 학습한 모델에 있어서 가장 쉬운 양자화를 우선 하기로 결정하였다. Tensorflow 기반의 모델을 양자화하는 예제를 기록해둔다.Tensorflow로 구성되어 학습하고 가중치를 .h5 확장자로 저장한 모델1. 모델 양자화a. 모델 불러오기import tensorflow as tfmodel = your_model(parameter)model.load_wei..

[Model Compression] 모델 양자화(Model Optimization) with Tensorflow

티스토리툴바