자율주행차나 증강현실과 같이 딥러닝을 활용하는 모바일 비전 어플리케이션에 대한 소비자의 수요가 증가하면서 학계와 산업계의 관심도 같이커지고 있다. 딥러닝 기반 모바일 비전 어플리케이션은 사용하는 딥러닝 모델의 너비, 깊이 등 모델 측면의 특성과 사용하는 모바일 단말의 컴퓨팅성능, 네트워크 환경, 발열 등 자원 측면의 특성 및 처지에 따라 그 성능이 크게 변한다. 기존 연구들은 대부분 주어진 단말에 대해서 딥러닝 모델을 최적화하거나 특정 모델에 대해서 동적 코드 오프로딩이나 동적 GPU 주파수 조절을 하는 등 자원을 최적화하는 단방향 최적화를 해왔다. 또한 모바일 단말의네트워크 환경이나 컴퓨팅 자원, 유저의 서비스 요청량 등이 특정한 분포를 따르는 등 비현실적인 가정을 포함해 실제 환경과 동떨어진 부분이 있었다. 우리는 현실적인 상황에서도 적응적으로 딥러닝 모델과 단말, 엣지 서버의 자원을 동시에 최적화하여 단말의 프레임 처리량, 평균 정확도, 에너지소모량, 발열, 메모리 용량 등 다양한 요구 조건을 만족할 수 있는 방안을 제안한다.