본 발명의 일 실시예에 따른 탑승객 인식 방법은 적어도 하나의 헤드를 포함하는 복수의 프레임을 획득하는 단계, 복수의 컨벌루션 레이어 및 복수의 헤드 검출 네트워크를 포함하는 신경망에 상기 복수의 프레임을 입력하는 단계, 제1 컨벌루션 레이어에서 출력된 제1 특징맵을 제1 헤드 검출 네트워크에 입력하고, 제2 컨벌루션 레이어에서 출력된 제2 특징맵 및 상기 제1 특징맵을 제2 헤드 검출 네트워크에 입력하는 단계, 상기 제2 헤드 검출 네트워크에서 상기 제1 특징맵을 업샘플링(upsampling)한 후 상기 제2 특징맵과 합성곱 연산을 수행하고, 상기 제2 헤드 검출 네트워크의 출력 데이터를 기초로 상기 복수의 프레임에 포함된 헤드를 검출하는 단계 및 상기 검출된 헤드가 제1 라인을 통과한 후 제2 라인을 통과하는 경우, 탑승객이 승차한 것으로 판단하고, 상기 헤드가 제2 라인을 통과한 후 제1 라인을 통과하는 경우 상기 탑승객이 하차한 것으로 판단하는 단계를 포함할 수 있다.