안경잡이개발자

728x90
반응형

※ 오류 상황 ※

 

  아래 오류는 PyTorch 프레임워크를 이용하여 CNN 분류 모델의 학습 코드를 돌릴 때 마주쳤던 오류다.

 

  ▶ 오류 메시지: "RuntimeError: Function AddmmBackward returned an invalid gradient."

 

 

※ 오류 발생 원인 ※

 

  일반적으로 CNN에서는 convolutional layers에 기반한 feature extractor에서 나온 결과를 flatten한 뒤에 (벡터터로 변경한 뒤에) linear layer의 입력으로 넣는다. 다만 이때, flattened dimension과 linear layer의 input dimension이 서로 다를 때 발생할 수 있는 오류다.

728x90
반응형

Comment +1