안경잡이개발자

728x90
반응형

  세계적으로 매우 많은 얼굴 데이터셋이 존재합니다. 오늘은 그중에서 PubFig라는 이름을 가지고 있는 두 개의 데이터셋을 소개하고자 합니다. 바로 PubFig와 PubFig83인데요. 재미있게도 이 두 개의 데이터셋은 이름은 같지만 서로 다른 데이터셋입니다.

 

1. PubFig (Public Figures Face Database)

 

  PubFig 데이터셋은 200명에 대한 총 60,000개의 얼굴 이미지로 구성됩니다. 장면이나 포즈가 통제된(controlled) 상태가 아니고, 완전히 다양한 상황에서의 사진으로 구성되어 있습니다. 그런 측면에서 LFW (Labeled Faces in the Wild) 데이터셋과 유사합니다. 그래도 LFW에 비하면 사람당(클래스당) 이미지가 훨씬 많은 편입니다.

 

  PubFig 데이터셋은 콜롬비아 대학교에서 배포하였으며, 다음의 경로에서 확인 가능합니다.

 

  ▶ 공식 사이트: www.cs.columbia.edu/CAVE/databases/pubfig/

 

Pubfig: Public Figures Face Database

Introduction The PubFig database is a large, real-world face dataset consisting of 58,797 images of 200 people collected from the internet. Unlike most other existing face datasets, these images are taken in completely uncontrolled situations with non-coop

www.cs.columbia.edu

 

  이 데이터셋의 아쉬운 점은 URL 정보만 알려주고, 다운로드는 개발자가 직접하는 방식이라는 점입니다. 특히나 이미 시간이 오래 지나서 접근이 불가능한 이미지 경로가 많습니다. 다음과 같이 직접 URL에 접근해야 합니다.

 

 

2. PubFig83 (A resource for studying face recognition in personal photo collections)

 

  PubFig83 데이터셋은 83명에 대한 만 개가량의 이미지로 구성됩니다. 참고로 PugFig83 데이터셋에 등장하는 사람은 대체로 유명인(celebrity)입니다. 예를 들어 윌 스미스(Will Smith), 휴 잭맨(Hugh Jackman)과 같은 사람의 이미지가 들어 있습니다. 

 

  PubFig83 데이터셋은 하버드 대학교에서 배포하였으며, 다음의 경로에서 확인 가능합니다.

 

  ▶ 공식 사이트: vision.seas.harvard.edu/pubfig83/

 

PubFig83

PubFig83: A resource for studying face recognition in personal photo collections   This is a downloadable dataset of 8300 cropped facial images, made up of 100 images for each of 83 public figures. It was derived from the list of URLs compiled by Neeraj K

vision.seas.harvard.edu

 

  이미지 파일을 다운로드해서 열어 보니 100 x 100 크기로 잘라진(croppe) 이미지 파일 형태로 존재하네요.

 

728x90
반응형