안경잡이개발자

728x90
반응형

  CheXpert 데이터셋은 스탠포드(Standford) 대학교에서 연구 목적으로 공개하는 Chest X-rays 데이터셋이다. 본 데이터셋은 말 그대로 흉부 X-ray 데이터셋으로, X-선 검사를 이용해 촬영한 이미지로 구성되어 있다. X-ray를 활용한 신체검사를 받아 본 분들은 알겠지만, 일반적으로 흉부 X-ray 이미지는 정면과 측면 2장을 찍는 경우가 많다.

 

  흉부 방사선 검사는 간단한 검사이지만, 심장의 크기/모양 및 폐혈관의 크기 및 폐부종 여부를 확인하는 데에 도움을 준다는 장점이 있다. 자동으로 흉부 방사선 이미지해석(interpretation)할 수 있는 기술에 대한 수요가 많아지고 있으며, 최근에는 실제로 의사들의 의사결정을 돕기 위해 인공지능을 활용하는 경우가 많아지고 있다. 

 

 

  ▶ CheXpert 데이터셋 소개: https://aimi.stanford.edu/chexpert-chest-x-rays

  ▶ CheXpert 대회(competition) 소개: https://stanfordmlgroup.github.io/competitions/chexpert/

 

  스탠포드(Standford)에서 제공하는 CheXpert 데이터셋은 총 65,240명의 환자(patient)로부터 얻은 224,316개의 흉부 방사선(chest radiograph) 이미지로 구성되어 있다. 각 이미지는 기본적으로 진단 결과 보고서(reports) 정보와 함께 확인 가능하다. CheXpert는 데이터셋의 크기가 크고, 비교를 위해 전문가의 성능 지표를 함께 제공한다.

 

  일반적으로 CheXpert는 데이터셋을 두 개로 나누어 사용한다. 하나는 original 버전이고, 하나는 small 버전이다. small 버전의 경우 320 X 320 크기의 해상도를 갖는다. 실제 논문을 확인해 보면, 각 방사선 촬영 이미지의 크기를 320 X 320으로 변형한 뒤에 분류 모델을 학습하고 평가를 진행한 것을 알 수 있다.

 

※ CheXpert 데이터셋 다운로드 방법 ※

 

  아래 사이트에 접속하여 아래쪽을 확인해 보자.

 

  https://stanfordmlgroup.github.io/competitions/chexpert/

 

CheXpert: A Large Dataset of Chest X-Rays and Competition for Automated Chest X-Ray Interpretation.

How well does the baseline model do on the test set? The model achieves the best AUC on Pleural Effusion (0.97), and the worst on Atelectasis (0.85). The AUC of all other observations are at least 0.9. On Cardiomegaly, Edema, and Pleural Effusion, the mode

stanfordmlgroup.github.io

 

  라이센스에 대한 설명이 있는데, 라이센스를 잘 읽고 아래와 같은 양식(form)을 채워 넣어서 [등록(Register)]을 진행할 수 있다. 결과적으로 등록을 진행하고 나면 다운로드 링크가 나온다.

 

 

  다운로드 링크를 확인한 뒤에는 곧바로 링크를 눌러 다운로드할 수 있지만, 리눅스(Linux) 환경에서는 wget을 이용하여 다운로드를 진행하는 것을 추천한다.

 

sudo wget -O CheXpert-v1.0-small.zip "CheXpert small 버전 다운로드 링크"
sudo wget -O CheXpert-v1.0.zip "CheXpert original 버전 다운로드 링크"

 

  다운로드 이후에는 다음과 같이 압축을 풀어줄 수 있다.

 

sudo unzip CheXpert-v1.0-small.zip
sudo unzip CheXpert-v1.0.zip

 

  참고로 original 데이터셋의 경우 크기가 500GB에 가까우므로, wget으로 다운로드받는 동안 세션을 계속 유지하기 어려울 수 있다. 따라서 리눅스 환경에서는 screen을 사용하는 것이 좋다. 예를 들어 다음과 같이 CheXpert_download라는 이름으로 세션(session)을 생성할 수 있다.

 

screen -S CheXpert_download

 

  이후에 다음과 같이 입력하여 다운로드를 진행한다.

 

sudo wget -O CheXpert-v1.0.zip "CheXpert original 버전 다운로드 링크"

 

  screen에서 세션을 유지한 채로 나가려면 ctrl + a를 입력한 뒤에, d를 누른다. 그러면 (detached)라는 메시지가 출력되고, 스크린 밖으로 빠져나올 수 있다. 현재 존재하는 screen 목록을 볼 때는 screen -list를 누르면 된다. 다시 해당 세션으로 접속할 때는 screen 명령어의 r 옵션을 사용하면 된다.

728x90
반응형

Comment +0

728x90
반응형

  비주얼 스튜디오 코드(Visual Studio Code)는 대표적인 소스코드 에디터(editor)다. C/C++, Python을 포함해 다양한 프로그래밍 언어로 소스코드를 작성할 때 매우 편리하게 사용할 수 있다. 또한 기본적으로 회사에서도 무료로 사용할 수 있다는 점에서, 회사에 다니는 많은 프로그래머들이 Visual Studio Code를 이용한다. Visual Studio Code는 다음의 홈페이지에 접속하여 설치를 진행할 수 있다.

 

※ Visual Studio Code 설치 ※

 

  ▶ Visual Studio Code 홈페이지: https://code.visualstudio.com/

 

Visual Studio Code - Code Editing. Redefined

Visual Studio Code is a code editor redefined and optimized for building and debugging modern web and cloud applications.  Visual Studio Code is free and available on your favorite platform - Linux, macOS, and Windows.

code.visualstudio.com

 

  접속 이후에는 [Download for Windows] 버튼을 눌러 설치 프로그램을 다운로드할 수 있다.

 

 

  Visual Studio Code를 설치할 때 기본(default) 설정으로 설치를 진행할 수 있다.

 

 

  설치 이후에는 다음과 같이 [Welcome] 탭이 등장한다.

 

 

※ 확장 프로그램 설치 ※

 

1. Python 확장 프로그램

 

  기본적으로 자주 사용되는 확장 프로그램들을 설치하면 좋다. 필자의 경우 메인으로 사용하는 프로그래밍 언어가 Python이므로 일단 Python 확장 프로그램(extension)을 설치했다. 사전에 파이썬이 설치되어 있어야 한다.

 

 

2. C/C++ 확장 프로그램

 

  참고로 C/C++ 개발 환경을 설치하고 싶다면, MinGW를 다운로드한다.

 

  ▶ MinGW 설치 경로: https://sourceforge.net/projects/mingw/

 

MinGW - Minimalist GNU for Windows

Download MinGW - Minimalist GNU for Windows for free. A native Windows port of the GNU Compiler Collection (GCC) This project is in the process of moving to osdn.net/projects/mingw, you can continue to follow us there. MinGW: A native Windows port of the G

sourceforge.net

 

  MinGW Installation Manager에서는 다음과 같이 필요한 패키지를 선택하여 설치한다. 최종적으로 설치를 진행할 때는 [Installation] - [Apply Changes] - [Apply]를 누르면 된다.

 

 

  이후에 시스템 환경 변수로 설치된 MinGW의 bin 폴더를 지정한다.

 

 

  이후에 [C/C++] 확장 프로그램을 설치한다.

 

 

  이후에 다음과 같이 예제 코드를 작성한다.

 

 

  코드 작성 이후에 [F5]를 눌러서 디버깅을 진행할 수 있다. 이때 C++ (GDB/LLDB)를 선택할 수 있다.

 

 

  이후에 앞서 설치한 MinGWg++.exe를 선택하여 디버깅을 진행할 수 있다. 참고로 경로에 한글이 포함되어 있다면 "Unable to start debugging. Program path..."라는 내용의 오류가 발생할 수 있다.

 

 

  또한 C++로 작성된 프로그램을 빌드할 때는 단순히 [Ctrl + Shift + B]를 눌러 빌드를 진행하면 된다. 이후에 생성된 .exe 파일을 터미널(terminal)에서 실행할 수 있다.

 

 

3. Java 확장 프로그램

 

  Java의 경우 JDK를 설치해야 한다. 필자는 Oracle JDK 14를 업무용이 아닌 개인 컴퓨터에 설치했다.

 

  ▶ Oracle JDK 14 링크: https://www.oracle.com/java/technologies/javase/jdk14-archive-downloads.html

 

 

  이후에 시스템 환경 변수로 등록한다.

 

  시스템 변수명: JAVA_HOME / 경로: C:\Program Files\Java\jdk-14.0.2

  시스템 변수명: JDK_HOME / 경로: C:\Program Files\Java\jdk-14.0.2

 

  이후에 PATH 시스템 변수에 %JAVA_HOME%\bin 경로를 추가한다. 이제 Visual Studio Code에서 [Extension Pack for Java]를 검색하여 설치한다.

 

 

  확장 프로그램이 설치된 이후에는 다음과 같이 Main.java 파일을 만들어 [Run]으로 프로그램을 실행해 볼 수 있다.

 

 

4. 원격 SSH 확장 프로그램

 

  또한 별도로 특정한 서버에 접속하여 코드를 작성하는 경우에는 [Remote - SSH] 또한 설치하면 좋다.

 

 

  설치 이후에는 [F1]을 누르고, "Remote-SSH: Connect to Host..."를 검색하여 원하는 호스트(host)에 접속할 수 있다. 리눅스 서버에 접속하는 경우, configuration 정보를 생성한 뒤에 리눅스(Linux)로 선택하여 접속을 진행하면 된다. 추가적인 정보는 관련 문서(https://code.visualstudio.com/docs/remote/ssh)에서 확인할 수 있다.

 

 

  접속 이후에는 터미널(terminal) 탭을 열어서 다양한 리눅스 명령어를 입력하는 것이 가능하기 때문에, 필자가 업무를 처리할 때는 추가적으로 Putty나 XShell 같은 프로그램을 사용하지 않아도 크게 어려움이 없는 것 같다. 다시 말해 개인적으로 Visual Studio Code에서의 Remote-SSH를 이용하는 것만으로도 굉장히 편리하게 많은 업무를 할 수 있었다.

 

※ 알아두면 좋은 단축키들 ※

 

  ▶ 에디터 창 분할하는 방법: Ctrl + \

  ▶ 선택한 영역을 자동 코드 정리: Ctrl + K + F

  ▶ 좌측 사이드바 토글: Ctrl + B

  ▶ 하단 패널(panel) 토글: Ctrl + J

  ▶ 디버그: F5

728x90
반응형

Comment +0