안경잡이개발자

728x90
반응형

다변인 선형회귀를 활용한 배추 가격 예측 AI 개발하기 2강 - 프로젝트 아이디어 및 데이터 수집

나동빈


  지난 시간에는 프로젝트의 개요에 대해 소개하는 시간을 가졌습니다. 이번 시간에는 프로젝트 아이디어를 고려하고 데이터를 수집하는 시간을 가집니다. 다변인 선형회귀는 데이터를 예측할 때 사용할 수 있는 대표적인 모델입니다. 따라서 특정한 대상을 예측해보는 프로젝트 아이디어를 생각해 보면 좋을 것입니다.


※ 프로젝트 아이디어 ※


  최근 태풍이 심해지고 있어 기후 변화가 심한 상태입니다. 이러한 배경에서 채소 중에서 '배추'의 가격은 날씨와 어떠한 변화가 있을지 궁금하여 배추 가격을 예측하는 인공지능을 만들어 보면 어떨까 생각해보았습니다.



  이외에도 우리의 주변에서는 인공지능을 활용해 분석할 수 있는 다양한 주제가 있습니다. 삶을 더욱 윤택하게 만들기 위해 다양한 아이디어를 고민해보는 습관을 기르는 것이 좋을 것 같습니다.


※ 데이터 수집 ※


  기후 데이터와 배추 가격 데이터는 어떻게 수집할 수 있을까요? 우리나라의 정부는 이러한 데이터를 무료로 제공해주고 있답니다. 다만 각 서비스는 데이터를 제공하는 정책이 다를 수 있기 때문에 필요에 따라서 크롤링(Crawling)의 과정이 필요할 수도 있습니다.


기상자료개방포털 다중지점통계: https://data.kma.go.kr/climate/StatisticsDivision/selectStatisticsDivision.do?pgmNo=158



농산물유통정보: https://www.kamis.or.kr/customer/price/retail/period.do?action=daily



※ 데이터 정제 ※


  수집한 데이터는 인공지능 소프트웨어가 인식하기 쉬운 형태로 정제해야 합니다. 배추 가격은 주말에는 책정되지 않는 점이나 몇몇 일자에서 톡톡 튀는 데이터가 있는 점 등을 감안해서 데이터를 쉽게 적용할 수 있는 형태로 바꾸어 주는 작업이 필요합니다.



※ 데이터 파일 ※


  직접 데이터를 추출하고 정제하는 과정이 귀찮으신 분은 다음의 파일을 다운로드 하시면 됩니다.


price data.csv


728x90
반응형