안경잡이개발자

728x90
반응형

다변인 선형회귀를 활용한 배추 가격 예측 AI 개발하기 5강 - 기초 데이터 시각화하기

나동빈


  지난 시간에는 간단히 저장된 학습 모델을 이용해 바로 결과를 예측해보는 방법에 대해 알아보는 시간을 가졌습니다. 이번 시간에는 엑셀(Excel)을 이용해서 기초 데이터를 시각화하는 방법에 대해 알아보는 시간을 가져보도록 하겠습니다.


※ 기초 데이터 시각화의 필요성 ※


  다양한 데이터를 수집해서 인공지능 모델을 돌려 보아도 입력 값과 결과 값의 상관 관계를 찾아내는 것은 쉽지 않을 수 있습니다. 그래서 만약에 많은 시행 착오를 거치고 있는 상황이라면 다양한 데이터를 수집해 보고, 데이터 시각화를 통해서 상관 관계를 유추하는 방법이 사용될 수도 있습니다. 특히 데이터의 개수가 많을 때는 한 눈에 데이터가 보이지 않을 수 있으므로 유용한 방법이 될 수 있습니다.


※ 엑셀로 시각화 해보기 ※


  우리가 학습 데이터로 사용했던 엑셀 파일을 열어 봅시다.



  저는 데이터 정제 과정에서 연도(Year) 정보를 단순한 숫자 형태로 넣었는데요, 엑셀 내에서 시간에 따른 데이터 시각화를 위해서는 '텍스트 나누기' 과정이 필요합니다.



  기본적인 설정대로 따르면 됩니다.





  위와 같이 '날짜'로 서식을 설정해주시면 자동으로 날짜 형태로 변환되는 것을 알 수 있습니다.



  이제 날짜(Year)와 평균 온도(Average Temp)를 설정해서 '데이터' -> '꺾은선 그래프'를 만들어 봅시다.



  그럼 위와 같이 날짜에 따라서 기온이 왔다갔다 하는 것을 시각화해서 확인할 수 있습니다.



  이후에 날짜와 가격을 기준으로 시각화를 진행해 봅시다.



  그럼 위와 같이 가격 그래프도 왔다갔다 봉우리 형태로 존재하는 것을 알 수 있습니다.



  위 그래프는 날짜에 따른 '강수량' 그래프입니다.


  위와 같은 그래프의 형태들을 확인했을 때 저는 온도 및 강수량이 배추 가격에 영향을 미치는 요인이 될 수 있다는 직감을 얻을 수 있었습니다. 이와 같이 기초 데이터를 시각화 하는 과정에서 다양한 인사이트를 얻을 수도 있다는 점을 유의해 주세요. 특정한 결과(Result)에 영향을 미치는 변인을 분석하는 과정에서 이러한 시각화는 큰 도움을 줄 수 있습니다.

728x90
반응형