BLOG

세계 최대 데이터 분석 대회 플랫폼, 캐글(Kaggle)

2021-12-06


캐글(Kaggle)이란, 2010년에 만들어진 머신러닝 경진대회 플랫폼이다. 2017년에 Google에 인수되었고, 기업이나 공공기관에서 데이터 분석 과제와 데이터를 등록하면 전 세계의 데이터 분석가와 머신 러너들이 집단 지성을 발휘하여 문제 해결에 도전하고, 우수 참가자는 상금을 받을 수도 있다.

 

대회 참가방법

캐글(Kaggle)에서 제공하는 정보를 가지고 결과를 예측하는 문제가 주어진다.

문제를 풀기 위한 예시 데이터(Train Data)와 예측력을 채첨하기 위한, 평가 데이터(Test Date), 그리고 기준이 되는 수식(Evaluation criterion)이 제시된다.

참가자들은 제공된 데이터로 예측 모델을 만들고 평가 데이터(Test Date)에 대한 예측 결과를 산출하여 제출한다.

대회에 참가한 팀이 제출한 예측 결과를 채점하여 순위를 매기고, 해당 순위는 공개된 리더보드에 게시된다. 제출 후에도 기간 내에 여러 번 다시 제출할 수 있다.

대회기간이 끝나면 상위 참가자에게 상금이나 메달이 주어진다.

 

캐글(Kaggle)은 캐글러(캐글에서 활동하는 회원)라는 말이 생겨날 정도로 데이터 분야 종사자들에게 많은 인기를 얻고 있다.

캐글(Kaggle)은 데이터를 무료로 공개한다는 것이 장점이다. 기업이 실제로 사용하는 데이터를 무료 공개함으로써 캐글러들은 빅테크 기업의 실제 데이터를 활용해 볼 수 있다.

데이터 분석을 하기 위해서는 파이썬, R 뿐만 아니라 Numpy, Pandas 등 다양한 라이브러리를 설치해야한다. 하지만 캐글(Kaggle)에서는 가상 IDE를 제공하기 때문에 번거로운 설치과정 없이 바로 데이터 분석이 가능하다.

또한 캐글(Kaggle)에서는 최상위 참가자에게 상금을 제공하기도 하고, 많은 기업에서 채용 시 캐글(Kaggle) 대회 입상자를 우대하는 조건을 걸고 있어서 자신의 실력을 증명하기에도 유리하다.

 

캐글(Kaggle) 사용자의 대부분은 배움의 자세로 임하는 학생들이다. 또한 사용자 연령대도 다양하기 때문에 어렵게 생각하지 않아도 된다. 캐글(Kaggle) 데이터 분석 입문을 두려워하지 않고 참가하는 것도 큰 경험이 될 것이다.

사업자등록번호 : 611-81-29261ㅣ업태 : 정보통신업ㅣ데이터분석 컨설팅업 ㅣseo_daeho@naver.com ㅣ 대표 :서대호

(본사)충청남도 천안시 서북구 두정역서5길 4, 403-417호, (지사)서울특별시 구로구 디지털로34길 55, 715호(구로동, 코오롱싸이언스밸리2차)  
문의 010-8598-7735 / 010-7130-2441