BLOG

AI 빅데이터 공부법

2021-05-17

4차 산업혁명의 가장 핵심 키워드는 역시 AI(인공지능), 빅데이터이다.


관련 학과, 학원 등이 우후죽순 생겨나고 있다. 그러나 체계적이지 못한 교육과정 때문에 수강생들의 혼선이 빚어지고 있다. 특히 이미 사회 생활을 하고 있는 사람들이 재교육이 받고 싶을 때는 더욱 난감하다. 다시 대학교를 들어갈 수도 없을뿐더러 학원을 다닌다고 해도 1주일에 3시간정도 10회 수업 듣는거로는 택도 없기 때문이다.

 

나는 AI 빅데이터 전문가로 활동하면서 꽤 많은 문의를 받았었다. 주로 취준생, 직장인들이었는데 AI 빅데이터 공부를 하고 싶은데 어떻게 시작하면 좋을찌 질문을 많이 하였다. 비슷한 질문을 많이 받았어서 '1년 안에 AI 빅데이터 전문가가 되는 법' 이라는 책도 썼는데 꽤 좋은 반응을 얻었었다. 이번 칼럼에서는 간단히 어떻게 공부를 하면 좋을찌 요약해보려 한다.

 


국내에서 AI 빅데이터 공부를 하기 위한 교육기관은 크게 3가지이다. 대학교, 대학원, 학원이다.


그러나 불행하게도 3군데 모두 현재까지는 공부하기에 그다지 적합하지 않다. 우선 대학교 학과 과정에 AI 빅데이터만 전문적으로 가르치는 학과가 거의 없다. 최근들어 꽤 많이 생겨났지만 아직까지도 전체 대학교 비율로 따지면은 굉장히 소수 이다. 대학원도 마찬가지 이다. 정부 주도로 설립한 AI 대학원이 10곳 있을뿐이다. 물론 AI 대학원 이외에 비슷한 관련 학과가 있는 대학원들도 있긴 하지만 다 합쳐도 소수이다. 운이 좋아 AI 관련 학과에 진학해서 공부를 한다고 해도 제대로 깊게 배우기는 힘들다. 1주일에 3시간씩 15회 정도 수업을 듣는다고 크게 실력이 늘지는 않는다. 기본 개론 수업과 예제 데이터세트로 간단한 코딩을 하고 끝나기 일쑤이다. 따라서 학원 교육과정은 더더욱 비추천한다. 100만원이 넘는 고액을 내고 강사에게 10회정도 배운다고 절대 실력이 늘지 않는다.

 

공부를 하기 위한 방법을 간단히 소개해보겠다.


우선 수학, 통계학 공부가 우선되어야 한다. AI 빅데이터 분석은 모두 수학, 통계 기반 알고리즘으로 이루어져 있다. 물론 계산은 컴퓨터가 해주지만 알고리즘의 원리가 되는 수학적 지식이 선행되어야 응용을 할 수 있다. 그러기 위해서는 수리통계학, 선형대수학을 필수적으로 공부해야 한다. 대학교를 자연계열로 졸업했다면 학부수업때 이미 배웠을 것이다. 그러면 다시 공부할 필요는 없다. 직접 증명이나 유도과정까지 할 필요는 없기 때문이다. 어느정도 지식이 있고 수식 흐름을 이해할 지식만 있으면 된다. 그러나 수리통계학, 선형대수학에 대해서 아예 모른다면 공부를 필수적으로 해야 한다. 관련 인터넷강의가 꽤 많이 때문에 이를 통해서 공부를 하면 된다.

 

데이터 마이닝 기법에 대해도 익혀야 한다. 데이터 마이닝이랑 AI 빅데이터 알고리즘의 기본이 되는 방법론이라고 생각하면 된다. 두꺼운 개론서를 하나 사서 읽으면 좋다. 데이터 마이닝 기법이 워낙 많기 때문에 중구난방으로 조금씩 배우는것보다 두꺼운 한권으로 한번에 익히는게 더 좋다. 다행인거는 양은 많지만 난이도가 어렵지는 않아 충분한 시간만 확보한다면 누구라도 도전해볼수 있다. 또는 관련 자격증 시험 공부도 해볼수 있다. 대표적으로 빅데이터분석 기사, 데이터분석 전문가, 경영빅데이터 분석사, 사회 조사분석사가 있다. 모두 데이터마이닝 알고리즘에 관련한 자격증들이다. 내용이 서로 많이 겹쳐 한 자격증을 공부하면 자연히 나머지 자격증도 같이 공부가 된다. 자격증도 취득하고 공부도 하는 일석이조를 누릴 수 있다.

 

데이터베이스에 대한 지식도 익혀야 한다. 빅데이터를 저장하고 가공하기 위해서는 DB에 대한 지식이 필수적이다. 전통적인 DBA들은 DB 최적화까지 능숙해야 하는데 AI 빅데이터 전문가는 거기까지는 할필요가 없다. DB CRUD(생성, 읽기, 갱신, 삭제) 쿼리를 기본으로 익히고 여러 조건문들이 포함된 쿼리까지 익히면 된다. 단 DB가 RDB, No-SQL로 나뉘어지기 때문에 두 종류 모두 익혀야 된다.

 

딥러닝 알고리즘에 대해서도 익혀야 한다. 딥러닝은 AI의 핵심이 되는 알고리즘이다. 딥러닝에서 deep은 신경망의 깊이가 깊다는 뜻이다. 신경망의 깊이가 깊어질수록 연산 파라미터의 수가 증가하여 복잡한 모델을 생성해낼 수 있다. 아무튼 딥러닝은 모델 네트워크를 어떻게 구성하느냐에 따라 다양한 형태로 구현할 수 있다. 또한 선형대수학과도 밀접한 관계를 지니기 때문에 딥러닝을 공부하면서 선형대수관련 내용을 많이 접할 것이다. 딥러닝 공부는 딥러닝 이론서+딥러닝 라이브러리를 활용한 코딩책을 같이 봐야 한다.

 

여기까지 공부하면 어느정도 기본적인 AI 빅데이터 분석가라고 할 수 있다. 조금 더 능력있는 AI 빅데이터 분석가가 되기 위해서는 각 산업 도메인별 AI 빅데이터 활용 사례 등을 익혀야 한다. AI 빅데이터 분석가가 어떤 도메인의 프로젝트를 맡을찌 모르기 때문이다. 예를 들어 금융, 제조업, e-커머스 등 각 산업 도메인별로 데이터의 유형도 다르고 적용되는 기법도 조금씩 차이가 난다. 따라서 대표적인 활용 사례들을 미리 익혀놓으면 관련 프로젝트를 맡았을 때 좀 더 익숙하기 대처할 수 있다. 공부는 AI 빅데이터를 경영 비즈니스에 활용한 사례를 모든 책을 구입하거나 실제 활용된 사례 논문을 찾아 읽으면 된다.

 

여기서 더 나아가 API 생성, 서버 관리, 웹 개발 까지 가능하면 엄청난 몸값을 자랑하게 될 것이다. 그러나 여기까지 하기에무리가 있으면 이 부분은 다른 개발자들과 분업해서 해도 무방하다.

 

AI 빅데이터 전문가로 직업을 삼으려는 분들이 공부 법 로드맵을 착실히 쌓아서 한걸음 한걸음 공부하길 바란다. 내용이 꽤 많긴 하지만 공부하다보면 수학, 통계, 코딩, 경영학을 모두 공부할 수 있어 재밌고 실제 비즈니스 데이터를 분석하기에 실용성도 어떠한 학문보다 높다. 또한 고연봉을 기대할 수 있는 미래 전망이 좋은 핵심 직업군에 속하기에 취준생들에게 추천한다.

 


 

 

 

 

 


사업자등록번호 : 492-04-01429ㅣ업태 : 정보통신업ㅣ데이터베이스 및 온라인 정보 제공업 ㅣseo_daeho@naver.com ㅣ 대표 :서대호

서울특별시 구로구 디지털로34길 55, 715호(구로동, 코오롱싸이언스밸리2차)  문의 010-8598-7735 / 010-7130-2441