본문 바로가기

backup

빅데이터?

요즘 빅데이터라는 말이 정말 유행이네요.

만화소재로도 이렇게 쓰이고 있으니 말이죠

 

만화에서 빅데이터는 보고서를 통과시켜주는 마법의 키워드라고 합니다. 대부분의 경우 빅데이터 분석이라고는 하지만, 기존에 했던 것과 별 다른 것없는 고객자료 분석 등등입니다. 실제로 IBM에서 진행한 아모레 퍼시픽 빅데이터 분석 프로젝트에서 아모레 퍼시픽 관계자가 빅데이터 프로젝트라고 해서 봤더니 그냥 CRM 좀 더 한 정도 밖에 안되네 라고 말했다고 하는 군요.

그리고 대부분 빅데이터의 사례라고 하는 것이 관련 커뮤니티 글 분석 정도 밖에 안되네요.

옛날부터 있었던 데이타 마이닝하고 차이 점도 찾을 수 없고, 오히려 더 단순한 경우가 많습니다.

빅데이터가 비지니스 용어인 것이 사실입니다.

지금의 어중이 떠중이 개념도 정체도 알수 없는 빅데이터가 아닌 진짜 빅데이터를 기술적으로 정의한다면

2가지 개념이 추가가 됩니다. 하나는 분산형 파일 저장으로 하둡으로 대변이 되죠. 예전에 자료를 데이터 베이스 하나에 모두 집어 넣고 분석을 하였다면 파일의 저장 방식이 관계형 DB에서 벗어나 큰 용량과 속도를 위한 비정형화된 방대한 데이터를 리소스가 크지 않은 여러 컴퓨터에 나눠서 통합적으로 저장하고 불러내는 것입니다.

다른 하나는 CEP입니다. 복잡한 실시간 데이터를 보다 간결하고 심플하게 처리를 할 수 있도록 도와주는 플랫폼입니다.

방대하고 복잡한 자료를 실시간으로 받아들이고 처리하는 기술이 바로 빅데이터가 기존 데이터 마이닝 등과 다른 점인데, 이 부분을 이해하는 사람은 드문 것 같습니다. 이걸 비지니스 적으로 다시 해석하는 것은 또 다른 문제이고, 이 과정에서 그냥 기존의 방식에서 이름만 빅데이터라고 하는 방식들이 난무하게 되었네요