빅데이터란 무엇인가

1. 빅데이터의 정의 및 특성

고승현 기자

작성 2020.08.29 12:42 수정 2020.09.02 12:49

올해 가톨릭대, 경기대, 성신여대 등 AI학부, 인공지능학과 등이 신설되며 AI, 빅데이터에 대한 관심이 높아지고 있다. 그렇다면 빅데이터는 무엇인가?

빅데이터의 특성은 총 크게 3가지를 들 수 있는데 첫째, 데이터의 양이 많다. 데이터의 양이 많다는 것은 현재의 it 기반 시설로도 감당하기 어려운 정도를 의미한다. 우리의 일상생활에서 생성되는 사소한 카드내역부터 시작하여 통신사 기록, 병원 데이터베이스등 우리 생활의 전부를 기록하는 것을 빅데이터라고 한다. 구글, 페이스북, 인스타그램 등의 소셜 미디어만 봐도 빅데이터가 넘쳐난다. 빅데이터는 사물인터넷과도 관계되는데 우리 주변에 수많은 센서가 부착되어 있고 이 모든 센서들이 인터넷으로 연결되어 이런 연결망을 사물인터넷이라고 부른다. 

 

 이와 같은 데이터는 굉장히 많은 양이 되기에 빅데이터 볼륨은 스케일이 점점 커지고 있다. 예전에는 표본추출이라고 모집단을 이용한 분석을 진행하였다. 하지만 요즘은 모집단을 선정하는 것이 아닌 그 데이터를 쓰는 모든 사람을 다 분석할 수 있게 되었다. 이에 대한 장점은 트렌드 분석이 아닌 나만의 맞춤형 추천, 이해와 예측이 가능해졌다는 것이다. 전체의 특성이 아닌 개인화의 시대가 열리게 되었다는 것이다. 

 

두번째 특징으론 생성속도가 빠르다는 것이다. 데이터는 순식간에 발생하여 한꺼번에 밀려들어온다. 융복합 환경에서 디지털 데이터는 매우 빠른 속도로 생산되므로 이를 실시간으로 저장, 유통, 수집, 분석처리가 가능해졌다. 이를 설명하기 위해선 네비게이션을 예로 들 수 있다. 네비게이션은 길을 목적지까지 찾아주는 그 용도 외에도 실시간으로 분석하여 어떤 길이 막힐 경우 다른 길로 우회해서 갈 수 있도록 도와준다. 이를 가능하게 만들어주는 서비스 제공 업체는 차들의 위치를 실시간으로 받고 단위 시간당 위치변화와 속도를 계산하여 이용자에게 알려준다. 업체는 각자의 속도로 달리는 수많은 이용자들이 보내는 실시간 데이터를 빠르게 처리하여 계산해서 알려주어야만 한다. 이렇기에 속도가 중요하다는 것이고 데이터의 생성속도가 빠르다는 것이 가능하게 한다.

 

마지막으로 이 데이터의 범주가 확대되어 데이터가 다양화되었다. 숫자만을 의미하던 예전과 달리 지금은 비정형 데이터, 즉 , 문서와 이미지, 동영상 등으로 확대되었다. 이런 데이터의 다양성은 대상에도 적용이 되는데 인간행동 데이터, 기계공정, 자연현상으로 크게 3가지로 나눌 수 있다. 행동데이터를 예로 들자면 우리는 학교에 가서 공부를 하기도 하고, 알바를 가기도 한다. 이런 모든 행동 또한 데이터화 되지만 행동뿐만 아니라 생각까지도 데이터화된다. 뇌파데이터를 이용하여 이 순간에 어떤 생각을 하고 있는지, 혹시 거짓말을 말하고 있는건 아닌지를 알아내는 연구가 지금도 진행되고 있다고 한다.

 

현시점에서도 사용이 되는데 COVID-19 바이러스로 인해 다중이용시설을 들어갈 때 QR코드를 찍어 전자명부를 사용하기도 한다. 이처럼 특정한 대상만이 데이터화가 되는 것이 아니고 빅데이터라는 것이 우리와 거리가 있다고 생각해서는 안될 것이다. 항상 우리 주변에 존재하며 현재도 우리와 함께하고 있다. 앞으로 우리의 삶과 더 떼려야 뗄 수 없는 사이가 될 것이므로 빅데이터에 대한 관심을 가지고 이에 대해 적극적으로 찾아보기를 권한다.

RSS피드 기사제공처 : 대한민국청소년의회 뉴스 / 등록기자: 고승현 무단 전재 및 재배포금지

해당기사의 문의는 기사제공처에게 문의