본문 바로가기
공부방/MKYU

MKYU 디지털 튜터 #3 | 빅데이터

by 비아(pia) 2021. 10. 14.

요즘은 빅데이터라는 말을 흔하게 사용한다. 어딜가든 빅데이터 기반이라는 말을 많이 사용하고 있는데 그렇다면 빅데이터란 무엇일까?

 

빅데이터란 디지털 환경에서 생성되는 데이터로 그 규모가 방대하고, 생성 주기도 짧고, 형태도 수치 데이터뿐 아니라 문자와 영상 데이터를 포함하는 대규모 데이터를 말한다. 빅데이터 환경은 과거에 비해 데이터의 양이 폭증했다는 점과 함께 데이터의 종류도 다양해져 사람들의 행동은 물론 위치정보와  SNS 를 통해 생각과 의견까지 분석하고 예측할 수 있다.

[네이버 지식백과] 빅데이터 정의 (빅데이터, 2013. 2. 25., 정용찬)

 

데이터를 사고 파는 시대가 되어버렸다. 후에는 나의 데이터를 제공하는 대신 이자를 받을 수 있는 시대가 오지 않을까 싶기도 한다. 그만큼 현재에서 데이터는 매우 중요한 자원이 되었다. AI를 교육시키기 위해서는 보다 객관적이고 분석적인 자료들이 필요하기 때문에 다양한 데이터들을 수집하는 것이 필수가 되었기 때문이다.

 

빅데이터는 IoT를 통해 데이터를 생성하고 인터넷으로 데이터를 수집하면서 만들어진다. IoT는 인터넷을 기반으로 모든 사물을 연결하여 정보를 상호 소통하는 지능형 기술과 서비스를 말한다. 

 

 

빅데이터의 종류

  1. 플랫폼 데이터
    플랫폼에는 판매자와 소비자의 다양한 데이터가 존재한다.
  2. 엔터프라이즈 데이터 
    1. 기업
      - 기업에서는 이메일이나 제안서 등 타인이 만든 데이터를 소비하거나 스스로 생산하는 일이 잦다. 
      - 스포츠 기록
      - 은행, 카드
    2. 공공기관
      - 홍채 데이터, 지문 인식 등과 같은 생체 데이터를 문서로 기록하고 있다.
      - QR 코드, 각종 신고서
      - 대통령, 의원의 말 등을 텍스트로 기록하고 있다.
    3. 의료기관
      - DNA를 문자로 텍스트화 하여 기록하고 있다.
      - 데이터를 통해 개인화된 의료가 가능하다.

 

빅데이터 분석 4단계

  1. 묘사 : 무슨 일이 벌어졌는가?
  2. 진단 : 원인을 따져 보는 것으로 '왜?'라는 질문을 던지는 것이다. 시각화, 연관 분석 등 다양한 방법으로 도출이 가능하다.
  3. 예측 : 미래를 예측하는 것이다.
  4. 처방 : 해결 방안을 세운다.

 

분석한 데이터에서 인사이트를 얻고 액션을 취해 가치를 창조해낸다. 이것이 데이터가 디지털 사회에서 하는 역할이다. 가치로 바뀌지 않는 데이터는 아무 의미가 없다. 데이터는 숫자, 문자, 이미지를 모두 포함하고 있으며 인사이트는 제품에 대한 소비자의 생각, 경험이 담긴 정보 등을 의미한다.

 

 

댓글