관리 메뉴

지식을 연주하는 사람

데이터 사이언스의 의미에 관하여 본문

Ph.D Course/Data Science

데이터 사이언스의 의미에 관하여

지식 연주가 Knowledge Designer 2017.01.07 01:27

<데이터 사이언스의 의미에 관하여>



시대의 유행어가 있습니다. 정확히 무슨 뜻인지는 모르지만, 안 쓰면 뒤쳐져 보이는 그런 말들이지요. 빅데이터, 데이터 애널리틱스, 데이터 시각화 등이 그렇습니다. 이들을 데이터를 활용한 과학적 행위에 중점을 둔 '데이터 사이언스'라는 단어로 통칭할 수 있습니다. 데이터를 가지고 하는 '행위'가 주목한다면 말입니다. 세계적인 IT 자문기관인 가트너(Gartner)는 2014년에 빅데이터의 시대가 저물고 '데이터 사이언스'가 부상하고 있다고 말합니다. '크기'에 집중하는 빅데이터라는 개념보다 '행동'에 중점을 두는 데이터 사이언스에 주목한 것입니다.

<2014 Gartner Hype Cycle>


최근에는 ‘스마트 데이터 디스커버리(Smart Data Discovery)’와 '개인용 분석(Personal Analytics)'을 주목할만한 키워드로 넣었습니다. 크기에 초점을 둔 빅데이터 자체보다 조직내에서 데이터를 어떻게 활용해야 하며, 그것을 통해 어떤 목적을 이루려 하는지가 보다 중요하다는 관점으로 해석할 수 있습니다. 빅데이터라고 부를 수 있는 큰 규모의 데이터를 가진 이들은 얼마 되지 않고, 데이터를 이용해 무언가를 하려는 이들은 많습니다. 그렇다면 가트너(Gartner)의 하이프 사이클 키워드 변화에서 볼 수 있듯이 데이터를 활용하고 가치를 발굴하는 행위에 초점을 두어야 한다고 생각합니다. 그것이 바로 데이터 사이언스입니다. 




<2016 Gartner Hype Cycle>




데이터 사이언스 분야는 산업계에서 시작돼 여러 분야에 영향을 주고 있는 대표적 분야입니다. 종주국인 미국을 포함해 여러 국가에서 비즈니스로 활용되고 연구됩니다. 아직은 학계가 그 속도를 따라가지 못한다고 느낄 정도로 매우 빠르게 변화하고 있습니다. 관련 인력에 대한 수요는 늘어나고 있고, 샐러리도 매우 높은 편입니다. 하지만, 제대로된 퀄리티의 인력을 키워낼 수 있는 기관은 매우 부족한 것도 현실입니다. 현장과 이론의 격차, 수요의 공급의 차이가 극심한 분야이기도 합니다. 


국내에서는 데이터 사이언스가 기술 변화 중심으로 회자되고, 처음에 이야기될 때에도 빅데이터라는 이름으로 시작되었기 때문에 목적과 도구가 도치되어 생각되는 경우도 많다고 생각합니다. 데이터만 모으면 모든 것을 해결할 수 있다고 생각하며 접근하는 경우도 있습니다. 오히려 문제해결과 멀어지는 길입니다. 데이터 사이언스는 데이터를 이용해 문제를 발견하고, 해결하는 과정입니다. 데이터는 이 과정에 쓰이는 재료입니다. 


<source=http://www.slideshare.net/ktoshik>



데이터 사이언스를 하나의 기술을 넘어, 데이터에 기반하여 생각하고 문제에 접근하고 해결하는 프로세스로, 문화적 요소로 접근해야 합니다. 데이터 사이언스가 부상하게된 원인, 그리고 전략적 효과, 조직의 문제해결과 연관지어 생각하는 것이 필요합니다. 데이터가 의미하는 바를 제대로 끌어내는 것이 목적이고, 그 목적을 이루기 위해서 여러가지 과학적인 방법을 이용하는 것입니다. 그래서 '빅'이라는 사이즈보다 '어떻게' 라는 방법과 사고방식이 더 중요합니다. 그것이 데이터 사이언스가 '사이언스'인 이유입니다. 


더 이상 데이터 사이언스는 연구자나 엔지니어만의 영역이 아닙니다. 디지털 시대에 살아남기 위해 데이터를 활용해서 문제를 해결하고자 하는 마케터, 디자이너, 기획자라면 데이터 사이언스의 영향에서 자유로울 수 없고, 기본적인 영향으로 보유해야 한다 생각합니다. 기존의 마케팅에서는 심미적인 것에 보다 신경을 썼다면, 디지털 기반의 마케팅에서는 고객의 행동 하나하나를 데이터를 통해서 바라보고 이를 통해서 최소한의 비용으로 최대한의 효과를 낼 수 있을지에 대해 측정하기도 합니다. 데이터가 생각과 판단의 근거가 되는 것입니다. 


한국에서는 데이터를 가지고 있지만 공유하는 것은 꺼려하는 경향이 있습니다. 공유함으로서 서로서로 좋은 효과를 보아야 하는데 그런 것은 조금 더딥니다. 데이터를 통한 프로세스와 기꺼히 오픈하는 것에 익숙하지 않기 때문이라고 생각합니다. 공공기관에서도 데이터를 공개하거나, 좋은 데이터의 모양으로 제공하는 것에 대한 노력이 부족합니다. 데이터 사이언스에 대한 사회적 인식이 아직 무르익지 않아서라고 생각해봅니다. 



<source=http://www.slideshare.net>



마찬가지로, 데이터 사이언스가 조직 내에서 제대로 기능하기 위해서는 인식이 제대로 되어야 합니다. 데이터를 하는 이들이 중심이 되는 구조가 되어야 합니다. 정치적 권력 혹은 혁신을 추진할 수 있는 힘이 주어지지 않은채로 조직내에 심어만 놓는다면, 사장되기 쉽습니다. 데이터 사이언스는 기존에 조직 내에서 커온 것이라기 보다는 새로운 분야 혹은 외부에서 들어온 유입요인이라고 생각되기 쉽기 때문에, 위에 언급된 조직적인 장치가 없다면 조직내의 생리에 뭍혀 힘을 발휘하기 어려운 경우가 생깁니다. 데이터 사이언스가 잘 기능할 수 있는 조직적, 전략적 접근에 대한 고민이 필요합니다. 


데이터 사이언스의 진정한 의미는 '데이터'를 존중하는 것에 있다고 생각합니다. 위에 언급된 개인용 분석(Personal Analytics)과 생활 데이터(Life Data)와 같은 용어가 생기는 이유이기도 합니다. 데이터가 그저 비즈니스의 현장에서 특정한 목적을 위해서만 사용되는 것이 아니라 저변으로 기능하고 생활 속에 들어올 때, 데이터 사이언스가 제대로 기능할 수 있지 않을까요. 많은 기업들이 데이터 사이언스 관련해서 오픈소스를 지향하고 커뮤니티를 지원하는 것은 바로 이런 이유인 것 같습니다. 저변이 있어야 제대로 된 역량을 발휘할 수 있고, 서로 격려하는 가운데 가치있는 토론이 이뤄질 수 있습니다. 이런 토양 위에서 지속적인 발전이 이뤄집니다. 



<source=http://datsciawards.ie>


한국에서 가장 부족한 것이 무엇일까요. 저는 그것이 기술이 아닌 문화적 역량이라고 생각합니다. 데이터 사이언스를 하고 싶고, 할 수 있고, 해내는 인재에 대한 조직적인 지원과 데이터 사이언스를 충분히 할 수 있는 저변이 가장 부족하다는 생각이 듭니다. 기술적으로 뛰어난 분들에 대한 이야기도 많이 들을 수 있습니다. 하지만 개인이 뛰어남과 조직의 성과 그리고 사회의 잘해냄은 다른 문제입니다. 이어질 수 있도록 효과적으로 잘 엮어져야 합니다. 이제는 정말 '어떻게' 하면 '효과적'으로 활용할 수 있는지에 대한 고민이 필요한 단계입니다. 이미 데이터 사이언스는 시대가 요구하는 기본 스킬이 되었습니다. 그렇다면 그 안에서의 경쟁과 새로움의 발굴에 중점을 두어야 합니다. 데이터 사이언스가 한국에서 어떠한 의미로 성장하는지 지켜보겠습니다. 그것 또한 의미가 있는 일이라 생각됩니다.



0 Comments
댓글쓰기 폼