관리 메뉴

지식을 연주하는 사람

데이터과학의 의미에 관하여 본문

Ph.D Course/Data Science

데이터과학의 의미에 관하여

지식 연주가 Knowledge Designer 2015.10.05 23:40

<데이터과학의 의미에 관하여>


다. 터, 스, 다. 다. 요. 고, 요. 요.



<source=http://datasciencebe.com/>



다. 다. 다. 다.





위키피디아에 나온 정의를 살펴보겠습니다. "Data Science is an interdisciplinary field about processes and systems to extract knowledge or insights from large volumes of data in various forms, either structured or unstructured,[1][2] which is a continuation of some of the data analysis fields such as statistics, data mining and predictive analytics, as well as Knowledge Discovery in Databases." 라고 나와있습니다. 데이터과학은 다양한 정형, 비정형 형태의 데이터셋에서 지식과 통찰력을 뽑아내는 행위이고, 통계, 데이터마이닝, 예측분석등에서 이어지는 흐름이라고 요약할 수 있습니다.


데이터과학이 가지는 의미는 '데이터'가 중심이 되는 구조가 아닐까 생각됩니다. '숫자'가 중요하다고 이야기는 많이 했지만, 정작 의사결정 과정에서 그 숫자가 의미있는 역할을 하는 경우는 많지 않습니다. 의사결정권자나 리더들의 경험적 감이 더 큰 영향력이 있었습니다. 데이터과학의 부상은 데이터가 가지는 의미를 생각하게 합니다. 데조, 다.


물론 데이터가 모든 것을 대변하지는 않습니다. 통계로 대표되는 숫자를 이용한 방법에도 함정은 존재하고, 그 . 의미없는 평균이 나오기도 하고, 이미 알고 있는 것을 숫자로 보여주기도 합니다. 법, 다. 다. 다.


'데이터 분석을 시작하려는 사람을 위한 책' 15 페이지에는 다음와 같은 내용이 나옵니다. "데이터 분석의 가장 큰 효과는 '의사 결정 프로세서의 최적화' 다. 복잡한 수리 모델을 구축하는 것도, 대규모 데이터를 빠르게 처리하는 것도 아니다. 단순하면서도 운용하기 쉽게, 한정된 경영 자원이나 정책 자원을 효율적으로 사용할 수 있도록 의사 결정을 지원하는 것. 바로 이것이 데이터 분석의 진정한 가치라고 할 수 있다." 이와 같은 관점에서 본다면 데이터 과학은 경영에서의 효율성을 추구하는 도구로 볼 수 있습니다.


같은 책 136 페이지에는. "데이터 분석 프로젝트를 성공시킬 때 중요한 것은 분석 자체가 아니라 분석을 통해 얻은 결과를 현장의 프로세스에 반영하는 것이다. 그러나 분석 결과를 과신하다 현장에 예측 모델을 도입하는 단계에서 큰 실패를 맛보는 경우가 있다. 올바른 프로세스를 통해 분석한 결과는 높은 정확도로 현실을 말해 준다. 그러나 단순히 그 결과를 보여주기만 해서는 사람, 즉 조직은 움직이지 않는다." 다. 다.


<source=http://dannybrown.me>


그래서 시각화가 주목받고 있다고 생각합니다. 분석은 데이터 마이닝이라는 꾸준히 실행되고 있었습니다. 하지만, 의사결정과정에서 반영되는 것은 다른 문제였습니다. 분석결과와 설득은 별개의 것이기 때문입니다. 최근에는 "Visual Data is Great, Real Data is Better" 이라고 할 정도로, 시각화가 중요하다고 이야기합니다. 링크드인은 분석된 결과를 보다 직관적으로 보여줌으로써 서비스의 효과를 극대화하기도 했습니다. 시각화는  데이터가 의사결정다. 아래 그림을 보시면 기존에는 데이터가 단계별로 밟아갔다면 각화는 데이터를 바로 의사결정(Decisions) 과정으로 바로 올라가게 합니다. 효율적입니다.


<source=https://www.pursuant.com>


데이터과학에서 간과되지만 중요한 것이 맥락을 뽑아내는 능력입니다. 컨텍스트입니다. 의미있게 해석해내는 것입니다. 데이터를 본다는 것은 분석만 하는 것이 아닙니다. 다. 숫자와 현실세계를 이어낼 수 있는 지식이 필요하고, 그것을 잘 표현하고 반영하도록 할 수 있는 커뮤니케이션 능력도 다. 다. 다. 


최근의 기업의 사례를 보면 재미있는 움직임을 볼 수 있습니다. 데이터를 중심으로 전략을 수립하는 것입니다. 구글, 페이스북 같은 기업은 물론이고 제조업 기반의 회사들도 데이터에 기반하여 미래를 설계합니다. 대표적인 기업이 GE 입니다. 전통적인 제조업 회사인 GE는 Industrial Internet 을 모토로 각종 데이터를 기반으로 새로운 산업을 펼쳐내는 계획을 선보였습니다.다.


<source=http://www.bidnessetc.com>


핀테크 역시 그 일환으로 볼 수 있다고 생각합니다. 금융데이터를 가, 다. 전통적인 금융회사는 데이터를 가지고 기술을 가지려고 하고, 스타트업들은 처리기술을 가지고 데이터를 확보하기 위해 노력합니다. 앞단이냐 뒷단이냐의 차이는 있지만 결국은 데이터를 가지고 처리하여 헤게모니를 차지하려는 움직임입니다. 데이터 중심의 통합전략의 하나로 볼 수 있습니다. 데이터는 지금 이 시대를 움직이는 하나의 모멘텀입니다.



<source=http://integration.pervasive.com>


데이터과학의 의미는 '데이터'와 함께한다 생각합니다. 데이터를 중심에 놓고 산업의 구도를 재편하듯이, 부차적인 수단으로서의 데이터가 아니라. 프로세스에서 항상 고려되는 요소로서 데이터를 바라보는 것입니다. 그래서 저는 데이터과학이 어떤 하나의 기술이나 방법 이전에 컨셉이라고 판단합니다. 데이터에 기반하여 생각하고 문제에 접근하며 결국에는 해결해내는 프로세스로 말입니다. 데이터과학의 목적은 데이터가 의미하는 바를 제대로 끌어내는 데 있습니다. 그러기 위해서 과학적인 방법을 통해 일하는 것입니다. 그래서 '빅'이라는 사이즈보다 '어떻게' 라는 방법과 사고방식이 더 중요하다고 봅니다.



<source=https://bouncingideas.wordpress.com>


Work with Data, think through Data.

요. 다. 죠. 다. 다. 엔지니어와 기술자의 차이는 사고방식(설계)에 있습니다. 단순하게 분석만 하는 이가 아니라. 고(계)고, 인(현)점으로 본다면 보다 적합한 표현이라는 생각이 듭니다. 


<http://www.visualnews.com/>




Ryan Kim | Convergence Business Designer

Facebook.   https://www.facebook.com/keyassist

E-mail.        youngwung.kim@gmail.com

Web.           http://keyassist.tistory.com


0 Comments
댓글쓰기 폼