관리 메뉴

지식을 연주하는 사람

앞으로 데이터분석을 시작하려는 사람을 위한 책 본문

Ph.D Course/Data Science

앞으로 데이터분석을 시작하려는 사람을 위한 책

지식 연주가 Knowledge Designer 2015.09.17 00:42

데이터 분석은 '신뢰의 과학' 이라고 생각합니다. 데이터는 말 그대로 가공하여 의미를 나타내는 어떤 존재입니다. 사람이 어떻게 해석하고 활용하느냐에 따라 그 용도가 달라집니다. 데이터 분석은 그 자체로는 모든 것을 해결할 수 없겠지만 얼마나 올바르게 이해하고 실천하느냐에 따라 차별화된 '무기'가 될 수 있는 어떤 수단입니다. 그것을 위해서는 '데이터 기반의 의사결정' 을 지원하는 문화가 구축되어야 함은 물론이고 분석가의 커뮤니케이션 능력도 매우 중요합니다.


이 책은 데이터 과학에 대해 입문하려는 사람에게 적절한 책입니다. 단순하게 분석사례를 서술한 기술서가 아니라 분석의 필요성, 의미, 그것을 위한 기반지식까지 상당히 쉽게 안내하고 있습니다. 빅데이터라는 단어와 함께 필요이상으로 남달되는 '데이터 분석' 분야에 대해 체계적으로 설명하고 있으니, 읽고 나면 전체적인 감을 잡으실 수 있습니다. 책 자체가 그리 두꺼운 편이 아니고 내용도 쉽게 기술되어 있기 때문에 전문을 읽는데 그리 오랜 시간이 걸리지는 않습니다.


데이터 분석은 분석하는 그 행위 뿐만 아니라 가설을 세우고 문제를 정의하고 현실속에서 해결하는 비즈니스의 과정입니다. 분석만 하면 모든 것을 해결하는 만병통치약이 아니라 행간의 의미를 찾아내어 효율성을 담보하는 맞춤처방전의 시작인 셈입니다. 개인적으로는 데이터 분석이 경영, 통계, 인간이 모두 얽혀있는 기술 기반의 종합예술이라고 생각합니다. 그런 의미에서 아래의 책을 읽으며 중요한 문장 일부를 공유합니다.





데이터 분석의 가장 큰 효과는 '의사 결정 프로세서의 최적화' 다. 복잡한 수리 모델을 구축하는 것도, 대규모 데이터를 빠르게 처리하는 것도 아니다. 단순하면서도 운용하기 쉽게, 한정된 경영 자원이나 정책 자원을 효율적으로 사용할 수 있도록 의사 결정을 지원하는 것. 바로 이것이 데이터 분석의 진정한 가치라고 할 수 있다. 

-'데이터 분석을 시작하려는 사람을 위한 책', p.15



데이터 분석이 성공하기 위한 다섯 가지 요소

1) 분석 대상의 데이터와 분석 기반이 있다

2) 목적과 경영 과제가 명확하다
3) 첨단 기술을 보유하고 있으며 인식 능력이 있는 실행팀
4) 경영층의 지원
5) 열정과 창의력이 있는 인재가 조직의 일원으로서 높은 능력을 발휘하고 있다

-'데이터 분석을 시작하려는 사람을 위한 책', p.40



요컨대 목적에 따라 통계나 분석 수법을 올바르게 실천해 결과를 이끌어내는 것이 중요하며, 이를 위해 분석 담당자는 단순히 분석 자체에 재미를 느끼는 것으로 끝내서는 안 된다. 협업 필터링 같은 일부를 제외하면 통계나 기계 학습 자체에는 의사 결정을 완전 자동화하는 힘이 없다. 어디까지나 의사 결정의 최적화를 지원할 뿐이다. 그런데 이 본질을 이해하지 못하는 사람이 많은 것이 현실이다.

-'데이터 분석을 시작하려는 사람을 위한 책', p.46



분석을 무기로 삼는 조직의 정공법

1) 처음부터 전체 최적을 지향한다

2) 임팩트가 큰 부분부터 착수한다

3) 강력한 리더십의 존재

4) 힘의 원천은 팀 편성에서 나온다'

-'데이터 분석을 시작하려는 사람을 위한 책', p.56~68



위기의식을 항상 느끼는 데이터 과학자는 데이터의 사전 처리와 분석 수법 선정, 유의성 검정 등 화려하지 않은 작업의 중요성을 잘 알고 있다. 그러나 경험이 일천한 분석자 중에는 분석 대상에 관심을 보이기보다 최첨단 분석 수법이나 도구에 정신이 팔려 이런 과정을 생략하고 숫자와 씨름하는 데만 열중하는 사람도 있다. 

-'데이터 분석을 시작하려는 사람을 위한 책', p.120



데이터 분석 프로젝트를 성공시킬 때 중요한 것은 분석 자체가 아니라 분석을 통해 얻은 결과를 현장의 프로세스에 반영하는 것이다. 그러나 분석 결과를 과신하다 현장에 예측 모델을 도입하는 단계에서 큰 실패를 맛보는 경우가 있다. 올바른 프로세스를 통해 분석한 결과는 높은 정확도로 현실을 말해 준다. 그러나 단순히 그 결과를 보여주기만 해서는 사람, 즉 조직은 움직이지 않는다. 

-'데이터 분석을 시작하려는 사람을 위한 책', p.136



목표를 잘못 설정하면 시간과 비용을 잃게 될 뿐만 아니라 도착점까지의 거리가 오히려 멀어질 것이다. 그런데 도착점을 어디에 두느냐에 관해서는 세심한 주의를 기울이는 기업도 유독 목표의 경우에는 감이나 과거의 경험에 의존해 설정한 탓에 정확성이 떨어지는 경향이 보인다. 의런 의사 결정의 모호함을 최대한 배제하고 정확도를 높이는 것이 데이터 분석의 특기다.

-'데이터 분석을 시작하려는 사람을 위한 책', p.184~185




"Efforts and courage are not enough without purpose and direction." 노력이나 용기 있는 한 발을 내디뎠다고 해도 목적이나 착지점에 대한 방향성이 없다면 (그 노력이나 행동의 결과는) 충분하지 못한 것이 될 것이다."

존 F. 케데니

0 Comments
댓글쓰기 폼