관리 메뉴

지식을 연주하는 사람

2015 Data Science Salary Survey / 2015 데이터과학 소득 조사 본문

Ph.D Course/Data Science

2015 Data Science Salary Survey / 2015 데이터과학 소득 조사

지식 연주가 Knowledge Designer 2015.10.03 01:15

O’Reilly 에서 발간한 <2015 Data Science Salary Survey>라는 제목의 보고서입니다.  원문주소는 <http://goo.gl/zohS84>입니다. 

데이터과학 분야에 종사하시거나 종사하려는 분들에게 좋은 자료가 될 것이라 생각합니다. 우리나라의 상황과는 다소 차이가 있을 수 있으나 참고할만할 것입니다. 텍스트를 발췌, 번역했고 의역이 있으니 참고해주시기 바랍니다. 공유해가시는 것은 환영합니다. 다만 출처를 언급해주셨으면 좋겠습니다.


<source=O’Reilly Report "2015 Data Science Salary Survey">


이 자료는 다양한 산업에서 종사하는 600명이 넘는 데이터과학 분야 사람들을 대상으로 32개의 문항조사를 바탕으로 작성되었습니다.




Executive Summary

-SQL, 엑셀, R 및 파이썬 이 네가지 툴은 3년 연속 정상의 자리를 지켰습니다.

-Spark(그리고 Scala) 사용은 작년에 비해 엄청나게 증가했고, 사용자들은 더 많은 소득을 올리는 경향을 보입니다.
-데이터에 관해 보다 전문가일수록 상용 프로그램보다 R를 사용합니다.
-파이썬이나 스파크 같은 오픈소스를 사용하는 사람들은 R을 더 이상 사용하지 않습니다.
-소프트웨어 산업분야에서의 소득이 가장 높게 나왔습니다.
-600명이 넘는 응답자 중 남성이 80%, 여자가 20% 입니다.
-동일변수로 비교해봐도, 여성들의 소득이 남성들보다 수천달러나 적습니다.



응답자의 비율과


<source=O’Reilly Report "2015 Data Science Salary Survey">


-600이 67%고, 이 12%, 드(6%), 아(5%), 다(4%), 카(3%), 주(2%), 카(1%)합니다.


-소득의 중위값을 살펴보면 미국, 호주, 영아일랜드, 캐나다, 유럽, 아시아, 아프리카, 남아메리카 순으로 나타납니다.


-미국을 대상으로 살펴보면 캘리포니아, 노스이스트가 최상위 수준의 소득 중위값을 보여줍니다.


-전체 응답자 중 가장 많은 비율을 차지하는 것은 31-35세로 25%, 26-30세 23%, 36-40세 14%, 41-45세 13%, 21-25세 9%, 그리고 나머지는 소수의 비율로 나타납니다.


-소득의 중위값을 살펴보면, 46-50세가 가장 많고, 41-45세, 51-55세, 56-60세, 61-65세가 그 다음을 차지합니다. (36-40세 그리고 31-35세가 많은데 이는 경력에 따른 소득이 고려되지 않은 비교이기 때문으로 보입니다. 나이별 소득의 중위값 항목은 큰 의미가 없다고 생각합니다.)


-응답자가 종사하는 산업은 소프트웨어 산업(23%), IT컨설팅(10%), 금융(10%), 유통/e-커머스(8%), 헬스케어/의료(7%), 출판/미디어(6%), 교육(5%), 비IT컨설팅(5%), 정부(5%), 광고/PR(4%), 컴퓨터/하드웨어(3%), 제조업(3%) 등의 순입니다.


-소득의 중위값은 컴퓨터/하드웨어, 금융, 소프트웨어 산업 등의 순으로 높게 나타납니다.


-응답자의 22%가 10,000 이상이 근무하는 대기업에 종사하고, 101-500 규모 기업 20%, 26-100명 규모 기업 17% , 2,501-10,000명 규모 기업 12%, 2-25명 규모 기업 11%, 501-1,000명 규모 기업(10%) 에 종사합니다.




일에 투자하는 시간


<source=O’Reilly Report "2015 Data Science Salary Survey">



응답자들의 31%가 일주일에 40시간을 일한다고 응답했고, 28%가 41-45시간, 16%가 46-50시간을 일한다고 합니다. 이 시간에 대한 세부항목은 아래와 같습니다.


ETL(Extraction, Transformation, Loading)

-일주일에 1시간 미만(43%), 일주일에 1-4시간(32%), 하루에 1-3시간(20%), 하루에 4시간 이상(5%)


데이터 정제

-일주일에 1-4시간(42%), 하루에 1-3시간(31%), 일주일에 1시간 미만(19%), 하루에 4시간 이상(7%)


석(Exploratory data analysis)

-하루에 1-3시간(46%), 일주일에 1-4시간(32%), 하루에 4시간 이상(12%)< 일주일에 1시간 미만(11%)


머신러닝, 통계

-일주일에 1시간 미만(34%), 일주일에 1-4시간(29%), 하루에 1-3시간(27%), 하루에 4시간 이상(10%)


시각화 작업

-일주일에 1-4시간(41%), 하루에 1-3시간(29%), 일주일에 1시간 미만(23%), 하루에 4시간 이상(7%)


분석결과 발표

-일주일에 1-4시간(47%), 일주일에 1시간 미만(27%), 하루에 1-3시간(30%), 하루에 4시간 이상(6%)





기타 지표


<source=O’Reilly Report "2015 Data Science Salary Survey">



응답자가 사용하는 OS에 대한 설문은 중복가능항목으로 조사되었습니다. 조사결과 응답자의 72%가 윈도우를, 50%가 리눅스, 43%가 MAC, 15%가 유닉스를 사용한다고 응답했습니다. 소득의 중위값을 조사한 결과 MAC 을 사용하는 사람의 값이 가장 높고, 그 다음이 리눅스, 유닉스, 윈도우 사용순으로 나타났습니다.


또한 이 분야에 종사하는 사람들에 대한 타이틀을 조사한 결과 24%가 데이터과학자, 14%는 분석가, 10%는 엔지니어, 9%는 관리자, 7%는 고위 관리자, 6%는 개발자/프로그래머로 나타났습니다.

* 데이터과학자가 많은 비중을 차지하지만 아직은 다른 타이틀로도 불리는 것을 볼 수 있습니다.


<source=O’Reilly Report "2015 Data Science Salary Survey">


응답자들이 사용하는 프로그래밍 언어, 데이터 플랫폼, 분석 툴 비율을 나타난 슬라이드입니다. 앞서 언급된 것처럼 SQL, 엑셀, R 및 파이썬이 가장 높은 비율을 차지하는 것을 볼 수 있습니다.


D3 for visualization

본문을 보면 시각화 관련해서 D3에 대한 언급이 있습니다. D3는 다른 도구들에 비해 배우기는 어렵지만, 최종 아웃풋이 매우 인상적이라고 합니다. D3가 인터랙티브하게 표현하는 데 효과적인 언어이기 때문이라는 것이 그 이유입니다. 그런 이유로 D3를 익히는 것에 대한 필요와 D3를 이미 배운 사람에 대한 채용수요가 점점 커질 것이라고 이야기합니다.




Ryan Kim | Convergence Business Designer

Facebook.   https://www.facebook.com/keyassist

E-mail.        youngwung.kim@gmail.com

Web.           http://keyassist.tistory.com



0 Comments
댓글쓰기 폼