"위 사람은 2주 간의 과정을 모두 수료하였음을 증명합니다." 지난 11월 30일 원티드에서 준비해주신 People & Data Analytics 부트캠프 2기를 수료하였습니다.뛰어난 교수님들의 강의와 성장에 진심이신 휼륭한 HRer분들과 보낸 즐겁고 뜻 깊은 기간이었습니다.수료 기념으로 부트캠프의 후기와 함께 이번에 얻은 PA와 관련된 큰 교훈에 대해서 이야기해보고자 합니다. 1. People & Data Analytics 부트캠프 간략 설명 이번으로 2기째인 원티드 People & Data Analytics 부트캠프는 California State University Monterey Bay의 수학&통계학 전공 Steven Kim 교수님과 가천대 이중학 교수님께서 R을 활용하여 회귀분석 중심의 데이터 분석 방법론과 현업에서의 PA 이슈, 최근 기술 변화와 HR의 트렌드에 대해 많은 인사이트를 전해주셨습니다.11월 18일 부터 30일까지 진행되었고, 첫 강의는 온라인 Zoom을 통해 PA에 대한 중요성과 최근 이슈에 대해 알아보고 R을 통해 간단한 회귀분석을 통해 P-value, R (adjusted) Square, AIC 값들을 확인해보는 실습을 진행하였습니다.그 다음 강의는 오프라인 수업(8hr)으로 본격적으로 R을 활용해서 로지스틱 회귀분석, 다중회귀분석, 예측모델 실습을 해보았습니다. 마지막 강의가 있던 수료식 날짜에는 PA와 부트캠프 수업에 대한 Wrap-up과 함께 수료증 전달과 즐거운 네트워킹 시간이 있었습니다.특히 짧은 시간에도 불구하고 핵심적인 내용들 위주로 두 교수님들께서 하나라도 더 알려주시고 도움주시려 애써주셔서 짧지만 아주 밀도 높은 교육 시간이었습니다. 2. 부트캠프 후기 저는 PA, HR Data 등에 평소에 관심이 있어 혼자서 이것저것 찾아보면서 공부했던 경험들이 있습니다. 하지만, PA에 관심이 있는 사람들과 함께 이야기하며 성장해나가는 경험은 전무했었죠. 그렇기에 혼자서 PA에 대한 사례들을 인터넷으로 접하며 통계적 내용들을 학습하는 것에는 항상 아쉬움이 있었습니다.이번 부트캠프에서는 그런 아쉬움을 해소할 수 있는 아주 좋은 기회였습니다. 함께 부트캠프에 참여하신 HRer분들께서는 캠프를 신청한 사유는 제각각이지만 본인들의 고민을 해결하고 더 나은 방법을 찾기위해 PA에 관심을 갖게된 것은 공통적이었습니다. 때문에 단순히 R 사용법, 회귀분석이 무엇인지를 알아간 것 보다는 이 분야에 관심이 있는 여러 사람들과 만날 수 있었던 좋은 기회로써도 소중한 부트캠프 경험이 되었습니다. (교육 현장 사진에는 다른 교육생분들이 나오셔서 첨부하지는 않은 점 양해 부탁드립니다.)물론 이번 부트캠프만으로 R이나 Python을 전혀 써보지 못한 분들이 우리가 흔히 '데이터 분석'하면 기대하는 완벽한 코딩과 깔끔하고 정갈한 이미지의 데이터 분석을 할 수 있는 것은 아닙니다. 다만, 서툴고 R의 표현식이 익숙하지 않더라도 데이터 전처리부터 분석, 시각화까지 조금씩은 경험해보며 데이터 분석에 대해 입문할 수 있는 좋은 기회임은 분명했습니다.또한 부트캠프의 강의 눈높이가 PA 입문자에 맞춰져있었으나 강의에서 얻는 인사이트는 그 이상이었습니다. 이 내용에 대해서는 다음 목차인 '3. HR Analytics : HR 도메인 & Data의 조화'에서 설명드리고자 합니다. 3. HR Analytics : HR 도메인 & Data의 조화 이번 부트캠프에서 실제 HR data를 활용해 다중회귀분석을 베이스로 여러 독립변수들을 선정하여 예측모델을 만들고 실제 데이터와 그 예측모델이 예측한 데이터간의 일치 정도를 실습해보고 가장 예측률이 높은 '예측왕'을 뽑는 과제를 수행하였습니다.저는 R의 Step 함수를 활용하여 전진선택법, 후진제거법, 단계적 선택법에서의 AIC가 가장 낮은 변수의 조합을 그대로 예측모델로 적용하였습니다. 그 결과, 실제 예측모델의 예측률은 기대 이상으로 낮았고, 특히 2종 오류의 발생률이 45%에 가까웠습니다.저의 이런 예측모델 결과에 대해 Steven 교수님과 이야기하던 중 **'HRer로서의 도메인 지식과 경험을 무시한 채 오로지 데이터값만을 맹신한 점'**이 좋지 못한 예측을 만들어낸 것의 원인임을 깨닫게 되었습니다.실제로 가장 높은 예측률로 '예측왕'에 선정되었던 분과 얘기해본 결과 R을 활용해 계산한 독립변수의 유효성은 하나의 참고 지표로서 보고, 실제 변수 선정에 있어서는 과거 HR 업무를 담당했던 시절에 고민하고 공부했던 내용들과 경험을 접목시켜 변수를 선정하였고, 이를 통해 높은 예측률을 달성하신 것이었습니다.위 경험을 토대로 이번 부트캠프를 통해 제가 가장 크게 배운 점을 공유드리며 이 글을 마치도록 하겠습니다.: ① HR의 도메인 지식과 경험, 그리고 ② Data를 함께 융합하여 바라보는 시각이 HR Data를 분석하고 들여다보는 HR Analytics(PA)를 완성시킨다.