πŸ’‘ β€˜κ΅μœ‘ λ°μ΄ν„°β€˜ 뢄석이 μ–΄λ €μš΄ 2κ°€μ§€ 이유 데이터 뢄석은 μˆ˜λ§Žμ€ μ˜μ—­κ³Ό λ§žλ‹Ώμ•„ μžˆλ‹€. 금육, 의료, κ°œμΈμ •λ³΄, νŠΈλž˜ν”½, 인사, 법λ₯  λ“±. λ¬Όλ‘  β€™κ΅μœ‘β€˜ 뢄야도 빼놓을 수 μ—†λ‹€. 각 λΆ„μ•Όλ§ˆλ‹€ λ‚˜λ¦„μ˜ 어렀움은 μžˆκ² μœΌλ‚˜, νŠΉλ³„νžˆ β€™κ΅μœ‘ 데이터 λΆ„μ„β€˜μ˜ 고좩을 닀뀄 보고자 ν•œλ‹€. 1. 데이터 μˆ˜μ§‘μ˜ 어렀움 의료의 경우, κ°€λ Ή 당뇨병에 νš¨κ³Όκ°€ μžˆλŠ” 신약을 κ°œλ°œν•˜κ³  μžˆλ‹€λ©΄, 성별/μ—°λ Ή/체쀑/지병 등을 κΈ°μ€€μœΌλ‘œ μ–΄λŠ 정도 객관적인 μ‹€ν—˜κ΅°μ„ λͺ¨μ§‘ν•  수 μžˆλ‹€. κ·ΈλŸ¬λ‚˜ ꡐ윑 λ°μ΄ν„°λŠ” μˆ˜μ§‘ μžμ²΄κ°€ 쉽지 μ•Šλ‹€. 일단 (ꡐ윑 λ°μ΄ν„°μ˜ 광산이라 ν•  수 μžˆλŠ”) μ΄ˆμ€‘κ³ κ΅μ—μ„œλŠ” κ°œμΈμ •λ³΄ 보호λ₯Ό μœ„ν•΄ ν•™μƒμ˜ 성적을 κ³΅κ°œν•˜μ§€ μ•ŠλŠ”λ‹€. μ‚¬κΈ°μ—…μ΄λ‚˜ ν•™μ›μ—μ„œλ„ 학생 성적은 일급 비밀이닀. κ²°κ΅­ μ†Œκ·œλͺ¨ 데이터 λ˜λŠ” μ•„μ£Ό 가끔 κ³΅κ°œλ˜λŠ” 곡곡 데이터λ₯Ό 톡해 뢄석을 μ‹œλ„ν•  μˆ˜λ°–μ— μ—†λŠ”λ°, μ΄λŠ” 맀우 μ œν•œμ μΈ κ²°κ³Όλ₯Ό κ°–λŠ”λ‹€. μ΄ˆλ“±ν•™κ΅ ν•œ 개 ν•™λ…„, ν•œ 개 반의 κ²°κ³ΌλŠ” μ–Όλ§ˆλ‚˜ 큰 ν•¨μ˜λ₯Ό κ°€μ§ˆκΉŒ? 3ν•™λ…„ λ•Œμ˜ 평과 κ²°κ³Όλ₯Ό 1-6ν•™λ…„ λͺ¨λ‘μ— μ μš©ν•  수 μžˆμ„κΉŒ? 2. 데이터 λΆ„μ„μ˜ 어렀움 1) λ…λ¦½λ³€μˆ˜ 섀정에 μ°½μ˜μ„±μ΄ ν•„μš”ν•˜λ‹€. μˆ˜μ§‘λ„ 쉽지 μ•Šμ§€λ§Œ, ꡐ윑 λ°μ΄ν„°λŠ” 뢄석도 μ–΄λ ΅λ‹€. μš°μ„  기본적인 νšŒκ·€ λΆ„μ„μ˜ μš”μ μ„ 생각해 보자. β‘  μ’…μ†λ³€μˆ˜ yλ₯Ό μ„€μ •ν•œλ‹€. β‘‘ μ’…μ†λ³€μˆ˜μ— 영ν–₯을 λ―ΈμΉ˜λŠ” λ…λ¦½λ³€μˆ˜(x)λ₯Ό μ—¬λŸ¬ 개 μ„€μ •ν•œλ‹€. β‘’ y=ax1 + bx2 + cx3… ν˜•νƒœμ˜ 방정식을 μ„Έμš°κ³ , κ°€μž₯ 큰 영ν–₯을 λ―ΈμΉ˜λŠ” λ…λ¦½λ³€μˆ˜λ₯Ό μ°ΎλŠ”λ‹€. ꡐ윑 데이터 λΆ„μ„μ—μ„œλŠ” 보톡 yλ₯Ό β€™μ„±μ β€˜μœΌλ‘œ λ†“λŠ”λ‹€. μ’‹λ‹€, 그럼 성적에 영ν–₯을 λ―ΈμΉ˜λŠ” μš”μΈμ€ λ¬΄μ—‡μΌκΉŒ? μ—¬κΈ°μ„œλΆ€ν„°κ°€ λ‚œν•­μ΄λ‹€. λΆ€λͺ¨λ‹˜μ˜ μž¬μ‚°μ΄λ‚˜ μ‹ λΆ„(직업), ν•™μŠ΅μžκ°€ λ‹€λ‹ˆλŠ” ν•™μ›μ˜ 수, ν•™μŠ΅μžμ˜ μ§€λ‚œ 성적, ν•™μŠ΅μžκ°€ λ°œμ–Έν•˜κ±°λ‚˜ 손 λ“  횟수, ν•™μŠ΅μžμ˜ μžμ‹ κ°β€¦β€¦ 정말 λ‹€μ–‘ν•œ xκ°€ λ‚˜μ˜€λŠ”λ°, 무엇 ν•˜λ‚˜ μΈ‘μ •ν•˜κΈ° μ‰¬μš΄ 것이 μ—†λ‹€. κ²Œλ‹€κ°€ ꡐ윑 데이터 뢄석은 정말 μ˜μ™Έμ˜ λ³€μˆ˜κ°€ 결정적일 λ•Œκ°€ μžˆλ‹€. μ–΄λŠ μ±…μ—μ„œλŠ” ’손을 λ“  νšŸμˆ˜β€™κ°€ 성적에 큰 영ν–₯을 λ―ΈμΉ˜λŠ” κ²ƒμœΌλ‘œ κ΄€μ°°λ˜μ—ˆλ‹€κ³  ν•œλ‹€. 즉, 참여도가 λ†’μœΌλ©΄ 성적도 높은 것이닀. 이렇듯 ꡐ윑 데이터 뢄석은 λ…λ¦½λ³€μˆ˜μ— λŒ€ν•΄μ„œλ„ μƒλ‹Ήν•œ μ°½μ˜μ„±μ„ μš”ν•œλ‹€. 2) μ’…μ†λ³€μˆ˜ 섀정도 κ²½μš°μ— 따라 달리해야 ν•œλ‹€. ν•œ κ°€μ§€ 더. μ’…μ†λ³€μˆ˜κ°€ κΌ­ β€™μ„±μ β€˜μ΄λΌλŠ” 법칙은 μ—†λ‹€. 특히 κΈ°μ—… 직무 κ΅μœ‘μ— μžˆμ–΄μ„œλŠ” λ”μš± κ·Έλ ‡λ‹€. 직무 ꡐ윑 성적이 λ†’λ‹€κ³  κ³Όμ—° 직무 μˆ˜ν–‰ λŠ₯λ ₯도 λ†’μ„κΉŒ? 높은 μƒκ΄€κ΄€κ³„λŠ” μžˆκ² μ§€λ§Œ, μ–΄λ–€ 직무냐에 따라 아닐 μˆ˜λ„ μžˆλ‹€. 이렇듯 ꡐ윑 데이터 뢄석은 생각보닀 적용이 쉽지 μ•Šλ‹€. μˆ˜λŸ‰ν™”μ™€ μˆ˜μΉ˜ν™”κ°€ μ–΄λ €μš΄ 만큼, λΆ„μ„κ°€μ˜ 톡찰이 μ€‘μš”ν•΄ 보인닀. #upyou_note #κ΅μœ‘λ°μ΄ν„°λΆ„μ„ #ꡐ윑 #뢄석
μ½˜ν…μΈ λ₯Ό 더 읽고 μ‹Άλ‹€λ©΄?
μ›ν‹°λ“œμ— κ°€μž…ν•΄ μ£Όμ„Έμš”.
둜그인 ν›„ λͺ¨λ“  글을 λ³Ό 수 μžˆμŠ΅λ‹ˆλ‹€.
γƒ»λŒ“κΈ€ 1