๐ŸŒˆ ๋จธ์‹ ๋Ÿฌ๋‹ ๋ชจ๋ธ๋ง์˜ ํ”ํ•œ ์‹ค์ˆ˜๋“ค - ๋จธ์‹ ๋Ÿฌ๋‹ ๋ชจ๋ธ๋ง์˜ ํ”ํ•œ ์‹ค์ˆ˜๋“ค์— ๋Œ€ํ•œ ๋ฐœํ‘œ ์˜์ƒ ์ž๋ฃŒ์ž…๋‹ˆ๋‹ค - ๋จธ์‹ ๋Ÿฌ๋‹ ๋ชจ๋ธ๋ง์„ ํ•˜๋‹ค๋ณด๋ฉด ํ•œ๋ฒˆ์ฏค ์‹ค์ˆ˜ํ•˜๋Š” ๋ถ€๋ถ„์ด ๋‹ค์ˆ˜ ์ž‘์„ฑ๋˜์–ด ์žˆ์–ด์„œ, ์ฝ์–ด๋ณด์‹œ๋ฉด ๋„์›€์ด ๋  ๊ฒƒ์ด์—์š”! - ๋ฐœํ‘œ ์ž๋ฃŒ : https://jehyunlee.github.io/2021/02/24/Python-DS-62-mistakes/210222_%EC%9D%B4%EC%A0%9C%ED%98%84_mistakes.pdf - ์„ค๋ฌธ ์กฐ์‚ฌ ๊ฒฐ๊ณผ : https://docs.google.com/spreadsheets/d/1FqtI2_Znkdf1iouwFUXOOsOfRiA_dNySZM9L3XjP5iw/edit ๐ŸŽ ์ด ๊ธ€์„ ์ถ”์ฒœํ•˜๋Š” ์ด์œ  - ๋จธ์‹ ๋Ÿฌ๋‹ ๋ชจ๋ธ๋ง์—์„œ ์ž์ฃผ ํ•  ์ˆ˜ ์žˆ๋Š” ์‹ค์ˆ˜๋“ค์„ ์ž‘์„ฑํ•œ ๊ธ€์ž…๋‹ˆ๋‹ค - ์ด๋Ÿฐ ์‹ค์ˆ˜๋ฅผ ์•Œ์•„๋‘ฌ์„œ, ๋ฏธ๋ž˜์— ๋ฐœ์ƒํ•  ์ˆ˜ ์žˆ๋Š” ์‹ค์ˆ˜๋ฅผ ๋ฐฉ์ง€ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค - ์ „๋ฐ˜์ ์œผ๋กœ ๊ณต๊ฐ๋˜๋Š” ๋‚ด์šฉ์ด์˜€์Šต๋‹ˆ๋‹ค! ๋””ํ…Œ์ผํ•œ ๋‚ด์šฉ์€ ๊ฐœ๋ณ„์ ์œผ๋กœ ๋” ์ž๋ฃŒ๋ฅผ ์ฐพ์•„๋ณด์…”๋„ ์ข‹์„ ๊ฒƒ ๊ฐ™์Šต๋‹ˆ๋‹ค ๐Ÿ‘ ์ฝ์œผ๋ฉด ์ข‹์€ ๋ถ„ - ๋จธ์‹ ๋Ÿฌ๋‹ ๋ชจ๋ธ๋ง์„ ์ž์ฃผ ์ง„ํ–‰ํ•˜๋Š” ๋ถ„ - ๋จธ์‹ ๋Ÿฌ๋‹์„ ๊ณต๋ถ€ํ•˜๊ณ  ๊ณ„์‹  ๋ถ„ ๐Ÿ“‹ ๋‚ด์šฉ ์˜ค๋ฅ˜ 1. ๋ชจ๋ธ ์„ ์ • - ๋ชจ๋ธ ์„ ์ • ๋ฐฉ๋ฒ• => ๋ฐ์ดํ„ฐ์— ๋Œ€ํ•œ ์‚ฌ์ „ ์ง€์‹์ด ํ•„์š” - 1) ๋ฌผ๋ฆฌ์  ์˜๋ฏธ - ์˜ˆ : ์ง€๋ฐฐ ๋ฐฉ์ •์‹ - 2) ์ˆ˜์น˜์  ํŠน์„ฑ ํŒŒ์•… - ์˜ˆ : ์ฃผ๊ธฐ์„ฑ, ์ƒ/ํ•˜ํ•œ์„ฑ ํŒŒ์•… - 3) ๋ฐ์ดํ„ฐ ํŠน์„ฑ ํŒŒ์•… - ์˜ˆ : ๋ถ„ํฌ, ์ธ์ž๊ฐ„ ์ƒ๊ด€์„ฑ - ๋‹จ์ˆœํžˆ ๋ฐ์ดํ„ฐ ํŠน์„ฑ๋งŒ ํŒŒ์•…ํ•ด์„œ ๋ชจ๋ธ์„ ๋งŒ๋“œ๋Š” ๊ฒฝ์šฐ ์‹ค์ˆ˜๊ฐ€ ๋งŽ์Œ - Feature Engineering + ๋ชจ๋ธ ์„ ์ • ๊ณผ์ •์—์„œ ๋‹ค์งœ๊ณ ์งœ 2์ฐจํ•ญ, 3์ฐจํ•ญ ๋งŒ๋“ค๊ณ  log ์ทจํ•˜๊ณ  ๋“ฑ๋“ฑ๋“ฑ => ์ž˜ ๋งž์•„๋„ ํ•ด์„์ด ์–ด๋ ค์›€ ์˜ค๋ฅ˜ 2. ๋ฐ์ดํ„ฐ ์ „์ฒ˜๋ฆฌ - ์ „์ฒ˜๋ฆฌํ•  ๋•Œ ์ด์ƒ์น˜๋ฅผ ์ฒ˜๋ฆฌํ•ด์ค˜์•ผ ํ•จ => ์ „์ฒด์ ์ธ ์„ฑ๋Šฅ์— ์˜ํ–ฅ - 1) ๋…ผ๋ฆฌ์  ์˜๋ฏธ - 2) ํ†ต๊ณ„์  ๊ณ ๋ฆฝ - ์ผ๋ฐ˜์ ์œผ๋กœ ํ†ต๊ณ„์ ์œผ๋กœ ๊ณ ๋ฆฝ๋œ ๋ฐ์ดํ„ฐ ํŒŒ์•…ํ•ด์„œ ๋ณธ ํ›„, ๋…ผ๋ฆฌ์ ์œผ๋กœ ํ•ฉ๋‹นํ•œ์ง€ ํ™•์ธ - ๋จธ์‹ ๋Ÿฌ๋‹ ํ•™์Šต ๋ฐ์ดํ„ฐ ๋ถ„ํ•  - 1) ํ…Œ์ŠคํŠธ ๋ฐ์ดํ„ฐ๋ฅผ ๋ฐ”๊พธ๋Š” ์ผ => ๋ชจ๋ธ์ด ๋ชฐ๋ผ์•ผ ํ•จ - ํ•™์Šต ๋ฐ์ดํ„ฐ๋ฅผ ๋‚˜๋ˆ ์„œ ๊ฒ€์ฆ ๋ฐ์ดํ„ฐ๋กœ ๋‚˜๋ˆ„๊ธฐ(K Fold) - ์ „์ฒด ๋ฐ์ดํ„ฐ ์ค‘ ํ•™์Šต ๋ฐ์ดํ„ฐ ์ผ๋ถ€, ํ…Œ์ŠคํŠธ ๋ฐ์ดํ„ฐ ์ผ๋ถ€๋ฅผ ์‚ฌ์šฉํ•˜๋Š” ๊ฒฝ์šฐ - 2) ์‹œ๊ณ„์—ด ๋ฐ์ดํ„ฐ์ธ ๊ฒฝ์šฐ๋Š” ๊ณผ๊ฑฐ ๋ฐ์ดํ„ฐ๊ฐ€ ํ•™์Šต ๋ฐ์ดํ„ฐ, ๋ฏธ๋ž˜ ๋ฐ์ดํ„ฐ๊ฐ€ ํ…Œ์ŠคํŠธ ๋ฐ์ดํ„ฐ - Nested Cross Validation์œผ๋กœ ์ ์ง„์ ์œผ๋กœ ์ง„ํ–‰ => ํ•™์Šต ๋ฐ์ดํ„ฐ๊ฐ€ ๊ท ๋“ฑํ•˜์ง€ ์•Š์•„์„œ ๋™์ผ ์กฐ๊ฑด์ด ์•„๋‹˜ - Blocking Time Series Split => ํ•™์Šต ๋ฐ์ดํ„ฐ์™€ ๊ฒ€์ฆ ๋ฐ์ดํ„ฐ๋ฅผ ๋™์ผํ•œ ๋ฐฉ์‹์œผ๋กœ ์ด๋™ ์˜ค๋ฅ˜ 3. ํ•™์Šต, ํ…Œ์ŠคํŠธ ๋ฐ์ดํ„ฐ ๋ถ„ํ•  - ๋ฐ์ดํ„ฐ๋ฅผ ๊ณจ๊ณ ๋ฃจ ๋‚˜๋ˆ„์–ด์•ผ ํ•จ - ์‹ค์ „ ๋ฐ์ดํ„ฐ๊ฐ€ ๋“ค์–ด์˜ฌ ๋ฒ”์œ„์˜ ๋ฐ์ดํ„ฐ๋ฅผ ์ถฉ๋ถ„ํžˆ ์ˆ˜์ง‘ํ•ด ํ•™์Šตํ•ด์•ผ ํ•จ ์˜ค๋ฅ˜ 4. ๋ฐ์ดํ„ฐ ๋ถˆ๊ท ํ˜• - ํ•™์Šต์ด ๋‹ค์ˆ˜ ๋ฐ์ดํ„ฐ์— ์น˜์ค‘๋˜๊ณ , ์†Œ์ˆ˜ ๋ฐ์ดํ„ฐ๊ฐ€ ์˜ˆ์ธก๋ ฅ์ด ์ €ํ•˜๋จ - ์› ํ•จ์ˆ˜๋ฅผ ์ž˜ ์ฐพ์•˜์ง€๋งŒ, R^2๊ฐ€ ๋‚ฎ์€ ๊ฒฝ์šฐ => R^2๊ฐ€ ๋‚ฎ๋‹ค๊ณ  ๋ชจ๋ธ์ด ๋‚˜์˜๋‹ค๊ณ  ๋งํ•˜๊ธด ์–ด๋ ค์›€ ์˜ค๋ฅ˜ 5. ๋ฐ์ดํ„ฐ ์Šค์ผ€์ผ๋ง - ๋ฐ์ดํ„ฐ ๋‹จ์œ„์˜ ๋ถˆ์ผ์น˜. 1m์™€ 50cm์ผ ๊ฒฝ์šฐ cm๋กœ ํ†ต์ผํ•˜๊ฑฐ๋‚˜ ์†Œ์ˆ˜์ ์œผ๋กœ ๋ฐ˜์˜ - ์„ ํ˜•ํšŒ๊ท€์—์„œ๋„ ์ด์Šˆ ๋ฐœ์ƒ ์˜ค๋ฅ˜6. ๋ฐ์ดํ„ฐ ์œ ์ถœ(Data Leakage) - 1) ๋ ˆ์ด๋ธ” ๋ฐ์ดํ„ฐ๊ฐ€ ์œ ์ถœ๋จ - ์˜ˆ์ธก ์‹œ์ ์— ์•Œ ์ˆ˜ ์—†๋Š” ๋ฐ์ดํ„ฐ๋ฅผ ํ•™์Šต์— ์‚ฌ์šฉ - ์ •๋ง ๋งŽ์ด ๋ฐœ์ƒํ•จ - 2) ํ•™์Šต-ํ…Œ์ŠคํŠธ ๋ฐ์ดํ„ฐ ์˜ค์—ผ - ํ…Œ์ŠคํŠธ์šฉ ๋ฐ์ดํ„ฐ๊ฐ€ ํ•™์Šต์‹œ ๋ฐ˜์˜๋จ - ๋ฐ์ดํ„ฐ ํ‘œ์ค€ํ™”์‹œ ํ…Œ์ŠคํŠธ ๋ฐ์ดํ„ฐ๋ฅผ ํฌํ•จํ•˜๋Š” ๊ฒฝ์šฐ - ์ฝ”๋“œ์ƒ์˜ ์ด์Šˆ๋กœ ๋ฐœ์ƒํ•  ์ˆ˜๋„ ์žˆ์Œ ๋‚˜๋จธ์ง€ ์˜ค๋ฅ˜๋Š” ์Šคํ”„๋ ˆ๋“œ์‹œํŠธ์— ๋‚˜์™€์žˆ์Šต๋‹ˆ๋‹ค! : https://docs.google.com/spreadsheets/d/1FqtI2_Znkdf1iouwFUXOOsOfRiA_dNySZM9L3XjP5iw/edit

์‚ฌ์šฉ์ž๊ฐ€ ๊ณต์œ ํ•œ ์ฝ˜ํ…์ธ 

-

์‚ฌ์šฉ์ž๊ฐ€ ๊ณต์œ ํ•œ ์ฝ˜ํ…์ธ 

๋‹ค์Œ ๋‚ด์šฉ์ด ๊ถ๊ธˆํ•˜๋‹ค๋ฉด?

๋˜๋Š”

์ด๋ฏธ ํšŒ์›์ด์‹ ๊ฐ€์š”?

2021๋…„ 2์›” 25์ผ ์˜ค์ „ 12:26

ย โ€ขย 

์ €์žฅ 152 โ€ข ์กฐํšŒ 5,721

๋Œ“๊ธ€ 0




    ๋น„์Šทํ•œ ๊ฒŒ์‹œ๋ฌผ

    ์ฃผ๊ฐ„ ์ธ๊ธฐ TOP 10

    1

    ์žฅํ™์„ ์ŠคํŽ˜์ด์Šค์˜ค๋””ํ‹ฐ ๋ถ€๋Œ€ํ‘œ/CPO

    < ๋ฆฌ๋”๋ฅผ ์œ„ํ•œ ํšจ์œจ์ ์ธ ์‹œ๊ฐ„ ์ชผ๊ฐœ๊ธฐ ๊ธฐ์ˆ  3๊ฐ€์ง€ >

    2

    ๋‹ฌ๋ ˆ Apollo GraphQL Software Engineer

    ๐Ÿž Bun์ด Anthropic์˜ ๊ฐ€์กฑ์ด ๋˜์—ˆ์Šต๋‹ˆ๋‹ค! ๐ŸŽ‰

    2

    ํ•˜์กฐ์€ ๋‹น๊ทผ Product Engineer

    ์‚ฌ์ด๋“œ ํ”„๋กœ์ ํŠธ์— ๋‚ ๊ฐœ๋ฅผ ๋‹ฌ์•„์ค€ ํด๋กœ๋“œ ์ฝ”๋“œ

    2

    ๋‹ฌ๋ ˆ Apollo GraphQL Software Engineer

    ๐Ÿ“ป ํ”„๋กœ๊ทธ๋ž˜๋จธ๋ฅผ ์œ„ํ•œ ํ”„๋กœ๊ทธ๋ž˜๋ฐ ํŒŸ์บ์ŠคํŠธ, ๋‹ฌ๋ ˆ์ค„๋ ˆ ๐ŸŽ™๏ธ

    5

    ๊ณจ๋นˆํ•ด์ปค Chief Maker

    ๐Ÿ“ AI๊ฐ€ Anthropic์˜ ์—…๋ฌด ๋ฐฉ์‹์„ ์–ด๋–ป๊ฒŒ ๋ฐ”๊พธ๊ณ  ์žˆ๋Š”๊ฐ€

    ์ถ”์ฒœ ํ”„๋กœํ•„