๋ณธ๋ฌธ ๋ฐ”๋กœ๊ฐ€๊ธฐ
  • ํ•€ํ„ฐ๋ ˆ์ŠคํŠธ  ๊ณต์œ ํ•˜๊ธฐ
  • ์นด์นด์˜คํ†ก ๊ณต์œ ํ•˜๊ธฐ
  • ๋„ค์ด๋ฒ„๋ธ”๋กœ๊ทธ ๊ณต์œ ํ•˜๊ธฐ
  • ๋„ค์ด๋ฒ„๋ฐด๋“œ ๊ณต์œ ํ•˜๊ธฐ
  • ํŽ˜์ด์Šค๋ถ ๊ณต์œ ํ•˜๊ธฐ
  • ํŠธ์œ„ํ„ฐ ๊ณต์œ ํ•˜๊ธฐ

๋ถ„๋ฅ˜ ์ „์ฒด๋ณด๊ธฐ34

[๋น…๋ฐ์ดํ„ฐ๋ถ„์„๊ธฐ์‚ฌ] ๋น…๋ถ„๊ธฐ ์ฒดํ—˜ํ™˜๊ฒฝ 3์œ ํ˜• ๋ฌธ์ œ ํ’€์ด (2025. 6 ์—…๋ฐ์ดํŠธ) ๋น…๋ฐ์ดํ„ฐ๋ถ„์„๊ธฐ์‚ฌ ์ฒดํ—˜ํ™˜๊ฒฝ 3์œ ํ˜• ๊ฐ€์„ค๊ฒ€์ • ๋ฌธ์ œ๊ฐ€ ๋“ฑ๋ถ„์‚ฐ ๊ฒ€์ •, ํ•ฉ๋™๋ถ„์‚ฐ ์ถ”์ •๋Ÿ‰ ๊ตฌํ•˜๊ธฐ, ๋…๋ฆฝํ‘œ๋ณธ t-๊ฒ€์ •์„ ์ˆ˜ํ–‰ํ•˜๋Š” ๋ฌธ์ œ๋กœ ๋ณ€๊ฒฝ๋จ์œผ๋กœ์จ ์•ž์œผ๋กœ ์ถœ์ œ๋  ์ˆ˜ ์žˆ๋Š” ๋ฒ”์œ„๊ฐ€ ํ™•์žฅ๋˜์—ˆ๋‹ค๊ณ  ํ•  ์ˆ˜ ์žˆ๋‹ค.ใ€Š์ œ๊ณต ๋ฐ์ดํ„ฐใ€‹์•” ํ™˜์ž์™€ ์ •์ƒ์ธ์˜ ๋ฆฌ์ง€์Šคํ‹ด ์ˆ˜์น˜์— ๋Œ€ํ•œ ์ž๋ฃŒ / ๋‘ ์ง‘๋‹จ ๋กœ๊ทธ ๋ฆฌ์ง€์Šคํ‹ด ๊ฐ’์˜ ์ฐจ์ด ์—ฌ๋ถ€ ๊ฒ€์ •(๋‹จ, ๋ชจ๋ธ์€ ์ ˆํŽธํ•ญ์„ ํฌํ•จ)- Resistin: ๋ฆฌ์ง€์Šคํ‹ด ์ˆ˜(ng/mL)- classification: ์‹คํ—˜์ž ์ •๋ณด[1: ์ •์ƒ, 2: ํ™˜์ž]import pandas as pd import numpy as npfrom scipy import statsdf = pd.read_csv("data/bcc.csv") print(df.head())> Resistin Classification 0 7.99585 1 1 4... 2025. 7. 20.
[๋น…๋ฐ์ดํ„ฐ๋ถ„์„๊ธฐ์‚ฌ] ๋น…๋ถ„๊ธฐ ์ฒดํ—˜ํ™˜๊ฒฝ 2์œ ํ˜• ๋ฌธ์ œ ํ’€์ด (2025. 6 ์—…๋ฐ์ดํŠธ) 2025๋…„ 6์›” ๋ณ€๊ฒฝ๋œ ๋น…๋ฐ์ดํ„ฐ๋ถ„์„๊ธฐ์‚ฌ ์ฒดํ—˜ํ™˜๊ฒฝ 2 ์œ ํ˜• ๋ฌธ์ œ์˜ ์ œ๊ณต ๋ฐ์ดํ„ฐ๋Š” ๊ธฐ์กด ๋ฐ์ดํ„ฐ์™€ ๋™์ผํ•˜๋‚˜, ๊ธฐ์กด์˜ ๋ถ„๋ฅ˜๋ชจ๋ธ์—์„œ ํšŒ๊ท€๋ชจ๋ธ ์˜ˆ์ธก ๋ฌธ์ œ๋กœ ๋ณ€๊ฒฝ๋˜์—ˆ๋‹ค.์ œ๊ณต๋ฐ์ดํ„ฐ: ๋ฐฑํ™”์  ๊ณ ๊ฐ์˜ 1๋…„๊ฐ„ ์ƒํ’ˆ ๊ตฌ๋งค ๊ธฐ๋กcustomer_train.csv: ํ•™์Šต์šฉ ๋ฐ์ดํ„ฐ, 3500๊ฐœcustomer_test.csv: ํ‰๊ฐ€์šฉ ๋ฐ์ดํ„ฐ, 2482๊ฐœใ€๋ฌธ์ œใ€‘ํ•™์Šต์šฉ ๋ฐ์ดํ„ฐ๋ฅผ ํ™œ์šฉํ•˜์—ฌ ์ด๊ตฌ๋งค์•ก์„ ์˜ˆ์ธกํ•˜๋Š” ๋ชจ๋ธ ๊ฐœ๋ฐœํ•˜๊ณ , ์ด ์ค‘ ๊ฐ€์žฅ ์šฐ์ˆ˜ํ•œ ๋ชจ๋ธ์„ ํ‰๊ฐ€์šฉ ๋ฐ์ดํ„ฐ์— ์ ์šฉํ•˜์—ฌ ์ด๊ตฌ๋งค์•ก ์˜ˆ์ธกํ•˜๊ธฐ ์˜ˆ์ธก๊ฒฐ๊ณผ๋Š” csvํŒŒ์ผ๋กœ ์ƒ์„ฑํ•˜๋Š” ์ฝ”๋“œ ์ œ์ถœ / ์˜ˆ์ธก ์ด๊ตฌ๋งค์•ก ์ปฌ๋Ÿผ๋ช…: pred / ์ œ์ถœ ์ปฌ๋Ÿผ ๊ฐœ์ˆ˜: 1๊ฐœ ์˜ˆ์ธก๊ฒฐ๊ณผ๋Š” RMSE(Root Mean Squared Error)๋ฅผ ํ‰๊ฐ€์ง€ํ‘œ์— ๋”ฐ๋ผ ํ‰๊ฐ€# 1. ๋ผ์ด๋ธŒ๋Ÿฌ๋ฆฌ ๋ฐ ๋ฐ์ดํ„ฐ ํ™•์ธ import pandas.. 2025. 7. 17.
[๋น…๋ฐ์ดํ„ฐ๋ถ„์„๊ธฐ์‚ฌ] ๋น…๋ถ„๊ธฐ ์ฒดํ—˜ํ™˜๊ฒฝ 1์œ ํ˜• ๋ฌธ์ œ ํ’€์ด(2025. 6 ์—…๋ฐ์ดํŠธ) ๋น…๋ฐ์ดํ„ฐ๋ถ„์„๊ธฐ์‚ฌ ์‹ค๊ธฐ ์‹œํ—˜์€ ๊ตฌ๋ฆ„ goorm ํ™˜๊ฒฝ์—์„œ ์ง„ํ–‰๋˜๋Š”๋ฐ, ๋น…๋ถ„๊ธฐ 10ํšŒ ์‹ค๊ธฐ์‹œํ—˜์„ ๋ณด๋ฆ„๊ฐ€๋Ÿ‰ ์•ž๋‘๊ณ  ์ฒดํ—˜ํ™˜๊ฒฝ์— ์žˆ๋Š” 1~3 ์œ ํ˜• ๋ฌธ์ œ๋“ค์ด ๋ชจ๋‘ ๋ณ€๊ฒฝ๋œ ๋ฐ” ์žˆ๋‹ค. ์ด๋ฒˆ ํฌ์ŠคํŒ…์—์„œ๋Š” ๋ณ€๊ฒฝ๋œ ์ฒดํ—˜ํ™˜๊ฒฝ 1์œ ํ˜• ๋ฌธ์ œ ํ’€์ด๋ฅผ ํ•ด๋ณด๋ ค ํ•œ๋‹ค.> - ์ง์›ID: ๊ณ ์œ  ์‹๋ณ„์ž - ๋ถ€์„œ: ์†Œ์† ๋ถ€์„œ - ์—ฐ๋ด‰: ์—ฐ๊ฐ„ ๊ธ‰์—ฌ - ๊ทผ์†์—ฐ์ˆ˜: ์ด ๊ทผ๋ฌด๊ธฐ๊ฐ„ - ์„ฑ๊ณผ๋“ฑ๊ธ‰: ์„ฑ๊ณผ ๋“ฑ๊ธ‰(A, B, C) - ๊ต์œก์ฐธ์—ฌํšŸ์ˆ˜: ํšŒ์‚ฌ ๊ต์œก์— ์ฐธ์—ฌํ•œ ํšŸ์ˆ˜ - ๊ณ ๊ฐ๋งŒ์กฑ๋„: ๋‹ด๋‹น ์—…๋ฌด์— ๋Œ€ํ•œ ๊ณ ๊ฐ์˜ ๋งŒ์กฑ๋„import pandas as pd df = pd.read_csv("data/employee_performance.csv") print(df.head()) > ์ง์›ID ๋ถ€์„œ ์—ฐ๋ด‰ ๊ทผ์†์—ฐ์ˆ˜ ์„ฑ๊ณผ๋“ฑ๊ธ‰ ๊ต์œก์ฐธ์—ฌํšŸ์ˆ˜ ๊ณ ๊ฐ๋งŒ์กฑ๋„ 0 E1 Marketing .. 2025. 7. 15.
๋น„์ „๊ณต์ž ๋น…๋ถ„๊ธฐ 10ํšŒ ํ•„๊ธฐ ์‹ค๊ธฐ 1ํŠธ ํ•ฉ๊ฒฉํ›„๊ธฐ (๊ธฐ์ถœ๋ฌธ์ œ ๋ณต๊ธฐ) ¶๋ชฉ์ฐจโ— ๋น…๋ถ„๊ธฐ ํ•„๊ธฐ ๊ณต๋ถ€๊ธฐ๊ฐ„ · ์‹œํ—˜์žฅ์†Œ · ๋‚œ์ด๋„โ— ๋น…๋ถ„๊ธฐ ์‹ค๊ธฐ ๊ณต๋ถ€๊ธฐ๊ฐ„ · ์‹œํ—˜์žฅ์†Œโ— ๋น…๋ถ„๊ธฐ 10ํšŒ ์‹ค๊ธฐ ๋ณต๊ธฐโ— ๋น…๋ถ„๊ธฐ ๋น ๋ฅธ ํ•ฉ๊ฒฉ๋น„๊ฒฐ · ๋‚œ์ด๋„๋น„์ „๊ณต์ž ๋น…๋ฐ์ดํ„ฐ ๋ถ„์„๊ธฐ์‚ฌ 10ํšŒ ์‹ค๊ธฐ ๊ธฐ์ถœ๋ฌธ์ œ ๋ณต๊ธฐ & ๋‹จ๊ธฐ ํ•ฉ๊ฒฉ ๋น„๊ฒฐ๋น…๋ถ„๊ธฐ ํ•„๊ธฐ ๊ณต๋ถ€๊ธฐ๊ฐ„ · ์‹œํ—˜์žฅ์†Œ · ๋‚œ์ด๋„๋น…๋ฐ์ดํ„ฐ ๋ถ„์„๊ธฐ์‚ฌ ํ•„๊ธฐ๋Š” ์‹œํ—˜์ ‘์ˆ˜ ํ›„ 1๋‹ฌ ๊ฐ€๊นŒ์ด ๊ณต๋ถ€ํ–ˆ๋Š”๋ฐ ์œ ๋ฃŒ ์ธ๊ฐ• ์•ˆ ๋“ฃ๊ณ  ์œ ํŠœ๋ธŒ ๊ฐ•์˜์™€ ๊ธฐ์ถœ๋ฌธ์ œ ๋ชจ์•„ ํ’€๋ฉด์„œ ์ค€๋น„ํ•ด์„œ 1ํŠธ์— ํ•ฉ๊ฒฉํ–ˆ๋‹ค. ์‹œํ—˜์žฅ์†Œ๋Š” ๋ถ„๋‹น ์„œํ˜„๊ณ ์˜€๋Š”๋ฐ ์‹œํ—˜์ ‘์ˆ˜ ์ฒซ๋‚  ๋น ๋ฅด๊ฒŒ ์ ‘์ˆ˜ํ•ด์•ผ ํ•œ๋‹ค๋Š” ์‚ฌ์‹ค์„ ๋ชจ๋ฅด๊ณ  ์žˆ๋‹ค๊ฐ€ ๋งˆ๊ฐ ์ „๋‚  ๋ฐค์— ์žฅ์†Œ ์ฐพ์•„๋ณด๋‹ค๊ฐ€ ์ง‘์—์„œ ๊ฐ€๊นŒ์šด ์„œํ˜„๊ณ ์— ๋”ฑ 1์ž๋ฆฌ ๋‚จ์•„์žˆ๋Š” ๊ฑธ ์šด์ข‹๊ฒŒ ๋ฐœ๊ฒฌํ•˜๊ณ  ๋ฐ”๋กœ ์ ‘์ˆ˜ ์„ฑ๊ณตํ–ˆ๋‹ค.ํ•„๊ธฐ ๊ณต๋ถ€ํ•ด๋ณด๋ฉด ์•Œ๊ฒ ์ง€๋งŒ ์ƒ๊ฐ๋ณด๋‹ค ๋ฒ”์œ„๊ฐ€ ๊ฝค ๋ฐฉ๋Œ€ํ•˜๊ธฐ ๋•Œ๋ฌธ์— ์ž˜ ์š”์•ฝํ•ด์„œ ์ •๋ฆฌํ•˜๋Š” ๊ฒƒ์ด ํ•„์š”ํ•˜๋‹ค.10ํšŒ .. 2025. 7. 9.
์ปดํ™œ1๊ธ‰ 50๋Œ€ ๋…ํ•™ ํ•ฉ๊ฒฉํ›„๊ธฐ NO๊ต์žฌ NO์œ ๋ฃŒ์ธ๊ฐ• (์šฉ์ธ์ƒ๊ณตํšŒ์˜์†Œ ์„œ๋ถ€์ƒ์„ค๊ฒ€์ •์žฅ & ์„ฑ๋‚จ์ƒ๊ณตํšŒ์˜์†Œ) ๋ชฉ์ฐจโ—พ์ปดํ™œ1๊ธ‰ ํ•„๊ธฐ 1ํŠธ ํ•ฉ๊ฒฉโ—พ์ปดํ™œ1๊ธ‰ ์‹ค๊ธฐ ์‹œํ–‰์ฐฉ์˜ค์™€ ๊นจ๋‹ฌ์Œโ—พ๊ธฐํƒ€ ์ฃผ์˜์‚ฌํ•ญ(์‹œํ—˜์ผ์ •, ์‹œํ—˜์žฅ ์„ ํƒ, ๋ฌธ์ œํ‘ธ๋Š” ์ˆœ์„œ ๋“ฑ)โ—พ์ปดํ™œ1๊ธ‰ ์‹ค๊ธฐ ์ ์ˆ˜ํ™•์ธ ๋ฐฉ๋ฒ•์ปดํ™œ 1๊ธ‰ ํ•ฉ๊ฒฉ์˜ ๋น ๋ฅธ ์ง€๋ฆ„๊ธธ์ž‘๋…„ 7์›”์— ์ปดํ™œ2๊ธ‰ ํ•ฉ๊ฒฉํ•˜๊ณ  ๋‚˜์„œ ๊ผญ 1๊ธ‰์— ๋„์ „ํ•˜๊ฒ ๋‹ค๊ณ  ๋งˆ์Œ์„ ๋จน์€ ๊ฑด ์•„๋‹ˆ์—ˆ๋Š”๋ฐ, 3๊ฐœ์›”์ด ์ง€๋‚˜ ์œ ํŠœ๋ธŒ์—์„œ ์ปดํ™œ1๊ธ‰ ๊ฒ€์ƒ‰ํ•˜๋‹ค๊ฐ€ [์ปดํ™œ1๊ธ‰์‹ค๊ธฐ 20์ผ๋งŒ์— ๋๋‚ด๊ธฐ]๋ผ๋Š” ๊ฐ•์˜๋ฅผ ์ ‘ํ•˜๊ณ ์„œ ๋“ค์–ด๋ณด๋‹ˆ ํ• ๋งŒํ•˜๋‹ค๋Š” ๋А๋‚Œ์ด ๋“ค์—ˆ๋‹ค. 2๊ธ‰์€ ์œ ๋ฃŒ์ธ๊ฐ•์œผ๋กœ ๊ณต๋ถ€ํ–ˆ์—ˆ๋Š”๋ฐ 1๊ธ‰์€ ๊ทธ๋ ‡๊ฒŒ ๋ฌด๋ฃŒ์ธ๊ฐ•์œผ๋กœ ๊ณต๋ถ€๋ฅผ ์‹œ์ž‘ํ•˜๊ฒŒ ๋๋‹ค. ๋‚˜์ด๊ฐ€ ์žˆ๋‹ค ๋ณด๋‹ˆ ์ฑ…์„ ๋ณด๋ฉด์„œ ๊ณต๋ถ€ํ•˜๋Š” ๊ฑด ๋ˆˆ๋„ ๋” ํ”ผ๋กœํ•œ ๊ฒƒ ๊ฐ™๊ณ  ์ปดํ“จํ„ฐ๋งŒ ๋ณด๋ฉด์„œ ๊ณต๋ถ€ํ•˜๋Š” ๊ฒŒ ํŽธํ•ด์„œ ๊ต์žฌ๊ตฌ์ž…์€ ๊ณ ๋ คํ•˜์ง€ ์•Š์•˜๋‹ค.์ปดํ™œ1๊ธ‰ ํ•„๊ธฐ 1ํŠธ ํ•ฉ๊ฒฉ๋‚ด๊ฐ€ 1๊ธ‰ ๋„์ „์„ ํ™•์‹ ํ•˜์ง€ ์•Š์•˜๊ธฐ์— ์ž‘๋…„ ํ•„๊ธฐ์‹œํ—˜๋„ 2๊ธ‰์„ ๋ดค๊ธฐ ๋•Œ๋ฌธ์— 1๊ธ‰ .. 2025. 3. 1.
์—‘์…€ ํ•จ์ˆ˜๋ฅผ ์ด์šฉํ•œ ๋กœ๋˜๋ฒˆํ˜ธ ์ž๋™์ถ”์ถœ (RANDBETWEEN, RAND, RANK.EQ, VLOOKUP ํ•จ์ˆ˜) ์ผํ™•์ฒœ๊ธˆ์˜ ๊ฟˆ์„ ๊พธ๋ฉฐ ๋กœ๋˜๋ฅผ ๊ตฌ๋งคํ•˜๋Š” ์ด๋“ค์ด ๋งŽ์Šต๋‹ˆ๋‹ค. ์—ฌ๋Ÿฌ๋ถ„์€ ๋กœ๋˜๊ตฌ๋งค ํ•  ๋•Œ ์ž๋™ ๊ตฌ๋งค ๋˜๋Š” ์ˆ˜๋™ ๊ตฌ๋งค ์–ด๋–ค ๋ฐฉ๋ฒ•์œผ๋กœ ํ•˜์‹œ๋‚˜์š”? ์—ญ๋Œ€ 1๋“ฑ ๋‹น์ฒจ์ž๋“ค์„ ๋ณด๋ฉด ์ˆ˜๋™ ๊ตฌ๋งค๋‚˜ ๋ฐ˜์ž๋™ ๊ตฌ๋งค์— ๋น„ํ•ด ์ž๋™ ๊ตฌ๋งค์ž์˜ ๋‹น์ฒจ ๋น„์œจ์ด ๋†’์•˜๋Š”๋ฐ์š”. ์˜ค๋Š˜์€ ์—‘์…€ ํ•จ์ˆ˜๋ฅผ ์ด์šฉํ•˜์—ฌ ๋กœ๋˜๋ฒˆํ˜ธ ์ž๋™์ถ”์ถœํ•˜๋Š” ๋‘ ๊ฐ€์ง€ ๋ฐฉ๋ฒ•์„ ์‚ดํŽด๋ณด๊ฒ ์Šต๋‹ˆ๋‹ค.๋ชฉ์ฐจ•1. RANDBETWEEN ํ•จ์ˆ˜๋ฅผ ์ด์šฉํ•œ ๋กœ๋˜๋ฒˆํ˜ธ ์ž๋™์ถ”์ถœ•2. RAND ํ•จ์ˆ˜, RANK.EQ ํ•จ์ˆ˜, VLOOKUP ํ•จ์ˆ˜๋ฅผ ์ด์šฉํ•œ ๋กœ๋˜๋ฒˆํ˜ธ ์ž๋™์ถ”์ถœ RANDBETWEEN ํ•จ์ˆ˜๋ฅผ ์ด์šฉํ•œ ๋กœ๋˜๋ฒˆํ˜ธ ์ž๋™์ถ”์ถœ๋จผ์ € ๊ฐ€์žฅ ๊ฐ„๋‹จํ•œ ๋ฐฉ๋ฒ•์ธ RANDBETWEEN ํ•จ์ˆ˜๋ฅผ ์ด์šฉํ•ด ์ถ”์ถœํ•ด ๋ณด๊ฒ ์Šต๋‹ˆ๋‹ค. RANDBETWEEN ํ•จ์ˆ˜๋Š” ์ง€์ •ํ•œ ๋‘ ์ •์ˆ˜ ๊ฐ€์šด๋ฐ ๋ฌด์ž‘์œ„์˜ ์ˆซ์ž๋ฅผ ์ถ”์ถœํ•˜๋Š” ํ•จ์ˆ˜์ž…๋‹ˆ๋‹ค. ๋กœ๋˜๋Š” 1์—์„œ 45๊นŒ์ง€์˜ .. 2024. 10. 9.