📊 데이터분석가는 챗GPT를 이렇게 씁니다 - 8

<더미(가짜)데이터를 만듭니다>


테스트를 해보거나 시뮬레이션을 하기 위해 임의의 데이터를 만들어야 할 경우가 종종 있습니다. 기초 통계학에 근거하여 평균과 표준편차를 알고 분포 유형을 정의하면 데이터를 쉽게 생성할 수 있습니다. 아래의 예시를 통해 직접 확인해보세요. 사실 구현은 아주 간단합니다! numpy 패키지의 분포 함수들을 이용하여 데이터를 생성하는 원리입니다.


🎯 Prompt :


1️⃣ 정규분포

50명으로 이루어진 반 구성원들의 키(height) 데이터를 임의로 만들려고 해. 평균 165, 표준편차 1.5 의 정규분포를 따른다고 할때, 각 50명의 데이터를 id, height 로 구분해서 만들어주고 CSV로 뽑아줘. 그리고 만들어준 데이터의 분포를 히스토그램 시각화 해줘.


2️⃣ 포아송분포

하루 동안 콜센터에 들어오는 전화의 수를 모델링한다고 할 때, 하루 평균 20통의 전화가 걸려온다고 가정하고, 포아송 분포를 따르는 데이터 50개를 생성해주고 데이터를 시각화 해줘.


3️⃣ 지수분포

콜센터에서 다음 전화가 걸려오기까지의 평균 시간이 10분 이라고 할때 지수 분포를 데이터 50개를 생성해주고 데이터를 시각화 해줘.

다음 내용이 궁금하다면?

또는

이미 회원이신가요?

2024년 7월 17일 오전 12:30

 • 

저장 18조회 1,773

댓글 0