이인영

Data Analytics Engineer

📊 데이터분석가는 챗GPT를 이렇게 씁니다 - 8

<더미(가짜)데이터를 만듭니다>

테스트를 해보거나 시뮬레이션을 하기 위해 임의의 데이터를 만들어야 할 경우가 종종 있습니다. 기초 통계학에 근거하여 평균과 표준편차를 알고 분포 유형을 정의하면 데이터를 쉽게 생성할 수 있습니다. 아래의 예시를 통해 직접 확인해보세요. 사실 구현은 아주 간단합니다! numpy 패키지의 분포 함수들을 이용하여 데이터를 생성하는 원리입니다.

🎯 Prompt :

1️⃣ 정규분포

50명으로 이루어진 반 구성원들의 키(height) 데이터를 임의로 만들려고 해. 평균 165, 표준편차 1.5 의 정규분포를 따른다고 할때, 각 50명의 데이터를 id, height 로 구분해서 만들어주고 CSV로 뽑아줘. 그리고 만들어준 데이터의 분포를 히스토그램 시각화 해줘.

2️⃣ 포아송분포

하루 동안 콜센터에 들어오는 전화의 수를 모델링한다고 할 때, 하루 평균 20통의 전화가 걸려온다고 가정하고, 포아송 분포를 따르는 데이터 50개를 생성해주고 데이터를 시각화 해줘.

3️⃣ 지수분포

콜센터에서 다음 전화가 걸려오기까지의 평균 시간이 10분 이라고 할때 지수 분포를 데이터 50개를 생성해주고 데이터를 시각화 해줘.

다음 내용이 궁금하다면?

이미 회원이신가요?

2024년 7월 17일 오전 12:30

•

저장 18 • 조회 1,818

함께 읽은 게시물

SNEW 스타트업 뉴스

start-up and VC

2일 전

독일 딜리버리히어로(DH)의 올해 1분기 실적발표 컨퍼런스콜에서 마리 앤 최고재무책임자(CFO)는 전세계 자사 브랜드 12곳 중 배민의 부진을 콕 찍어 투자자들에 고개를 숙였다. 올해 1분기 아시아 지역 GMV(거래액)이 전년 대비 12% 이상 감소했다는 '어닝 쇼크'를 언급하면서다. 특히 한국을 제외한 전세계 GMV가 22% 급성장한 점과도 대비됐다.

성장세 꺾인 배민…IB업계선 '매각 가능성' 설왕설래

n.news.naver.com

저장 2 • 조회 494

SNEW 스타트업 뉴스

start-up and VC

3일 전

파이낸셜타임스(FT)는 2일(현지시간) 소식통들을 인용해 xAI가 현재 3억달러 주식 매각을 추진하고 있다면서 성공하면 기업가치가 1130억달러에 이르게 된다고 보도했다.

머스크 xAI 3억달러 주식 매각…기업가치 155조원 목표

파이낸셜뉴스

조회 608

이인영

Data Analytics Engineer

7시간 전

(홍보) 노코드 AI 자동화툴 n8n 강의 얼리버드 혜택 D-1

추

노코드 자동화 입문부터 실전까지: n8n 완전정복 강의 | 데이터팝콘 - 인프런 | 변성윤

tinyurl.com

댓글 1 • 저장 1 • 조회 248

김소진

제니휴먼리소스 대표(헤드헌터/ 커리어코치)

18시간 전

💥불안한 3040직장인을 위한 환승 이직 코칭!

�

저장 1 • 조회 32

Annette MJ Kim

사람과 조직의 동반 성장을 위해 일해요:D

20시간 전

기업에서 리더의 위치에 올랐다고 해서 모두 훌륭한 리더가 되는 것은 아니다. 기업을 이끄는 리더의 위치에 있는 사람치고 더 나은 실적을 목표로 하지 않는 경우는 없지만 말처럼 쉽지 않다. 더 나은 실적은 리더 혼자의 힘으로 이뤄지는 것이 아니기 때문이다.

[초점] '조직에 도움 안되는 나쁜 리더'의 5가지 공통점 - 글로벌이코노믹

글로벌이코노믹

조회 201

박성국

테크니컬 아티스트

5일 전

괴물은 하루아침에 태어나지 않는다

큰 것을 하는 것보다 매일 작은 것을 완벽하게 해내는 노력이 더 중요하다. 내가 성격 장애의 하나인 자기애성 성격장애자(NPD, Narcissistic Personality Disorder)를 만나면서 느낀 것은, 처음에는 그런 사람도 "정상인"처럼 느껴진다는 것이었다. 다만 그의 미친짓은 내가 매일매일 "사소한" 사건들로 상대방에게 익숙해졌을 때 발생한다.

저장 2 • 조회 490

비슷한 게시물

이인영 Data Analytics Engineer

📊 데이터분석가는 챗GPT를 이렇게 씁니다 - 9

이명진 한국레드햇 솔루션 아키텍트

Pandas의 중요한 트릭 TOP 5

변성윤 머신러닝 엔지니어, Engineering Manager

BigQuery 기능 업데이트-changes(테이블의 변경된 행 반환)

이인영 Data Analytics Engineer

📊 데이터분석가는 챗GPT를 이렇게 씁니다 - 4

김영욱 SAP France 프로덕트 매니저

<마이크로소프트 365 코파일럿의 동작 구조>

이인영 Data Analytics Engineer

📊 데이터분석가는 챗GPT를 이렇게 씁니다 - 1

주간 인기 TOP 10

진용진 Product manager

PM이 이해하면 좋은 지표 개념

장홍석 스페이스오디티 부대표/CPO

< 쿠팡의 창업자를 직접 보며 배운 것: 리더의 크기가 전부다 >

골빈해커 Chief Maker

나는 가끔 조합형 한글의 아름다움에 대해 생각한다. 그 아름다움

달레 Apollo GraphQL Software Engineer

리트코드 102. Binary Tree Level Order Tr

레드버스백맨 리서처 앤 라이터

⟪🚀 유니콘이라 불리던 그들, 이제 진짜 실력을 보여줄 때⟫

석민 커리어 코치

이력서에 쓰는 경험

백선환 AWS/ AIML Specialist

한때 천만원에 거래되었던 Manus, Bedrock 무료 오픈소스

한성규 '지금 써보러 갑니다' '팁스터 뉴스레터' 운영자

👋 LLM 활용에 도움이 되는 가이드 모음

동크루트 AI 엔지니어, SW 엔지니어

AI 시대에 갈피 못잡던 구글의 역습

𝙍𝙞𝙘𝙝𝙖𝙧𝙙 처음 배워도 재미있고 가치있는 DATA/AI 교육을 만듭니다.

훌륭한 데이터 분석가란 어떤 사람인가?

📊 데이터분석가는 챗GPT를 이렇게 씁니다 - 8

댓글 0

함께 읽은 게시물

(홍보) 노코드 AI 자동화툴 n8n 강의 얼리버드 혜택 D-1

💥불안한 3040직장인을 위한 환승 이직 코칭!

괴물은 하루아침에 태어나지 않는다

비슷한 게시물

주간 인기 TOP 10

추천 프로필