📊 DATA ANALYSIS/스터디노트 33

[스터디노트] 연관규칙분석을 통한 장바구니 분석(유통 데이터)

상황A마트는 지속적인 매출 감소가 매대 진열에 문제가 있다고 판단하였다.  따라서 매대 진열을 다시 기획하고 있다. 서로 잘 팔리는 상품에 대해서는 근접하게 매대에 배치하려고 한다.  고객의 구매 데이터(POS)를 활용해서 같이 팔리는 상품을 확인하고 이를 기반을 레이아웃을 조정하고자 한다. 데이터 구조각 고객별(row) 구매 품목에 대한 Yes or No data7,501 row, 20 col 분석과정 요약1. 구매 데이터 전처리 및 탐색2. Apriori 사용한 규칙 탐색3. 유의미한 구매 규칙 도출 1. 구매 데이터 전처리 및 탐색df.shape                       #행,열 수 확인df.info()                        #data type 확인df.isnull..

[스터디노트] HR Analytics(이직예측)

상황최근 이직 시장이 활발하게 성장함에 따라 A사에 직원들도 줄줄이 퇴사 행렬을 이어가고 있다.  핵심인재의 유출이 지속되고 있어 회사 입장에서는 큰 문제에 봉착했다.HR팀은 이를 해결하기 위해 이직 가능성이 높은 핵심인재를 대상으로 관리 프로그램을 운영하려고 한다.목적이직 직원수 감소, 핵심인재 방어, 업무 로드 평준화 데이터 구조AgeAttritionBusinessTravelDailyRateDepartmentDistanceFromHome나이이직여부출장일당부서집까지의거리EducationEducationFieldEmployeeCountEmployeeNumberEnvironmentSatisfactionGender교육수준전공직원수직원번호환경만족도성별HourlyRateJobInvolvementJobLevelJ..

[스터디노트] 넷플릭스 선호 컨텐츠 분석

상황넷플릭스 플랫폼에서 제공하는 컨텐츠에 대한 사용자 선호도와 관련된 데이터 분석 작업을 통해 시청자 행동과 선호를 이해하고자 한다.목적1) 넷플릭스의 컨텐츠 포트폴리오를 최적화메타데이터를 활용한 다차원적인 데이터 분석넷플릭스 사용자들의 대량의 컨텐츠에 대한 선호도 및 시청 패턴 분석인구통계학적 데이터와 결합하여 시청자 기반의 시장 분석 수행컨텐츠 관리 및 마케팅 전략에 필요한 인사이트 도출2)분석 결과의 인사이트가 컨텐츠 관련 의사결정에 얼마나 영향을 미치는지 평가성과를 측정하기 위한 KPI 설정(예: 컨텐츠 관람수, 사용자 확보 수, 구독 전환율 등)데이터 구조show_idtypetitledirectorcastcountrydate_addedrelease_yearratingduration각 영화/TV..

[스터디노트] GA(Google Analytics) 데이터 활용 유저분석

상황A사는 자사의 웹사이트에 대한 사용자의 행동 패턴과 트래픽 출처에 대한 깊은 이해를 갖기 원한다.최근 웹사이트 방문자 수의 변동이 있었으나, 원인을 정확히 파악하지 못하고 있다.GA(Google Analytics) 데이터를 통해 웹사이트의 사용자 행동 및 트래픽의 주요 원인을 파악하려 한다.분석 목표다양한 채널을 통한 사용자 유입 패턴 파악총계 데이터를 통해 주요 KPIs(Key Performance Indicators) 분석 및 개선방안 탐색방문자 세션과 방문 시작 시간 데이터를 활용하여 사용자의 방문 패턴 및 웹사이트 내 행동 흐름 분석사용자의 주요 행동 패턴과 유입 채널을 파악하여 효율적인 마케팅 전략 수립 및 웹사이트 개선 방향 설정분석 방법GA 데이터를 통해 주요 트래픽 소스 및 채널 그룹핑..

[스터디노트] Git Merge, Conflict, Tag

목차1. Git Merge2. Git Conflict[실습1] Branch merge 해보기[실습2] Remote Branch를 Merge해보기[실습3] Conflict 체험해보기3. Git Tag서론많이 중요한 Merge와 ConflictMerge에서 실수가 많이 발생하고, Conflict는 어떤 문제 상황인데 실무에서도 conflict를 해결하지 못해서 힘들어하는 사람이 많다 개념을 빠삭하게 익히는 것이 중요1. Git Merge현재 위치한 버전에 다른 버전을 병합하는 작업Branch를 병합하거나, Push/Pull 할때도 일어난다방향이 있음*Merge시도 시, Head의 위치를 주의해야함!git merge  2가지 CASE1) Main에서 Dev를 Merge2) Dev에서 Main을 Merge+)..

[스터디노트] Git Checkout과 Git Branch

1. Git Checkout2. Git Branch3. Default Branch4. Branch 가지고 놀아보기 1. Git Checkout특정 버전으로 이동. 따라서, 버전을 구분할 수 있어야함git checkout  Commit ID(Hash Code)commit을 구분하는 단위가 버전로그를 보면 나오는 .. Git Checkout하면 벌어지는 일그 버전의 상태로 working directory가 변경HEAD가 Checkout 한 버전을 가리킴로그를 보면 (HEAD -> MAIN)이 표시된걸 확인할 수 있음.여기가 main branch가 가리키고 있는 버전이고, head역시 여기 위치하고 있다는 얘기는 이 버전에서 수정사항을 업데이트를 나가겠다는 의미임.  2. Git Branch개발을 하다보면 코..

[스터디노트] 상품가입고객 예측 및 타겟 마케팅

상황최근 주식, 코인 투자가 열풍이 불면서 A은행의 정기예금 가입자가 감소하고 있다.정기예금 가입률이 높았을 때는 Mass 마케팅 형식으로 홍보를 해도 투자 대비 효율이 좋았지만 현재는 가입률이 떨어지고 있기 때문에 마케팅 비용 투자 대비 효율이 감소하고 있는 상황이다.마케팅 비용을 줄이기 위해 정기예금 가입 가능성이 높은 고객군을 추출하고 타겟 마케팅을 수행하고자 한다.데이터 구조agejobmaritaleducationdefaulthousingloancontactmonth나이직업결혼교육신용카드주택대출연락처마지막 연락 월day_of_weekdurationcampaignpdayspreviouspoutcome마지막 연락 요일통화시간캠페인 기간동안 고객연락횟수이전 캠페인 연락 후 지난일현재 캠페인 전 연락 횟..

[스터디노트] Remote Repository

Github에서 Remote 저장소를 생성한다.앞서, Git Clone 사용해봤다. [링크] Local Repository에서 Push, Pull (Fetch)하여 동기화할 수 있다.  1. Remote 저장소 추가2. Local 저장소 먼저 만들어서 연습3.   Remote 저장소 추가#Remote 저장소 추가git remote add git remote add origin     #default로 가장 중요한 repository를 등록할때 반드시 origin 사용#Remote 저장소 주소 수정git remote set-url  git remote set-url origin #Remote 저장소 이름 수정git remote rename #Remote 저장소 삭제git remote remove gi..

[스터디노트] 카드거래이력 분석을 통한 고객특성파악

상황A사는 신규 브랜드의 점포를 입점 시키려는 계획을 가지고 있다. 신규 브랜드이기 때문에 과거 상권에 대한 정보가 없어, 어느 지역에 입점을 시켜야할지 고민이 많다. 고민 끝에 후보 지역A를 최종 후보로 정했다. 하지만 자신들의 브랜드와 해당 지역에 거주하는 고객의 소비성향과 비슷한지가 아직 의문이다.따라서 신용카드 Spending data를 활용하여 고객의 소비 성향을 파악하고자 한다.파악된 고객의 소비성향과 브랜드의 성향이 맞는지 비교해보고 최종 결정을 내리고자 한다. 데이터 구조store_iddatetimecard_idamountinstallmentsdays_of_weekholydayID날짜시간카드ID매출액할부개월요일(월요일0, 일요일6)공휴일 여부 -amount(매출액) : 음수는 거래 취소를 ..