📊 DATA ANALYSIS/스터디노트 33

웹페이지 동작 과정과 데이터 수집 방법(Python) 이해하기

웹페이지 동작 과정* 서버는 일단 github라고 가정   HTTP 구성요소  브라우저의 역할 정리해보고,파이썬으로 웹페이지에서 데이터를 수집한다는 것의 의미를 알아보기  Python HTTP clients: RequestsPython에서 웹 서버와 HTTP/HTTPS 프로토콜을 사용하여 데이터 송수신== HTTP 요청을 만들어서 보내고 응답을 받는다용도: 웹 스크래핑, API 호출, 웹 서비스 통신 등종류:  Requests 라이브러리1) request 2) get  3) Response 속성   Requests 사용하기1. 설치pip install requests2. Importimport requests3. HTTP 요청 보내고 응답 받기url = 'https://[github-username].g..

[HTML와 CSS] 웹페이지 기초 지식, 만들어보고 배포까지

목표 : 간단한 웹페이지(모양) 만들기! (HTML , CSS)목차1. 웹페이지의 구성2. HTML 기초[실습] 이력서 제작(1) HTML 3. CSS 기초4. 개발자 도구[실습] 이력서 제작(2) CSS로 앞서 만든 이력서 꾸미기5. 선택자[실습] 이력서 제작(3) 라벨링 작업6. 웹페이지 배포하기 1. 웹페이지의 구성 무엇으로 이루어져 있는가 HTML - 구조+구성CSS - 크기, 색, 위치 등JS - 기능(동작)웹페이지=컨테이너 하우스컨테이너 하우스(구조)가 있다 != 도로명 주소지가 있다 2. HTML 기초HyperText Markup Language문서(웹페이지)의 구조를 나타내는 *마크업 언어*   HTML의 요소와 종류 전체 구조 및 구조별 설명  [실습] 이력서 제작(1) HTML VSCo..

[Ad-hoc] 정의 및 상황별 쿼리 짜보기

Ad hoc(애드혹)는 특정 목적을 위해 즉흥적으로 만들어지거나 계획된 것을 의미"데이터 분석 팀은 갑작스러운 고객 불만을 해결하기 위해 애드혹 분석을 실시했다." 상황에 따른 Ad-hoc 쿼리 작성/* 1. Department, Joblevel, JobRole별 재직자 대상* 2. 평균 월급* 3. 평균 Salary 인상률 (이 인상률을 연 인상률로 가정)* 4. 인당 월급과 연 인상률을 활용해서 내년 추정 월급 산출* 5. 내년 추정 연봉 (12개월)*/SELECT Department, JobLevel, JobRole , avg(hn.MonthlyIncome) AS avg_MonthlyIncome , avg(hn.PercentSalaryHike) AS avg_PercentSalaryHike , avg..

[DBeaver] 단축키, 스키마 생성 및 데이터 다뤄보기

자주 쓰는 단축키  DBeaver 실습 환경 세팅mysql local host 연결 - HR 스키마 생성 - 데이터 가져오기  실제 db처럼 만들기 위해 테이블 생성해보자CREATE TABLEVARCHAR로 쓰나, VARBINARY 육안으로 똑같지만 컴퓨터 인코딩이 다름. 대소문자를 구분할수있게됨 Data Type별 설명 *DECIMAL을 자주 사용   원천테이블이 있는 경우, create + insert 한큐에 할 수 있는 방법CREATE TABLE tbl_name(SELECTFROM);      위 교육 자료는 zerobase로부터 제공받아 작성되었습니다.

[스터디노트] AARRR 단계별 지표 for 고객 행동 분석(Funnel분석)

고객 행동 분석을 통한 서비스 헬스체크(데이터 출처 : Kaggle) 주제 선정 이유결제 이전에 무슨 일이 일어나는지? 고객 행동 지표구매나 정기 결제같이 중요한 행동까지 이어지는 과정을 차근차근 살펴보는 과정 : Funnel분석이러한 funnel을 분석하기 위한 한가지 프레임으로 AARRR라는게 있음  각 단계별 지표 및 의미AARRR단계설명주요 확인 지표의미*Acquisition유입고객들을얼마나 획득하는지DAUDaily Active User(일간 활성 유저)WAUWeekly Active User(주간 활성 유저)MAUMonthly Active User(월간 활성 유저)신규 고객수새로 방문한 고객Activation활성화고객들이 주요기능을 사용했는지평균 Page View(PV)고객들이 둘러본 평균 페이지..

[Big Query] 이커머스 데이터 쿼리 및 날짜 다루기

이커머스 데이터    -3가지 쿼리 예시종합 쿼리 실습빅쿼리에서 날짜 다루기 이커머스 데이터   SQL로 Data Warehouse(Big Query, RedShift)빅쿼리에 테이블들 업로드 이커머스 비즈니스 분석지표: 매출, 주문건수, 건당주문금액... 3가지 쿼리1. 주문 상품 정보 테이블에서 총매출, 주문건수, 주문1건당 평균가격 추출2. 테이블 조인 - unique한 주문 고객 세기 - 주문 빈도 조회3. 건당주문금액(주문당평균가격), 건당판매상품수(주문당평균판매상품수), 상품 평균가격(제품개당평균가격)  주문정보와 주문상품정보 테이블 설명   1. 주문 상품 정보 테이블에서 총매출, 주문건수, 주문1건당 평균가격 추출*작은따옴표(') 아닌 백틱(`)   주문 정보와 고객 정보 테이블 설명 2...

[스터디노트] 통신사 이탈 고객 예측

상황A통신사는 업계 1위의 통신사였으나 그 명성이 무색해져가고 있다. 다양한 경쟁사가 등장함에 따라 M/S가 떨어지고 있고, 타 통신사로의 이탈 고객이 증가하고 있는 상황이다. 이에 이탈 가능성이 높은 고객을 예측하고, 해지 방어 활동들을 전개하려고 한다. 데이터 구조customerIDgenderSeniorCitizenPartnerDependentstenure고객ID성별노인여부결혼여부부양가족여부회원개월수PhoneServiceMultipleLinesInternetServiceOnlineSecurityOnlineBackupDeviceProtection전화서비스 여부다회선 여부인터넷 서비스 공급자온라인 보안 여부온라인 백업 여부기기보험여부TechSupportStreamingTVStreamingMoviesCon..

[스터디노트] 품질관리를 위한 주요인자 분석

상황A공장에서는 Wine을 생산한다. 좋은 품질의 Wine은 높은 단가로 시장에 판매할 수 있다.A공장에서 생산하는 Wine은 1~9등급까지의 등급이 있고, 7등급 이상이 가장 프리미엄 Wine이다.7등급 이상의 Wine을 최대한 많이 생산해야 영업이익을 남길 수 있다.Wine 품질에 영향을 끼치는  주요 공정변수를 확인하고, 공정 변수 관리를 통해 7등급 이상의 Wine을 생성하고자 한다. 데이터 구조fixed acidityvolatile aciditycitric acidresidual sugarchloridesfree sulfur dioxide산도휘발성산시트르산잔당염화물독립 이산화황total sulfur dioxidedensitypHsulphatesalcoholquality총 이산화항밀도수소이온농도황..

[스터디노트] 숙박예약 수요 분석

상황A호텔은 요즘 코로나 여파로 인하여 고생을 겪고 있다. 객실 예약 건수도 줄고 있는 마당에 노쇼/취소 고객도 증가있는 것이 가장 큰 문제이다.  캔슬 고객은 그나마 다행이지만 노쇼 고객의 경우 객실을 하루 날려버리는 것과 같아서, 비용적인 문제에서도 큰 영향을 끼치고 있다.따라서 노쇼와 취소고객을 사전 예측하고, 운영 비용을 상황에 맞춰 조정하려고 한다. 데이터 구조hotelis_canceledlead_timearrival_date_yeararrival_date_montharrival_date_week_number호텔명취소여부입실까지 남은일년월주arrival_date_day_of_monthstays_in_weekend_nightsstays_in_week_nightsadultschildrenbabies..