본문 바로가기

Data Science

(20)
SQL을 이용한 코호트 분석 SQL을 이용한 코호트 분석 SQL을 이용해서 코호트 분석을 해보려고 합니다. 그러기 앞서 코호트가 무엇인지 알아봐야겠죠. 코호트분석 이란? Cohort analysis 란 시간의 흐름에 따라 growth와 retention을 측정하는 방법이라고 합니다. 나누어진 그룹에 따른 변화된 지표를 측정 합니다. 예를 들자면 제품이나 서비스를 사용한 시간에 따라 고객을 구분 하는 방법이 있을 겁니다. 그룹을 나누는 방법 그룹별로 1월, 2월, 3월... 에 가입한 회원들로 나눌수도 있으며 첫구매를 언제했는지로 나눌수도 있습니다. 시간을 기준으로 나눌 수도 있겠죠. 원하는 날짜의 기간으로 디멘전을 부여하여 값을 정리 할 수 있을 겁니다. 코호트분석의 예시 예컨데 다음과 같은 데이터가 있다고 가정해 보도록 하겠습니다..
mongoDB Docker로 설치하여 접속하기 mongoDB Docker로 설치하여 접속하기 안녕하세요. 해야지~ 해야지~ 하면서 아직 못하던걸 오늘 합니다. 바로 mongoDB 입문 입니다. 앞으로 업무적으로 필요할 수도 있을것 같고, 저의 스킬 확장을 위해서 꼭 공부 하고 싶었던 DB입니다. 그럼 우선 설치하고 접속을 해봐야겠죠? 시작하겠습니다! @Docker에서 mongoDB 내려받아서 설치하기 docker -v 우선 Docker의 버전을 확인 해봅니다. 그리고 이미지 다운로드 받습니다. 아래와 같은 명령어로 간단하게 다운로드 받을 수 있죠. 이것이 docker! 그리고 docker를 실행하기전에 다음과 같이 폴더를 만들어 줍니다. 컨테이너의 /data/db 와 동기화 시켜주어야 나중에 데이터를 복구 할 수 있기 때문 입니다. docker ru..
구글빅쿼리 유용한 문자 숫자 함수정리 구글빅쿼리 유용한 문자 숫자 함수정리 안녕하세요. 요즘 구글 빅쿼리 사용 많이들 하시더라구요. 구글빅쿼리에서 사용 할 수 있는 유용한 문자 숫자 함수들에 대해서 정리를 해보겠습니다. 구글빅쿼리 문자함수 starts_with, ends_with starts_with, ends_with 함수는 초성과 종성을 확인 해주는 문자 함수 입니다. 분석용으로 쓰이는 구글빅쿼리에서 많이 사용 되는 함수 입니다. SELECT STARTS_WITH('Hello', 'o') -- FALSE ,STARTS_WITH('Hello', 'H') -- TRUE ,ENDS_WITH('Hello', 'o') -- TRUE ,ENDS_WITH('Hello', 'H') -- FALSE 구글빅쿼리 문자함수 strpos strpos는 inst..
구글 빅쿼리(BigQuery) CSV 데이터 import 하는 방법 구글 빅쿼리(BigQuery) CSV 데이터 import 하는 방법 안녕하세요. 구글 빅쿼리(BigQuery) 에 생성된 테이블의 데이터를 채워보도록 할께요. 지난번에 구글 빅쿼리 계정 생성하고, 데이터를 넣을 테이블을 생성 했습니다. 이번엔 거기에 데이터를 넣도록 할께요. 2021.07.27 - [Data Science] - 구글 빅쿼리(BigQuery) 시작하기 및 datagrip 연동 안내 구글 빅쿼리(BigQuery) 시작하기 및 datagrip 연동 안내 구글 빅쿼리(BigQuery) 시작하기 및 datagrip 연동 안내 안녕하세요. 구글 빅쿼리(BigQuery)를 첨으로 사용하시는 분들께 구글 빅쿼리 사용법에 대해서 간단하게 안내를 드립니다. 우선 구글 빅쿼리(BigQu stricky.tis..
구글 빅쿼리(BigQuery) Cloud mysql, Cloud postgres 데이터 추가 import 하기 구글 빅쿼리(BigQuery) Cloud mysql, Cloud postgres 데이터 추가 import 하기 안녕하세요. 구글 빅쿼리(BigQuery) 에 계정을 생성하고, 테이블 생성까지 하였습니다. 이젠 생성한 테이블에 데이터를 넣어야 겠죠. 관련 내용은 아래 포스트를 참조 하시면 됩니다. 2021.07.27 - [Data Science] - 구글 빅쿼리(BigQuery) 시작하기 및 datagrip 연동 안내 구글 빅쿼리(BigQuery) 시작하기 및 datagrip 연동 안내 구글 빅쿼리(BigQuery) 시작하기 및 datagrip 연동 안내 안녕하세요. 구글 빅쿼리(BigQuery)를 첨으로 사용하시는 분들께 구글 빅쿼리 사용법에 대해서 간단하게 안내를 드립니다. 우선 구글 빅쿼리(BigQu..
구글 빅쿼리(BigQuery) create table 방법 및 주의사항 구글 빅쿼리(BigQuery) create table 방법 및 주의사항 안녕하세요. 지난번에 구글 빅쿼리(BigQuery)를 셋팅하고 서비스 계정을 만들어 datagrip과 연동하는것까지 포스팅을 드렸었는데요. 이번엔 연동한 datagrip에서 구글 빅쿼리(BigQuery) 테이블 생성하는 DDL 샘플을 보여 드릴까 합니다. 2021.07.27 - [Data Science] - 구글 빅쿼리(BigQuery) 시작하기 및 datagrip 연동 안내 구글 빅쿼리(BigQuery) 시작하기 및 datagrip 연동 안내 구글 빅쿼리(BigQuery) 시작하기 및 datagrip 연동 안내 안녕하세요. 구글 빅쿼리(BigQuery)를 첨으로 사용하시는 분들께 구글 빅쿼리 사용법에 대해서 간단하게 안내를 드립니다..
구글 빅쿼리(BigQuery) 시작하기 및 datagrip 연동 안내 구글 빅쿼리(BigQuery) 시작하기 및 datagrip 연동 안내 안녕하세요. 구글 빅쿼리(BigQuery)를 첨으로 사용하시는 분들께 구글 빅쿼리 사용법에 대해서 간단하게 안내를 드립니다. 우선 구글 빅쿼리(BigQuery) 가 무엇이고, 왜 사용하는지, 그리고 어떻게 편하게 사용 하는지에 대해서 알아보도록 하겠습니다. 자, 따라오시죠. 구글 빅쿼리는 머신러닝(ML)에 특화된 Cloud Database 입니다. 비교적 저렴한 비용으로 많은 데이터에서 아주 빠르고 간단하게 Ansi SQL을 이용하여 데이터를 추출 해 낼수 있습니다. OLAP성 데이터베이스로 이용하시면 아주 편합니다. 따로 물리서버나 개인 PC에 DB를 설치할 필요도 없이 언제 어디서든 데이터를 확인하고, 분석 할 수 있습니다. 사용방..
[python] 파이썬 데이터 분석 코로나 19 동적 시각화 분석하기 3편 [python] 파이썬 데이터 분석 코로나 19 동적 시각화 분석하기 3편 코로나 19 데이터를 이용한 동적 시각화 분석 세번째 시간 입니다. 아직 1, 2편을 안보신 분들은 아래 링크로 이동 하셔서 1, 2편을 먼저 보시고 이 회차를 시작 하시면 됩니다. 그럼 바로 시작 해보겠습니다. # 이전 포스트 보러가기 2021.03.29 - [Data Science] - [python 데이터 분석 실습] 코로나 19 2021 현재 시점 분석하기 1편 [python 데이터 분석 실습] 코로나 19 2021 현재 시점 분석하기 1편 코로나 19 2021 현재 시점 python으로 데이터 분석하기 안녕하세요. 파이썬 데이터 분석 실습 쉽게 따라해보기~ 이번 시간은 코로나 19의 2021년 현재 상황 분석 하기 입니다..