본문 바로가기

Data Science

(20)
[python 데이터 분석 실습] 코로나 19 2021 현재 시점 데이터 동적 시각화 분석하기 2편 [python 데이터 분석 실습] 코로나 19 2021 현재 시점 데이터 동적 시각화 분석하기 2편 파이썬 데이터 분석 코로나19 데이터 분석 실습 두번째 시간 입니다. 1편을 올리고 시간이 좀 늦었습니다. 이번편에서는 남은 전처리를 좀 하고, 시각화 하는것을 실습 하겠습니다. 바로 그럼 시작 하도록 하겠습니다. 2021.03.29 - [Data Science] - [python 데이터 분석 실습] 코로나 19 2021 현재 시점 분석하기 1편 [python 데이터 분석 실습] 코로나 19 2021 현재 시점 분석하기 1편 코로나 19 2021 현재 시점 python으로 데이터 분석하기 안녕하세요. 파이썬 데이터 분석 실습 쉽게 따라해보기~ 이번 시간은 코로나 19의 2021년 현재 상황 분석 하기 입니..
[python 데이터 분석 실습] 코로나 19 2021 현재 시점 분석하기 1편 코로나 19 2021 현재 시점 python으로 데이터 분석하기 안녕하세요. 파이썬 데이터 분석 실습 쉽게 따라해보기~ 이번 시간은 코로나 19의 2021년 현재 상황 분석 하기 입니다. 우리 세상을 뒤덮고, 일상생활을 아주~ 힘들게 하고 있는 이 코로나 19의 현 시점 상황에 대해서, 데이터를 이용하여 알아보도록 하겠습니다. 첫번째 시간으로 우선 데이터 가지고 오고, 정리하는 시간을 가지도록 하겠습니다. 그럼 바로 시작 해보도록 하겠습니다. Let's Go~!!! Covid 19 데이터 다운로드 아래 코드를 이용하여 covid19 데이터 분석을 위한 csv 데이터를 다운로드 하도록 하겠습니다. import os import requests for filename in ['time_series_covid..
캐글 데이터 시각화 넷플릭스(netflix) 데이터를 이용한 데이터 분석 실습 (3) 캐글 데이터 시각화 넷플릭스(netflix) 데이터를 이용한 데이터 분석 실습 (3) 캐글의 넷플릭스 데이터를 이용한 데이터 분석 3번째 시간 입니다. 이번편은 종전에 데이터 전처리를 하고, 일부 데이터 시각화를 하였었는데, 본격적으로 시각화를 하는 과정 입니다. 그럼 우선, 지난 편들 링크를 남길테니, 이걸 처음으로 보신분들은 전편부터 보시고 오시길 바랍니다. 이전 분석 포스트 보러가기 2021.03.02 - [Data Science] - 캐글 넷플릭스(netflix) 데이터를 이용한 데이터 분석 실습 (1) 캐글 넷플릭스(netflix) 데이터를 이용한 데이터 분석 실습 (1) 캐글 넷플릭스(netflix) 데이터를 이용한 데이터 분석 실습 (1) 오랫만에 데이터 분석 실습 포스트를 진행 합니다. 데..
캐글 넷플릭스(netflix) 데이터를 이용한 데이터 분석 실습 (2) 캐글 넷플릭스(netflix) 데이터를 이용한 데이터 분석 실습 (2) 안녕하세요. 지난번 넷플릭스 데이터를 이용한 데이터 분석 실습 1편에 이어서 2편을 작성 합니다. 지난 1편을 보시고 싶으신 분들은 아래 링크로 이동 하셔서 1편을 보시고 다시 2편을 봐주시면 됩니다. 2021/03/02 - [Data Science] - 캐글 넷플릭스(netflix) 데이터를 이용한 데이터 분석 실습 (1) 캐글 넷플릭스(netflix) 데이터를 이용한 데이터 분석 실습 (1) 캐글 넷플릭스(netflix) 데이터를 이용한 데이터 분석 실습 (1) 오랫만에 데이터 분석 실습 포스트를 진행 합니다. 데이터 분석은 저도 아직.. 많이 허접한 실력을 가지고 있기 때문에, 이 글을 보시 stricky.tistory.com ..
캐글 넷플릭스(netflix) 데이터를 이용한 데이터 분석 실습 (1) 캐글 넷플릭스(netflix) 데이터를 이용한 데이터 분석 실습 (1) 오랫만에 데이터 분석 실습 포스트를 진행 합니다. 데이터 분석은 저도 아직.. 많이 허접한 실력을 가지고 있기 때문에, 이 글을 보시는 많은 실력자 분들께서 조언을 해주시면 감사 할 것 같습니다. 그리고 저처럼 하나씩 배워 가시는 분들 또한 같이 여기서 실력을 키워 갔으면 좋겠습니다. 데이터 소스 알아보기 이번에 데이터 분석을 진행 할 대상 데이터는 넷플릭스 데이터 입니다. 아래 그림과 같이 데이터에 대한 개요와 생김새 등을 알수 있습니다. 넷플릭스에 등록되어 있는 각종 영상 및 영화, 드라마등 각 프로그램별 제목, 감독, 배우 등등의 정보가 2019년 기준으로 저장이 되어 있는것을 확인 할 수 있습니다. 엑셀로 데이터를 뽑아보니 아..
Rain in Australia 캐글 날씨 데이터셋 다운로드 받아 mysql에 넣는 방법 Rain in Australia 캐글에서 테스트 데이터셋을 다운로드 받아 나의 mysql에 넣는 방법 소개!! 오늘은 데이터분석을 위한 첫걸음, 바로 분석할 데이터를 다운받아서 넣는 과정에 대해서 진행을 해보려고 합니다. 사실 데이터 분석이든 SQL실습이든 하려면 대용량 데이터가 있었으면 할때가 많으실겁니다. 그래서 오늘 준비를 좀 해봤습니다. 1. 데이터가 많은곳을 찾아라 데이터가 그럼 어디에 많이 있을까요? 많은 분들이 아시겠지만 kaggle이라는곳이 있습니다. 여긴 데이터를 이용해서 데이터 분석 대회도 하는 그런 커뮤니티와 같은 곳입니다. 저도 예전에 여기서 타이타닉 캐글 데이터 분석을 실습 해보기도 했습니다. 구글에서 kaggle을 검색하셔서 들어가 보시면 됩니다. 간단하게 구글 로그인으로 sig..
Softmax Regression 기본 개념 파악 및 실습하기 | sTricky Softmax Regression 기본 개념 파악 및 실습하기 | sTricky 안녕하세요. 이번 딥러닝 시간은 Softmax Regression에 대해서 알아보고 실습해보는 시간을 가져 보겠습니다. 사실 이전에 함께 공부했던 Logistic regression은 H(x) = Wx의 수식을 가지고 있는데, 이는 출력하는값이 실수를 가지기 때문에 때론 200, 300, 1000이 나올 수 있구요, 0, -1 등의 값이 나올수도 있습니다. 그렇다보니 어떤 패턴을 압축해서 찾는데에서 문제점을 나타내기도 합니다. 그래서 나온것이 바로 이 Softmax Regression입니다. Softmax Regression는 Multinomaial classification의 일종입니다. 그렇다면 먼저 Multinomaia..
Logistic classification 모두의 딥러닝 실습 및 개념 파악 하기 | sTricky Logistic classification 모두의 딥러닝 실습 및 개념 파악 하기 | sTricky 우선, Binary Classification에 대해서 알아 보도록 하겠습니다. 여기에서 classification 이란 아래 그림을 보시면서 이야기 해보도록 하겠습니다. 자, 가장 위에 있는 Spam Detection은 spam 메일이냐, Ham 메일이냐, 다음은 Facebood feed에 보여 줄것이냐, 숨길것이냐, 마지막으로 신용카드의 사용내역이 일반적인 사용이냐 아니면 뭔가 어떤 범위와 벗어난 불법적인 사용이냐 아니냐를 알려 주는 로직을 이야기 합니다. 그동안 앞서 공부했던 linear regression 처럼 어떤 학습을 통해서 그래프위에 위치를 리턴하는 방법과는 약간 다를수 있습니다. 하지만 그..