본문 바로가기

캐글

(5)
캐글 데이터 시각화 넷플릭스(netflix) 데이터를 이용한 데이터 분석 실습 (3) 캐글 데이터 시각화 넷플릭스(netflix) 데이터를 이용한 데이터 분석 실습 (3) 캐글의 넷플릭스 데이터를 이용한 데이터 분석 3번째 시간 입니다. 이번편은 종전에 데이터 전처리를 하고, 일부 데이터 시각화를 하였었는데, 본격적으로 시각화를 하는 과정 입니다. 그럼 우선, 지난 편들 링크를 남길테니, 이걸 처음으로 보신분들은 전편부터 보시고 오시길 바랍니다. 이전 분석 포스트 보러가기 2021.03.02 - [Data Science] - 캐글 넷플릭스(netflix) 데이터를 이용한 데이터 분석 실습 (1) 캐글 넷플릭스(netflix) 데이터를 이용한 데이터 분석 실습 (1) 캐글 넷플릭스(netflix) 데이터를 이용한 데이터 분석 실습 (1) 오랫만에 데이터 분석 실습 포스트를 진행 합니다. 데..
Rain in Australia 캐글 날씨 데이터셋 다운로드 받아 mysql에 넣는 방법 Rain in Australia 캐글에서 테스트 데이터셋을 다운로드 받아 나의 mysql에 넣는 방법 소개!! 오늘은 데이터분석을 위한 첫걸음, 바로 분석할 데이터를 다운받아서 넣는 과정에 대해서 진행을 해보려고 합니다. 사실 데이터 분석이든 SQL실습이든 하려면 대용량 데이터가 있었으면 할때가 많으실겁니다. 그래서 오늘 준비를 좀 해봤습니다. 1. 데이터가 많은곳을 찾아라 데이터가 그럼 어디에 많이 있을까요? 많은 분들이 아시겠지만 kaggle이라는곳이 있습니다. 여긴 데이터를 이용해서 데이터 분석 대회도 하는 그런 커뮤니티와 같은 곳입니다. 저도 예전에 여기서 타이타닉 캐글 데이터 분석을 실습 해보기도 했습니다. 구글에서 kaggle을 검색하셔서 들어가 보시면 됩니다. 간단하게 구글 로그인으로 sig..
[python 데이터분석] 캐글 타이타닉 따라해보기 #2 # 캐글 타이타닉 따라해보기 2탄 입니다. 아마 타이타닉 따라하기는 마지막 편이 될 것 같습니다. 전편 보기 : 2019/12/26 - [DB엔지니어가 공부하는 python] - [python] 캐글 타이타닉 따라해보기 #1 [python] 캐글 타이타닉 따라해보기 #1 오늘 부터는 캐글에서 진행했던 데이터 분석 대회중 하나인 타이타닉을 따라해볼꺼다. 아직 난 파린이닌깐... # 대회 링크는 : https://www.kaggle.com/c/2019-1st-ml-month-with-kakr/data 위 링크에 들어가서 데.. stricky.tistory.com 전편에도 제가 언급했지만, 캐글 타이타닉 따라해보기는 아래 참조 블로그가 있습니다. 참조 블로그 : https://cyc1am3n.github.io..
[python 데이터분석] 캐글 타이타닉 따라해보기 #1 오늘부터는 캐글에서 진행했던 데이터 분석 대회 중 하나인 타이타닉을 따라 해 볼 거다. 아직 난 파린이닌깐... # 대회 링크는 : https://www.kaggle.com/c/2019-1st-ml-month-with-kakr/data 위 링크에 들어가서 데이터 셋도 한번 살펴보고.. 대회 요강 등도 한번 살펴보자.. 그리고 나는, 괜찮은 튜토리얼 블로그를 하나 보고 따라 할 생각이다. 그래서 찾은 블로그는... https://cyc1am3n.github.io/2018/10/09/my-first-kaggle-competition_titanic.html 캐글 타이타닉 생존자 예측 도전기 (1) 이번에는 캐글의 입문자를 위한 튜토리얼 문제라고 할 수 있는 Titanic: Machine Learning fro..
[python] 기본이 되는 numpy numpy 는 python을 다루고, 배우는 이들에게 어쩌면 가장 기본이 되는 모듈이다. numpy는 벡터 및 행렬 연산을 구현하도록 해주며 데이터분석을 할때 꼭 필요한 pandas 와 matplotlib의 기본이 되기도 한다. 자세한 사용법이야 워낙 인터넷에 많으니, 기본적으로 numpy를 잘 쓸수 있게 해주는 사용법을 몇개 정리 한다. array - 말 그대로 행렬이다. numpy는 데이터를 array로 묶어 연산을 수행한다. import numpy as np data1 = [1,2,3,] data1 out : [1,2,3] arr1 = np.array(data1) arr1 out: array([1,2,3]) arr1.shape out:(3, ) arr1.dtype out:dtype('int64') ..