본문 바로가기

python

(19)
[python 데이터분석]파이썬으로 점심식사, 교과목 이수, 부모학력, 인종에 따른 시험 성적 데이터 분석 하기 feat.seaborn.catplot #[python 데이터분석]파이썬으로 점심식사, 교과목 이수, 부모학력, 인종에 따른 시험 성적 데이터 분석 하기 feat.seaborn.catplot 안녕하세요. 파이썬으로 데이터분석 시간을 오랫만에 가져봅니다. 오늘은 캐글에 있는 데이터중 "Students Performance in Exams" 이라는 데이터셋을 가지고 시험 성적 데이터를 분석해 보겠습니다. 우선 데이터셋 링크는 아래와 같습니다. https://www.kaggle.com/spscientist/students-performance-in-exams Students Performance in Exams Marks secured by the students in various subjects www.kaggle.com 여기 들어가서 데이터를..
파이썬 알고리즘 1 부터 n까지의 합 구하기 #2 파이썬 알고리즘 1 부터 n까지의 합 구하기 #2 안녕하세요. 아마 프로그래밍 언어를 많이 공부하신 분들은 지겨우실 수도 있는 주제가 되겠네요. 사실.. 정보처리기사에서도 자주 출제되는 문제이기도 하구요. 개념을 잘 알고 있지만, 파이썬이라는 걸 처음 접하거나, 생소하신 분들은 이걸 어떻게 구현해야 하나? 고민이 많으실 수 있습니다. 그래도 우리가 파이썬을 시작하였으니, 하나하나 벽돌 쌓아 집을 짓듯 그렇게 한 발짝씩 나아가 보겠습니다. 1부터 n까지 합을 구하는 알고리즘 역시 많은 방법이 있습니다. 이미 여러분들 머릿속에 있는 것들부터 한번 볼까요? 만약 n이 100이라고 가정한다면, 그 과정은 아래와 같을 수 있습니다. 자, 위의 그림과 같이 1+2를 한 결과 3을 기억하고, 3+3을 한 결과 6을 ..
[python]데이터 시각화 seaborn 라이브러리 실습 해보기 feat.lmplot ##[python]데이터 시각화 seaborn 라이브러리 실습 해보기 feat. lmplot 안녕하세요. 오늘은 데이터 시각화 라이브러리중 seaborn에 대해서 알아보겠습니다. 데이터 시각화에 관심이 있고, 능력이 있으신 분들께서는 이미 많은 분들이 알고 계시는 라이브러리인데요, seaborn은 matplotlib을 기반으로 만들어진 라이브러리로 high-level interface를 제공하고 있습니다. matplotlib을 좀 더 사용하기 쉽게 만든 라이브러리로 생각하시면 되겠습니다. 먼저, seaborn의 공식 사이트를 소개하겠습니다. http://seaborn.pydata.org/index.html seaborn: statistical data visualization — seaborn 0.9.0..
[python_주소DB가지고놀기] 파이썬 으로 주소DB에 위도 경도 값 api로 받아 update 하기 #2 [python_주소DB가지고놀기] 파이썬 으로 주소DB에 위도 경도 값 api로 받아 update 하기 #2 안녕하세요. 지난번에 주소 DB를 공공데이터 포털에서 다운로드하여서 구축하는 작업을 했습니다. ## python_주소DB가지고놀기 1편 보러 가기 2020/01/17 - [DB엔지니어가 공부하는 python] - [python_주소DB가지고놀기]공공데이터포털 에서 주소DB 다운 받아 DB에 insert 하기 #1 [python_주소DB가지고놀기]공공데이터포털 에서 주소DB 다운 받아 DB에 insert 하기 #1 안녕하세요. 이번 작업은 제가 이미 여러 번 했던 작업이긴 한데.. 혹시나 필요하신 분들이 계실까 싶어 공유합니다. 우리나라 주소 DB를 내 DB에 구축하는 방법입니다. 1편은 파이썬과 ..
[python] 파이썬으로 역대 로또 당첨번호, 1등 당첨금 수집 후 엑셀,텍스트 파일에 저장 feat.미완성 안녕하세요. 1일 1공부를 목표로 파이썬을 스터디 하고 있는 8년차 DB엔지니어 sTricky 입니다. 사실 몇일 비었는데.. 쉴려고 쉰건 아니고, 하고싶은 주제를 목표하는만큼 끌어 올리는데 실패해서 늦어졌습니다. 원래 그림은 역대 로또 번호를 api로 받아와서 그걸 엑셀에 이쁘게 저장 하는거 였는데.. 지금 상태로는 엑셀에서의 후처리를 할수밖에 없는 상황입니다. 상태를 보시고 혹시 도움을 주실수 있으시면 "댓글" 로 간곡히 부탁드립니다. ㅠㅠ 바로 들어가 볼께요! 아주 간단 합니다! (하긴... 제가 복잡한건 아직 못해요..ㅎㅎ) from urllib.request import urlopen import pandas as pd import json 필요한 라이브러리를 import 해줍니다. 그리고 fo..
[python] 파이썬으로 주식 상장기업 크롤링한 데이터 엑셀 저장 및 엑셀 파일 불러오기 feat.pandas 안녕하세요. 오늘은 파이썬으로 크롤링한 데이터를 엑셀로 저장하는 방법과 더불어 엑셀에 저장된 데이터를 파이썬 pandas dataset 으로 불러오는 방법 간단하게 소개 합니다. 우선 데이터를 크롤링해 봅니다. 한국거래소에서 운영하는 kind.krx.co.kr에서 상장기업 정보를 불러 오겠습니다. import pandas as pd code_df = pd.read_html('http://kind.krx.co.kr/corpgeneral/corpList.do?method=download&searchType=13', header=0)[0] # 웹에 있는 데이터를 불러 옵니다. # header = 0 옵션을 준 이유는, # 맨 윗줄의 데이터를 헤더로 사용하기 위해서 입니다. 그리고 읽어온 데이터를 DataFra..
[python] 인터넷이 안되는곳에서 파이썬 패키지 설치하기! (pip download) 안녕하세요. 파이썬 패키지를 설치하는 방법을 안내드립니다. 일반적인 파이썬 패키지 설치는 매우 간단합니다. 예를들어서 우리가 많이쓰는 numpy 패키지를 인터넷이 되는 환경에서는 pip3 install numpy 이렇게 하면 되겠죠. 하지만 우리가 인터넷이 안되는 환경에서 설치를 하려면 어떻게 해야 할까요? 그럴땐 일단, 인터넷이 되는 환경에서 아래와 같이 커맨드하여 설치 파일을 다운로드 받습니다. pip3 download numpy 이러면 아마 numpy-2019.xx.xx.tar.gz 파일이 PC로 저장 될 겁니다. 이걸 복사해서 설치하고자 하는 시스템에 복사해 넣습니다. 그러고나서 설치하고자 하는 시스템에서 아래와 같이 커맨드 하여 numpy를 설치 합니다. pip3 install --no-inde..
[python] 텍스트 파일에서 명사만 뽑아서 명사별 빈도 카운트 하기 konlypy 안녕하세요. 파이썬을 열심히 공부하고 있는 db 엔지니어입니다. 이번 포스팅에서는 어떤 텍스트 파일 안에서 명사만 찾아 그 빈도를 카운트해보는 소스를 함께 공부해 볼 거예요. 이걸 이용해서 우리가 흔하게 보던 시각화 툴인 WordCloud를 이용해서 요런 거 만들 수 있습니다. 이 포스팅에서는 WordCloud 까지는 안 하고, (이건 다음에 포스팅하겠습니다.) 일단 명사를 추출해서 빈도를 카운트하는데 까지만 해보도록 하겠습니다. 이것만으로도 데이터를 분석하는데 다방면으로 꽤나 유용하게 쓸 수 있습니다. 바로 시작할게요!! f = open("E:/test_comments.txt", "r") lines = f.read() 일단, 분석을 할 문장이 들어 있는 데이터를. txt로 저장하고, 이 파일을 읽어 옵..