본문 바로가기

python

(21)
[python] 인터넷이 안되는곳에서 파이썬 패키지 설치하기! (pip download) 안녕하세요. 파이썬 패키지를 설치하는 방법을 안내드립니다. 일반적인 파이썬 패키지 설치는 매우 간단합니다. 예를들어서 우리가 많이쓰는 numpy 패키지를 인터넷이 되는 환경에서는 pip3 install numpy 이렇게 하면 되겠죠. 하지만 우리가 인터넷이 안되는 환경에서 설치를 하려면 어떻게 해야 할까요? 그럴땐 일단, 인터넷이 되는 환경에서 아래와 같이 커맨드하여 설치 파일을 다운로드 받습니다. pip3 download numpy 이러면 아마 numpy-2019.xx.xx.tar.gz 파일이 PC로 저장 될 겁니다. 이걸 복사해서 설치하고자 하는 시스템에 복사해 넣습니다. 그러고나서 설치하고자 하는 시스템에서 아래와 같이 커맨드 하여 numpy를 설치 합니다. pip3 install --no-inde..
[python] 텍스트 파일에서 명사만 뽑아서 명사별 빈도 카운트 하기 konlypy 안녕하세요. 파이썬을 열심히 공부하고 있는 db 엔지니어입니다. 이번 포스팅에서는 어떤 텍스트 파일 안에서 명사만 찾아 그 빈도를 카운트해보는 소스를 함께 공부해 볼 거예요. 이걸 이용해서 우리가 흔하게 보던 시각화 툴인 WordCloud를 이용해서 요런 거 만들 수 있습니다. 이 포스팅에서는 WordCloud 까지는 안 하고, (이건 다음에 포스팅하겠습니다.) 일단 명사를 추출해서 빈도를 카운트하는데 까지만 해보도록 하겠습니다. 이것만으로도 데이터를 분석하는데 다방면으로 꽤나 유용하게 쓸 수 있습니다. 바로 시작할게요!! f = open("E:/test_comments.txt", "r") lines = f.read() 일단, 분석을 할 문장이 들어 있는 데이터를. txt로 저장하고, 이 파일을 읽어 옵..
[python 데이터분석] 캐글 타이타닉 따라해보기 #2 # 캐글 타이타닉 따라해보기 2탄 입니다. 아마 타이타닉 따라하기는 마지막 편이 될 것 같습니다. 전편 보기 : 2019/12/26 - [DB엔지니어가 공부하는 python] - [python] 캐글 타이타닉 따라해보기 #1 [python] 캐글 타이타닉 따라해보기 #1 오늘 부터는 캐글에서 진행했던 데이터 분석 대회중 하나인 타이타닉을 따라해볼꺼다. 아직 난 파린이닌깐... # 대회 링크는 : https://www.kaggle.com/c/2019-1st-ml-month-with-kakr/data 위 링크에 들어가서 데.. stricky.tistory.com 전편에도 제가 언급했지만, 캐글 타이타닉 따라해보기는 아래 참조 블로그가 있습니다. 참조 블로그 : https://cyc1am3n.github.io..
[python 데이터분석] 캐글 타이타닉 따라해보기 #1 오늘부터는 캐글에서 진행했던 데이터 분석 대회 중 하나인 타이타닉을 따라 해 볼 거다. 아직 난 파린이닌깐... # 대회 링크는 : https://www.kaggle.com/c/2019-1st-ml-month-with-kakr/data 위 링크에 들어가서 데이터 셋도 한번 살펴보고.. 대회 요강 등도 한번 살펴보자.. 그리고 나는, 괜찮은 튜토리얼 블로그를 하나 보고 따라 할 생각이다. 그래서 찾은 블로그는... https://cyc1am3n.github.io/2018/10/09/my-first-kaggle-competition_titanic.html 캐글 타이타닉 생존자 예측 도전기 (1) 이번에는 캐글의 입문자를 위한 튜토리얼 문제라고 할 수 있는 Titanic: Machine Learning fro..
[python] 크롤러 만들어 db에 정보 insert 하기 일단, 아래 소스에서 영화 제목과 평점을 뽑아 오는 과정은 타 블로그에서 소스를 가져왔습니다.. (해당 소스가 여기저기 블로그에 많이 있어서 어디가 원본인지 파악이 힘듦) 파이썬을 이용해서 크롤러를 만들기 위해 구글 선생님한테 가서 무척이나 많은 검색을 부탁드렸고, 아래와 같이, 비교적 간단한 크롤링을 구현하는 소스를 구하게 되었다. 그냥 소스를 돌리기만 하면 그건 내 것이 아니니.. 소스 분석을 해보았다. 그리고 내가 가지고 있는 TEST DB에 그 데이터를 insert 하는데 까지 일단 성공! 블로그에 흔적을 남겨둔다. from bs4 import BeautifulSoup from urllib.request import urlopen #선언부로, 어떤 모듈을 쓸것인지.. 선언하는 부분. #위와 같이 ..