DB엔지니어가 공부하는 python

[python_상가(상권)정보DB가지고놀기]공공데이터포털 에서 상가(상권)정보DB 다운 받아 DB에 insert 하기

sTricky 2020. 2. 24. 14:55

[python_상가(상권)정보DB가지고놀기]공공데이터포털 에서 상가(상권)정보DB 다운 받아 DB에 insert 하기 #1

안녕하세요.

 

이번에는 지난번 주소DB에 이어 상가(상권) 정보 DB를 공공데이터 포털에서 다운로드하여 내 DB에 넣어 보도록 하겠습니다.

 

상가정보와 주소정보가 결합이 되면 괜찮은 데이터 분석이 가능할 것으로 생각됩니다. 상권분석 같은 걸 할 수 있지 않을까요? 

 

python을 통해서 상가 정보까지 넣고 나서 도~~~ 전 해보도록 하겠습니다. 여유가 있으신 분들은 저와 함께 데이터를 따라서 넣고, 같이 해보면 좋겠습니다.

 

데이터를 다운로드 받을수 있는 곳은 이곳입니다.

https://www.data.go.kr/dataset/15012005/fileData.do

 

이곳에 가셔서 상가(상권) DB를 다운로드하시기 바랍니다!

여기서 데이터를 다운로드하시면 "상가(상권) 정보_201912.zip" 파일을 받게 되십니다.

 

해당 zip 파일의 압축을 풀면 아래와 같이 데이터가 나오죠.

이젠 이것을 지난번 주소 DB를 넣을 때와 마찬가지로 텍스트 파일의 캐릭터 셋을 변경을 하고, 서버로 옮겨 mariadb의 LOAD DATA LOCAL INFILE 기능으로 INSERT 작업을 해주시면 됩니다.

 

우선 그럼 데이터를 넣기 전에 테이블을 먼저 생성하여야겠습니다.

 

 

create table store_svc_m.store_info_m
(
	store_seq int(15) not null comment '상가업소번호'
		primary key,
	store_nm varchar(500) null comment '상호명',
	store_sub_nm varchar(500) null comment '지점명',
	bsn_sector_big_cd varchar(500) null comment '상권업종대분류코드',
	bsn_sector_big_nm varchar(500) null comment '상권업종대분류명',
	bsn_sector_mid_cd varchar(500) null comment '상권업종중분류코드',
	bsn_sector_mid_nm varchar(500) null comment '상권업종중분류명',
	bsn_sector_small_cd varchar(500) null comment '상권업종소분류코드',
	bsn_sector_small_nm varchar(500) null comment '상권업종소분류명',
	stdrd_Ind_type_cd varchar(500) null comment '표준산업분류코드',
	stdrd_Ind_type_nm varchar(500) null comment '표준산업분류명',
	sd_cd varchar(500) null comment '시도코드',
	sd_nm varchar(500) null comment '시도명',
	sgg_cd varchar(500) null comment '시군구코드',
	sgg_nm varchar(500) null comment '시군구명',
	adm_dong_cd varchar(500) null comment '행정동코드',
	adm_dong_nm varchar(500) null comment '행정동명',
	law_dong_cd varchar(500) null comment '법정동코드',
	law_dong_nm varchar(500) null comment '법정동명',
	jb_cd varchar(500) null comment '지번코드',
	land_dv_cd varchar(500) null comment '대지구분코드',
	land_dv_nm varchar(500) null comment '대지구분명',
	jb_main_num varchar(500) null comment '지번본번지',
	jb_sub_num varchar(500) null comment '지번부번지',
	jb_adrs varchar(500) null comment '지번주소',
	road_cd varchar(500) null comment '도로명코드',
	road_nm varchar(500) null comment '도로명',
	build_main_num varchar(500) null comment '건물본번지',
	build_sub_num varchar(500) null comment '건물부번지',
	build_mgmt_num varchar(500) null comment '건물관리번호',
	build_nm varchar(500) null comment '건물명',
	road_adrs varchar(500) null comment '도로명주소',
	past_post_num varchar(500) null comment '구우편번호',
	post_num varchar(500) null comment '신우편번호',
	dong_info varchar(500) null comment '동정보',
	grade_info varchar(500) null comment '층정보',
	ho_info varchar(500) null comment '호정보',
	inf_longtitude varchar(500) null comment '경도',
	inf_latitude varchar(500) null comment '위도'
);

전 위와 같이 테이블을 생성하였습니다.

 

여기에다가 이젠 LOAD DATA LOCAL INFILE 기능으로 INSERT 작업을 하겠습니다.

 

LOAD DATA LOCAL INFILE 기능은 아래 포스팅에 잘 나와 있으니 보시면서 응용하시면 됩니다.

 

fields terminated by 부분과 set 부분을 잘 확인하시어 작업하시면 됩니다.

https://stricky.tistory.com/116?category=1028871

 

[python_주소DB가지고놀기]공공데이터포털 에서 주소DB 다운 받아 DB에 insert 하기 #1

안녕하세요. 이번 작업은 제가 이미 여러 번 했던 작업이긴 한데.. 혹시나 필요하신 분들이 계실까 싶어 공유합니다. 우리나라 주소 DB를 내 DB에 구축하는 방법입니다. 1편은 파이썬과 직접적으로 관련 없습니다...

stricky.tistory.com

자, 여기까지 잘하셨으면 이젠 전국 상가에 대한 정보를 내 DB에서 확인할 수 있습니다.

 

다음 편에서 이것을 이용한 데이터 분석에 도전해보겠습니다.

 

감사합니다.

 

 

 

# 상가(상권) 데이터로 데이터 분석하기 1편

2020/02/28 - [DB엔지니어가 공부하는 python] - 파이썬 상권분석 실습# 상가(상권)데이터를 이용한 데이터 분석 #1

 

파이썬 상권분석 실습# 상가(상권)데이터를 이용한 데이터 분석 #1

파이썬 상권분석 실습# 상가(상권)데이터를 이용한 데이터 분석 #1 안녕하세요. 파이썬을 이용해서 상가(상권) 분석을 해보도록 하겠습니다. 상가(상권) 데이터는 지난번에 공공데이터 포털에서 다운로드한 데이..

stricky.tistory.com

 

by.sTricky