본문 바로가기

Tech

xml excel 엑셀로 변환, kci 논문 정보 OAI-PMH 데이터 처리

xml excel 엑셀로 변환, kci 논문 정보 OAI-PMH 데이터 처리

 

 

안녕하세요.

 

KCI, 한국 학술지 인용색인에서 제공하는 OAI-PMH 프로토콜이 있더라구요.

 

제가 이해한 바로는 API인데 범용적으로 모든 사람들이 API 키 같은걸 발급받지 않고도 이용할 수 있게끔 만들어둔 서비스라고 이해를 했습니다.

 

https://www.kci.go.kr/kciportal/oai.kci

 

KCI 국내학술지 인용색인 정보 포털입니다.

http://open.kci.go.kr/oai/request OAI-PMH를 사용한 적이 없다면 Open Archives Initiative의 Guidelines for Harvester Implementers를 참조하십시오. 다음은 기본적인 OAI-PMH 요청 프로토콜 입니다. 모든 OAI 프로토콜 요청에 대한 응답은 XML 문서입니다. 01 ListSets - 저장소의 세트 구성을 얻을 수 있습니다. http://open.kci.go.kr/oai/re

www.kci.go.kr

여기로 가시면 한국 학술지 인용색인에서 제공하는 OAI-PMH 프로토콜 서비스에 관해서 자세히 알 수 있습니다.

 

여기서 논문 description 정보를 받아와서 데이터로써 DB에 저장을 하고 싶었습니다.

 

OAI-PMH 프로토콜 서비스는 리턴 값을 XML로 주는데, 이를 물론 파이썬에서 DataFrame 등을 통해서 처리할 수도 있으나, 이것을 반복적으로 할 것도 아니고, 한 번만, 혹은 어쩌다 한 번씩 해야 하는 것 이라서요.

 

간단하게 하고 싶었습니다.

 

xml 파일을 excel, 엑셀 파일로 저장 후, 이것으로 그냥 DB 테이블에 입력을 하는 것 이죠.

 

우선 OAI-PMH 프로토콜을 통해서 값을 한번 테스트 삼아서 받아와 봤습니다.

 

OAI-PMH 프로토콜 호출 형식 중에서 <저장소에서 모든 메타 데이터 레코드 목록을 가져옵니다.>라는 것을 크롬의 주소창에 붙여 넣었습니다.

http://open.kci.go.kr/oai/request?verb=ListRecords&metadataPrefix=oai_dc

이런 결과가 나왔습니다.

 

XML 형식으로 나오네요. 이것을 xml 파일로 저장을 합니다.

그럼 이렇게 저장 창이 뜨고, 파일 이름을 쓰면 됩니다.

여기서 저장한 xml 파일을 excel 파일로 변환을 해야 합니다.

 

xml to 엑셀 파일 변환을 하기 위해서 아래 사이트를 찾았습니다.

https://conversiontools.io/convert/xml-to-excel

불러오는 중입니다...

 

아주 간단합니다.

 

아래 그림에서 Browse 버튼을 누르고 아까 위에서 저장한 xml 파일을 불러와서 넣어 줍니다.

 

 

그럼 아래와 같이 화면이 바뀝니다.

 

여기에서 Run Conversion을 클릭하면 됩니다.

 

프로그래스 바가 올라가면서 100%가 되고 나면 Download File 버튼을 눌러서 xml에서 excel 파일로 변환된 파일을 다운로드하시면 됩니다.

이거, 너무 심각할 정도로 간단한 것 아닐까요?

 

이젠 Excel 파일에서 데이터를 DB로 저장만 하면 되겠네요.

 

너무나 간단한 xml 파일 엑셀 파일로 변환하기!

 

꿀팁 인정?!

 

감사합니다!!!

 

 

 

by.sTricky