본문 바로가기

Data Science

Dataiku 다타이쿠 클라우드 서버 설치 방법 가이드

Dataiku 다타이쿠 클라우드 서버 설치 방법 가이드

dataiku

다타이쿠는 원시 데이터의 정제 작업을 거쳐 어떤 예측을 할 수 있도록 하는 통합 데이터 엔지니어링 플랫폼입니다. 여러 소스에서 들어오는 데이터들을 쉽고 빠르고 더 효율적으로 탐색 및 활용할 수 있게 하는 툴입니다.

 

파일 시스템 및 각종 DBMS, Hadoop 등 다양한 데이터 스토리지 시스템과 연결할 수 있으며 머신러닝, 데이터 시각화, 데이터 랭글 링, 데이터 마이닝, 데이터 워크 플로우 등 많은 기능을 제공하고 있습니다.

 

데이터 팀이 있다면, 유용하게 사용할 수 있는 툴입니다.

 

오늘 그 툴을 네이버 클라우드 플랫폼에다 centos를 설치하고, 그 위에 설치를 하여 크롬으로 접속하는 것 까지 실습을 해보도록 하겠습니다.

 

이미 dataiku 다타이쿠를 설치할수 있는 서버가 있으신 분들은 중간부터 보시면 됩니다.

 

추후 이 다타이쿠를 이용하여 작업도 진행할 예정입니다.

 

네이버 클라우드 플랫폼 서버 설정

제일 먼저 할 일은 네이버 클라우드 플랫폼에 서버를 만드는 일이겠죠?

 

아래와 같이 네이버 클라우드 플랫폼에 로그인하시고, Products & Service에서 Server을 클릭합니다.

네이버 클라우드 플랫폼 서버 설정1

아래와 같은 화면이 나올 텐데, 여기서 1세대를 선택합니다. 그래야 Micro 서버를 선택할 수 있습니다.

그리고.. 그래야 공짜로 쓰실 수 있어요..ㅎ

네이버 클라우드 플랫폼 서버 설정2

아래와 같이 설정을 하시고 아래쪽 centos 목록 중 가장 위에 것을 선택하여 다음을 눌러줍니다.

네이버 클라우드 플랫폼 서버 설정3

Micro 서버는 1년간 무료로 제공이 됩니다.

저 같은 경우는 가입한 지가 좀 지나서... 무료 사용기간이 많이 남지 않았네요.

AWS로 갈아타야 하나요...ㅎㅎ

 

 

 

네이버 클라우드 플랫폼 서버 설정4

전, KR1리 전을 선택했습니다.

여기에 제가 사용하는 공인 IP가 있기 때문입니다.

서버 이름도 적어주고, 반납 보호를 설정해주고 다음으로 넘어갑니다.

네이버 클라우드 플랫폼 서버 설정5

인증키 파일, pem 파일을 새로 생성해줍니다. 이름은 서버 이름과 동일하게 하시는 게 안 헷갈립니다.

인증키를 저장합니다.

네이버 클라우드 플랫폼 서버 설정6

저장 버튼을 눌러줘야겠죠.

네이버 클라우드 플랫폼 서버 설정7

 

 

 

그러고 나서 다음 버튼을 눌러 계속 진행을 합니다.

네이버 클라우드 플랫폼 서버 설정8

ACG를 신규로 생성을 합니다.

다들 아시겠지만, ACG는 서버 방화벽 설정이라고 생각하시면 됩니다.

신규 생성을 선택하고 아래 ACG 생성 버튼을 눌러줍니다.

네이버 클라우드 플랫폼 서버 설정9

그럼 아래와 같은 화면이 나오는데, 뭐.. 연습용 서버이니 모든 접근을 0.0.0.0/0을 입력하여 열어주고, 포트는 22, ssh 포트를 열어 줍니다. 그리고 추가 버튼을 눌러주세요.

 

 

 

네이버 클라우드 플랫폼 서버 설정10

그리고 ACG 이름도 적어줍니다. 전 똑같이 dataiku라고 입력했습니다.

그리고 생성을 눌러 진행을 합니다.

네이버 클라우드 플랫폼 서버 설정11

그럼 아래 서버 생성을 눌러서 서버를 생성합니다.

네이버 클라우드 플랫폼 서버 설정12

시간이 조금 걸린다고 합니다. 

한, 5분가량 걸렸던 것 같아요.

일전에, 1시간이 지나도 생성이 안 되는 서버가 있었는데, 너무 오래 걸린다 싶으면 다시 하시는 게 맞습니다.

 

 

 

네이버 클라우드 플랫폼 서버 설정13

아직 생성중이라고 나옵니다.

네이버 클라우드 플랫폼 서버 설정14

오오~! 드디어 생성이 되었습니다.

네이버 클라우드 플랫폼 서버 설정15

자, 다음은 공인 IP 설정을 해줍니다.

네이버 클라우드 플랫폼에 공인 IP가 없으시면 따로 먼저 생성을 하셔야 합니다.

서버 위에서 우클릭을 하셔서 공인 IP 설정을 눌러줍니다.

네이버 클라우드 플랫폼 서버 설정16

그럼 아래와 같이 창이 하나 열리고, 여기서 가지고 있는 공인 IP를 선택 후 적용 버튼을 눌러주면 됩니다.

네이버 클라우드 플랫폼 서버 설정17

다음은 관리자 비밀번호를 확인해야 합니다.

무작위로 생성이 되어 있기 때문에 접속을 위해서 관리자 비밀번호를 확인합니다.

마찬가지로 서버 위에서 우클릭을 하면 관리자 비밀번호 확인 버튼이 있습니다.

그걸 눌러 줍니다.

네이버 클라우드 플랫폼 서버 설정18

아까 다운로드하였던 인증키 파일 (pem) 파일을 드래그 하여 관리자 비밀번호 확인 팝업창에 올려줍니다.

네이버 클라우드 플랫폼 서버 설정19

아래와 같이 잘 올라왔다면 비밀번호 확인 버튼을 눌러서 비밀번호를 확인합니다.

네이버 클라우드 플랫폼 서버 설정20

아래와 같이 팝업 창에서 확인할 수 있습니다.

네이버 클라우드 플랫폼 서버 설정21

자, 그러면 이젠 서버에 설정한 공인 IP와 관리자(root) 비밀번호를 이용해서 putty나 쓰고 계시는 터미널 프로그램을 이용하여 서버에 접속을 합니다.

 

아래 스크린샷을 보시면 root 계정으로 제가 다운로드하고 설치를 했는데, dataiku는 root 계정으로 설치가 안 되는 프로그램입니다. 

 

 

 

 

꼭 OS 계정을 하나 만드셔서 진행을 하시길 바랍니다. 저 처럼 헤매지 마시고요...ㅎㅎ

 

아래와 같이 로그인이 되셨다면, 이젠 dataiku를 다운로드합니다.

wget https://downloads.dataiku.com/public/studio/8.0.1/dataiku-dss-8.0.1.tar.gz

현시점 최신 버전인 8.0.1을 다운로드하겠습니다.

 

centos dataiku 설치1

생각보다 파일의 크기가 큽니다.

다운로드가 완료되었으면 압축을 풀어줍니다.

 

tar xzf dataiku-dss-8.0.1.tar.gz

tar로 압축을 풀어줍니다.

centos dataiku 설치2

위에서도 말씀드렸지만 꼭 새로운 OS 계정을 만들어서 진행을 하세요. root 계정으로는 설치가 진행되지 않습니다.

이젠 압축을 풀었으면 압축을 푼 dataiku-dss-8.0.1 폴더로 들어가서 아래와 같은 명령어로 dataiku를 설치합니다.

./installer.sh -d /dataiku/dataiku -p 11220

여기서 /dataiku/dataiku 는 dataiku를 설치할 경로를 이야기하고, -p의 11220은 dataiku에 접속할 포트 번호입니다.

 

설치가 진행되는가 싶다가, 아래와 같이 Error 가 발생합니다. 의존성 프로그램들이 설치되어 있지 않다고 하네요.

한 번에 설치가 될 수 있도록 shell이 만들어져 있네요.

centos dataiku 설치3

아래 명령어로 의존성 프로그램들을 설치해줍니다.

아마 기존 가지고 계신 서버를 이용하시는 분들은 잘 되시겠지만, 네이버 클라우드 플랫폼에서 방금 만드신 분들은 sudo가 안 될 수 있습니다.

 

그때는 아래 포스트 링크로 이동하셔서 sudo를 설정하고 오시면 됩니다.

2020/08/27 - [LINUX] - [centos] sudo is not in the sudoers file. this incident will be reported 해결방법

 

[centos]sudo is not in the sudoers file. this incident will be reported 해결방법

[centos]sudo is not in the sudoers file. this incident will be reported 해결방법 새로 만든 centos를 사용하는 과정에서 sudo 명령을 실행하는데도, 제목과 같은 에러가 발생하면서 실행이 안될 때가 있습니..

stricky.tistory.com

sudo /download/dataiku-dss-8.0.1/scripts/install/install-deps.sh

자, 그럼 위 명령어를 실행하시면 아래와 같이 의존성 프로그램들이 설치되는 것을 확인할 수 있습니다.

모두 잘 설치가 되었습니다.

centos dataiku 설치4

그럼 이젠, 다시 설치를 진행합니다.

./installer.sh -d /dataiku/dataiku -p 11220

아래 installation complete가 나왔네요.

잘 설치가 된 것 같습니다.

centos dataiku 설치5

마지막으로 dataiku를 실행합니다.

/dataiku/dataiku/bin/dss start

아래와 같은 화면이 나오면 잘 실행이 된 것입니다.

centos dataiku 설치6

자, 그런데, 우리가 dataiku를 11220 포트로 실행을 할꺼닌깐 네이버 클라우드 플랫폼에서 ACG 설정에 11220 포트를 추가해 주어야 합니다.

 

 

 

아래 화면에서 ACG를 눌러줍니다.

ACG 설정 추가1

그리고 나면 아래와 같은 화면이 나올 것이고, dataiku서버를 먼저 클릭해주시고, 위에 있는 ACG 설정 버튼을 클릭합니다.

ACG 설정 추가2

그리고 dataiku라는 이름으로 0.0.0.0/0에서 11220으로 들어오는 모든 접속을 추가해줍니다.

ACG 설정 추가3

아래와 같이 적용되었습니다 라는 메시지가 나옵니다.

잘 설정이 되었군요.

ACG 설정 추가4

자, 그럼 이젠 크롬 브라우저를 열어줍니다.

dataiku는 크롬으로 접속을 하셔야 합니다.

크롬 주소창에 네이버 클라우드 플랫폼의 공인 IP나 본인의 서버의 접속 가능한 IP를 입력하고 그 뒤에 11220을 붙여주시면 됩니다.

http://xxx.xxx.xxx.xxx:11220/

위와 같이 말이죠.

그럼 아래와 같은 화면이 나오는 것을 확인할 수 있습니다.

 

여기에서 No 버튼을 클릭합니다. 처음 왔으닌깐요. 라이선스가 없겠죠.

dataiku 접속1

그리고 나면 회원 가입 비슷한 창이 뜹니다.

젤 위에 free licence를 선택하시고 아래 빈칸들을 채워 주시고 진행하시면 됩니다.

dataiku 접속2

그럼 admin/admin이라는 초기 접속 정보가 뜨는 걸 확인했습니다.

아래 버튼을 눌러서 진행하시면 됩니다.

dataiku 접속3

아래와 같이 log in 창이 열리면 admin/admin으로 접속을 하시면 됩니다.

dataiku 접속4

그럼 초기 화면이 뜨는 것을 볼 수 있습니다!

자, 이젠 dataiku를 설치했습니다.

 

 

 

다음 포스팅에서 이걸로 할 수 있는 것들을 하나씩 해보도록 하겠습니다.

수고 많으셨습니다.

dataiku 접속5

감사합니다!!

 

담에 뵙겠습니다!!!

 

 

 

by.sTricky