Dataiku 다타이쿠 클라우드 서버 설치 방법 가이드
다타이쿠는 원시 데이터의 정제 작업을 거쳐 어떤 예측을 할 수 있도록 하는 통합 데이터 엔지니어링 플랫폼입니다. 여러 소스에서 들어오는 데이터들을 쉽고 빠르고 더 효율적으로 탐색 및 활용할 수 있게 하는 툴입니다.
파일 시스템 및 각종 DBMS, Hadoop 등 다양한 데이터 스토리지 시스템과 연결할 수 있으며 머신러닝, 데이터 시각화, 데이터 랭글 링, 데이터 마이닝, 데이터 워크 플로우 등 많은 기능을 제공하고 있습니다.
데이터 팀이 있다면, 유용하게 사용할 수 있는 툴입니다.
오늘 그 툴을 네이버 클라우드 플랫폼에다 centos를 설치하고, 그 위에 설치를 하여 크롬으로 접속하는 것 까지 실습을 해보도록 하겠습니다.
이미 dataiku 다타이쿠를 설치할수 있는 서버가 있으신 분들은 중간부터 보시면 됩니다.
추후 이 다타이쿠를 이용하여 작업도 진행할 예정입니다.
네이버 클라우드 플랫폼 서버 설정
제일 먼저 할 일은 네이버 클라우드 플랫폼에 서버를 만드는 일이겠죠?
아래와 같이 네이버 클라우드 플랫폼에 로그인하시고, Products & Service에서 Server을 클릭합니다.
아래와 같은 화면이 나올 텐데, 여기서 1세대를 선택합니다. 그래야 Micro 서버를 선택할 수 있습니다.
그리고.. 그래야 공짜로 쓰실 수 있어요..ㅎ
아래와 같이 설정을 하시고 아래쪽 centos 목록 중 가장 위에 것을 선택하여 다음을 눌러줍니다.
Micro 서버는 1년간 무료로 제공이 됩니다.
저 같은 경우는 가입한 지가 좀 지나서... 무료 사용기간이 많이 남지 않았네요.
AWS로 갈아타야 하나요...ㅎㅎ
전, KR1리 전을 선택했습니다.
여기에 제가 사용하는 공인 IP가 있기 때문입니다.
서버 이름도 적어주고, 반납 보호를 설정해주고 다음으로 넘어갑니다.
인증키 파일, pem 파일을 새로 생성해줍니다. 이름은 서버 이름과 동일하게 하시는 게 안 헷갈립니다.
인증키를 저장합니다.
저장 버튼을 눌러줘야겠죠.
그러고 나서 다음 버튼을 눌러 계속 진행을 합니다.
ACG를 신규로 생성을 합니다.
다들 아시겠지만, ACG는 서버 방화벽 설정이라고 생각하시면 됩니다.
신규 생성을 선택하고 아래 ACG 생성 버튼을 눌러줍니다.
그럼 아래와 같은 화면이 나오는데, 뭐.. 연습용 서버이니 모든 접근을 0.0.0.0/0을 입력하여 열어주고, 포트는 22, ssh 포트를 열어 줍니다. 그리고 추가 버튼을 눌러주세요.
그리고 ACG 이름도 적어줍니다. 전 똑같이 dataiku라고 입력했습니다.
그리고 생성을 눌러 진행을 합니다.
그럼 아래 서버 생성을 눌러서 서버를 생성합니다.
시간이 조금 걸린다고 합니다.
한, 5분가량 걸렸던 것 같아요.
일전에, 1시간이 지나도 생성이 안 되는 서버가 있었는데, 너무 오래 걸린다 싶으면 다시 하시는 게 맞습니다.
아직 생성중이라고 나옵니다.
오오~! 드디어 생성이 되었습니다.
자, 다음은 공인 IP 설정을 해줍니다.
네이버 클라우드 플랫폼에 공인 IP가 없으시면 따로 먼저 생성을 하셔야 합니다.
서버 위에서 우클릭을 하셔서 공인 IP 설정을 눌러줍니다.
그럼 아래와 같이 창이 하나 열리고, 여기서 가지고 있는 공인 IP를 선택 후 적용 버튼을 눌러주면 됩니다.
다음은 관리자 비밀번호를 확인해야 합니다.
무작위로 생성이 되어 있기 때문에 접속을 위해서 관리자 비밀번호를 확인합니다.
마찬가지로 서버 위에서 우클릭을 하면 관리자 비밀번호 확인 버튼이 있습니다.
그걸 눌러 줍니다.
아까 다운로드하였던 인증키 파일 (pem) 파일을 드래그 하여 관리자 비밀번호 확인 팝업창에 올려줍니다.
아래와 같이 잘 올라왔다면 비밀번호 확인 버튼을 눌러서 비밀번호를 확인합니다.
아래와 같이 팝업 창에서 확인할 수 있습니다.
자, 그러면 이젠 서버에 설정한 공인 IP와 관리자(root) 비밀번호를 이용해서 putty나 쓰고 계시는 터미널 프로그램을 이용하여 서버에 접속을 합니다.
아래 스크린샷을 보시면 root 계정으로 제가 다운로드하고 설치를 했는데, dataiku는 root 계정으로 설치가 안 되는 프로그램입니다.
꼭 OS 계정을 하나 만드셔서 진행을 하시길 바랍니다. 저 처럼 헤매지 마시고요...ㅎㅎ
아래와 같이 로그인이 되셨다면, 이젠 dataiku를 다운로드합니다.
wget https://downloads.dataiku.com/public/studio/8.0.1/dataiku-dss-8.0.1.tar.gz
현시점 최신 버전인 8.0.1을 다운로드하겠습니다.
생각보다 파일의 크기가 큽니다.
다운로드가 완료되었으면 압축을 풀어줍니다.
tar xzf dataiku-dss-8.0.1.tar.gz
tar로 압축을 풀어줍니다.
위에서도 말씀드렸지만 꼭 새로운 OS 계정을 만들어서 진행을 하세요. root 계정으로는 설치가 진행되지 않습니다.
이젠 압축을 풀었으면 압축을 푼 dataiku-dss-8.0.1 폴더로 들어가서 아래와 같은 명령어로 dataiku를 설치합니다.
./installer.sh -d /dataiku/dataiku -p 11220
여기서 /dataiku/dataiku 는 dataiku를 설치할 경로를 이야기하고, -p의 11220은 dataiku에 접속할 포트 번호입니다.
설치가 진행되는가 싶다가, 아래와 같이 Error 가 발생합니다. 의존성 프로그램들이 설치되어 있지 않다고 하네요.
한 번에 설치가 될 수 있도록 shell이 만들어져 있네요.
아래 명령어로 의존성 프로그램들을 설치해줍니다.
아마 기존 가지고 계신 서버를 이용하시는 분들은 잘 되시겠지만, 네이버 클라우드 플랫폼에서 방금 만드신 분들은 sudo가 안 될 수 있습니다.
그때는 아래 포스트 링크로 이동하셔서 sudo를 설정하고 오시면 됩니다.
2020/08/27 - [LINUX] - [centos] sudo is not in the sudoers file. this incident will be reported 해결방법
sudo /download/dataiku-dss-8.0.1/scripts/install/install-deps.sh
자, 그럼 위 명령어를 실행하시면 아래와 같이 의존성 프로그램들이 설치되는 것을 확인할 수 있습니다.
모두 잘 설치가 되었습니다.
그럼 이젠, 다시 설치를 진행합니다.
./installer.sh -d /dataiku/dataiku -p 11220
아래 installation complete가 나왔네요.
잘 설치가 된 것 같습니다.
마지막으로 dataiku를 실행합니다.
/dataiku/dataiku/bin/dss start
아래와 같은 화면이 나오면 잘 실행이 된 것입니다.
자, 그런데, 우리가 dataiku를 11220 포트로 실행을 할꺼닌깐 네이버 클라우드 플랫폼에서 ACG 설정에 11220 포트를 추가해 주어야 합니다.
아래 화면에서 ACG를 눌러줍니다.
그리고 나면 아래와 같은 화면이 나올 것이고, dataiku서버를 먼저 클릭해주시고, 위에 있는 ACG 설정 버튼을 클릭합니다.
그리고 dataiku라는 이름으로 0.0.0.0/0에서 11220으로 들어오는 모든 접속을 추가해줍니다.
아래와 같이 적용되었습니다 라는 메시지가 나옵니다.
잘 설정이 되었군요.
자, 그럼 이젠 크롬 브라우저를 열어줍니다.
dataiku는 크롬으로 접속을 하셔야 합니다.
크롬 주소창에 네이버 클라우드 플랫폼의 공인 IP나 본인의 서버의 접속 가능한 IP를 입력하고 그 뒤에 11220을 붙여주시면 됩니다.
http://xxx.xxx.xxx.xxx:11220/
위와 같이 말이죠.
그럼 아래와 같은 화면이 나오는 것을 확인할 수 있습니다.
여기에서 No 버튼을 클릭합니다. 처음 왔으닌깐요. 라이선스가 없겠죠.
그리고 나면 회원 가입 비슷한 창이 뜹니다.
젤 위에 free licence를 선택하시고 아래 빈칸들을 채워 주시고 진행하시면 됩니다.
그럼 admin/admin이라는 초기 접속 정보가 뜨는 걸 확인했습니다.
아래 버튼을 눌러서 진행하시면 됩니다.
아래와 같이 log in 창이 열리면 admin/admin으로 접속을 하시면 됩니다.
그럼 초기 화면이 뜨는 것을 볼 수 있습니다!
자, 이젠 dataiku를 설치했습니다.
다음 포스팅에서 이걸로 할 수 있는 것들을 하나씩 해보도록 하겠습니다.
수고 많으셨습니다.
감사합니다!!
담에 뵙겠습니다!!!
by.sTricky
'Data Science' 카테고리의 다른 글
Softmax Regression 기본 개념 파악 및 실습하기 | sTricky (0) | 2021.02.07 |
---|---|
Logistic classification 모두의 딥러닝 실습 및 개념 파악 하기 | sTricky (0) | 2021.01.31 |
Multivariable linear regression 딥러닝 예제 개념 및 실습 | sTricky (0) | 2021.01.24 |
파이썬 머신러닝 linear regression과 supervised learning (모두의 딥러닝) | sTricky (1) | 2021.01.17 |
파이썬 머신러닝 스터디 모두의 딥러닝 computational graph | sTricky (1) | 2021.01.12 |