본문 바로가기
AI/DataCollecting

[Download] aihub 이용법

by TSpoons 2024. 5. 23.

AIHUB 이용 절차(for Linux)

https://www.aihub.or.kr/devsport/apishell/list.do?currMenu=403&topMenu=100

 

조금 더 구체적으로 소개해봤어요.

1. curl 다운로드

sudo apt install curl

 

 

 

linux 시스템에 curl을 설치하여 url을 통해 데이터 전송 및 수신하기 위해 사용

 

 

2.  aihubshell 다운로드

curl -o "aihubshell" https://api.aihub.or.kr/api/aihubshell.do

 

3. aihubshell 실행권한 부여(필수)

chmod +x aihubshell

chmod +x aihubshell

 

4. 전역 실행 bin 등록

aihubshell을 /usr/bin/에 복사하여 전역명령어로 등록

(경로 위치 상관 x)

sudo cp aihubshell /usr/bin

 

 

5. 계정정보 환경변수 등록

- 일시적인 방법

- nano editor 이용(반영구적인 방법)

nano ~/.bashrc

nano ~/.bashrc

 

 

export AIHUB_ID=aihub@aihub.or.kr

export AIHUB_PW=12345!@#$%aihub12345!@#$%작성 후 저장 (crtl+x -> Y)source .bashrc

 

 

 

* Issue 1 

--> (5.) 영구적인 계정정보 등록을 하지 않으면 터미널을 나가면 찾을 수 없음(다시 5로 돌아가야 함)

 

6. 잘 설치되었는지 테스트 

 

 

- 데이터집합 파일 정보 조회

( https://www.aihub.or.kr/aihubdata/data/view.do?currMenu=115&topMenu=100&dataSetSn=171

홈페이지 번호 끝에 datasetkey가 있음

 

7. 데이터set 다운로드

- 전체

aihubshell -mode d -datasetkey 171

aihubshell -mode d -datasetkey [dataset 키 번호]

 

 

총 데이터가 4TB여서 포기,,

 

- 선택

 aihubshell -mode d -datasetkey [datasetkey 번호] -filekey [filekey 번호]

 aihubshell -mode d -datasetkey 171 -filekey 49782

 

 

 

인터넷 빠른 거로 쓰세요.. 와이파이 너무 느려

 

8. 파일 확인

 

.mp4 , .xml 파일로 나누어짐

'AI > DataCollecting' 카테고리의 다른 글

[WebCrawling] Selenium  (0) 2024.08.19
[Labelme] labelme(라벨링) 사용을 위한 환경 조성  (1) 2024.05.30