AIHUB 이용 절차(for Linux)
https://www.aihub.or.kr/devsport/apishell/list.do?currMenu=403&topMenu=100
조금 더 구체적으로 소개해봤어요.
1. curl 다운로드
sudo apt install curl
linux 시스템에 curl을 설치하여 url을 통해 데이터 전송 및 수신하기 위해 사용
2. aihubshell 다운로드
curl -o "aihubshell" https://api.aihub.or.kr/api/aihubshell.do
3. aihubshell 실행권한 부여(필수)
chmod +x aihubshell
chmod +x aihubshell
4. 전역 실행 bin 등록
aihubshell을 /usr/bin/에 복사하여 전역명령어로 등록
(경로 위치 상관 x)
sudo cp aihubshell /usr/bin
5. 계정정보 환경변수 등록
- 일시적인 방법
- nano editor 이용(반영구적인 방법)
nano ~/.bashrc
nano ~/.bashrc
export AIHUB_ID=aihub@aihub.or.kr
export AIHUB_PW=12345!@#$%aihub12345!@#$%작성 후 저장 (crtl+x -> Y)source .bashrc
* Issue 1
--> (5.) 영구적인 계정정보 등록을 하지 않으면 터미널을 나가면 찾을 수 없음(다시 5로 돌아가야 함)
6. 잘 설치되었는지 테스트
- 데이터집합 파일 정보 조회
( https://www.aihub.or.kr/aihubdata/data/view.do?currMenu=115&topMenu=100&dataSetSn=171)
홈페이지 번호 끝에 datasetkey가 있음
7. 데이터set 다운로드
- 전체
aihubshell -mode d -datasetkey 171
aihubshell -mode d -datasetkey [dataset 키 번호]
총 데이터가 4TB여서 포기,,
- 선택
aihubshell -mode d -datasetkey [datasetkey 번호] -filekey [filekey 번호]
aihubshell -mode d -datasetkey 171 -filekey 49782
인터넷 빠른 거로 쓰세요.. 와이파이 너무 느려
8. 파일 확인
.mp4 , .xml 파일로 나누어짐
'AI > DataCollecting' 카테고리의 다른 글
[WebCrawling] Selenium (0) | 2024.08.19 |
---|---|
[Labelme] labelme(라벨링) 사용을 위한 환경 조성 (1) | 2024.05.30 |