본문 바로가기
AI

[SED] DCASE 2023 Task 4 Baseline test

by TSpoons 2025. 3. 14.

https://github.com/tshoon/DESED_task/tree/master/recipes/dcase2023_task4_baseline

 

DESED_task/recipes/dcase2023_task4_baseline at master · tshoon/DESED_task

Domestic environment sound event detection task. Contribute to tshoon/DESED_task development by creating an account on GitHub.

github.com

 

 

1. conda 설치

2. conda_create_environment.sh 환경구성

2-1 python setup.py install 

 

2-2 bash conda_creatae_environment.sh

 

2-3 pip install -r requirements.txt

https://pytorch.org/get-started/previous-versions/

 

Previous PyTorch Versions

Installing previous versions of PyTorch

pytorch.org

 

 

그냥 sh 파일로 환경을 구성하게 되면 cpu 버전으로 깔리게 되어 GPU 사용이 안될 수 도 있다.

3번째 줄을 cuda 버전에 맞추어 위처럼 설정한 sh 파일을 실행시키는 걸 추천

chmod +x ()
bash ()
  • before

  • after

2.1 issue

Error while loading conda entry point: conda-libmamba-solver (libarchive.so.20: cannot open shared object file: No such file or directory)

  • 확인
find / -name "libarchive.so.*" 2>/dev/null

  • libarchive.so.20이 없으므로 수동으로 심볼릭 링크 생성
ln -s /home/user/anaconda3/lib/libarchive.so.13 /home/user/anaconda3/lib/libarchive.so.20

  • LD_LIBRARY_PATH 환경 변수를 설정해서 Conda가 새 라이브러리를 찾을 수 있도록 함
# ~/.bashrc에 추가

echo 'export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/home/user/anaconda3/lib' >> ~/.bashrc
  • Conda가 정상적으로 실행되는지 확인 후, solver를 classic으로 변경

3. dataset download

 python generate_dcase_task4_2023.py

# 파일 개수확인
ls -l *.wav | wc -l
  • Weak labeled training set :

DESED_task/data/dcase/dataset/audio/train/weak - 1578 clips -> 1319 clips 만 다운됨

  • Unlabeled in domain training set :

DESED_task/data/dcase/dataset/audio/train/unlabel_in_domain 14412 clips -> 12069 clips 만 다운됨

  • Validaion set

DESED_task/data/dcase/dataset/audio/validation/validation 1168 clips -> 962 clips만 다운됨

  • Synthetic training set with strong annotations : syntetic21_train -

DESED_task/data/dcase/dataset/audio/train/synthetic21_train/soundscapes : 10000 clips 완료

  • Strong labeled training set (only for the SED Audioset baseline) : 3470 clips -> 3224 clips 다운됨

모두 샘플링 레이트: 44100 Hz의 .wav 파일

4. Training

baseline without external data
baseline using Audioset data (real-world strong-label data)
baseline using pre-trained embedding extractor DNN
baseline using pre-trained embeddings and Audioset data.

cd ~/DESED_task
export PYTHONPATH=$PYTHONPATH:$(pwd)

train_sed.py 파일 실행

data가 없음..

RuntimeError: Failed to open the input "../../data/dcase/dataset/audio/train/weak_16k/YIZpgE9_0SKw_70.000_80.000.wav" (No such file or directory).

'AI' 카테고리의 다른 글

[DCASE] CNN.py 파헤치기  (0) 2025.04.05
[FL] Federated Learning tutorial (flwr)  (0) 2025.03.03
[ML] 강화학습(RL)의 이해  (0) 2025.02.02
[PyTorch] MNIST 문자 인식 모델  (2) 2024.10.09
window에서 tensorflow-gpu 사용하기  (0) 2024.05.29