https://github.com/tshoon/DESED_task/tree/master/recipes/dcase2023_task4_baseline
DESED_task/recipes/dcase2023_task4_baseline at master · tshoon/DESED_task
Domestic environment sound event detection task. Contribute to tshoon/DESED_task development by creating an account on GitHub.
github.com
1. conda 설치
2. conda_create_environment.sh 환경구성
2-1 python setup.py install
2-2 bash conda_creatae_environment.sh
2-3 pip install -r requirements.txt
https://pytorch.org/get-started/previous-versions/
Previous PyTorch Versions
Installing previous versions of PyTorch
pytorch.org

그냥 sh 파일로 환경을 구성하게 되면 cpu 버전으로 깔리게 되어 GPU 사용이 안될 수 도 있다.
3번째 줄을 cuda 버전에 맞추어 위처럼 설정한 sh 파일을 실행시키는 걸 추천
chmod +x ()
bash ()
- before

- after

2.1 issue
Error while loading conda entry point: conda-libmamba-solver (libarchive.so.20: cannot open shared object file: No such file or directory)
- 확인
find / -name "libarchive.so.*" 2>/dev/null

- libarchive.so.20이 없으므로 수동으로 심볼릭 링크 생성
ln -s /home/user/anaconda3/lib/libarchive.so.13 /home/user/anaconda3/lib/libarchive.so.20

- LD_LIBRARY_PATH 환경 변수를 설정해서 Conda가 새 라이브러리를 찾을 수 있도록 함
# ~/.bashrc에 추가
echo 'export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/home/user/anaconda3/lib' >> ~/.bashrc
- Conda가 정상적으로 실행되는지 확인 후, solver를 classic으로 변경

3. dataset download
python generate_dcase_task4_2023.py


# 파일 개수확인
ls -l *.wav | wc -l
- Weak labeled training set :
DESED_task/data/dcase/dataset/audio/train/weak - 1578 clips -> 1319 clips 만 다운됨
- Unlabeled in domain training set :
DESED_task/data/dcase/dataset/audio/train/unlabel_in_domain 14412 clips -> 12069 clips 만 다운됨
- Validaion set
DESED_task/data/dcase/dataset/audio/validation/validation 1168 clips -> 962 clips만 다운됨
- Synthetic training set with strong annotations : syntetic21_train -
DESED_task/data/dcase/dataset/audio/train/synthetic21_train/soundscapes : 10000 clips 완료

- Strong labeled training set (only for the SED Audioset baseline) : 3470 clips -> 3224 clips 다운됨
모두 샘플링 레이트: 44100 Hz의 .wav 파일
4. Training
baseline without external data
baseline using Audioset data (real-world strong-label data)
baseline using pre-trained embedding extractor DNN
baseline using pre-trained embeddings and Audioset data.

cd ~/DESED_task
export PYTHONPATH=$PYTHONPATH:$(pwd)
train_sed.py 파일 실행
data가 없음..
RuntimeError: Failed to open the input "../../data/dcase/dataset/audio/train/weak_16k/YIZpgE9_0SKw_70.000_80.000.wav" (No such file or directory).'AI' 카테고리의 다른 글
| [DCASE] CNN.py 파헤치기 (0) | 2025.04.05 |
|---|---|
| [FL] Federated Learning tutorial (flwr) (0) | 2025.03.03 |
| [ML] 강화학습(RL)의 이해 (0) | 2025.02.02 |
| [PyTorch] MNIST 문자 인식 모델 (2) | 2024.10.09 |
| window에서 tensorflow-gpu 사용하기 (0) | 2024.05.29 |