본문 바로가기

전체 글149

파이썬 OOP vs FP 보호되어 있는 글 입니다. 2025. 3. 2.
[NLP] 임베딩(Embedding) 원-핫 인코딩 방식에서발전된 방법으로 단어의 의미를 수치적으로 표현하여 컴퓨터가 이해하게 만드는 기법이다.   비교하여 설명하면원-핫 인코딩은 '강아지'를 [0, 1, 0, 0, ...]처럼 0과 1로만 표현하지만,임베딩은 '강아지'를 [0.1, -0.2, 0.3, ...]처럼 의미를 담은 숫자로 바꾼다. 이 숫자들은 단어의 느낌(귀여움, 털, 짓기 등)을 반영된 리스트(벡터)이다. 룩업 테이블(Lookup Table)파이썬 딕셔너리 같이 key-value를 연결하는 것처럼단어-단어의 특성을 연결해준다.embedding_layer = model.layers[0] # 첫 번째 레이어 (Embedding)embedding_weights = embedding_layer.get_weights()[0] # 룩.. 2025. 2. 27.
[Linux] ubuntu - Low Disk Space on "Filesystem root" os : ubuntu 22.04 - Examine 클릭 메모리 관리를 안했더니 이처럼 용량 부족이 일어난다.  일단 제일 많이 차지하는 캐시메모리 확인   캐시메모리는 문제가 없는데..   무엇이 용량을 많이 차지하고 있는지 확인du -ah ~ | sort -rh | head -15 - 캐시 삭제- snap - (rpi-imager) 삭제- arduino 15 삭제  1. 로그 저장 삭제하기 전 얼마나 before/after 비교를 위해 df -h > before_cleanup.txt  2. 불필요한 파일 삭제 - 캐시rm -rf ~/.cache/*rm -rf ~/snap/rpi-imager/*  *Before/After  3 sudo apt autoremove -ysudo apt autoclean   .. 2025. 2. 22.
[DL] RNN(순환신경망) 맛보기 RNN(Recurrent Neural Network)시계열 데이터 처리에 특화된 아키텍처이전 단계의 정보를 기억하고 활용할 수 있는 능Sequence(시퀀스 데이터)문장을 구성하는 단어들의 순서시간에 따른 주식 가격의 변화음성 신호의 연속된 파형순환신경망 구조입력층 → 반복(hidden) 층 → 출력층입력층 (Input Layer)시퀀스 데이터 (예: 문장, 주식 가격, 음성 신호)시점(t)에 따라 나눠진 입력 벡터 ( x_t )예: 자연어 처리라면 단어 임베딩 벡터, 시계열 데이터라면 숫자 값반복(hidden)층 (Recurrent Hidden Layer)현재 시점(t)의 입력 ( x_t )과 이전 시점(t-1)의 hidden state ( h_{t-1} )를 사용하여 새로운 hidden state (.. 2025. 2. 18.
[중급] 파이썬 객체지향프로그래밍 tip 3가지 1. init 메서드init은 Python 클래스에서 생성자(constructor) 역할객체(Object)가 생성될 때 자동으로 호출되며, 초기 설정을 담당객체 생성과 동시에 데이터를 설정할 수 있어 편리객체 생성과 동시에 데이터를 설정하여 편리class DataCollector: def __init__(self, path="./data"): self.path = path # 데이터 저장 경로 설정 self.transform = transforms.Compose([ transforms.ToTensor(), transforms.Normalize((0.5,), (0.5,)) ]) self.train_data = .. 2025. 2. 15.
[중급] tensor라는 데이터 구조 AI 공부를 하다보면 자유 사용되는 텐서는 데이터 흐름을 표현하고, 딥러닝 모델의 학습 과정에서 데이터를 주고받는 데 사용한다.자세하게 텐서를 알아보자.텐서란?텐서는 다차원 배열을 표현하는 데이터 구조차원에 따라 다음과 같이 분류:스칼라 (Rank 0의 텐서): 단일 숫자벡터 (Rank 1의 텐서): 숫자의 배열행렬 (Rank 2 텐서): 숫자의 2차원 배열텐서 (3차원 이상): 3차원 또는 그 이상의 차원을 가진 배열텐서의 특징크기(Shape):각 차원의 요소 수를 나타내는 튜플예: (224, 224, 3) - 224×224 크기의 channel이 3인 RGB 이미지차원(Dimension):텐서의 축(axis) 또는 방향의 수예시퀀스는 텍스트에서는 (시간x문자)이미지는 보통 3차원 텐서 (높이 × 너비.. 2025. 2. 13.