강화학습1 [ML] 강화학습(RL)의 이해 강화학습(Reinforcement Learning)의 개념1. 보상(Reward)과 벌칙(Publishment)파블로프의 개, 스키너의 비둘기 실험처럼 가르칠 때, 적절한 보상과 벌을 작용하게 되면 학습의 효과가 강화된다는 것을 원리로 시작되었다.2. 시행착오: 에이전트(Agent)와 환경(Enviroment)의 상호작용 처음 게임을 시작할 때를 떠올리면 실수도 많이 하고, 낮은 점수를 획득하지만 게임을 계속하다 보면 어떤 행동이 점수를 높이는지, 어떤 행동이 게임오버로 만드는지 자연스럽게 아는 과정을 의미한다. Agent(에이전트)는 다음과 같이 학습한다.처음에는 무작위로 행동을 시도해봅니다각 행동의 결과를 기억합니다좋은 결과를 가져온 행동은 더 자주 시도합니다나쁜 결과를 가져온 행동은 피하려고 합니다.. 2025. 2. 2. 이전 1 다음