머신러닝(Machine Learning)의 종류 지도학습 (Supervised Learning) 비지도학습 (Unsupervised Learning) 강화학습 (Reinforcement Learning) 강화학습(Reinforcement Learning)만의 특이점 지도자(Superviser)가 존재하지 않고, 단지 보상(Reward)만 존재한다. 행동에 대한 피드백이 즉각적이지 않고, 지연될 수 있다. 시간(또는 스텝)이 매우 중요한 역할을 한다. (Sequential, i.i.d Data) i.i.d (independent identically distributed) 란 각각의 Random Variable들이 독립적이며 동일한 확률 분포를 가지는 것을 뜻한다. 에이전트의 행동이 이후에 받을 데이터에 ..