Multi Reinforcement Learning 멀티 에이전트 강화학습 동일 환경 각자 다른 목적 경쟁적/협력적 최적의 정책 도출 분산 강화 학습 독립적 환경 동일 목적 보상 공유 정책의 빠른 도출