마르코프 결정 과정 (MDP)

작가: Laura McKinney
창조 날짜: 5 4 월 2021
업데이트 날짜: 22 6 월 2024
Anonim
[강화학습] 2-1강. Markov Decision Process 개념
동영상: [강화학습] 2-1강. Markov Decision Process 개념

콘텐츠

정의-Markov 의사 결정 프로세스 (MDP) 란 무엇입니까?

Markov 의사 결정 프로세스 (MDP)는 전문가들이 "이산 시간 확률 적 제어 프로세스"라고 부르는 것입니다. 이는 19 세기 후반과 20 세기 초 러시아의 Andrey Markov가 개척 한 수학을 기반으로합니다.


Microsoft Azure 및 Microsoft 클라우드 소개 | 이 가이드를 통해 클라우드 컴퓨팅에 관한 모든 내용과 클라우드에서 비즈니스를 마이그레이션하고 운영하는 데 Microsoft Azure가 어떻게 도움이되는지 알아 봅니다.

Techopedia는 Markov Decision Process (MDP)를 설명합니다

Markov 의사 결정 과정과 관련 Markov 체인을 설명하는 한 가지 방법은 수백 년 전에 러시아 과학자의 간단한 수학적 연구를 전제로 한 현대 게임 이론의 요소라는 것입니다. Markov 의사 결정 프로세스에 대한 설명은 시스템이 특정 상태 세트에있는 시나리오를 연구하고 의사 결정자의 의사 결정에 따라 다른 상태로 진행한다는 것입니다.

모델로서의 Markov 체인은 주어진 이벤트의 확률이 이전에 달성 한 상태에 의존하는 일련의 이벤트를 보여줍니다. 전문가들은 Markov 의사 결정 프로세스를 설명 할 때 "가상 한 상태 공간"에 대해 이야기 할 수 있습니다. 일부 사람들은 Markov 의사 결정 모델의 아이디어를 "랜덤 워크"모델 또는 확률에 기반한 다른 확률 적 모델 (종종 벽에 인용 된 랜덤 워크 모델)과 연관시킵니다 스트리트, 시장 확률에 따라 주식의 움직임을 위 또는 아래로 모델링).

일반적으로 Markov 의사 결정 프로세스는 종종 로봇 공학, 자동화 및 연구 모델과 같이 오늘날 전문가가 작업하는 가장 정교한 기술 중 일부에 적용됩니다.