Q- 러닝

작가: Roger Morrison
창조 날짜: 24 구월 2021
업데이트 날짜: 11 할 수있다 2024
Anonim
[강화학습] 1-2강. "맛집 찾기"로 설명하는 강화학습 (Q-learning 기초편)
동영상: [강화학습] 1-2강. "맛집 찾기"로 설명하는 강화학습 (Q-learning 기초편)

콘텐츠

정의-Q- 러닝이란 무엇입니까?

Q- 러닝은 모델이없는 강화 학습을 나타내는 알고리즘 구조의 용어입니다. Q- 러닝은 정책을 평가하고 확률 적 모델링을 사용하여 Markov 의사 결정 프로세스에서 최상의 진로를 찾습니다.


Microsoft Azure 및 Microsoft 클라우드 소개 | 이 가이드를 통해 클라우드 컴퓨팅에 관한 모든 내용과 클라우드에서 비즈니스를 마이그레이션하고 운영하는 데 Microsoft Azure가 어떻게 도움이되는지 알아 봅니다.

QoLearning을 설명하는 Techopedia

Q- 러닝 알고리즘의 기술적 구성에는 에이전트, 상태 세트 및 상태 당 조치 세트가 포함됩니다.

Q 함수는 보상을 평가하기 위해 할인 요소와 함께 다양한 단계에 가중치를 사용합니다.

간단한 아이디어처럼 보이지만 Q- 러닝은 많은 유형의 강화 학습 및 딥 러닝 모델에서 가장 중요합니다. 가장 좋은 예 중 하나는 기계 학습 프로그램이 다양한 유형의 비디오 게임 (예 : 1980 년대 아타리 게임)에서 게임 플레이 전략을 배우는 데 도움을주기 위해 딥 Q- 러닝을 사용하는 것입니다. 컨볼 루션 신경망은 시간이 지남에 따라 게임을 더 잘하는 방법을 컴퓨터가 알 수 있도록 확률 모델을 작성하기 위해 게임 플레이 샘플을 가져옵니다.

Q- 러닝은 인공 지능과 기계 학습을 발전시키는 데 도움이되는 풍부한 잠재력을 가지고 있습니다.