강화 학습

작가: Lewis Jackson
창조 날짜: 11 할 수있다 2021
업데이트 날짜: 15 할 수있다 2024
Anonim
강화학습기초(Introduction to Reinforcement Learning)
동영상: 강화학습기초(Introduction to Reinforcement Learning)

콘텐츠

정의-강화 학습은 무엇을 의미합니까?

인공 지능과 관련하여 강화 학습은 보상 및 처벌 시스템을 사용하여 알고리즘을 훈련시키는 일종의 동적 프로그래밍입니다.


강화 학습 알고리즘 또는 에이전트는 해당 환경과 상호 작용하여 학습합니다. 에이전트는 올바르게 수행하면 보상을 받고 잘못 수행하면 불이익을받습니다. 에이전트는 보상을 극대화하고 페널티를 최소화함으로써 인간의 개입없이 학습합니다.

Microsoft Azure 및 Microsoft 클라우드 소개 | 이 가이드를 통해 클라우드 컴퓨팅에 관한 모든 내용과 클라우드에서 비즈니스를 마이그레이션하고 운영하는 데 Microsoft Azure가 어떻게 도움이되는지 알아 봅니다.

Techopedia는 강화 학습을 설명합니다

강화 학습은 행동주의 심리학에서 영감을 얻은 기계 학습에 대한 접근 방식입니다. 자녀가 새로운 과제를 수행하는 방법을 배우는 것과 비슷합니다. 강화 학습은 알고리즘이 작업을 수행하는 방법을 명시 적으로 알려주지 않고 자체적으로 문제를 해결한다는 점에서 다른 기계 학습 접근 방식과 대조됩니다.

자율 주행 차 또는 체스를하는 프로그램 일 수있는 에이전트는 환경과 상호 작용하며 안전하게 목적지로 운전하거나 게임에서 승리하는 등의 수행 방식에 따라 보상 상태를받습니다. 반대로, 에이전트는 도로에서 나가거나 체크 표시와 같이 잘못 수행 한 경우 페널티를받습니다.

시간이 지남에 따라 에이전트는 동적 프로그래밍을 사용하여 보상을 극대화하고 패널티를 최소화하기로 결정합니다. 인공 지능에 대한 이러한 접근 방식의 장점은 AI 프로그램이 프로그래머가 에이전트가 작업을 수행하는 방법을 설명하지 않고도 학습 할 수 있다는 것입니다.