강화 학습은 마케팅에 좋은 역동적 인 스핀을 줄 수 있습니다

동영상: Brightics AI를 통한 Data-Driven Business Innovation - 삼성SDS 이은주 상무 [REAL 2019 - Disruptive Technology]

콘텐츠

강화 학습이란 무엇입니까?
버그 없음, 스트레스 없음-인생을 파괴하지 않고 인생을 바꾸는 소프트웨어를 만드는 단계별 가이드
마케팅 담당자를위한 기계
출시 예정
더 큰 생각
입양 경로

출처 : Juliatimchenko / Dreamstime.com

테이크 아웃 :

강화 학습은 결과를 예측하고 사용자가 더 나은 결정을 내릴 수 있도록 도와주는 인공 지능 및 기계 학습의 하위 집합입니다.

마케팅 담당자는 점점 경쟁이 치열 해지는 마케팅 조건에서 우위를 점할 때 확장 가능하고 지능적인 솔루션을 지속적으로 찾고 있습니다. 인공 지능 (AI)과 머신 러닝 (ML)이 브랜드와 마케팅 조직에 의해 전체적으로 채택되고있는 것은 놀라운 일이 아닙니다. ML의 기본 사항에 대한 자세한 내용은 Machine Learning 101을 확인하십시오.

초기에 AI는 일반적으로 컴퓨터가 사람이 달리 정의한 작업을 자동화 할 때 기술로 간주 될 수 있습니다. AI의 기능 영역 인 머신 러닝은 컴퓨터에 최종 목표가 주어 지지만 자체적으로 최상의 경로를 계산해야 할 때입니다.

오늘날 우리는 광고 사기 탐지, 소비자 행동 예측, 추천 시스템, 창의적인 개인화 등을 포함한 여러 마케팅 영역에 이러한 기술, 특히 머신 러닝이 배포되는 것을보고 있습니다.

이것이 모두 훌륭하지만, 마케팅 담당자가 머신 러닝의 요구를 진정으로 충족시킬 수있는 새로운 파생 기술이 있습니다. 이를 "강화 학습"(RL)이라고합니다.

강화 학습이란 무엇입니까?

ML에서 RL 로의 단계 변경은 단순한 문자 이상입니다. 머신 러닝에 전달 된 대부분의 작업에는 "이 이미지 인식", "책 내용 이해"또는 "캐치 사기"와 같은 단일 단계를 사용하는 것이 포함됩니다. 마케팅 담당자의 경우 "사용자 유치, 유지 및 참여"와 같은 비즈니스 목표는 다음과 같습니다. 머신 러닝으로는 쉽게 달성 할 수없는 본질적으로 다단계 및 장기적인 것입니다.

RL 알고리즘은 역동적 인 문제가 발생하는 전개되고 끊임없이 변화하는 여정에 대한 최적화에 관한 것입니다. RL은 수학적 "보상 함수"를 사용하여 각 순열의 결과를 계산함으로써 미래를보고 올바른 호출을 할 수 있습니다.

오늘날,이 최첨단 기술의 최상의 실시 예는 게임 및 자율 주행 자동차에서 볼 수 있습니다. 작년에 Google의 AlphaGo 시스템이 세계 최고의 보드 게임 바둑 선수를 이겼을 때, 그들의 비밀 소스는 강화 학습이었습니다. 게임이 규칙을 설정하는 동안 승리를 향한 경로에 대한 플레이어의 옵션은 보드 상태에 따라 동적으로 변경됩니다. 강화 학습을 통해 시스템은 다음 각 이동에 따라 변경 될 수있는 모든 순열을 설명합니다.

마찬가지로, 자율 주행 차는 도로 규칙과 목적지 위치가 고정 된 상태로 여행하지만, 보행자부터 도로 블록, 자전거 타는 사람에 이르는 경로의 변수는 동적으로 변경됩니다. 그렇기 때문에 Tesla의 Elon Musk이 설립 한 OpenAI는 차량에 고급 RL 알고리즘을 사용합니다.

버그 없음, 스트레스 없음-인생을 파괴하지 않고 인생을 바꾸는 소프트웨어를 만드는 단계별 가이드

아무도 소프트웨어 품질에 신경 쓰지 않으면 프로그래밍 기술을 향상시킬 수 없습니다.

마케팅 담당자를위한 기계

이것은 마케팅 담당자에게 어떤 의미가 있습니까?

비즈니스 상황이 항상 변하기 때문에 많은 마케팅 담당자의 핵심 과제가 발생합니다. 성공적인 캠페인 전략은 시간이 지남에 따라 불리해질 수 있지만 오래된 전략은 새로운 견인력을 얻을 수 있습니다. RL은 여러 결과의 성공 및 / 또는 실패로부터 배우고 미래의 승리 전략을 형성하는 진정한 인간 지능을 모방하는 단계입니다. 몇 가지 예를 들어 보겠습니다.

1. 사용자 참여 향상

식당 체인에 대한 고객 참여에 초점을 맞추고 내년에이를 10 배로 늘리 겠다는 목표를 봅시다. 오늘날 마케팅 캠페인에는 음식 선호도에 따라 할인 혜택으로 생일 인사를하는 것이 포함될 수 있습니다. 이것은 마케팅 담당자가 시작점과 끝점을 정의한 선형적인 사고입니다.

바쁜 세상에서 고객의 생활은 지속적으로 실시간으로 변화하고 있습니다. 강화 학습에서 시스템은 어떤 시점에서든 마케팅 병기에서 어떤 전술이든지 수령인을 10 배 참여의 궁극적 목표로 이끌 수있는 최상의 기회를 지속적으로 재 교정하고있을 것입니다.

2. 동적 예산 할당

이제 예산이 백만 달러이고 월말까지 매일 지출해야하고 TV, 로열티 프로모션 및 Google의 네 가지 채널에 할당 된 광고 시나리오를 상상해보십시오. 예산을 가장 최적의 방식으로 사용하도록하려면 어떻게해야합니까? 대답은 요일, 대상 사용자, 재고 가격 및 기타 여러 요인에 따라 다릅니다.

강화 학습에서 알고리즘은 과거 광고 결과 데이터를 사용하여 특정 지출 결정에 점수를 매기는 보상 함수를 작성합니다. 그러나 가격과 같은 실시간 요소와 대상 고객의 긍정적 인 반응 가능성도 설명합니다. 반복 학습을 통해 한 달 내내 광고 지출 할당이 동적으로 변경됩니다. 궁극적 인 목표가 설정되었지만 RL은 모든 시나리오를 통해 가능한 최선의 방식으로 예산을 할당했습니다. 마케팅의 AI에 대한 자세한 내용은 인공 지능이 판매 산업을 혁신하는 방법을 참조하십시오.

출시 예정

강화 학습은 복잡성을 인정하고 사람들이 이기종임을 인식하고 이러한 진실을 설명하여 게임 보드의 조각이 변화함에 따라 시간이 지남에 따라 각 다음 행동을 개선합니다.

강화 학습은 여전히 연구 프로젝트와 최첨단 채택 자의 보존입니다. 수학 개념과 기술은 40 년 이상 사용되어 왔지만 다음과 같은 세 가지 추세로 인해 비교적 최근까지는 배포 할 수 없었습니다.

고성능 그래픽 처리 장치 (GPU)를 통한 컴퓨팅 성능의 확산.
클라우드 컴퓨팅은 GPU 자체 구매 비용의 극히 일부만으로도 고급 프로세서 성능을 사용할 수있게 해 타사가 GPU를 임대하여 RL 모델을 몇 시간, 며칠 또는 몇 주 동안 비교적 저렴한 지하실 가격으로 교육 할 수 있습니다.
수치 알고리즘 또는 스마트 휴리스틱 개선. RL 알고리즘의 몇 가지 중요한 수치 단계가 훨씬 빠른 속도로 수렴 될 수 있습니다. 이러한 마법의 수치 트릭이 없다면 오늘날 가장 강력한 컴퓨터에서도 여전히 실현 가능하지 않을 것입니다.

더 큰 생각

이 모든 것은 강화 학습의 새로운 힘이 곧 브랜드와 마케팅 담당자에게 대규모로 제공 될 것임을 의미합니다. 그러나 그것을 수용하려면 사고 방식이 바뀌어야합니다. 마케팅 관리자에게이 기술은 손을 the 수있는 능력을 의미합니다.

모든 사업에는 목표가 있지만, 당신이 참호에 빠지면 그 목표를 향한 일상적인 행동이 희미해질 수 있습니다. 이제 의사 결정권자들은 RL 기술을 통해 시스템이 목표를 향한 최선의 과정을 계획 할 것이라는 확신을 가지고 목표를 설정할 수 있습니다.

예를 들어, 광고에서 요즘 많은 사람들은 클릭률 (CTR)과 같은 측정 항목이 실제 비즈니스 결과에 대한 프록시 일 뿐이며 계산할 수 있기 때문에 계산 된 것으로 만 인식합니다. RL 중심의 마케팅 시스템은 그러한 중개자 메트릭스 및 이와 관련된 모든 무거운 리프팅을 강조하여 보스가 목표에 집중할 수 있도록합니다.

이를 위해서는 기업들이 큰 문제에 대해 훨씬 더 적극적이고 장기적으로 생각해야합니다. 기술이 성숙 해지면 목표를 달성 할 것입니다.