딥 러닝 모델 둘러보기

동영상: How to Improve Your Deep Learning Model Performance - Python, Deep Learning

콘텐츠

신경 스타일
신경 이야기꾼
데이터
Char-RNN TED
결론

출처 : Kran77 / Dreamstime.com

테이크 아웃 :

딥 러닝 모델은 컴퓨터가 스스로 재미있게 생각하고 재미 있고 흥미로운 결과를 얻도록 가르치고 있습니다.

딥 러닝은 점점 더 많은 영역과 산업에 적용되고 있습니다. 무인 자동차부터 Go 연주, 이미지 음악 생성에 이르기까지 매일 새로운 딥 러닝 모델이 등장합니다. 여기서 우리는 몇 가지 인기있는 딥 러닝 모델을 살펴 봅니다. 과학자와 개발자는이 모델을 가져 와서 새롭고 창의적인 방식으로 수정하고 있습니다. 이 쇼케이스를 통해 가능한 것이 무엇인지 알 수 있기를 바랍니다. 인공 지능의 발전에 대해 배우려면 컴퓨터가 인간의 뇌를 모방 할 수 있을까요?를 참조하십시오.

신경 스타일

아무도 소프트웨어 품질에 신경 쓰지 않으면 프로그래밍 기술을 향상시킬 수 없습니다.

신경 이야기꾼

신경 이야기꾼은 이미지가 주어지면 이미지에 대한 로맨스 이야기를 생성 할 수있는 모델입니다. 재미있는 장난감이지만 미래를 상상하고 모든 인공 지능 모델이 움직이는 방향을 볼 수 있습니다.

위의 기능은 모델이 표준 이미지 캡션을 소설의 스토리 스타일로 전송할 수있는 "스타일 전환"작업입니다. 스타일 전환은 "예술적 스타일의 신경 알고리즘"에서 영감을 얻었습니다.

데이터

이 모델에 사용되는 두 가지 주요 데이터 소스가 있습니다. MSCOCO는 약 300,000 개의 이미지가 포함 된 Microsoft의 데이터 집합이며 각 이미지에는 5 개의 캡션이 있습니다. MSCOCO는 사용되는 유일한 감독 데이터입니다. 즉, 사람이 들어가서 각 이미지의 캡션을 명시 적으로 작성해야하는 유일한 데이터임을 의미합니다.

피드 포워드 신경망의 주요 한계 중 하나는 메모리가 없다는 것입니다. 각 예측은 네트워크가 처음으로 예측 한 유일한 예측 인 것처럼 이전 계산과는 독립적입니다. 그러나 문장이나 단락 번역과 같은 많은 작업의 경우 입력은 순차적이고 일관성있게 관련된 데이터로 구성되어야합니다. 예를 들어, 주변 단어가 제공하지 않는 한 문장에서 한 단어를 이해하는 것이 어려울 수 있습니다.

RNN은 뉴런간에 다른 연결 세트를 추가하기 때문에 다릅니다. 이러한 링크는 숨겨진 층의 뉴런으로부터 활성화가 서열의 다음 단계에서 그들 자신에게 피드백 될 수있게한다. 다시 말해, 모든 단계에서, 숨겨진 계층은 그 아래의 계층과 시퀀스의 이전 단계에서 활성화를받습니다. 이 구조는 본질적으로 반복적 인 신경망 메모리를 제공합니다. 따라서 객체 감지 작업을 위해 RNN은 현재 이미지가 개인 지 확인하기 위해 이전에 분류 한 개를 사용할 수 있습니다.

Char-RNN TED

숨겨진 계층의이 유연한 구조를 통해 RNN은 문자 수준 언어 모델에 매우 적합합니다. 원래 Andrej Karpathy가 만든 Char RNN은 하나의 파일을 입력으로 사용하고 시퀀스에서 다음 문자를 예측하도록 RNN을 훈련시키는 모델입니다. RNN은 원래 교육 데이터처럼 보일 수있는 문자별로 생성 할 수 있습니다. 데모는 다양한 TED 토크의 대본을 사용하여 훈련되었습니다. 모델에 하나 또는 여러 개의 키워드를 제공하면 TED 토크의 음성 / 스타일로 키워드에 대한 구절이 생성됩니다.

결론

이러한 모델은 딥 러닝으로 인해 가능해진 머신 인텔리전스의 새로운 혁신을 보여줍니다. 딥 러닝은 이전에는 결코 해결할 수 없었던 문제를 해결할 수 있으며 아직 그 고원에 도달하지 못했음을 보여줍니다. 딥 러닝 혁신의 결과로 향후 몇 년 동안 무인 자동차와 같은 더 흥미로운 것들을 보게 될 것입니다.