자동화 : 데이터 과학 및 기계 학습의 미래?

작가: Louise Ward
창조 날짜: 6 2 월 2021
업데이트 날짜: 1 칠월 2024
Anonim
데이터 과학 단계 Steps of Data Science
동영상: 데이터 과학 단계 Steps of Data Science

콘텐츠


출처 : Krulua / Dreamstime.com

테이크 아웃 :

기계 학습은 시스템이 자체 프로그래밍을 변경하는 기능입니다. 그러나 시스템이이를 수행 할 수있을 때 여전히 인간이 필요한가?

머신 러닝은 컴퓨팅 역사상 가장 큰 발전 중 하나였으며 이제는 빅 데이터 및 분석 분야에서 중요한 역할을 수행 할 수 있다고 믿어지고 있습니다. 빅 데이터 분석은 비즈니스 관점에서 큰 도전입니다. 예를 들어, 방대한 양의 다양한 데이터 형식을 이해하고 분석을위한 데이터 준비 및 중복 데이터 필터링과 같은 활동은 많은 리소스를 소비 할 수 있습니다. 데이터 과학자와 전문가를 고용하는 것은 값 비싼 제안이며 모든 회사의 수단이 아닙니다. 전문가들은 머신 러닝이 일상적이고 복잡한 분석과 관련된 많은 작업을 자동화 할 수 있다고 생각합니다. 머신 러닝을 자동화하면보다 복잡하고 혁신적인 작업에 사용할 수있는 많은 리소스를 확보 할 수 있습니다. 머신 러닝이 그 방향으로 가고있는 것 같습니다. (머신 러닝 사용법에 대한 자세한 내용은 머신 러닝의 약속과 함정을 참조하십시오.)

정보 기술의 자동화

IT와 관련하여 자동화 란 별도의 시스템과 소프트웨어를 연결하여 사람의 개입없이 특정 작업을 수행 할 수 있도록합니다. IT 산업에서 자동화 시스템은 단순하고 복잡한 작업을 모두 수행 할 수 있습니다. 간단한 작업의 예로는 양식을 PDF와 통합하고 문서를 올바른 수신자에게 통합하는 것이있을 수 있으며 오프 사이트 백업을 제공하는 것은 복잡한 작업의 예일 수 있습니다.

작업을 수행하려면 자동화 된 시스템을 프로그래밍하거나 명시적인 지침을 제공해야합니다. 자동화 된 시스템이 작업 범위를 수정해야 할 때마다 프로그램 또는 지침 세트는 사람이 업데이트해야합니다. 자동화 된 시스템은 작업에서 효율적이지만 여러 가지 이유로 오류가 발생할 수 있습니다. 오류가 발생하면 근본 원인을 식별하고 수정해야합니다. 분명히, 그들의 업무를 수행하기 위해 자동화 시스템은 전적으로 인간에 의존합니다. 작업의 특성이 복잡할수록 오류 및 문제 가능성이 높아집니다.


일반적으로 일상적인 작업과 반복 가능한 작업은 자동화 된 시스템에 할당됩니다. IT 산업에서 자동화의 일반적인 예는 웹 기반 사용자 인터페이스 테스트를 자동화하는 것입니다. 테스트 사례는 자동화 스크립트에 제공되며 이에 따라 사용자 인터페이스가 테스트됩니다. (머신 러닝의 실제 사용에 대한 자세한 내용은 차세대 사기 탐지의 머신 러닝 및 하둡을 참조하십시오.)

자동화를 선호하는 주장은 일상적이고 반복 가능한 작업을 수행하고 직원이 더 복잡하고 창의적인 작업을 수행 할 수있게한다는 것입니다. 그러나 자동화는 이전에 인간이 수행했던 많은 작업이나 역할을 대체했다고 주장한다. 이제 머신 러닝이 다양한 산업으로 진출하면서 자동화는 새로운 차원을 더할 수있었습니다.

자동화는 기계 학습의 미래인가?

머신 러닝의 본질은 시스템이 데이터를 지속적으로 배우고 사람의 개입없이 진화 할 수있는 능력입니다. 기계 학습은 인간의 뇌처럼 행동 할 수 있습니다. 예를 들어 전자 상거래 웹 사이트의 추천 엔진은 사용자의 고유 한 선호도 및 취향을 평가하고 사용자의 선택에 가장 적합한 제품 및 서비스에 대한 권장 사항을 제공 할 수 있습니다. 이러한 기능을 고려할 때 머신 러닝은 빅 데이터 및 분석과 관련된 복잡한 작업을 자동화하는 데 이상적입니다. 정기적 인 사람의 개입 없이는 작동 할 수없는 기존 자동화 시스템의 주요 한계를 이미 극복했습니다. 이 기사의 뒷부분에서 설명 할 것처럼 머신 러닝이 정교한 데이터 분석 작업을 수행 할 수 있음을 보여주는 여러 사례 연구가 있습니다.

이미 지적한 바와 같이, 빅 데이터 분석은 기업에게 까다로운 제안이며 기계 학습 시스템에 부분적으로 위임 될 수 있습니다. 이는 비즈니스 관점에서보다 창의적이고 중요한 과제를위한 데이터 과학 리소스 확보, 작업 완료 시간 단축, 작업 완료 시간 단축 및 비용 효율성과 같은 많은 이점을 제공 할 수 있습니다.



버그 없음, 스트레스 없음-인생을 파괴하지 않고 인생을 바꾸는 소프트웨어를 만드는 단계별 가이드

아무도 소프트웨어 품질에 신경 쓰지 않으면 프로그래밍 기술을 향상시킬 수 없습니다.


사례 연구

2015 년에 MIT 연구원은 Deep Feature Synthesis 알고리즘이라는 기술을 사용하여 방대한 양의 원시 데이터에서 예측 데이터 모델을 생성 할 수있는 데이터 과학 도구를 개발하기 시작했습니다. 과학자들은이 알고리즘은 머신 러닝의 최고의 기능을 결합 할 수 있다고 주장했다. 과학자들에 따르면, 그들은 이미 3 가지 다른 데이터 세트에서 알고리즘을 테스트했으며 더 많은 데이터 세트로 테스트 범위를 확장 할 것이라고합니다. 제임스 맥스 캔터 (James Max Kanter)와 칼리 얀 베라 마차 니 (Kalyan Veeramachaneni) 연구원은 국제 데이터 과학 및 분석 회의에서 발표 한 논문에서“자동 튜닝 프로세스를 사용하여 사람의 개입없이 전체 경로를 최적화하여 일반화 할 수있게한다”고 논문에 발표했다. 다른 데이터 세트로

작업이 얼마나 복잡한 지 살펴 보자. 알고리즘에는 자동 튜닝 기능으로 알려진 기능이 있으며,이 알고리즘을 사용하면 연령 또는 성별과 같은 원시 데이터에서 통찰력 또는 값을 도출하거나 추출 할 수 있습니다. 예측 데이터 모델을 만들 수 있습니다. 이 알고리즘은 복잡한 수학 함수와 가우시안 코 풀라 (Gaussian Copula)라는 확률 이론을 사용합니다. 따라서 알고리즘이 처리 할 수있는 복잡성의 정도를 쉽게 이해할 수 있습니다. 이 기술은 또한 경쟁에서 상을 수상했습니다.

기계 학습이 작업을 대체 할 수 있음

기계 학습은 인간 두뇌의 효율성으로 작업을 수행하기 때문에 많은 작업을 대체 할 수 있다고 전 세계에서 논의되고 있습니다. 실제로 머신 러닝이 데이터 과학자를 대체 할 것이라는 우려가 있으며 그러한 우려의 근거가있는 것 같습니다.

데이터 분석 기술은 없지만 일상 생활에서 다양한 정도의 분석이 필요한 일반 사용자의 경우 대용량 데이터를 분석하고 분석을 제공 할 수있는 컴퓨터를 보유 할 수는 없습니다. 그러나 자연어 처리 (NLP) 기술은 컴퓨터가 인간의 자연스럽고 구어를 받아들이도록 처리함으로써 이러한 제한을 극복 할 수 있습니다. 이렇게하면 일반 사용자는 정교한 분석 기능이나 기술이 필요하지 않습니다.

IBM은 자사의 Watson 자연 언어 분석 플랫폼을 통해 데이터 과학자의 필요성을 최소화하거나 제거 할 수 있다고 생각합니다. Marc Atschuller Watson Analytics 및 비즈니스 인텔리전스의 부사장에 따르면, "Watson과 같은인지 시스템을 사용하면 질문을 할 수 있습니다. 또는 질문이없는 경우 데이터를 업로드하면 Watson이이를보고 추론 할 수 있습니다." 알고 싶을 것입니다.”

결론

자동화는 기계 학습의 다음 논리적 단계이며 전자 상거래 웹 사이트, 친구 제안, LinkedIn 네트워킹 권장 사항 및 Airbnb 검색 순위 등 일상 생활에서 이미 영향을 경험하고 있습니다. 주어진 예를 고려하면, 자동화 된 기계 학습 시스템에 의해 생성 된 출력 품질에 의심의 여지가 없습니다. 모든 자질과 이점에있어, 큰 실업을 유발하는 머신 러닝에 대한 생각은 약간의 과잉 반응으로 보일 수 있습니다. 기계는 수십 년 동안 우리 삶의 많은 영역에서 인간을 대체 해 왔지만, 인간은 진화하고 업계와 관련성을 유지하도록 적응해 왔습니다. 관점에 따라 머신 러닝은 모든 파괴적 요소에 대해 사람들이 적응할 수있는 또 다른 물결 일뿐입니다.