데이터 과학 또는 기계 학습? 차이점을 발견하는 방법

작가: Laura McKinney
창조 날짜: 3 4 월 2021
업데이트 날짜: 1 칠월 2024
Anonim
Ch03_01.기계학습 기초(기계학습이란)01
동영상: Ch03_01.기계학습 기초(기계학습이란)01

콘텐츠


출처 : Elnur / Dreamstime.com

테이크 아웃 :

데이터 과학과 기계 학습은 핵심적인면에서 다릅니다. 어떤면에서는 하나가 다른 하나의 부분 집합으로 보일 수 있습니다. 둘 다 현재 IT 발전에 중요합니다.

이 새로운 인공 지능 및 데이터 관리 세계에서 IT 세계에서 가장 일반적으로 사용되는 용어에 의해 혼동되기 쉽습니다.

예를 들어, 데이터 과학과 기계 학습은 서로 관련이 있습니다. 이러한 학문에 대한 지식 만 가지고있는 많은 사람들이 서로 어떻게 다른지 알아내는 데 어려움을 겪은 것은 놀라운 일이 아닙니다.

원칙과 기술 접근 ​​방식으로 데이터 과학을 기계 학습과 분리하는 가장 좋은 방법은 다음과 같습니다.

데이터 과학 및 기계 학습 : 광범위하고 좁은 용어

우선, 데이터 과학은 실제로 다양한 유형의 프로젝트와 창작물을 포괄하는 광범위한 기술 범주입니다. (데이터 과학 직무에 관한 자세한 내용은 직무 역할 : 데이터 과학자를 참조하십시오.)

데이터 과학은 본질적으로 빅 데이터를 다루는 관행입니다. 무어의 법칙과보다 효율적인 저장 장치의 확산으로 인해 회사와 다른 당사자가 엄청난 양의 데이터를 수집했습니다. 그리고 Hadoop과 같은 빅 데이터 플랫폼 및 도구는 데이터 관리 작동 방식을 변경하여 컴퓨팅을 재정의하기 시작했습니다. 이제 클라우드 및 컨테이너화와 새로운 모델을 통해 빅 데이터는 우리가 일하고 생활하는 방식의 주요 원동력이되었습니다.

가장 간단한 형태의 데이터 과학은 데이터를 정리하고 수정하는 것에서부터 통찰의 형태로 사용할 수 있도록 데이터를 관리하는 방법입니다.

기계 학습의 정의는 훨씬 좁습니다. 머신 러닝에서 기술은 "학습"이라고하는 인간의인지 과정을 시뮬레이션하기 위해 데이터를 가져 와서 알고리즘을 통해 적용합니다. 즉, 데이터를 가져 와서 훈련 한 컴퓨터는 자체 결과를 제공 할 수 있습니다. 프로그래머가 수행 한 프로세스에서 기술이 배운 것 같습니다.


데이터 과학 및 기계 학습 기술 세트

데이터 과학과 기계 학습을 대조하는 또 다른 방법은 이러한 분야의 전문가에게 가장 유용한 다양한 기술을 살펴 보는 것입니다.

버그 없음, 스트레스 없음-인생을 파괴하지 않고 인생을 바꾸는 소프트웨어를 만드는 단계별 가이드

아무도 소프트웨어 품질에 신경 쓰지 않으면 프로그래밍 기술을 향상시킬 수 없습니다.

데이터 과학자는 심층 분석 및 수학 기술, 데이터베이스 기술에 대한 실무 경험, 빅 데이터를 구문 분석하는 데 사용되는 Python 또는 기타 패키지와 같은 프로그래밍 언어에 대한 지식을 활용할 수 있다는 일반적인 합의가 있습니다.

Simplilearn의 Srihari Sasikumar는“(데이터 과학)에서 강력한 경력을 쌓고 싶은 사람은 분석, 프로그래밍 및 도메인 지식의 세 부서에서 핵심 기술을 습득해야합니다. “한 단계 더 깊이 들어가면 다음 기술이 데이터 과학자로서의 틈새를 개척하는 데 도움이 될 것입니다. Python, SAS, R (및) Scala에 대한 강력한 지식, SQL 데이터베이스 코딩에 대한 실무 경험, 비정형 데이터 작업 능력 비디오 및 소셜 미디어와 같은 다양한 소스를 통해 여러 분석 기능 (및 기계 학습에 대한 지식)을 이해할 수 있습니다.”

기계 학습 측면에서 전문가들은 종종 기계 학습 엔지니어 툴킷에서 유용한 도구로 데이터 모델링 기술, 확률 및 통계 지식 및 광범위한 프로그래밍 기술을 인용합니다.

머신 러닝을 발견하는 방법

여기서 중요한 것은 모든 종류의 데이터가 데이터 과학 작업을 구성한다는 것입니다. 그러나 컴퓨터의 입력에서 배우도록 컴퓨터를 매우 엄격하게 설정하지 않으면 기계 학습이 아닙니다.


그것이있을 때, 그것은 우리의 삶에 광범위한 영향을 미칠 수있는 놀랍도록 유능한 시스템을 만듭니다.

아마존의 설립자 인 제프 베조스 (Jeff Bezos)는“기계 학습으로하는 대부분의 작업은 표면 아래에서 이루어지고있다”고 말했다. “기계 학습은 수요 예측, 제품 검색 순위, 제품 및 거래 권장 사항, 머천다이징 배치, 사기 탐지, 번역 등을위한 알고리즘을 주도합니다. 눈에 잘 띄지 않지만 머신 러닝의 영향은 조용하지만 의미있는 핵심 운영을 개선하는 데 도움이됩니다.”

여기에서 가장 유용한 예 중 하나는 신경망의 출현입니다. 이는 머신 러닝 프로세스를 설정하는 일반적이고 널리 사용되는 방법입니다.

가장 기본적인 형태로 신경망은 인공 뉴런 층으로 구성됩니다. 각 개별 인공 뉴런은 생물학적 뉴런과 동등한 기능을 갖지만 시냅스와 수상 돌기 대신 입력, 활성화 기능 및 최종 출력이 있습니다.

신경망은 인간 두뇌처럼 작동하도록 만들어졌으며, 머신 러닝 전문가는 종종이 모델을 사용하여 머신 러닝 결과를 만듭니다.

그러나 이것이 머신 러닝을하는 유일한 방법은 아닙니다. 좀 더 기초적인 머신 러닝 프로젝트에는 단순히 컴퓨터에 다양한 사진을 보여 주거나 (또는 ​​다른 원시 데이터를 제공함) 감독되는 머신 러닝과 라벨 데이터를 사용하는 과정을 통해 아이디어를 입력하고 컴퓨터가 결국을 구별 할 수있게하는 것이 포함됩니다 시야에 다양한 모양 또는 항목. (머신 러닝의 기본 사항은 머신 러닝 101을 확인하십시오.)

최첨단 분야

결론적으로 머신 러닝은 데이터 과학의 중요한 부분입니다. 그러나 데이터 과학은 더 넓은 영역과 머신 러닝이 이루어지는 단점을 나타냅니다.

어떤 식 으로든 빅 데이터가 없으면 기계 학습이 결코 일어나지 않을 것이라고 말할 수 있습니다. 빅 데이터 자체는 머신 러닝을 만들지 못했습니다. 대신에 우리가 처리 할 데이터를 거의 모을 정도로 많은 데이터를 모은 후, 가장 중요한 것은 이러한 바이오 시뮬레이션 프로세스를 과급 된 방법으로 생각해 냈습니다. 통찰력을 제공합니다.

여기서 명심해야 할 또 다른 좋은 점은 데이터 과학이 두 가지 주요 방식으로 적용될 수 있다는 것입니다. 머신 러닝과 인공 지능을 수용하여 컴퓨터가 우리를 생각하게하거나 데이터 과학을보다 인간 중심적인 접근 방식으로 가져올 수 있습니다. 컴퓨터는 단순히 결과를 제시하고 우리는 인간이 결정을 내립니다.

이는 오늘날 최고의 혁신가를 포함하여 일부 전문가가 이러한 기술을 사용하는 방식에 대한보다 역동적 인 설명을 요구하도록 이끌고 있습니다.

Elon Musk은 "(AI)는 거의 모든 사람이 아는 것보다 훨씬 더 많은 능력이 있으며 개선 속도는 기하 급수적입니다."라고 말하면서 기계 학습 및 AI 프로그램에는 감독이 필요하다고 경고했습니다.

어쨌든 데이터 과학과 머신 러닝은 오늘날 우리 사회가 기술을 발전시키는 핵심 요소입니다.