기계 학습
이 문서는 참고 문헌 목록을 포함하고 있으나, 각주가 불충분하거나 존재하지 않아 출처가 모호합니다. |
기계 학습(機械學習) 또는 머신 러닝(영어: machine learning, ML)은 경험을 통해 자동으로 개선하는 컴퓨터 알고리즘의 연구이다.[1] 방대한 데이터를 분석해 '미래를 예측하는 기술'이자 인공지능의 한 분야로 간주된다. 기계 학습은 복잡한 패턴에 대한 학습을 통해 상황에 대한 예측과 의사 결정을 돕는다.[2] 컴퓨터가 학습할 수 있도록 하는 알고리즘과 기술을 개발하는 분야이다. 가령, 기계 학습을 통해서 수신한 이메일이 스팸인지 아닌지를 구분할 수 있도록 훈련할 수 있다.
기계 학습의 핵심은 표현(representation)과 일반화(generalization)에 있다. 표현이란 데이터의 평가이며, 일반화란 아직 알 수 없는 데이터에 대한 처리이다. 이는 전산 학습 이론 분야이기도 하다. 다양한 기계 학습의 응용이 존재한다. 문자 인식은 이를 이용한 가장 잘 알려진 사례이다.
정의
편집1959년, 아서 사무엘은 기계 학습을 "기계가 일일이 코드로 명시하지 않은 동작을 데이터로부터 학습하여 실행할 수 있도록 하는 알고리즘을 개발하는 연구 분야"라고 정의하였다.
일반화
편집기계 학습에서의 일반화는 훈련 이후 새롭게 들어온 데이터를 정확히 처리할 수 있는 능력을 말한다.
기계 학습과 데이터 마이닝
편집기계 학습과 데이터 마이닝은 종종 같은 방법을 사용하며 상당히 중첩된다. 다만 다음에 따라 대략적으로 구분된다.
이론
편집이론 전산학의 한 갈래이다. 훈련 데이터는 유한한데, 결과는 불확실하다. 이는 학습 이론을 통해 알고리즘의 결과를 장담할 수 없기 때문이다. 또한 다른 용어를 사용함에도 불구하고 통계적 추론과도 많은 유사점이 있다.
알고리즘 유형
편집접근 방법별 알고리즘
편집결정 트리 학습법
편집연관 규칙 학습법
편집인공신경망
편집인공신경망(artificial neural network, ANN)은 기계학습과 인지과학에서 생물학의 신경망에서 영감을 얻은 통계학적 학습 알고리즘으로 시냅스의 결합으로 네트워크를 형성한 인공 뉴런(노드)이 학습을 통해 시냅스의 결합 세기를 변화시켜, 문제 해결 능력을 가지는 모델 전반을 가리킨다. 인공신경망에는 교사 신호(정답)의 입력에 의해서 문제에 최적화되어 가는 교사 학습과 교사 신호를 필요로 하지 않는 비교사 학습이 있다. 명확한 해답이 있는 경우에는 교사 학습이, 데이터 클러스터링에는 비교사 학습이 이용된다. 다른 기계학습과 같이 신경망은 일반적으로 규칙기반 프로그래밍으로 풀기 어려운 컴퓨터 비전 또는 음성 인식과 같은 다양한 범위의 문제를 푸는데 이용된다.
유전 계획법
편집귀납 논리 계획법
편집서포트 벡터 머신
편집클러스터링
편집베이즈 네트워크
편집강화 학습법
편집표현 학습법
편집동일성 계측 학습법
편집주제별 알고리즘
편집같이 보기
편집참고 문헌
편집- 전철홍; 유선아 (2024년 2월). “과학교육 분야 자연어 처리 기법의 연구동향 분석”. 《한국과학교육학회지》 (한국과학교육학회) 44 (1): 39-55.
각주
편집- ↑ “Machine Learning textbook”. 《www.cs.cmu.edu》. 2020년 5월 28일에 확인함.
- ↑ 전철홍 2024, 40쪽
외부 링크
편집- 위키미디어 공용에 기계 학습 관련 미디어 분류가 있습니다.