특징이란?

Question

기계 학습과 패턴 인식에서 특징(feature)은 데이터 세트의 개별적으로 측정 가능한 속성 또는 특성을 말한다. 유익하고, 변별력 있으며, 독립적인 특징을 선택하는 것은 패턴 인식, 분류, 회귀 작업을 위한 효과적인 알고리즘을 만드는 데 매우 중요하다. 특징은 일반적으로 수치형이지만, 원-핫 인코딩과 같은 전처리 단계를 거친 후에는 문자열이나 그래프와 같...

MOAI Technologies · Accepted Answer

기계 학습과 패턴 인식에서 특징(feature)은 데이터 세트의 개별적으로 측정 가능한 속성 또는 특성을 말한다.[^1] 유익하고, 변별력 있으며, 독립적인 특징을 선택하는 것은 패턴 인식, 분류, 회귀 작업을 위한 효과적인 알고리즘을 만드는 데 매우 중요하다. 특징은 일반적으로 수치형이지만, 원-핫 인코딩과 같은 전처리 단계를 거친 후에는 문자열이나 그래프와 같은 다른 유형도 구문 패턴 인식에 사용된다. "특징"의 개념은 선형 회귀와 같은 통계 기법에서 사용되는 설명 변수의 개념과 관련이 있다. 특징의 유형
특징 공학에서는 수치형과 범주형의 두 가지 유형의 특징이 일반적으로 사용된다. 수치형 특징은 척도로 측정할 수 있는 연속적인 값이다. 수치형 특징의 예로는 나이, 키, 체중, 소득 등이 있다. 수치형 특징은 기계 학습 알고리즘에 직접 사용할 수 있다. 범주형 특징은 범주로 그룹화할 수 있는 이산적인 값이다. 범주형 특징의 예로는 성별, 색상, 우편번호 등이 있다. 범주형 특징은 일반적으로 기계 학습 알고리즘에 사용하기 전에 수치형 특징으로 변환해야 한다. 이는 원-핫 인코딩, 레이블 인코딩, 순서형 인코딩 등 다양한 기법을 사용하여 수행할 수 있다. 특징 공학에서 사용되는 특징의 유형은 사용하는 특정 기계 학습 알고리즘에 따라 달라진다. 의사결정 나무와 같은 일부 기계 학습 알고리즘은 수치형 특징과 범주형 특징을 모두 처리할 수 있다. 선형 회귀와 같은 다른 기계 학습 알고리즘은 수치형 특징만 처리할 수 있다. 분류
수치형 특징은 특징 벡터로 편리하게 표현할 수 있다. 이진 분류를 수행하는 한 가지 방법은 특징 벡터를 입력으로 사용하는 선형 예측 함수(퍼셉트론과 관련됨)를 이용하는 것이다. 이 방법은 특징 벡터와 가중치 벡터 사이의 스칼라곱을 계산하여, 그 결과가 임계값을 초과하는 관측값을 선별하는 것으로 구성된다. 특징 벡터를 이용한 분류 알고리즘에는 최근접 이웃 분류, 신경망, 베이즈 접근법과 같은 통계 기법 등이 있다. 예시
문자 인식에서 특징에는

특징

특징의 유형

분류

예시

특징 벡터

선택과 추출

같이 보기

참고 문헌

관련 인사이트