2026-1학기/paper review 및 etc.

논문수정) 영어표현

mo_o 2026. 6. 2. 11:39

피처엔지니어링의 범위 와 정의:

피처 엔지니어링(Feature Engineering)이란?
피처 엔지니어링은 "도메인 지식(지식·경험)을 활용하여, 원시 데이터(Raw Data)로부터 머신러닝 알고리즘이 패턴을 더 잘 학습할 수 있도록 새로운 특징(Feature)을 정제, 선택, 변환, 생성하는 모든 과정"을 뜻합니다. [1]

 

모델 인풋값에 맞게 0~1로 한것도 피처엔지니어링이고? 그럼 전처리랑 다른 점이 뭐야?

피처엔지니어링:

  • 특성 생성 (Feature Generation): 기존 변수를 조합하거나 외부 지식을 결합해 새로운 변수를 만듦 (예: SMILES에서 TPSA 추출) [1, 2]
  • 특성 선택 (Feature Selection): 수많은 변수 중 모델 예측에 진짜 유용한 핵심 변수만 골라냄 (데이터가 적을 때 과적합 방지에 필수) [1, 2]
  • 스케일링 (Scaling / 정규화): SVM 같은 모델은 변수 간의 단위가 다르면(예: 분자량은 수백 단위, LogP는 한 자릿수 단위) 학습이 망가집니다. 이를 0과 1 사이로 맞춰주는 작업입니다