YZ ZONE

[자연어처리] 8.개체명 인식 본문

IT/자연어처리

[자연어처리] 8.개체명 인식

러블리YZ 2023. 2. 3. 12:19

개체명 인식(Named Entity Recognition, NER)

사람 (Person PS), 장소 (Location LC), 기관(Organization OG), 날짜(Date DT)등 명명된(named)개체를 텍스트로 식별하는 작업.

개체명 인식을 통해 특정 명사에 해당하는 태그를 붙여 개체명을 인식하여 분류.

 

Ex) 춘향아 8월15일에 강남에서 홍길동과 약속이 있으니까, 늦지 말고 오도록 해!

[사람] : 춘향, 홍길동

[날짜] : 8월 15일

[장소] : 강남

 

BIO 태깅 기법 (BIO Tagging Scheme)

개체명을 텍스트로부터 인식시키기 위한 기법 중 하나. 추출작업에서 자주 이용됨.

태그⇒ B: 시작 단어, I:B혹은 I뒤에오는 단어 O: 개체명이 아닌 나머지 단어

Ex)New York → (New, B-LOC), (York, I-LOC)