동일 패턴에 Parameter만 변경해서 많이 학습하는 것 보다는 동사 조사를 변경해 가면서 다양하게 학습해주는 것이 캡슐에 도움이 됩니다.
- 정해진 패턴만 학습할 경우
- "김치찌개 레시피 보여줘", "된장찌개 레시피 알려줘" 등 "보여줘"나 "알려줘" 처럼 정해진 몇 개의 패턴만 학습시키게 되면 다른 발화가 들어왔을 때, 캡슐이 인식을 제대로 하지 못하는 경우가 발생할 수 있습니다.
- "보여줘", "알려줘" 이외에 "김치찌개는 어떻게 만들어?", "된장찌개 만드는 순서가 뭐야?" 등 다양하게 학습을 시켜주시면 캡슐이 발화를 인식하는데 도움이 됩니다.
- 두 가지 Concept을 붙여서 학습할 경우
- "부천역 1호선 언제와"과 같이 "부천역"과 "1호선"을 조사없이 붙여서 학습할 경우 캡슐이 인식을 제대로 하지 못하는 경우가 발생할 수 있습니다.
- "부천역에 1호선 언제와", "부천역으로 1호선 언제와" 등 다양한 조사 등을 활용하셔서 학습을 시켜주시면 캡슐이 발화를 인식하는데 도움이 됩니다.
- 또한, "몇 분에 도착해", "몇 분 남았어", "도착하려면 얼마나 남았어", "도착시간 알려줘" 등 조사와 동사를 다양하게 학습하는 것도 캡슐이 발화를 인식하는데 도움이 됩니다.
- Parameter를 한 가지 단어로만 학습할 경우
- "빨간색"으로만 학습을 할 경우 "빨강", "빨강색"은 인식을 하지 못하는 경우가 발생할 수 있습니다. 해당 Parameter에 표현을 학습하시면 캡슐이 발화를 인식하는데 도움이 됩니다.
- 예를 들어, 의약품 이름은 아주 다양해서 vocab에 모두 의존할 수 없습니다. vocab에는 자주 사용하는 의약품을 나열하고 vocab에 포함된 것과 포함되지 않은 것을 50% 정도 섞어서 학습시키면 예상하지 못한 의약품 이름이 들어와도 태깅이 잘 될 수 있습니다.
Capsule을 Submission하고 "Capsule Interpreter Training Summary"를 클릭하셔서 항목을 살펴보시고 중복으로 학습된 것들을 다양하게 변경하시면 캡슐이 발화를 인식하는데 도움이 될 수 있습니다.
Comments
0 comments
Please sign in to leave a comment.