언어 차이로 인해 태그 수가 늘어나는 문제는 해결한다 해도, 그 때 그 때의 표현에 따라 양산되는 동의어 태그는 더욱 문제이다. '버릇' '습성' '습관' '관행' '관례' 등은 문맥에 따라 같은 뜻이 되기도, 그렇지 않기도 하다. 이것을 어떻게 태그화할 것인가?
PM 06:17
같은 개념을 설명할 때 한국어와 영어로 모두 태그화하면 그 수가 너무 많아서, 한 가지 언어로 통일할 때가 많다. 예를 들어 'cellular phone' '휴대폰' 등은 '휴대전화'로, '파이어폭스' '불여우' 등은 'firefox'로 통일하여 사용한다.
PM 06:14
태그를 달 때 어려운 건, 하나의 개념에 너무 많은 태그가 붙을 수 있다는 것. 예컨대 디지털 카메라는 '디지털' '카메라' '디지털카메라' '디카' 'digital' 'camera' 'digitalcamera' 'digital_camera' 등이 붙을 수 있다.
PM 06:09