def parse_lexeme(self, lexeme: str) -> List:
try:
clean_lexeme = strip_noise(lexeme)
low_lexeme = clean_lexeme.lower()
if low_lexeme in self.terms:
lexeme_parts = [clean_lexeme]
else:
lexeme_parts = split_lexeme(lexeme)
parsed_lexeme = []
for lexeme_part in lexeme_parts:
segments = self.segment_into_words(lexeme, lexeme_part)
parsed_lexeme.append((lexeme_part, segments))
return parsed_lexeme
except Exception:
logger.exception('failed to parse lexeme {}'.format(lexeme))
return [(lexeme, [SegmentMap('miss', lexeme, None, lexeme, [0])])]
评论列表
文章目录