araby.py 文件源码

python
阅读 23 收藏 0 点赞 0 评论 0

项目:tashaphyne 作者: linuxscout 项目源码 文件源码
def strip_harakat(text):
    """Strip Harakat from arabic word except Shadda.
    The striped marks are :
        - FATHA,  DAMMA,  KASRA
        - SUKUN
        - FATHATAN,  DAMMATAN,  KASRATAN,  ,  ,  .
    Example:
        >>> text = u"?????????????"
        >>> stripTashkeel(text)
        ????????
    @param text: arabic text.
    @type text: unicode.
    @return: return a striped text.
    @rtype: unicode.
    """
    # if text:
        # return  re.sub(HARAKAT_PATTERN, u'', text)
    # return text
    if not text:
        return text
    elif is_vocalized(text): 
        for char in HARAKAT:
            text  = text.replace(char, '')
    return text
评论列表
文章目录


问题


面经


文章

微信
公众号

扫码关注公众号