如何在Python中处理多字节字符串

发布于 2021-01-29 14:10:43

PHP中有多字节字符串函数来处理多字节字符串(例如:CJK脚本)。例如,我想通过使用lenpython中的函数来计算一个多字节字符串中有多少个字母,但是它返回的结果不准确(即该字符串中的字节数)

japanese = "桜の花びらたち"
print japanese
print len(japanese)#return 21 instead of 7

PHP中有像mb_strlen这样的软件包或函数吗?

关注者
0
被浏览
125
1 个回答
  • 面试哥
    面试哥 2021-01-29
    为面试而生,有面试问题,就找面试哥。

    使用Unicode字符串

    # Encoding: UTF-8
    
    japanese = u"桜の花びらたち"
    print japanese
    print len(japanese)
    

    注意u字符串前面。

    要将字节字符串转换为Unicode,请使用decode"桜の花びらたち".decode('utf-8')



知识点
面圈网VIP题库

面圈网VIP题库全新上线,海量真题题库资源。 90大类考试,超10万份考试真题开放下载啦

去下载看看