如何在Python中处理多字节字符串
发布于 2021-01-29 14:10:43
PHP中有多字节字符串函数来处理多字节字符串(例如:CJK脚本)。例如,我想通过使用len
python中的函数来计算一个多字节字符串中有多少个字母,但是它返回的结果不准确(即该字符串中的字节数)
japanese = "桜の花びらたち"
print japanese
print len(japanese)#return 21 instead of 7
PHP中有像mb_strlen这样的软件包或函数吗?
关注者
0
被浏览
125
1 个回答
-
使用Unicode字符串:
# Encoding: UTF-8 japanese = u"桜の花びらたち" print japanese print len(japanese)
注意
u
字符串前面。要将字节字符串转换为Unicode,请使用
decode
:"桜の花びらたち".decode('utf-8')