阅读更多
bson.errors.InvalidStringData: strings in documents must be valid UTF-8: ' \xe7\x84\x89\xe8\x80\x86\xe5\x9b'
怎么解决??
solution:
uft-8 的汉字 占3个字节
因此取前两个字符 是这样的 vstr[0:6] ,开始以为是 每个汉字占4个字节,用 vstr[0:8],怪不得 最后一个汉字后面会有“??” 这样在 vim 里 :set fileencoding 显示 fileencoding= 而正常fileencoding=utf8
正是由于上面的原因 ,使得在python里不能正确的使用上面取到的汉字