在处理中文时,isspace
函数可能会遇到问题,因为中文字符不被视为空白字符。解决方法如下:
def is_whitespace(ch): if ch.isspace() or ord(ch) == 12288 or ord(ch) in range(8192, 8200): return True else: return False
import re def is_whitespace(ch): if re.match(r'[\s\u3000]', ch): return True else: return False
使用上述的自定义函数或正则表达式,可以解决isspace
函数对中文处理的问题。