输入字符串,输出检测的编码和置信度。
- import urllib
- rawdata = urllib.urlopen('http://yahoo.co.jp/').read()
- import chardetchardet.detect(rawdata)
二、高级用法
处理大量文本,增量式的检测。
- import urllib
使用UniversalDetector()检测器,.feed()添加检测文本,增量检测的时候,如果达到最小阈值,则.done的值为True。
使用.close()关闭,.result为结果。
- import glob
.reset()为UniversalDetector()检测器的重用。
论坛输代码,心累。输完了,代码不见了。
原文:http://www.jianshu.com/p/38b4a283414b