python处理中文编码和判断编码示例_python教程-查字典教程网
python处理中文编码和判断编码示例
python处理中文编码和判断编码示例
发布时间:2016-12-28 来源:查字典编辑
摘要:下面所说的都是针对python2.7复制代码代码如下:#coding:utf-8#chardet需要下载安装importchardet#抓取...

下面所说的都是针对python2.7

复制代码 代码如下:

#coding:utf-8

#chardet 需要下载安装

import chardet

#抓取网页html

line = "http://www.***.com"

html_1 = urllib2.urlopen(line,timeout=120).read()

#print html_1

encoding_dict = chardet.detect(html_1)

#print encoding

web_encoding = encoding_dict['encoding']

if web_encoding == 'utf-8' or web_encoding == 'UTF-8':

html = html_1

else :

html = html_1.decode('gbk','ignore').encode('utf-8')

#有以上处理,整个html就不会是乱码。

相关阅读
推荐文章
猜你喜欢
附近的人在看
推荐阅读
拓展阅读
  • 大家都在看
  • 小编推荐
  • 猜你喜欢
  • 最新python学习
    热门python学习
    脚本专栏子分类