python实现网页链接提取的方法分享_python教程-查字典教程网
python实现网页链接提取的方法分享
python实现网页链接提取的方法分享
发布时间:2016-12-28 来源:查字典编辑
摘要:复制代码代码如下:#encoding:utf-8importsocketimporthtmllib,formatterdefopen_soc...

复制代码 代码如下:

#encoding:utf-8

import socket

import htmllib,formatter

def open_socket(host,servname):

s=socket.socket(socket.AF_INET,socket.SOCK_STREAM)

port=socket.getservbyname(servname)

s.connect((host,port))

return s

host=''

host=input('请输入网址n')

mysocket=open_socket(host,'http')

message='GET http://%s/nn'%(host,)

mysocket.send(message)

file=mysocket.makefile()

htmldata=file.read()

file.close()

parser=htmllib.HTMLParser(formatter.NullFormatter())

parser.feed(htmldata)

print 'n'.join(parser.anchorlist)

parser.close()

相关阅读
推荐文章
猜你喜欢
附近的人在看
推荐阅读
拓展阅读
  • 大家都在看
  • 小编推荐
  • 猜你喜欢
  • 最新python学习
    热门python学习
    脚本专栏子分类