ruby+nokogori抓取糗事百科前10页并存储进数据库示例
ruby+nokogori抓取糗事百科前10页并存储进数据库示例
发布时间:2016-12-28 来源:查字典编辑
摘要:ruby,nokogori,爬取糗事百科最新的10页加图片比并同时保存进文本跟数据库复制代码代码如下:#encoding:utf-8requ...

ruby,nokogori,爬取糗事百科最新的10页加图片比并同时保存进文本跟数据库

复制代码 代码如下:

#encoding:utf-8

require "open-uri"

require "nokogiri"

require "mysql"

@dbh=Mysql.real_connect("localhost","root","dengli","pachong")

@file=open("qb.txt","w")

def getQiubai(url)

data=open(url){|f| f.read}

doc=Nokogiri::HTML(data)

doc.css('div.block.untagged.mb15.bs2').each{|p|

content=p.css('div.content').text

@file.puts("#{content}n")

img=p.css('div.thumb img').each{|img|

imgAddr=img.attr('src')

@file.puts("#{imgAddr}n")

time=Time.now

sql="INSERT INTO qiushibaike (`body`,`img`,`time`) VALUES ('#{content}','#{imgAddr}','#{time}')"

@dbh.query(sql)

}

}

end

for i in 1..10

@file.puts("这是第#{i}页")

url="http://www.qiushibaike.com/8hr/page/#{i}"

getQiubai(url)

end

推荐文章
猜你喜欢
附近的人在看
推荐阅读
拓展阅读
相关阅读
网友关注
最新ruby专题学习
热门ruby专题学习
脚本专栏子分类