node.js正则表达式获取网页中所有链接的代码实例_Javascript教程-查字典教程网
node.js正则表达式获取网页中所有链接的代码实例
node.js正则表达式获取网页中所有链接的代码实例
发布时间:2016-12-30 来源:查字典编辑
摘要:实现代码复制代码代码如下:varhttp=require('http');//定义函数vargetAHref=function(htmlst...

实现代码

复制代码 代码如下:

var http = require('http');

//定义函数

var getAHref = function(htmlstr){

var reg = /<a.+?href=('|")?([^'"]+)('|")?(?:s+|>)/gim;

var arr = [];

while(tem=reg.exec(htmlstr)){

arr.push(tem[2]);

}

return arr;

}

var qHref = "http://xxx";//设置被查询的目标网址

var req = http.get(qHref, function(res) {

var pageData = "";

res.setEncoding('utf8');

res.on('error', function (errget) {

//出错处理

});

res.on('data', function (chunk) {

pageData += chunk;

});

res.on('end', function(){

//console.dir(pageData);

var content = pageData;//获取到网页内容

var hrefs=getAHref(content);//获取链接

});

});

相关阅读
推荐文章
猜你喜欢
附近的人在看
推荐阅读
拓展阅读
  • 大家都在看
  • 小编推荐
  • 猜你喜欢
  • 最新Javascript教程学习
    热门Javascript教程学习
    编程开发子分类