PHP通过伪造和模拟客户端COOKIE登陆来采集抓取远程网址


  平时开发中经常会遇到抓取某个页面内容,但是有时候某些页面需要登陆才能访问,最常见的就是论坛,这时候我们需要来使用curl模拟登陆。
  以下讨论的是和伪造模拟客户端COOKIE登陆采集抓取远程网址相关的PHP通过伪造和模拟客户端COOKIE登陆来采集抓取远程网址页面内容的方法教程文章,内容是本站精心挑选整理的教程,希望对广大的网友给到帮助,下面是详细内容:
  php模拟登陆
  平时开发中经常会遇到抓取某个页面内容,但是有时候某些页面需要登陆才能访问,最常见的就是论坛,这时候我们需要来使用curl模拟登陆。大致思路:需要先请求提取cookies并保存,然后利用保存下来的这个cookies再次发送请求来获取页面内容,下面我们直接上代码
  <?php
  /**
  * Brief PHP读取Curl模拟登陆,获取cookie,带cookie进行请求
  * Date:2016/10/20
  * Time:9:41
  */
  //设置cookie保存位置
  $cookieFile=dirname(__FILE__).'cookieurl.tmp';
  //第一步:获取cookie
  $url='hfxskyyj/;
  $data=array(
  'username'=>'aseoe',
  'password'=>'aseoe',
  );
  //curl初始化
  $ch=curl_init();
  curl_setopt($ch,CURLOPT_URL,$url);
  //设置为post请求
  curl_setopt($ch,CURLOPT_POST,true);
  //设置附带返回header信息为空
  curl_setopt($ch,CURLOPT_HEADER,0);
  //post数据
  curl_setopt($ch,CURLOPT_POSTFIELDS,$data);
  //cookie保存文件位置
  curl_setopt($ch,CURLOPT_COOKIEJAR,$cookieFile);
  //设置数据返回作为变量储存,而不是直接输出
  curl_setopt($ch,CURLOPT_RETURNTRANSFER,true);
  //执行请求
  $ret=curl_exec($ch);
  //关闭连接
  curl_close($ch);
  //第二步:附带cookie请求需要登陆的页面
  $url='hfxskyyj/';
  //curl初始化
  $ch=curl_init();
  curl_setopt($ch,CURLOPT_URL,$url);
  //设置为post请求
  curl_setopt($ch,CURLOPT_POST,true);
  //设置附带返回header信息为空
  curl_setopt($ch,CURLOPT_HEADER,0);
  //设置cookie信息文件位置,注意与第二步中的获取不同,这里是读取
  curl_setopt($ch,CURLOPT_COOKIEFILE,$cookieFile);
  //设置数据返回作为变量储存,而不是直接输出
  curl_setopt($ch,CURLOPT_RETURNTRANSFER,true);
  //执行请求
  $ret=curl_exec($ch);
  //关闭连接
  curl_close($ch);
  //打印抓取内容
  var_dump($ret);
  这样我们就抓取到了需要登陆才能访问页面的内容,注意上面的地址只是一个示例,需要换成你想要抓取页面的地址。
  平时开发中经常会遇到抓取某个页面内容,但是有时候某些页面需要登陆才能访问,最常见的就是论坛,这时候我们需要来使用curl模拟登陆。大致思路:需要先请求提取cookies并保存,然后利用保存下来



上一篇:织梦dede文章增加HTML自定义字段字符被过滤问题

下一篇:PHP解决HTTP和HTTPS跨域共享session的方法及代码实例


php数组
Copyright © 2002-2019 k262电脑网 www.k262.cn 皖ICP备2020016292号
温馨提示:部分文章图片数据来源与网络,仅供参考!版权归原作者所有,如有侵权请联系删除!QQ:251442993 热门搜索 网站地图