找回密码
 立即注册
搜索
查看: 400|回复: 0

[基础] PHP中使用CURL模拟登录并获取数据实例

  [复制链接]
发表于 2023-2-22 22:06 | 显示全部楼层 |阅读模式
cURL 是一个功能强大的PHP库,使用PHP的cURL库可以简单和有效地抓取网页并采集内容,设置cookie完成模拟登录网页,curl提供了丰富的函数,开发者可以从PHP手册中获取更多关于cURL信息。 此方式模拟的是form表单的提交,对于模拟ajax表单的提交还没有尝试。
<?php
//模拟登录
function login_post($url, $cookie, $post) {
    $curl = curl_init();//初始化curl模块
    curl_setopt($curl, CURLOPT_URL, $url);//登录提交的地址
    curl_setopt($curl, CURLOPT_HEADER, 0);//是否显示头信息
    curl_setopt($curl, CURLOPT_RETURNTRANSFER, 0);//是否自动显示返回的信息
    curl_setopt($curl, CURLOPT_COOKIEJAR, $cookie); //设置Cookie信息保存在指定的文件中
    curl_setopt($curl, CURLOPT_POST, 1);//post方式提交
    curl_setopt($curl, CURLOPT_POSTFIELDS, http_build_query($post));//要提交的信息
    curl_exec($curl);//执行cURL
    curl_close($curl);//关闭cURL资源,并且释放系统资源
}

//登录成功后获取数据
function get_content($url, $cookie) {
    $ch = curl_init();
    curl_setopt($ch, CURLOPT_URL, $url);
    curl_setopt($ch, CURLOPT_HEADER, 0);
    curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
    curl_setopt($ch, CURLOPT_COOKIEFILE, $cookie); //读取cookie
    $rs = curl_exec($ch); //执行cURL抓取页面内容
    curl_close($ch);
    return $rs;
}


//设置post的数据
$post = array (
    'email' => '帐号',
    'password' => '密码',
    'origURL' => 'http://www.renren.com/home',
    'domain' => 'renren.com',
    'key_id' => '1',
    'captcha_type' => 'web_login',
);

//登录地址
$url = "http://www.renren.com/PLogin.do";
//设置cookie保存路径
$cookie = dirname(__FILE__) . '/cookie_jb51.txt';
echo $cookie;
//登录后要获取信息的地址
$url2 = "http://zhibo.renren.com/top";
//模拟登录
login_post($url, $cookie, $post);
//获取登录页的信息
$content = get_content($url2, $cookie);
//删除cookie文件
//@ unlink($cookie);
file_put_contents("./junjun.txt" , $content);
echo $content;
//匹配页面信息
/*$preg = "/<td class='portrait'>(.*)<\/td>/i";
preg_match_all($preg, $content, $arr);
$str = $arr[1][0];
//输出内容
echo $str;*/

?>
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|学习笔记

GMT+8, 2024-12-22 14:54 , Processed in 0.026084 second(s), 13 queries , APCu On.

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表