热搜:NVER node 开发 php

CURL抓取的网页中,通过相对路径引用了其他页面,如何解决cookie问题?

2024-09-15 14:10:01
CURL抓取的网页中,通过相对路径引用了其他页面,如何解决cookie问题?

curl 相对路径 cookie

例如,用curl抓取页面A,页面A通过相对路径引用了页面B,页面B有Set-Cookie的头部,而页面A没有Set-Cooike。
我只能curl抓取页面A,但是抓不到cookie,因为cookie是在页面B设置的。求高手解决问题!万分感激!

回复讨论(解决方案)

分两次/多次抓取
其实对于ajax/验证码等等都是这样做的

	header("Content-type:text/html;charset=utf-8");	function request_by_curl($remote_server, $post_string)	{		$ch = curl_init();		curl_setopt($ch, CURLOPT_URL, $remote_server);		curl_setopt($ch, CURLOPT_POSTFIELDS, $post_string);		curl_setopt($ch, CURLOPT_RETURNTRANSFER, true);		curl_setopt($ch, CURLOPT_NOBODY, false);		curl_setopt($ch, CURLOPT_HEADER,true);		curl_setopt($ch, CURLOPT_HTTPHEADER, array());		$data = curl_exec($ch);		curl_close($ch);		return $data;	}	//获取验证码	file_get_contents("http://jysx.scnu.edu.cn/VerifyImg.aspx");	$cookie = $http_response_header[6];	$code = substr($cookie,23,4);	echo $code."
"; //post登录 $remote_server = "http://jysx.scnu.edu.cn/login.aspx"; $post_string = 'act=login&type=ajax&name=20102301025&pass=523523&verify='.$code; echo request_by_curl($remote_server,$post_string);


这是我模拟登录华南师范大学抢实习的php代码,好像不行啊

可以了!!!!!

为什么这个网站会把验证码写到头信息里??