У меня есть этот код для входа в Google с помощью Simple DOM Parser с curl. Я попытался добавить файл cookiejar, но безрезультатно. Я продолжаю получать сообщение:
Кукиз вашего браузера в настоящий момент выключены. Пожалуйста, включите его.
Любая идея о том, как это решить?
Вот мой код для справки:
$html = file_get_html('https://accounts.google.com/ServiceLogin?hl=en&service=alerts&continue=http://www.google.com/alerts/manage'); //... some code for getting post data here $curl_connection = curl_init('https://accounts.google.com/ServiceLoginAuth'); curl_setopt($curl_connection, CURLOPT_CONNECTTIMEOUT, 30); curl_setopt($curl_connection, CURLOPT_USERAGENT, "Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1)"); curl_setopt($curl_connection, CURLOPT_RETURNTRANSFER, true); curl_setopt($curl_connection, CURLOPT_SSL_VERIFYPEER, false); curl_setopt($curl_connection, CURLOPT_FOLLOWLOCATION, 1); curl_setopt($curl_connection, CURLOPT_COOKIEJAR, COOKIEJAR); curl_setopt($curl_connection, CURLOPT_COOKIEFILE, COOKIEJAR); curl_setopt($curl_connection, CURLOPT_HEADER, true); curl_setopt($curl_connection, CURLOPT_RETURNTRANSFER,1); curl_setopt($curl_connection, CURLOPT_CONNECTTIMEOUT, 120); curl_setopt($curl_connection, CURLOPT_TIMEOUT, 120); curl_setopt($curl_connection, CURLOPT_POSTFIELDS, $post_string); $result = curl_exec($curl_connection); curl_close($curl_connection); echo $result;
Вот какой модифицированный код работает.
Сначала он запрашивает страницу входа в систему, чтобы получить начальные файлы cookie и извлечь необходимые значения для формы входа. Затем он выполняет запись в службу входа в систему. Затем он проверяет, пытается ли он использовать javascript и метатеги для перенаправления на целевой URL.
Казалось, что у вас уже есть код для захвата полей формы, поэтому я не опубликовал мои сообщения, но если вам это нужно, дайте мне знать. Просто убедитесь, что $formFields
является ассоциативным массивом с ключами, являющимися именем поля, а значение – значением поля.
<?php /** * Log in to Google account and go to account page * */ $USERNAME = 'youraccount@gmail.com'; $PASSWORD = 'password'; $COOKIEFILE = 'cookies.txt'; // initialize curl handle used for all requests $ch = curl_init(); // set some options on the handle curl_setopt($ch, CURLOPT_CONNECTTIMEOUT, 30); curl_setopt($ch, CURLOPT_USERAGENT, "Mozilla/5.0 (X11; Ubuntu; Linux x86_64; rv:49.0) Gecko/20100101 Firefox/49.0"); curl_setopt($ch, CURLOPT_RETURNTRANSFER, true); curl_setopt($ch, CURLOPT_SSL_VERIFYPEER, false); curl_setopt($ch, CURLOPT_FOLLOWLOCATION, 1); curl_setopt($ch, CURLOPT_COOKIEJAR, $COOKIEFILE); curl_setopt($ch, CURLOPT_COOKIEFILE, $COOKIEFILE); curl_setopt($ch, CURLOPT_HEADER, 0); curl_setopt($ch, CURLOPT_RETURNTRANSFER,1); curl_setopt($ch, CURLOPT_CONNECTTIMEOUT, 120); curl_setopt($ch, CURLOPT_TIMEOUT, 120); // url of our first request fetches the account login page curl_setopt($ch, CURLOPT_URL, 'https://accounts.google.com/ServiceLogin?hl=en&service=alerts&continue=http://www.google.com/alerts/manage'); $data = curl_exec($ch); // extract form fields from account login page $formFields = getFormFields($data); // inject email and password into form $formFields['Email'] = $USERNAME; $formFields['Passwd'] = $PASSWORD; unset($formFields['PersistentCookie']); $post_string = http_build_query($formFields); // build urlencoded POST string for login // set url to login page as a POST request curl_setopt($ch, CURLOPT_URL, 'https://accounts.google.com/ServiceLoginAuth'); curl_setopt($ch, CURLOPT_POST, 1); curl_setopt($ch, CURLOPT_POSTFIELDS, $post_string); // execute login request $result = curl_exec($ch); // check for "Redirecting" message in title to indicate success // based on your language - you may need to change this to match some other string if (strpos($result, '<title>Redirecting') === false) { die("Login failed"); var_dump($result); } // login likely succeeded - request account page; unset POST so we do a regular GET curl_setopt($ch, CURLOPT_URL, 'https://myaccount.google.com/?utm_source=OGB'); curl_setopt($ch, CURLOPT_POST, 0); curl_setopt($ch, CURLOPT_POSTFIELDS, null); // execute request for login page using our cookies $result = curl_exec($ch); echo $result; // helpef functions below // find google "#gaia_loginform" for logging in function getFormFields($data) { if (preg_match('/(<form.*?id=.?gaia_loginform.*?<\/form>)/is', $data, $matches)) { $inputs = getInputs($matches[1]); return $inputs; } else { die('didnt find login form'); } } // extract all <input fields from a form function getInputs($form) { $inputs = array(); $elements = preg_match_all('/(<input[^>]+>)/is', $form, $matches); if ($elements > 0) { for($i = 0; $i < $elements; $i++) { $el = preg_replace('/\s{2,}/', ' ', $matches[1][$i]); if (preg_match('/name=(?:["\'])?([^"\'\s]*)/i', $el, $name)) { $name = $name[1]; $value = ''; if (preg_match('/value=(?:["\'])?([^"\'\s]*)/i', $el, $value)) { $value = $value[1]; } $inputs[$name] = $value; } } } return $inputs; }
не<?php /** * Log in to Google account and go to account page * */ $USERNAME = 'youraccount@gmail.com'; $PASSWORD = 'password'; $COOKIEFILE = 'cookies.txt'; // initialize curl handle used for all requests $ch = curl_init(); // set some options on the handle curl_setopt($ch, CURLOPT_CONNECTTIMEOUT, 30); curl_setopt($ch, CURLOPT_USERAGENT, "Mozilla/5.0 (X11; Ubuntu; Linux x86_64; rv:49.0) Gecko/20100101 Firefox/49.0"); curl_setopt($ch, CURLOPT_RETURNTRANSFER, true); curl_setopt($ch, CURLOPT_SSL_VERIFYPEER, false); curl_setopt($ch, CURLOPT_FOLLOWLOCATION, 1); curl_setopt($ch, CURLOPT_COOKIEJAR, $COOKIEFILE); curl_setopt($ch, CURLOPT_COOKIEFILE, $COOKIEFILE); curl_setopt($ch, CURLOPT_HEADER, 0); curl_setopt($ch, CURLOPT_RETURNTRANSFER,1); curl_setopt($ch, CURLOPT_CONNECTTIMEOUT, 120); curl_setopt($ch, CURLOPT_TIMEOUT, 120); // url of our first request fetches the account login page curl_setopt($ch, CURLOPT_URL, 'https://accounts.google.com/ServiceLogin?hl=en&service=alerts&continue=http://www.google.com/alerts/manage'); $data = curl_exec($ch); // extract form fields from account login page $formFields = getFormFields($data); // inject email and password into form $formFields['Email'] = $USERNAME; $formFields['Passwd'] = $PASSWORD; unset($formFields['PersistentCookie']); $post_string = http_build_query($formFields); // build urlencoded POST string for login // set url to login page as a POST request curl_setopt($ch, CURLOPT_URL, 'https://accounts.google.com/ServiceLoginAuth'); curl_setopt($ch, CURLOPT_POST, 1); curl_setopt($ch, CURLOPT_POSTFIELDS, $post_string); // execute login request $result = curl_exec($ch); // check for "Redirecting" message in title to indicate success // based on your language - you may need to change this to match some other string if (strpos($result, '<title>Redirecting') === false) { die("Login failed"); var_dump($result); } // login likely succeeded - request account page; unset POST so we do a regular GET curl_setopt($ch, CURLOPT_URL, 'https://myaccount.google.com/?utm_source=OGB'); curl_setopt($ch, CURLOPT_POST, 0); curl_setopt($ch, CURLOPT_POSTFIELDS, null); // execute request for login page using our cookies $result = curl_exec($ch); echo $result; // helpef functions below // find google "#gaia_loginform" for logging in function getFormFields($data) { if (preg_match('/(<form.*?id=.?gaia_loginform.*?<\/form>)/is', $data, $matches)) { $inputs = getInputs($matches[1]); return $inputs; } else { die('didnt find login form'); } } // extract all <input fields from a form function getInputs($form) { $inputs = array(); $elements = preg_match_all('/(<input[^>]+>)/is', $form, $matches); if ($elements > 0) { for($i = 0; $i < $elements; $i++) { $el = preg_replace('/\s{2,}/', ' ', $matches[1][$i]); if (preg_match('/name=(?:["\'])?([^"\'\s]*)/i', $el, $name)) { $name = $name[1]; $value = ''; if (preg_match('/value=(?:["\'])?([^"\'\s]*)/i', $el, $value)) { $value = $value[1]; } $inputs[$name] = $value; } } } return $inputs; }