Парсинг — это процесс сбора информации в сети. Фактически, это специальная программа, которая автоматически выполняет процесс сбора данных, после чего преподносит их в удобочитаемом виде. Многие специалисты уже поняли выгоду использования данной методики и применяют ее для создания таблиц, отчетов, рекламных текстов и многого другого. Именно парсинг помогает узнает среднюю стоимость по сети какого-либо наименования.
Легко представить ситуацию, когда необходимо создать рекламный текст для какого-либо продукта или услуги. Но, для того, чтобы предоставить грамотную и актуальную информацию, в лучшую сторону отличающуюся от конкурентов, необходимо в первую очередь эту самую информацию собрать и проанализировать. Парсер выполняет следующие задачи:
<?php // // //****Парсер новостей из групп, //Дата регистрации 19.10.2020 время 07-50 // // // // // function cURL($url){ $user_agent = ‘Mozilla/5.0 (Windows NT 6.3; WOW64; rv:35.0) Gecko/20100101 Firefox/37.0’; $ci = curl_init(); curl_setopt($ci, CURLOPT_RETURNTRANSFER, true); curl_setopt($ci, CURLOPT_FOLLOWLOCATION, true); curl_setopt($ci, CURLOPT_MAXREDIRS, 3); curl_setopt($ci, CURLOPT_USERAGENT, $user_agent); curl_setopt($ci, CURLOPT_URL, $url); $ret = curl_exec($ci); curl_close($ci); return $ret; } $urlArray[] = array( ‘-64209172’ //порядок заполнения в полной версии. ); $max = count($urlArray) — 1; $countInt = (int)@file_get_contents(«./count.txt»); $f = @fopen(«./count.txt», «w»); $ntext = ($countInt >= $max) ? 0 : $countInt + 1; @fwrite($f, $ntext); @fclose($f); // количество дней $token = ‘81887f3807d9f4600ac9a87e94ec121141d72632bb139f1fa2441f8d75415c19cbaa15dab19f5a72e5bac6’; //меняем на свой foreach($urlArray[$countInt] as $key) { if((int)$key < 0) $where = ‘owner_id=’.$key; else $where = ‘domain=’.$key; $url = ‘https://api.vk.com/method/wall.get?v=5.30&’.$where.’&count=100&access_token=’.$token; $resultParsing = cURL($url); $array = json_decode($resultParsing)->response->items; for($i=0; $i < count($array); $i++){ $text = htmlspecialchars($array[$i]->text); if (preg_match(«/http[\S]+/ism»,$text)) continue; if (preg_match(«/vk\.com+/ism»,$text)) continue; $content[] = $text; $text_ok = preg_replace(‘@((https?://)?([-\w]+\.[-\w\.]+)+\w(:\d+)?(/([-\w/_\.]*(\?\S+)?)?)*)@’, », $text); $normalDate = date(‘d.m.Y’, $date); //Данные для базы данных //Добавление в базу данных на Wopdress ………………………… echo ‘<br>’.$text_ok.'<br> ‘.$normalDate.'<br>Фото’.$photo; echo ‘<br>Открыть запись <a target=»_blank» href=https://vk.com/wall’.$id_grup.’_’.$id_post.’>ОТКРЫТЬ</a><br><hr>’; //var_dump ($query); echo «<pre>»; } } //Добавляем 10 новых постов в группу ?>
<?php // // //****Парсер новостей из групп, //Дата регистрации 19.10.2020 время 07-50 // // // // //
function cURL($url){ $user_agent = ‘Mozilla/5.0 (Windows NT 6.3; WOW64; rv:35.0) Gecko/20100101 Firefox/37.0’; $ci = curl_init(); curl_setopt($ci, CURLOPT_RETURNTRANSFER, true); curl_setopt($ci, CURLOPT_FOLLOWLOCATION, true); curl_setopt($ci, CURLOPT_MAXREDIRS, 3); curl_setopt($ci, CURLOPT_USERAGENT, $user_agent); curl_setopt($ci, CURLOPT_URL, $url); $ret = curl_exec($ci); curl_close($ci); return $ret; }
$urlArray[] = array( ‘-64209172’ //порядок заполнения в полной версии. );
$max = count($urlArray) — 1; $countInt = (int)@file_get_contents(«./count.txt»); $f = @fopen(«./count.txt», «w»); $ntext = ($countInt >= $max) ? 0 : $countInt + 1; @fwrite($f, $ntext); @fclose($f); // количество дней
$token = ‘81887f3807d9f4600ac9a87e94ec121141d72632bb139f1fa2441f8d75415c19cbaa15dab19f5a72e5bac6’; //меняем на свой foreach($urlArray[$countInt] as $key) { if((int)$key < 0) $where = ‘owner_id=’.$key; else $where = ‘domain=’.$key; $url = ‘https://api.vk.com/method/wall.get?v=5.30&’.$where.’&count=100&access_token=’.$token; $resultParsing = cURL($url); $array = json_decode($resultParsing)->response->items; for($i=0; $i < count($array); $i++){ $text = htmlspecialchars($array[$i]->text); if (preg_match(«/http[\S]+/ism»,$text)) continue; if (preg_match(«/vk\.com+/ism»,$text)) continue; $content[] = $text;
$text_ok = preg_replace(‘@((https?://)?([-\w]+\.[-\w\.]+)+\w(:\d+)?(/([-\w/_\.]*(\?\S+)?)?)*)@’, », $text); $normalDate = date(‘d.m.Y’, $date);
//Данные для базы данных
//Добавление в базу данных на Wopdress …………………………
echo ‘<br>’.$text_ok.'<br> ‘.$normalDate.'<br>Фото’.$photo; echo ‘<br>Открыть запись <a target=»_blank» href=https://vk.com/wall’.$id_grup.’_’.$id_post.’>ОТКРЫТЬ</a><br><hr>’; //var_dump ($query);
echo «<pre>»; } } //Добавляем 10 новых постов в группу ?>
Таким образом можно собирать любую информацию через стены групп ВК, а также данные о пользователях. После этого пользователь парсера сможет составлять рекламные тексты. Парсер также позволяет собрать много уникального текста для сайтов, который затем можно размещать на своих проектах.
Будь то рекламодатель, продавец или просто пользователь, читатель должен осознавать важность использования парсера в процессе сбора данных.
Конечно, один и тот же код невозможно использовать в различных целях, зато всегда можно заказать доработку существующего скрипта или разработку нового.
Все это поможет оптимизировать сбор данных, ускорит рабочие процессы, а также приведет к лучшим результатам. Заказывайте разработку уникального скрипта сегодня и оцените его возможности.
Остались вопросы? Пишите в комментариях
Автор статьи
Алексей Гаврилов