Парсинг картинок из страницы по url

С помощью CURL и phpDom

Небольшой скрипт для получения необходимых url-изображений

Открыть

        

$url = 'https://retter241.by/notes/';
$base = 'https://retter241.by';
$format = '?';

$c = curl_init($url);//.json
        
curl_setopt($c, CURLOPT_RETURNTRANSFER, true);
curl_setopt($c, CURLOPT_HEADER, false);
curl_setopt($c, CURLOPT_SSL_VERIFYHOST, FALSE);
curl_setopt($c, CURLOPT_SSL_VERIFYPEER, FALSE);

$response['content'][] = curl_exec($c);
$response['errors'][] = curl_error($c);

// выборка через dom
$dom = new DOMDocument;
@$dom->loadHTML($response['content'][0]);
$imgs = $dom->getElementsByTagName('img');

 $imgURLs = [];
 
 //если надо установить ограничение на количество изображений
 $counter = 10;
 
foreach ($imgs as $img) {
    if (preg_match('|assets/components|', $img->getAttribute('src')) && $img->hasAttribute('src') && $counter > 0) {
        $imgURLs[] = $base.strtok($img->getAttribute('src'), '?').$format;
        
        // при ограничении количества
        $counter--;
    }
}

// $string = implode(",", $imgURLs);




< ?php  var_dump($imgURLs); ? >

//результат вида 

 array(10) {
  [0]=>
  string(113) "https://retter241.by/assets/components/phpthumbof/cache/lara-relations-min.9bc94789db37458aa533651f0e6c9614.jpg?"
  [1]=>
  string(124) "https://retter241.by/assets/components/phpthumbof/cache/lara_dndImageuploadermultiple.9bc94789db37458aa533651f0e6c9614.jpg?"
.............
}

        
    
Тэги:

Комментарии (0)


Оставить комментарий

Success/Error Message Goes Here

TOP