файл получить содержимое, когда url не существует

Я использую file_get_contents () для доступа к URL-адресу.

file_get_contents('http://somenotrealurl.com/notrealpage');

если URL-адрес не является реальным, он возвращает это сообщение об ошибке. Как я могу заставить его изящно ошибиться, чтобы я знал, что страница не существует, и действовать соответственно без отображения этого сообщения об ошибке?

file_get_contents('http://somenotrealurl.com/notrealpage') 
[function.file-get-contents]: 
failed to open stream: HTTP request failed! HTTP/1.0 404 Not Found 
in myphppage.php on line 3

например, в zend вы можете сказать:if ($request->isSuccessful())

$client = New Zend_Http_Client();
$client->setUri('http://someurl.com/somepage');

$request = $client->request();

if ($request->isSuccessful()) {
 //do stuff with the result
}

7 ответов


вам нужно проверить код ответа HTTP:

function get_http_response_code($url) {
    $headers = get_headers($url);
    return substr($headers[0], 9, 3);
}
if(get_http_response_code('http://somenotrealurl.com/notrealpage') != "200"){
    echo "error";
}else{
    file_get_contents('http://somenotrealurl.com/notrealpage');
}

С такими командами в PHP, вы можете префикс их с @ для подавления таких предупреждений.

@file_get_contents('http://somenotrealurl.com/notrealpage');

функции file_get_contents() возвращает FALSE если происходит сбой, поэтому, если вы проверяете возвращенный результат против этого, вы можете обработать сбой

$pageDocument = @file_get_contents('http://somenotrealurl.com/notrealpage');

if ($pageDocument === false) {
    // Handle error
}

каждый раз, когда вы называете file_get_contents С помощью HTTP-оболочки создается переменная в локальной области:$http_response_header

эта переменная содержит все заголовки HTTP. Этот метод лучше get_headers() функция, так как выполняется только один запрос.

примечание: 2 разных запроса могут заканчиваться по-разному. Например, get_headers() вернет 503, а file_get_contents () вернет 200. И вы получите правильный выход, но не будете использовать его из-за ошибки 503 в функция get_headers() вызова.

function getUrl($url) {
    $content = file_get_contents($url);
    // you can add some code to extract/parse response number from first header. 
    // For example from "HTTP/1.1 200 OK" string.
    return array(
            'headers' => $http_response_header,
            'content' => $content
        );
}

// Handle 40x and 50x errors
$response = getUrl("http://example.com/secret-message");
if ($response['content'] === FALSE)
    echo $response['headers'][0];   // HTTP/1.1 401 Unauthorized
else
    echo $response['content'];

этот aproach также позволяет вам отслеживать несколько заголовков запросов, хранящихся в разных переменных, так как если вы используете file_get_contents() $http_response_header перезаписывается в локальной области.


пока file_get_contents очень лаконично и удобно, я склоняюсь к библиотеке Curl для лучшего контроля. Вот пример.

function fetchUrl($uri) {
    $handle = curl_init();

    curl_setopt($handle, CURLOPT_URL, $uri);
    curl_setopt($handle, CURLOPT_POST, false);
    curl_setopt($handle, CURLOPT_BINARYTRANSFER, false);
    curl_setopt($handle, CURLOPT_HEADER, true);
    curl_setopt($handle, CURLOPT_RETURNTRANSFER, true);
    curl_setopt($handle, CURLOPT_CONNECTTIMEOUT, 10);

    $response = curl_exec($handle);
    $hlength  = curl_getinfo($handle, CURLINFO_HEADER_SIZE);
    $httpCode = curl_getinfo($handle, CURLINFO_HTTP_CODE);
    $body     = substr($response, $hlength);

    // If HTTP response is not 200, throw exception
    if ($httpCode != 200) {
        throw new Exception($httpCode);
    }

    return $body;
}

$url = 'http://some.host.com/path/to/doc';

try {
    $response = fetchUrl($url);
} catch (Exception $e) {
    error_log('Fetch URL failed: ' . $e->getMessage() . ' for ' . $url);
}

простой и функциональный (простой в использовании в любом месте):

function file_contents_exist($url, $response_code = 200)
{
    $headers = get_headers($url);

    if (substr($headers[0], 9, 3) == $response_code)
    {
        return TRUE;
    }
    else
    {
        return FALSE;
    }
}

пример:

$file_path = 'http://www.google.com';

if(file_contents_exist($file_path))
{
    $file = file_get_contents($file_path);
}

чтобы избежать двойных запросов, как прокомментировано Orbling ответ ynh вы можете объединить свои ответы. Если вы получите правильный ответ в первую очередь, используйте это. Если не выяснить в чем проблема (если требуется).

$urlToGet = 'http://somenotrealurl.com/notrealpage';
$pageDocument = @file_get_contents($urlToGet);
if ($pageDocument === false) {
     $headers = get_headers($urlToGet);
     $responseCode = substr($headers[0], 9, 3);
     // Handle errors based on response code
     if ($responseCode == '404') {
         //do something, page is missing
     }
     // Etc.
} else {
     // Use $pageDocument, echo or whatever you are doing
}

вы можете добавить 'ignore_errors' = > true для опций:

$options = array(
  'http' => array(
    'ignore_errors' => true,
    'header' => "Content-Type: application/json\r\n"
    )
);
$context  = stream_context_create($options);
$result = file_get_contents('http://example.com', false, $context);

в этом случае вы сможете прочитать ответ от сервера.