Как получить размер файла из заголовков http



Я хочу получить размер http:/.../ файл, прежде чем я его скачаю. Файл может быть веб-страницей, изображением или мультимедийным файлом. Можно ли это сделать с помощью заголовков HTTP? Как загрузить только заголовок HTTP файла?

758   4  

4 ответов:

Да, предполагая, что HTTP-сервер, с которым вы говорите, поддерживает / разрешает это:

System.Net.WebRequest req = System.Net.HttpWebRequest.Create("http://stackoverflow.com/robots.txt");
req.Method = "HEAD";
using (System.Net.WebResponse resp = req.GetResponse())
{
    int ContentLength;
    if(int.TryParse(resp.Headers.Get("Content-Length"), out ContentLength))
    { 
        //Do something useful with ContentLength here 
    }
}

Если использование метода HEAD не разрешено или заголовок Content-Length отсутствует в ответе сервера, единственный способ определить размер содержимого на сервере-это загрузить его. Поскольку это не особенно надежно, большинство серверов будут включать эту информацию.

Можно ли это сделать с помощью HTTP-заголовков?

Да, это правильный путь. Если информация предоставлена, она находится в заголовке как Content-Length. Заметьте, однако, что это не обязательно так.

Загрузка только заголовка может быть выполнена с помощью запроса HEAD вместо GET. Возможно, поможет следующий код:

HttpWebRequest req = (HttpWebRequest)WebRequest.Create("http://example.com/");
req.Method = "HEAD";
long len;
using(HttpWebResponse resp = (HttpWebResponse)(req.GetResponse()))
{
    len = resp.ContentLength;
}
Обратите внимание на свойство длины содержимого объекта HttpWebResponse – нет необходимости разбирать Заголовок Content-Length вручную.
WebClient webClient = new WebClient();
webClient.OpenRead("http://stackoverflow.com/robots.txt");
long totalSizeBytes= Convert.ToInt64(webClient.ResponseHeaders["Content-Length"]);
Console.WriteLine((totalSizeBytes));

Обратите внимание, что не каждый сервер принимает запросы HTTP HEAD. Один из альтернативных подходов к получению размера файла состоит в том, чтобы сделать вызов HTTP GET к серверу, запрашивающему только часть файла, чтобы сохранить ответ маленьким и получить размер файла из метаданных, возвращаемых как часть заголовка содержимого ответа.

Для этого можно использовать стандарт System.Net.Http.HttpClient. Частичное содержимое запрашивается путем установки диапазона байтов в заголовке сообщения запроса в виде:
    request.Headers.Range = new RangeHeaderValue(startByte, endByte)

Сервер отвечает сообщением, содержащим запрошенный диапазон, а также весь размер файла. Эта информация возвращается в заголовке содержимого ответа (response.Content.Header) с ключом "Content-Range".

Вот пример диапазона содержимого в заголовке содержимого ответного сообщения:

    {
       "Key": "Content-Range",
       "Value": [
         "bytes 0-15/2328372"
       ]
    }

В этом примере значение заголовка подразумевает, что ответ содержит байты от 0 до 15 (т. е. всего 16 байт), а файл-2 328 372 байта в целом.

Вот пример реализации этого метод:

public static class HttpClientExtensions
{
    public static async Task<long> GetContentSizeAsync(this System.Net.Http.HttpClient client, string url)
    {
        using (var request = new System.Net.Http.HttpRequestMessage(System.Net.Http.HttpMethod.Get, url))
        {
            // In order to keep the response as small as possible, set the requested byte range to [0,0] (i.e., only the first byte)
            request.Headers.Range = new System.Net.Http.Headers.RangeHeaderValue(from: 0, to: 0);

            using (var response = await client.SendAsync(request))
            {
                response.EnsureSuccessStatusCode();

                if (response.StatusCode != System.Net.HttpStatusCode.PartialContent) 
                    throw new System.Net.WebException($"expected partial content response ({System.Net.HttpStatusCode.PartialContent}), instead received: {response.StatusCode}");

                var contentRange = response.Content.Headers.GetValues(@"Content-Range").Single();
                var lengthString = System.Text.RegularExpressions.Regex.Match(contentRange, @"(?<=^bytes\s[0-9]+\-[0-9]+/)[0-9]+$").Value;
                return long.Parse(lengthString);
            }
        }
    }
}

Comments

    Ничего не найдено.