Клиент HTTP Python с конвейерной обработкой запросов

Проблема: мне нужно отправить много HTTP-запросов на сервер. Я могу использовать только одно соединение (ограничение для неограниченного сервера). Время отклика сервера и латентность сети слишком высоки - я отстаю.

Обычно запросы не изменяют состояние сервера и не зависят от предыдущего запроса ответа. Поэтому моя идея состоит в том, чтобы просто отправить их друг на друга, выделить объекты ответа и зависеть от Content-Length: входящих ответов для подачи входящих ответов на объект ожидания следующего ожидания. Другими словами: Pipeline - запросы на сервер.

Это, конечно, не совсем безопасно (любой ответ без Content-Length: означает проблему), но мне все равно - в этом случае я всегда могу повторить любые запросы в очереди. (Безопасный способ состоял бы в том, чтобы дождаться заголовка перед отправкой следующего бита.Это могло бы помочь мне достаточно. Нет способа проверить заранее.)

Итак, в идеале я хочу, чтобы следующий клиентский код (который использует задержки клиентов для имитации латентности сети) запускается через три секунды.

Теперь для вопроса $64000: есть ли библиотека Python, которая уже делает это, или мне нужно перевернуть мою? В моем коде используется gevent; При необходимости я мог бы использовать Twisted, но стандартный пул соединений Twisted не поддерживает конвейерные запросы. Я также мог бы написать оболочку для некоторой библиотеки C, если это необходимо, но я бы предпочел собственный код.

Ответы

Ответ 1

Dugong является клиентом только для HTTP/1.1, который утверждает, что поддерживает реальную конвейерную обработку HTTP/1.1. В учебнике есть несколько примеров того, как его использовать, в том числе using темы и еще один с помощью asyncio.

Обязательно убедитесь, что сервер, с которым вы общаетесь, фактически поддерживает конвейерную обработку HTTP/1.1, некоторые серверы утверждают, что поддерживают HTTP/1.1, но не реализуют конвейерную обработку.

Ответ 2

Это не ответ на вопрос вашей библиотеки, но не могли бы вы использовать что-то в качестве селена и их selenium.webdriver.support.ui import WebDriverWait дождаться, когда ваши запросы будут обработаны в течение некоторого времени, а затем сделайте следующий шаг: сохраните ответ для последующего использования или отправьте следующий запрос, если у вас нет соответствующего ответа?
Использование этого интерфейса также позволит использовать прокси для обхода (разумно, в зависимости от вашего приложения и потребностей) лимит сервера (либо 3, либо 5 - большая скорость), если для этого соединения не требуется аутентификация.

Ответ 3

Кажется, вы используете python2.

Для python3 >= 3.5 вы можете использовать цикл async/wait См. asyncio

Кроме того, есть библиотека, построенная сверху для лучшего, более простого использования называемый Trio, доступный по адресу.

Еще одна вещь, о которой я могу думать, - это несколько потоков с замками. Я буду думать о том, как лучше объяснить это, или он может даже работать.