Сокет, обнаружение соединения теряется

Я подключаю серверный процесс и клиентский процесс с TCP-соединением, и я должен определить что физическое соединение между двумя машинами не работает. Я пытаюсь сделать это, используя keepalive,
уменьшая значения по умолчанию для системы по умолчанию:

TCP_KEEPIDLE = 5
TCP_KEEPCNT = 5
TCP_KEEPINTVL = 1

Когда соединение опускается (я отсоединяю кабель), только сервер через 10 секунд обнаруживает, что соединение было потеряно, клиент просто зависает при отправке.

Это код клиента:

#include <iostream>
#include <string.h>
#include <sys/socket.h>
#include <stdlib.h>
#include <arpa/inet.h>
#include <errno.h>
#include <netinet/tcp.h>

int main(int argc, char** argv) {
  char myVector[1600];

  int mySocket = socket(AF_INET, SOCK_STREAM, IPPROTO_IP);
  if (mySocket < 0 ) {
    std::cout << "error creating the socket" << strerror(errno) << std::endl;
    ::exit(-1);
 }

 struct sockaddr_in sin;
 memset( (char *)&sin, 0, sizeof( sin ) );
 sin.sin_addr.s_addr = inet_addr("192.168.21.27");
 sin.sin_port   = htons(7788);
 sin.sin_family = AF_INET;

 if ( connect( mySocket, (struct sockaddr *)&sin, sizeof( sin )) < 0 ) {
   std::cout << "Error on connection: " << strerror(errno) << std::endl;
   ::exit(-1);
 }

 int optval = 1;
 socklen_t optlen = sizeof(optval);

 /*Enabling keep alive*/
 if(setsockopt(mySocket, SOL_SOCKET, SO_KEEPALIVE, &optval, optlen) < 0) {
   std::cout << "Error setting SO_KEEPALIVE: " << strerror(errno) << std::endl;
 }

 optval = 5;
 optlen = sizeof(optval);
 if(setsockopt(mySocket, SOL_TCP, TCP_KEEPIDLE, &optval, optlen) < 0) {
    std::cout << "Error setting TCP_KEEPIDLE: " << strerror(errno) << std::endl;
 }

 optval = 5;
 optlen = sizeof(optval);
 if(setsockopt(mySocket, SOL_TCP, TCP_KEEPCNT, &optval, optlen) < 0) {
   std::cout << "Error setting TCP_KEEPCNT: " << strerror(errno) << std::endl;
 }

 optval = 1;
 optlen = sizeof(optval);
 if(setsockopt(mySocket, SOL_TCP, TCP_KEEPINTVL, &optval, optlen) < 0) {
   std::cout << "Error setting TCP_KEEPINTVL: " << strerror(errno) << std::endl;
 }

 for (;;) {
   ssize_t myRet= ::send(mySocket,
                                      myVector,
                                      sizeof(myVector),
                                     0);
   if (myRet < 0) {
     std::cout << "Error: " << strerror(errno) << std::endl;
     break;
   }
   std::cout << myRet << "."; std::cout.flush();
   sleep(1);
 }
}

Я уверен, что мне что-то не хватает, но что?

Ответы

Ответ 1

TCP Keepalive не предназначен для этого использования.

Если вы хотите обнаружить отключения на уровне приложения, выполните протоколы, такие как SSH, IMAP и IRC, - выполните сообщение типа echo/ping на уровне приложения. Отправляйте их на регулярной основе, и если вы не получите своевременный ответ, можно предположить, что соединение не работает.

Ответ 2

Мы задавались вопросом об этом в нашей компании некоторое время назад: "Как определить, что соединение опустилось?". Чтобы достоверно оценить эту проблему, нам пришлось внедрить систему "heart-beat", то есть клиент регулярно проверяет (каждую секунду в нашем случае), что сервер все еще существует, делая псевдо-пинг. Если вы не хотите этого делать, вы можете дождаться, что ОС действительно обнаружит, что соединение опустилось, но не ожидайте, что оно будет надежным...

Ответ 3

Итак, после дальнейших исследований, даже если "TCP Keepalive" не предназначен для этого использования, я обнаружил, что активные живые зонды начинают посылаться на "незанятое соединение". Теперь возникает вопрос: "когда соединение рассматривается в состоянии ожидания?". Соединение считается бездействующим, когда данные "не передаются, поэтому, если один из два пэра блокируются при отправке (...), на самом деле передаются некоторые данные, и соединение не считается бездействующим. Я предполагаю, что единственный вариант, который у меня есть сейчас, - это сделать ping/pong, используя send/recv с таймаутом, объявив соединение "потерянным", когда истечет срок действия этих таймеров.

Ответ 4

Gaetano, IMO, TCP keep-alives могут использоваться для обнаружения мертвых соединений. В вашем примере клиент действительно может быть висит в передаче, ожидая, когда TCP-попытки исчерпают себя. В зависимости от алгоритма отсрочки и состояния стека TCP стека это может длиться несколько минут без каких-либо зондов с живым хранением и, следовательно, не может выходить из keepcnt.

Я предполагаю, что сервер в основном блокируется чтением, и в этом случае его keep-alives будут отправляться каждые секунды keepidle/slowhz (slowhz часто бывает 2 вместо 1), и он будет обнаруживать потери соединения довольно быстро.

Если вы захватили трассировку пакетов с помощью tcpdump, вы точно увидите, что происходит на проводе.