Неблокирующий fifo Linux (ведение журнала по требованию)

мне нравится регистрировать вывод программ "по требованию". Например. выход регистрируется на терминале, но другой процесс может подключиться к текущему выходу в любое время.

классическим способом было бы:

myprogram 2>&1 | tee /tmp/mylog

и по требованию

tail /tmp/mylog

однако это создаст постоянно растущий файл журнала, даже если он не будет использоваться до тех пор, пока диск не закончится. Итак, моя попытка была:--5-->

mkfifo /tmp/mylog
myprogram 2>&1 | tee /tmp/mylog

и по требованию

cat /tmp/mylog

теперь я могу читать /tmp / mylog на в любой момент. Однако любой вывод блокирует программу, пока не будет прочитан /tmp/mylog. Мне нравится, что fifo очищает любые входящие данные,которые не считываются. Как это сделать?

8 ответов


вдохновленный вашим вопросом, я написал простую программу, которая позволит вам сделать это:

$ myprogram 2>&1 | ftee /tmp/mylog

он ведет себя так же tee но клонирует stdin в stdout и в именованный канал (требование на данный момент) без блокировки. Это означает, что если вы хотите войти таким образом, может случиться, что вы потеряете свои данные журнала, но я думаю, что это приемлемо в вашем сценарии. Трюк состоит в том, чтобы заблокировать сигнал SIGPIPE и игнорировать ошибку при записи в сломанный fifo. Этот образец может быть оптимизирован различными способами, конечно, но до сих пор он выполняет свою работу, я думаю.

/* ftee - clone stdin to stdout and to a named pipe 
(c) racic@stackoverflow
WTFPL Licence */

#include <stdio.h>
#include <stdlib.h>
#include <string.h>
#include <sys/types.h>
#include <sys/stat.h>
#include <fcntl.h>
#include <errno.h>
#include <signal.h>
#include <unistd.h>

int main(int argc, char *argv[])
{
    int readfd, writefd;
    struct stat status;
    char *fifonam;
    char buffer[BUFSIZ];
    ssize_t bytes;

    signal(SIGPIPE, SIG_IGN);

    if(2!=argc)
    {
        printf("Usage:\n someprog 2>&1 | %s FIFO\n FIFO - path to a"
            " named pipe, required argument\n", argv[0]);
        exit(EXIT_FAILURE);
    }
    fifonam = argv[1];

    readfd = open(fifonam, O_RDONLY | O_NONBLOCK);
    if(-1==readfd)
    {
        perror("ftee: readfd: open()");
        exit(EXIT_FAILURE);
    }

    if(-1==fstat(readfd, &status))
    {
        perror("ftee: fstat");
        close(readfd);
        exit(EXIT_FAILURE);
    }

    if(!S_ISFIFO(status.st_mode))
    {
        printf("ftee: %s in not a fifo!\n", fifonam);
        close(readfd);
        exit(EXIT_FAILURE);
    }

    writefd = open(fifonam, O_WRONLY | O_NONBLOCK);
    if(-1==writefd)
    {
        perror("ftee: writefd: open()");
        close(readfd);
        exit(EXIT_FAILURE);
    }

    close(readfd);

    while(1)
    {
        bytes = read(STDIN_FILENO, buffer, sizeof(buffer));
        if (bytes < 0 && errno == EINTR)
            continue;
        if (bytes <= 0)
            break;

        bytes = write(STDOUT_FILENO, buffer, bytes);
        if(-1==bytes)
            perror("ftee: writing to stdout");
        bytes = write(writefd, buffer, bytes);
        if(-1==bytes);//Ignoring the errors
    }
    close(writefd); 
    return(0);
}

вы можете скомпилировать его с помощью этой стандартной команды:

$ gcc ftee.c -o ftee

вы можете быстро проверить это, запустив например:

$ ping www.google.com | ftee /tmp/mylog

$ cat /tmp/mylog

Также обратите внимание - это не мультиплексор. У вас может быть только один процесс $ cat /tmp/mylog одновременно.


Это (очень) старый нить, но я столкнулся с подобной проблемой в последнее время. На самом деле, мне нужно клонирование stdin в stdout с копией в канал, который не блокирует. предложенный ftee в первом ответе действительно помог там, но был (для моего случая использования) слишком изменчивым. Это значит, что я потерял данные, которые мог бы обработать, если бы добрался до них вовремя.

сценарий, с которым я столкнулся, заключается в том, что у меня есть процесс (some_process), который агрегирует некоторые данные и записывает его результаты каждый три секунды в stdout. (Упрощенная) настройка выглядела так (в реальной настройке я использую именованный канал):

some_process | ftee >(onlineAnalysis.pl > results) | gzip > raw_data.gz

теперь, raw_data.gz должен быть сжат и должен быть полным. ftee делает эту работу очень хорошо. Но труба, которую я использую в середине, была слишком медленной, чтобы захватить данные, но она была достаточно быстрой, чтобы обработать все, если бы она могла добраться до нее, что было проверено с помощью обычного тройника. Однако нормальный тройник блокирует, если что-то случится с неназванной трубой, и как я хочу чтобы иметь возможность подключаться по требованию, tee не является вариантом. Вернемся к теме: стало лучше, когда я поставил буфер между ними, в результате чего:

some_process | ftee >(mbuffer -m 32M| onlineAnalysis.pl > results) | gzip > raw_data.gz

но это все еще теряло данные, которые я мог бы обработать. Поэтому я пошел вперед и расширил ftee, предложенный ранее, до буферизованной версии (bftee). Он по-прежнему имеет все те же свойства, но использует (неэффективно ?) внутренний буфер в случае сбоя записи. Он по-прежнему теряет данные, если буфер работает полностью, но он прекрасно работает для моего случая. Как всегда есть много возможностей для улучшения, но поскольку я скопировал код отсюда, я хотел бы поделиться им с людьми, которые могут его использовать.

/* bftee - clone stdin to stdout and to a buffered, non-blocking pipe 
    (c) racic@stackoverflow
    (c) fabraxias@stackoverflow
    WTFPL Licence */

    #include <stdio.h>
    #include <stdlib.h>
    #include <string.h>
    #include <sys/types.h>
    #include <sys/stat.h>
    #include <fcntl.h>
    #include <errno.h>
    #include <signal.h>
    #include <unistd.h>

    // the number of sBuffers that are being held at a maximum
    #define BUFFER_SIZE 4096
    #define BLOCK_SIZE 2048

    typedef struct {
      char data[BLOCK_SIZE];
      int bytes;
    } sBuffer;

    typedef struct {
      sBuffer *data;  //array of buffers
      int bufferSize; // number of buffer in data
      int start;      // index of the current start buffer
      int end;        // index of the current end buffer
      int active;     // number of active buffer (currently in use)
      int maxUse;     // maximum number of buffers ever used
      int drops;      // number of discarded buffer due to overflow
      int sWrites;    // number of buffer written to stdout
      int pWrites;    // number of buffers written to pipe
    } sQueue;

    void InitQueue(sQueue*, int);              // initialized the Queue
    void PushToQueue(sQueue*, sBuffer*, int);  // pushes a buffer into Queue at the end 
    sBuffer *RetrieveFromQueue(sQueue*);       // returns the first entry of the buffer and removes it or NULL is buffer is empty
    sBuffer *PeakAtQueue(sQueue*);             // returns the first entry of the buffer but does not remove it. Returns NULL on an empty buffer
    void ShrinkInQueue(sQueue *queue, int);    // shrinks the first entry of the buffer by n-bytes. Buffer is removed if it is empty
    void DelFromQueue(sQueue *queue);          // removes the first entry of the queue

    static void sigUSR1(int);                  // signal handled for SUGUSR1 - used for stats output to stderr
    static void sigINT(int);                   // signla handler for SIGKILL/SIGTERM - allows for a graceful stop ?

    sQueue queue;                              // Buffer storing the overflow
    volatile int quit;                         // for quiting the main loop

    int main(int argc, char *argv[])
    {   
        int readfd, writefd;
        struct stat status;
        char *fifonam;
        sBuffer buffer;
        ssize_t bytes;
        int bufferSize = BUFFER_SIZE;

        signal(SIGPIPE, SIG_IGN);
        signal(SIGUSR1, sigUSR1);
        signal(SIGTERM, sigINT);
        signal(SIGINT,  sigINT);

        /** Handle commandline args and open the pipe for non blocking writing **/

        if(argc < 2 || argc > 3)
        {   
            printf("Usage:\n someprog 2>&1 | %s FIFO [BufferSize]\n"
                   "FIFO - path to a named pipe, required argument\n"
                   "BufferSize - temporary Internal buffer size in case write to FIFO fails\n", argv[0]);
            exit(EXIT_FAILURE);
        }

        fifonam = argv[1];
        if (argc == 3) {
          bufferSize = atoi(argv[2]);
          if (bufferSize == 0) bufferSize = BUFFER_SIZE;
        }

        readfd = open(fifonam, O_RDONLY | O_NONBLOCK);
        if(-1==readfd)
        {   
            perror("bftee: readfd: open()");
            exit(EXIT_FAILURE);
        }

        if(-1==fstat(readfd, &status))
        {
            perror("bftee: fstat");
            close(readfd);
            exit(EXIT_FAILURE);
        }

        if(!S_ISFIFO(status.st_mode))
        {
            printf("bftee: %s in not a fifo!\n", fifonam);
            close(readfd);
            exit(EXIT_FAILURE);
        }

        writefd = open(fifonam, O_WRONLY | O_NONBLOCK);
        if(-1==writefd)
        {
            perror("bftee: writefd: open()");
            close(readfd);
            exit(EXIT_FAILURE);
        }

        close(readfd);


        InitQueue(&queue, bufferSize);
        quit = 0;

        while(!quit)
        {
            // read from STDIN
            bytes = read(STDIN_FILENO, buffer.data, sizeof(buffer.data));

            // if read failed due to interrupt, then retry, otherwise STDIN has closed and we should stop reading
            if (bytes < 0 && errno == EINTR) continue;
            if (bytes <= 0) break;

            // save the number if read bytes in the current buffer to be processed
            buffer.bytes = bytes;

            // this is a blocking write. As long as buffer is smaller than 4096 Bytes, the write is atomic to a pipe in Linux
            // thus, this cannot be interrupted. however, to be save this should handle the error cases of partial or interrupted write none the less.
            bytes = write(STDOUT_FILENO, buffer.data, buffer.bytes);
            queue.sWrites++;

            if(-1==bytes) {
                perror("ftee: writing to stdout");
                break;
            }

            sBuffer *tmpBuffer = NULL;

            // if the queue is empty (tmpBuffer gets set to NULL) the this does nothing - otherwise it tries to write
            // the buffered data to the pipe. This continues until the Buffer is empty or the write fails.
            // NOTE: bytes cannot be -1  (that would have failed just before) when the loop is entered. 
            while ((bytes != -1) && (tmpBuffer = PeakAtQueue(&queue)) != NULL) {
               // write the oldest buffer to the pipe
               bytes = write(writefd, tmpBuffer->data, tmpBuffer->bytes);

               // the  written bytes are equal to the buffer size, the write is successful - remove the buffer and continue
               if (bytes == tmpBuffer->bytes) {
                 DelFromQueue(&queue);
                 queue.pWrites++;
               } else if (bytes > 0) {
                 // on a positive bytes value there was a partial write. we shrink the current buffer
                 //  and handle this as a write failure
                 ShrinkInQueue(&queue, bytes);
                 bytes = -1;
               }
            }
            // There are several cases here:
            // 1.) The Queue is empty -> bytes is still set from the write to STDOUT. in this case, we try to write the read data directly to the pipe
            // 2.) The Queue was not empty but is now -> bytes is set from the last write (which was successful) and is bigger 0. also try to write the data
            // 3.) The Queue was not empty and still is not -> there was a write error before (even partial), and bytes is -1. Thus this line is skipped.
            if (bytes != -1) bytes = write(writefd, buffer.data, buffer.bytes);

            // again, there are several cases what can happen here
            // 1.) the write before was successful -> in this case bytes is equal to buffer.bytes and nothing happens
            // 2.) the write just before is partial or failed all together - bytes is either -1 or smaller than buffer.bytes -> add the remaining data to the queue
            // 3.) the write before did not happen as the buffer flush already had an error. In this case bytes is -1 -> add the remaining data to the queue
            if (bytes != buffer.bytes)
              PushToQueue(&queue, &buffer, bytes);
            else 
              queue.pWrites++;
        }

        // once we are done with STDIN, try to flush the buffer to the named pipe
        if (queue.active > 0) {
           //set output buffer to block - here we wait until we can write everything to the named pipe
           // --> this does not seem to work - just in case there is a busy loop that waits for buffer flush aswell. 
           int saved_flags = fcntl(writefd, F_GETFL);
           int new_flags = saved_flags & ~O_NONBLOCK;
           int res = fcntl(writefd, F_SETFL, new_flags);

           sBuffer *tmpBuffer = NULL;
           //TODO: this does not handle partial writes yet
           while ((tmpBuffer = PeakAtQueue(&queue)) != NULL) {
             int bytes = write(writefd, tmpBuffer->data, tmpBuffer->bytes);
             if (bytes != -1) DelFromQueue(&queue);
           }
        }

        close(writefd);

    }


    /** init a given Queue **/
    void InitQueue (sQueue *queue, int bufferSize) {
      queue->data = calloc(bufferSize, sizeof(sBuffer));
      queue->bufferSize = bufferSize;
      queue->start = 0;
      queue->end = 0;
      queue->active = 0;
      queue->maxUse = 0;
      queue->drops = 0;
      queue->sWrites = 0;
      queue->pWrites = 0;
    }

    /** push a buffer into the Queue**/
    void PushToQueue(sQueue *queue, sBuffer *p, int offset)
    {

        if (offset < 0) offset = 0;      // offset cannot be smaller than 0 - if that is the case, we were given an error code. Set it to 0 instead
        if (offset == p->bytes) return;  // in this case there are 0 bytes to add to the queue. Nothing to write

        // this should never happen - offset cannot be bigger than the buffer itself. Panic action
        if (offset > p->bytes) {perror("got more bytes to buffer than we read\n"); exit(EXIT_FAILURE);}

        // debug output on a partial write. TODO: remove this line
        // if (offset > 0 ) fprintf(stderr, "partial write to buffer\n");

        // copy the data from the buffer into the queue and remember its size
        memcpy(queue->data[queue->end].data, p->data + offset , p->bytes-offset);
        queue->data[queue->end].bytes = p->bytes - offset;

        // move the buffer forward
        queue->end = (queue->end + 1) % queue->bufferSize;

        // there is still space in the buffer
        if (queue->active < queue->bufferSize)
        {
            queue->active++;
            if (queue->active > queue->maxUse) queue->maxUse = queue->active;
        } else {
            // Overwriting the oldest. Move start to next-oldest
            queue->start = (queue->start + 1) % queue->bufferSize;
            queue->drops++;
        }
    }

    /** return the oldest entry in the Queue and remove it or return NULL in case the Queue is empty **/
    sBuffer *RetrieveFromQueue(sQueue *queue)
    {
        if (!queue->active) { return NULL; }

        queue->start = (queue->start + 1) % queue->bufferSize;
        queue->active--;
        return &(queue->data[queue->start]);
    }

    /** return the oldest entry in the Queue or NULL if the Queue is empty. Does not remove the entry **/
    sBuffer *PeakAtQueue(sQueue *queue)
    {
        if (!queue->active) { return NULL; }
        return &(queue->data[queue->start]);
    }

    /*** Shrinks the oldest entry i the Queue by bytes. Removes the entry if buffer of the oldest entry runs empty*/
    void ShrinkInQueue(sQueue *queue, int bytes) {

      // cannot remove negative amount of bytes - this is an error case. Ignore it
      if (bytes <= 0) return;

      // remove the entry if the offset is equal to the buffer size
      if (queue->data[queue->start].bytes == bytes) {
        DelFromQueue(queue);
        return;
      };

      // this is a partial delete
      if (queue->data[queue->start].bytes > bytes) {
        //shift the memory by the offset
        memmove(queue->data[queue->start].data, queue->data[queue->start].data + bytes, queue->data[queue->start].bytes - bytes);
        queue->data[queue->start].bytes = queue->data[queue->start].bytes - bytes;
        return;
      }

      // panic is the are to remove more than we have the buffer
      if (queue->data[queue->start].bytes < bytes) {
        perror("we wrote more than we had - this should never happen\n");
        exit(EXIT_FAILURE);
        return;
      }
    }

    /** delete the oldest entry from the queue. Do nothing if the Queue is empty **/
    void DelFromQueue(sQueue *queue)
    {
        if (queue->active > 0) {
          queue->start = (queue->start + 1) % queue->bufferSize;
          queue->active--;
        }
    }

    /** Stats output on SIGUSR1 **/
    static void sigUSR1(int signo) {
      fprintf(stderr, "Buffer use: %i (%i/%i), STDOUT: %i PIPE: %i:%i\n", queue.active, queue.maxUse, queue.bufferSize, queue.sWrites, queue.pWrites, queue.drops);
    }

    /** handle signal for terminating **/
    static void sigINT(int signo) {
      quit++;
      if (quit > 1) exit(EXIT_FAILURE);
    }

эта версия принимает еще один (необязательный) аргумент, который указывает количество блоков, которые должны быть буферизованы для канала. Мой пример вызова теперь выглядит так:

some_process | bftee >(onlineAnalysis.pl > results) 16384 | gzip > raw_data.gz

в результате 16384 блоков должны быть буферизованы до сброса произойдет. это использует около 32 Mbyte больше памяти, но... какая разница ?

Of конечно, в реальной среде я использую именованный канал, чтобы я мог присоединять и отсоединять по мере необходимости. Есть выглядит так:

mkfifo named_pipe
some_process | bftee named_pipe 16384 | gzip > raw_data.gz &
cat named_pipe | onlineAnalysis.pl > results

кроме того, процесс реагирует на сигналы следующим образом: SIGUSR1 - > счетчики печати в STDERR SIGTERM, SIGINT - > первый выходит из основного цикла и сбрасывает буфер в канал, второй немедленно завершает программу.

может быть, это поможет кому-то в будущем... Наслаждайтесь


однако это создаст постоянно растущий файл журнала, даже если он не будет использоваться до тех пор, пока диск не закончится.

почему бы периодически не вращать журналы? Есть даже программа, чтобы сделать это для вас logrotate.

существует также система для генерации сообщений журнала и делать с ними разные вещи в соответствии с типом. Это называется syslog.

вы даже можете объединить два. Ваш программа генерирует сообщения syslog, настроить syslog на поместите их в файл и используйте logrotate, чтобы убедиться, что они не заполняют диск.


Если оказалось, что вы пишете для небольшой встроенной системы, и выход программы тяжелый, есть множество методов, которые вы могли бы рассмотреть.

  • удаленный системный журнал: отправка сообщений системного журнала на сервер системного журнала в сети.
  • используйте уровни серьезности, доступные в системном журнале, чтобы делать разные вещи с сообщениями. Е. Г. отменить "информация", но войти и вперед "ERR" или больше. Е. Г. в консоли
  • используйте обработчик сигнала в вашей программе, чтобы перечитывать конфигурацию на HUP и изменять генерацию журнала "по требованию" таким образом.
  • пусть ваша программа прослушивает сокет unix и записывает сообщения при открытии. Вы даже можете реализовать и интерактивную консоль в своей программе таким образом.
  • используя файл конфигурации, обеспечьте гранулированный контроль выхода журнала.

BusyBox, часто используемый на встроенных устройствах, может создать журнал буферизации ОЗУ

syslogd -C

, который может быть восполнен

logger

и читать

logread

работает довольно хорошо, но предоставляет только один глобальный журнал.


Если вы можете установить экран на встроенном устройстве, то вы можете запустить "myprogram" в нем и отсоединить его, и снова прикрепить его в любое время, когда вы хотите увидеть журнал. Что-то вроде:

$ screen -t sometitle myprogram
Hit Ctrl+A, then d to detach it.

всякий раз, когда вы хотите, чтобы увидеть выход, подключите его:

$ screen -DR sometitle
Hit Ctrl-A, then d to detach it again.

таким образом, вам не придется беспокоиться о выходе программы с использованием дискового пространства вообще.


похоже на bash <> переадресация оператором (3.6.10 открытия файловых дескрипторов для чтения и WritingSee) делает запись в файл/fifo, открытый с его помощью, неблокирующей. Это должно сработать:

$ mkfifo /tmp/mylog
$ exec 4<>/tmp/mylog
$ myprogram 2>&1 | tee >&4
$ cat /tmp/mylog # on demend

решение дано gniourf_gniourf на # bash IRC канал.


проблема с данным fifo подход заключается в том, что все это будет висеть, когда буфер трубы заполняется и процесс чтения не происходит.

на fifo подход к работе я думаю, вам придется реализовать модель клиент-сервер именованного канала, аналогичную той, которая упоминается в BASH: Лучшая архитектура для чтения из двух входных потоков (см. слегка измененный код ниже, пример кода 2).

для обходного пути вы также можете используйте while ... read построить вместо teeING stdout в именованный канал, реализуя механизм подсчета внутри while ... read цикл, который будет периодически перезаписывать файл журнала указанным количеством строк. Это предотвратит постоянно растущий файл журнала (пример кода 1).

# sample code 1

# terminal window 1
rm -f /tmp/mylog
touch /tmp/mylog
while sleep 2; do date '+%Y-%m-%d_%H.%M.%S'; done 2>&1 | while IFS="" read -r line; do 
  lno=$((lno+1))
  #echo $lno
  array[${lno}]="${line}"
  if [[ $lno -eq 10 ]]; then
    lno=$((lno+1))
    array[${lno}]="-------------"
    printf '%s\n' "${array[@]}" > /tmp/mylog
    unset lno array
  fi
  printf '%s\n' "${line}"
done

# terminal window 2
tail -f /tmp/mylog


#------------------------


# sample code 2

# code taken from: 
# https://stackoverflow.com/questions/6702474/bash-best-architecture-for-reading-from-two-input-streams
# terminal window 1

# server
(
rm -f /tmp/to /tmp/from
mkfifo /tmp/to /tmp/from
while true; do 
  while IFS="" read -r -d $'\n' line; do 
    printf '%s\n' "${line}"
  done </tmp/to >/tmp/from &
  bgpid=$!
  exec 3>/tmp/to
  exec 4</tmp/from
  trap "kill -TERM $bgpid; exit" 0 1 2 3 13 15
  wait "$bgpid"
  echo "restarting..."
done
) &
serverpid=$!
#kill -TERM $serverpid

# client
(
exec 3>/tmp/to;
exec 4</tmp/from;
while IFS="" read -r -d $'\n' <&4 line; do
  if [[ "${line:0:1}" == $'7' ]]; then 
    printf 'line from stdin: %s\n' "${line:1}"  > /dev/null
  else       
    printf 'line from fifo: %s\n' "$line"       > /dev/null
  fi
done &
trap "kill -TERM $"'!; exit' 1 2 3 13 15
while IFS="" read -r -d $'\n' line; do
  # can we make it atomic?
  # sleep 0.5
  # dd if=/tmp/to iflag=nonblock of=/dev/null  # flush fifo
  printf '7%s\n' "${line}"
done >&3
) &
# kill -TERM $!


# terminal window 2
# tests
echo hello > /tmp/to
yes 1 | nl > /tmp/to
yes 1 | nl | tee /tmp/to
while sleep 2; do date '+%Y-%m-%d_%H.%M.%S'; done 2>&1 | tee -a /tmp/to


# terminal window 3
cat /tmp/to | head -n 10

Если ваш процесс записывает в любой файл журнала, а затем стирает файл и начинает снова и снова, поэтому он не становится слишком большим или использует logrotate.

tail --follow=name --retry my.log

все, что вам нужно. Вы получите столько же прокрутки назад, сколько ваш терминал.

ничего нестандартного не требуется. Я не пробовал это с небольшими файлами журналов, но все наши журналы вращаются так, и я никогда не замечал потери строк.