source: lib/format_ndag.c @ 639d952

cachetimestampsdevelopdpdk-ndagetsilivendag_formatrc-4.0.2rc-4.0.3rc-4.0.4ringdecrementfixringperformance
Last change on this file since 639d952 was 639d952, checked in by Shane Alcock <salcock@…>, 4 years ago

Minor performance tweaks for format_ndag

Most notably, split receive_encap_records() into two separate
versions (blocking and nonblocking) which should avoid a few
"if (block)" checks.

Also removed extraneous call to receiver_read_messages when using
the pread function.

  • Property mode set to 100644
File size: 42.1 KB
Line 
1
2#define _GNU_SOURCE
3
4#include "config.h"
5#include "common.h"
6#include "libtrace.h"
7#include "libtrace_int.h"
8#include "format_helper.h"
9#include "format_erf.h"
10
11#include <assert.h>
12#include <errno.h>
13#include <fcntl.h>
14#include <stdio.h>
15#include <string.h>
16#include <unistd.h>
17#include <stdlib.h>
18#include <net/if.h>
19#include <sys/types.h>
20#include <sys/socket.h>
21#include <netdb.h>
22
23#include "format_ndag.h"
24
25#define NDAG_IDLE_TIMEOUT (600)
26#define ENCAP_BUFSIZE (10000)
27#define CTRL_BUF_SIZE (10000)
28#define ENCAP_BUFFERS (100)
29
30#define RECV_BATCH_SIZE (20)
31
32#define FORMAT_DATA ((ndag_format_data_t *)libtrace->format_data)
33
34static struct libtrace_format_t ndag;
35
36volatile int ndag_paused = 0;
37
38typedef struct monitor {
39        uint16_t monitorid;
40        uint64_t laststart;
41} ndag_monitor_t;
42
43
44typedef struct streamsource {
45        uint16_t monitor;
46        char *groupaddr;
47        char *localiface;
48        uint16_t port;
49} streamsource_t;
50
51typedef struct streamsock {
52        char *groupaddr;
53        int sock;
54        struct addrinfo *srcaddr;
55        uint16_t port;
56        uint32_t expectedseq;
57        ndag_monitor_t *monitorptr;
58        char **saved;
59        char *nextread;
60        int nextreadind;
61        int nextwriteind;
62        int savedsize[ENCAP_BUFFERS];
63        uint32_t startidle;
64        uint64_t recordcount;
65
66        struct mmsghdr mmsgbufs[RECV_BATCH_SIZE];
67} streamsock_t;
68
69typedef struct recvstream {
70        streamsock_t *sources;
71        uint16_t sourcecount;
72        libtrace_message_queue_t mqueue;
73        int threadindex;
74        ndag_monitor_t *knownmonitors;
75        uint16_t monitorcount;
76
77        uint64_t dropped_upstream;
78        uint64_t missing_records;
79        uint64_t received_packets;
80} recvstream_t;
81
82typedef struct ndag_format_data {
83        char *multicastgroup;
84        char *portstr;
85        char *localiface;
86        uint16_t nextthreadid;
87        recvstream_t *receivers;
88
89        pthread_t controlthread;
90        libtrace_message_queue_t controlqueue;
91} ndag_format_data_t;
92
93enum {
94        NDAG_CLIENT_HALT = 0x01,
95        NDAG_CLIENT_RESTARTED = 0x02,   // redundant
96        NDAG_CLIENT_NEWGROUP = 0x03
97};
98
99typedef struct ndagreadermessage {
100        uint8_t type;
101        streamsource_t contents;
102} ndag_internal_message_t;
103
104
105static inline int seq_cmp(uint32_t seq_a, uint32_t seq_b) {
106
107        /* Calculate seq_a - seq_b, taking wraparound into account */
108        if (seq_a == seq_b) return 0;
109
110        if (seq_a > seq_b) {
111                return (int) (seq_a - seq_b);
112        }
113
114        /* -1 for the wrap and another -1 because we don't use zero */
115        return (int) (0xffffffff - ((seq_b - seq_a) - 2));
116}
117
118static uint8_t check_ndag_header(char *msgbuf, uint32_t msgsize) {
119        ndag_common_t *header = (ndag_common_t *)msgbuf;
120
121        if (msgsize < sizeof(ndag_common_t)) {
122                fprintf(stderr,
123                        "nDAG message does not have a complete nDAG header.\n");
124                return 0;
125        }
126
127        if (ntohl(header->magic) != NDAG_MAGIC_NUMBER) {
128                fprintf(stderr,
129                        "nDAG message does not have a valid magic number.\n");
130                return 0;
131        }
132
133        if (header->version > NDAG_EXPORT_VERSION || header->version == 0) {
134                fprintf(stderr,
135                        "nDAG message has an invalid header version: %u\n",
136                                header->version);
137                return 0;
138        }
139
140        return header->type;
141}
142
143static int join_multicast_group(char *groupaddr, char *localiface,
144        char *portstr, uint16_t portnum, struct addrinfo **srcinfo) {
145
146        struct addrinfo hints;
147        struct addrinfo *gotten;
148        struct addrinfo *group;
149        unsigned int interface;
150        char pstr[16];
151        struct group_req greq;
152        int bufsize;
153
154        int sock;
155
156        if (portstr == NULL) {
157                snprintf(pstr, 15, "%u", portnum);
158                portstr = pstr;
159        }
160
161        interface = if_nametoindex(localiface);
162        if (interface == 0) {
163                fprintf(stderr, "Failed to lookup interface %s -- %s\n",
164                                localiface, strerror(errno));
165                return -1;
166        }
167
168        hints.ai_family = PF_UNSPEC;
169        hints.ai_socktype = SOCK_DGRAM;
170        hints.ai_flags = AI_PASSIVE;
171        hints.ai_protocol = 0;
172
173        if (getaddrinfo(NULL, portstr, &hints, &gotten) != 0) {
174                fprintf(stderr,
175                        "Call to getaddrinfo failed for NULL:%s -- %s\n",
176                                portstr, strerror(errno));
177                return -1;
178        }
179
180        if (getaddrinfo(groupaddr, NULL, &hints, &group) != 0) {
181                fprintf(stderr, "Call to getaddrinfo failed for %s -- %s\n",
182                                groupaddr, strerror(errno));
183                return -1;
184        }
185
186        *srcinfo = gotten;
187        sock = socket(gotten->ai_family, gotten->ai_socktype, 0);
188        if (sock < 0) {
189                fprintf(stderr,
190                        "Failed to create multicast socket for %s:%s -- %s\n",
191                                groupaddr, portstr, strerror(errno));
192                goto sockcreateover;
193        }
194
195        if (bind(sock, (struct sockaddr *)gotten->ai_addr, gotten->ai_addrlen) < 0)
196        {
197                fprintf(stderr,
198                        "Failed to bind to multicast socket %s:%s -- %s\n",
199                                groupaddr, portstr, strerror(errno));
200                close(sock);
201                sock = -1;
202                goto sockcreateover;
203        }
204
205        greq.gr_interface = interface;
206        memcpy(&(greq.gr_group), group->ai_addr, group->ai_addrlen);
207
208        if (setsockopt(sock, IPPROTO_IP, MCAST_JOIN_GROUP, &greq,
209                        sizeof(greq)) < 0) {
210                fprintf(stderr,
211                        "Failed to join multicast group %s:%s -- %s\n",
212                                groupaddr, portstr, strerror(errno));
213                close(sock);
214                sock = -1;
215                goto sockcreateover;
216        }
217
218        bufsize = 16 * 1024 * 1024;
219        if (setsockopt(sock, SOL_SOCKET, SO_RCVBUF, &bufsize,
220                                (socklen_t)sizeof(int)) < 0) {
221
222                fprintf(stderr,
223                        "Failed to increase buffer size for multicast group %s:%s -- %s\n",
224                                groupaddr, portstr, strerror(errno));
225                close(sock);
226                sock = -1;
227                goto sockcreateover;
228        }
229
230sockcreateover:
231        freeaddrinfo(group);
232        return sock;
233}
234
235
236static int ndag_init_input(libtrace_t *libtrace) {
237
238        char *scan = NULL;
239        char *next = NULL;
240
241        libtrace->format_data = (ndag_format_data_t *)malloc(
242                        sizeof(ndag_format_data_t));
243
244        FORMAT_DATA->multicastgroup = NULL;
245        FORMAT_DATA->portstr = NULL;
246        FORMAT_DATA->localiface = NULL;
247        FORMAT_DATA->nextthreadid = 0;
248        FORMAT_DATA->receivers = NULL;
249
250        scan = strchr(libtrace->uridata, ',');
251        if (scan == NULL) {
252                trace_set_err(libtrace, TRACE_ERR_BAD_FORMAT,
253                        "Bad ndag URI. Should be ndag:<interface>,<multicast group>,<port number>");
254                return -1;
255        }
256        FORMAT_DATA->localiface = strndup(libtrace->uridata,
257                        (size_t)(scan - libtrace->uridata));
258        next = scan + 1;
259
260        scan = strchr(next, ',');
261        if (scan == NULL) {
262                FORMAT_DATA->portstr = strdup("9001");
263                FORMAT_DATA->multicastgroup = strdup(next);
264        } else {
265                FORMAT_DATA->multicastgroup = strndup(next, (size_t)(scan - next));
266
267                FORMAT_DATA->portstr = strdup(scan + 1);
268        }
269        return 0;
270}
271
272static void new_group_alert(libtrace_t *libtrace, uint16_t threadid,
273                uint16_t portnum, uint16_t monid) {
274
275        ndag_internal_message_t alert;
276
277        alert.type = NDAG_CLIENT_NEWGROUP;
278        alert.contents.groupaddr = FORMAT_DATA->multicastgroup;
279        alert.contents.localiface = FORMAT_DATA->localiface;
280        alert.contents.port = portnum;
281        alert.contents.monitor = monid;
282
283        libtrace_message_queue_put(&(FORMAT_DATA->receivers[threadid].mqueue),
284                        (void *)&alert);
285
286}
287       
288static int ndag_parse_control_message(libtrace_t *libtrace, char *msgbuf,
289                int msgsize, uint16_t *ptmap) {
290
291        int i;
292        ndag_common_t *ndaghdr = (ndag_common_t *)msgbuf;
293        uint8_t msgtype;
294
295        msgtype = check_ndag_header(msgbuf, (uint32_t)msgsize);
296        if (msgtype == 0) {
297                return -1;
298        }
299
300        msgsize -= sizeof(ndag_common_t);
301        if (msgtype == NDAG_PKT_BEACON) {
302                /* If message is a beacon, make sure every port included in the
303                 * beacon is assigned to a receive thread.
304                 */
305                uint16_t *ptr, numstreams;
306
307                if ((uint32_t)msgsize < sizeof(uint16_t)) {
308                        fprintf(stderr, "Malformed beacon (missing number of streams).\n");
309                        return -1;
310                }
311
312                ptr = (uint16_t *)(msgbuf + sizeof(ndag_common_t));
313                numstreams = ntohs(*ptr);
314                ptr ++;
315
316                if ((uint32_t)msgsize != ((numstreams + 1) * sizeof(uint16_t)))
317                {
318                        fprintf(stderr, "Malformed beacon (length doesn't match number of streams).\n");
319                        fprintf(stderr, "%u %u\n", msgsize, numstreams);
320                        return -1;
321                }
322
323                for (i = 0; i < numstreams; i++) {
324                        uint16_t streamport = ntohs(*ptr);
325
326                        if (ptmap[streamport] == 0xffff) {
327                                new_group_alert(libtrace,
328                                        FORMAT_DATA->nextthreadid, streamport,
329                                        ntohs(ndaghdr->monitorid));
330
331                                ptmap[streamport] = FORMAT_DATA->nextthreadid;
332
333                                if (libtrace->perpkt_thread_count == 0) {
334                                        FORMAT_DATA->nextthreadid = 0;
335                                } else {
336                                        FORMAT_DATA->nextthreadid =
337                                                ((FORMAT_DATA->nextthreadid + 1) % libtrace->perpkt_thread_count);
338                                }
339                        }
340
341                        ptr ++;
342                }
343        } else {
344                fprintf(stderr,
345                        "Unexpected message type on control channel: %u\n",
346                         msgtype);
347                return -1;
348        }
349
350        return 0;
351
352}
353
354static void *ndag_controller_run(void *tdata) {
355
356        libtrace_t *libtrace = (libtrace_t *)tdata;
357        uint16_t ptmap[65536];
358        int sock = -1;
359        struct addrinfo *receiveaddr = NULL;
360        fd_set listening;
361        struct timeval timeout;
362
363        /* ptmap is a dirty hack to allow us to quickly check if we've already
364         * assigned a stream to a thread.
365         */
366        memset(ptmap, 0xff, 65536 * sizeof(uint16_t));
367
368        sock = join_multicast_group(FORMAT_DATA->multicastgroup,
369                        FORMAT_DATA->localiface, FORMAT_DATA->portstr, 0,
370                        &receiveaddr);
371        if (sock == -1) {
372                trace_set_err(libtrace, TRACE_ERR_INIT_FAILED,
373                        "Unable to join multicast group for nDAG control channel");
374                trace_interrupt();
375        }
376
377        ndag_paused = 0;
378        while ((is_halted(libtrace) == -1) && !ndag_paused) {
379                int ret;
380                char buf[CTRL_BUF_SIZE];
381
382                FD_ZERO(&listening);
383                FD_SET(sock, &listening);
384
385                timeout.tv_sec = 0;
386                timeout.tv_usec = 500000;
387
388                ret = select(sock + 1, &listening, NULL, NULL, &timeout);
389                if (ret < 0) {
390                        fprintf(stderr, "Error while waiting for nDAG control messages: %s\n", strerror(errno));
391                        break;
392                }
393
394                if (!FD_ISSET(sock, &listening)) {
395                        continue;
396                }
397
398                ret = recvfrom(sock, buf, CTRL_BUF_SIZE, 0,
399                                receiveaddr->ai_addr,
400                                &(receiveaddr->ai_addrlen));
401                if (ret < 0) {
402                        fprintf(stderr, "Error while receiving nDAG control message: %s\n", strerror(errno));
403                        break;
404                }
405
406                if (ret == 0) {
407                        break;
408                }
409
410                if (ndag_parse_control_message(libtrace, buf, ret, ptmap) < 0) {
411                        fprintf(stderr, "Error while parsing nDAG control message.\n");
412                        continue;
413                }
414        }
415
416        if (sock >= 0) {
417                close(sock);
418        }
419
420        /* Control channel has fallen over, should probably encourage libtrace
421         * to halt the receiver threads as well.
422         */
423        if (!is_halted(libtrace)) {
424                trace_interrupt();
425        }
426
427        pthread_exit(NULL);
428}
429
430static int ndag_start_threads(libtrace_t *libtrace, uint32_t maxthreads)
431{
432        int ret;
433        uint32_t i;
434        /* Configure the set of receiver threads */
435
436        if (FORMAT_DATA->receivers == NULL) {
437                /* What if the number of threads changes between a pause and
438                 * a restart? Can this happen? */
439                FORMAT_DATA->receivers = (recvstream_t *)
440                                malloc(sizeof(recvstream_t) * maxthreads);
441        }
442
443        for (i = 0; i < maxthreads; i++) {
444                FORMAT_DATA->receivers[i].sources = NULL;
445                FORMAT_DATA->receivers[i].sourcecount = 0;
446                FORMAT_DATA->receivers[i].knownmonitors = NULL;
447                FORMAT_DATA->receivers[i].monitorcount = 0;
448                FORMAT_DATA->receivers[i].threadindex = i;
449                FORMAT_DATA->receivers[i].dropped_upstream = 0;
450                FORMAT_DATA->receivers[i].received_packets = 0;
451                FORMAT_DATA->receivers[i].missing_records = 0;
452
453                libtrace_message_queue_init(&(FORMAT_DATA->receivers[i].mqueue),
454                                sizeof(ndag_internal_message_t));
455        }
456
457        /* Start the controller thread */
458        /* TODO consider affinity of this thread? */
459
460        ret = pthread_create(&(FORMAT_DATA->controlthread), NULL,
461                        ndag_controller_run, libtrace);
462        if (ret != 0) {
463                return -1;
464        }
465        return maxthreads;
466}
467
468static int ndag_start_input(libtrace_t *libtrace) {
469        return ndag_start_threads(libtrace, 1);
470}
471
472static int ndag_pstart_input(libtrace_t *libtrace) {
473        if (ndag_start_threads(libtrace, libtrace->perpkt_thread_count) ==
474                        libtrace->perpkt_thread_count)
475                return 0;
476        return -1;
477}
478
479static void halt_ndag_receiver(recvstream_t *receiver) {
480        int j, i;
481        libtrace_message_queue_destroy(&(receiver->mqueue));
482
483        if (receiver->sources == NULL)
484                return;
485        for (i = 0; i < receiver->sourcecount; i++) {
486                streamsock_t src = receiver->sources[i];
487                if (src.saved) {
488                        for (j = 0; i < ENCAP_BUFFERS; j++) {
489                                if (src.saved[j]) {
490                                        free(src.saved[j]);
491                                }
492                        }
493                        free(src.saved);
494                }
495                for (j = 0; j < RECV_BATCH_SIZE; j++) {
496                        if (src.mmsgbufs[j].msg_hdr.msg_iov) {
497                                free(src.mmsgbufs[j].msg_hdr.msg_iov);
498                        }
499                }
500                close(src.sock);
501        }
502        if (receiver->knownmonitors) {
503                free(receiver->knownmonitors);
504        }
505
506        if (receiver->sources) {
507                free(receiver->sources);
508        }
509}
510
511static int ndag_pause_input(libtrace_t *libtrace) {
512        int i;
513
514        /* Close the existing receiver sockets */
515        for (i = 0; i < libtrace->perpkt_thread_count; i++) {
516               halt_ndag_receiver(&(FORMAT_DATA->receivers[i]));
517        }
518        return 0;
519}
520
521static int ndag_fin_input(libtrace_t *libtrace) {
522
523        if (FORMAT_DATA->receivers) {
524                free(FORMAT_DATA->receivers);
525        }
526        if (FORMAT_DATA->multicastgroup) {
527                free(FORMAT_DATA->multicastgroup);
528        }
529        if (FORMAT_DATA->portstr) {
530                free(FORMAT_DATA->portstr);
531        }
532        if (FORMAT_DATA->localiface) {
533                free(FORMAT_DATA->localiface);
534        }
535
536        free(libtrace->format_data);
537        return 0;
538}
539
540static int ndag_prepare_packet_stream(libtrace_t *libtrace,
541                recvstream_t *rt,
542                streamsock_t *ssock, libtrace_packet_t *packet,
543                uint32_t flags) {
544
545        dag_record_t *erfptr;
546        ndag_encap_t *encaphdr;
547        uint16_t ndag_reccount = 0;
548        int nr;
549
550        if ((flags & TRACE_PREP_OWN_BUFFER) == TRACE_PREP_OWN_BUFFER) {
551                packet->buf_control = TRACE_CTRL_PACKET;
552        } else {
553                packet->buf_control = TRACE_CTRL_EXTERNAL;
554        }
555
556        packet->trace = libtrace;
557        packet->buffer = ssock->nextread;
558        packet->header = ssock->nextread;
559        packet->type = TRACE_RT_DATA_ERF;
560
561        erfptr = (dag_record_t *)packet->header;
562
563        if (erfptr->flags.rxerror == 1) {
564                packet->payload = NULL;
565                erfptr->rlen = htons(erf_get_framing_length(packet));
566        } else {
567                packet->payload = (char *)packet->buffer +
568                                erf_get_framing_length(packet);
569        }
570
571        /* Update upstream drops using lctr */
572
573        if (erfptr->type == TYPE_DSM_COLOR_ETH) {
574                /* TODO */
575        } else {
576                if (rt->received_packets > 0) {
577                        rt->dropped_upstream += ntohs(erfptr->lctr);
578                }
579        }
580
581        rt->received_packets ++;
582        ssock->recordcount += 1;
583
584        nr = ssock->nextreadind;
585        encaphdr = (ndag_encap_t *)(ssock->saved[nr] +
586                        sizeof(ndag_common_t));
587
588        ndag_reccount = ntohs(encaphdr->recordcount);
589        if ((ndag_reccount & 0x8000) != 0) {
590                /* Record was truncated -- update rlen appropriately */
591                erfptr->rlen = htons(ssock->savedsize[nr] -
592                                (ssock->nextread - ssock->saved[nr]));
593        }
594        ssock->nextread += ntohs(erfptr->rlen);
595
596        if (ssock->nextread - ssock->saved[nr] >= ssock->savedsize[nr]) {
597                /* Read everything from this buffer, mark as empty and
598                 * move on. */
599                ssock->savedsize[nr] = 0;
600                nr = (nr + 1) % ENCAP_BUFFERS;
601                ssock->nextread = ssock->saved[nr] + sizeof(ndag_common_t) +
602                                sizeof(ndag_encap_t);
603                ssock->nextreadind = nr;
604        }
605
606        packet->order = erf_get_erf_timestamp(packet);
607        packet->error = packet->payload ? ntohs(erfptr->rlen) :
608                        erf_get_framing_length(packet);
609
610        return ntohs(erfptr->rlen);
611}
612
613static int ndag_prepare_packet(libtrace_t *libtrace UNUSED,
614                libtrace_packet_t *packet UNUSED,
615                void *buffer UNUSED, libtrace_rt_types_t rt_type UNUSED,
616                uint32_t flags UNUSED) {
617
618        assert(0 && "Sending nDAG records over RT doesn't make sense! Please stop.");
619        return 0;
620
621}
622
623static ndag_monitor_t *add_new_knownmonitor(recvstream_t *rt, uint16_t monid) {
624
625        ndag_monitor_t *mon;
626
627        if (rt->monitorcount == 0) {
628                rt->knownmonitors = (ndag_monitor_t *)
629                                malloc(sizeof(ndag_monitor_t) * 5);
630        } else {
631                rt->knownmonitors = (ndag_monitor_t *)
632                            realloc(rt->knownmonitors,
633                            sizeof(ndag_monitor_t) * (rt->monitorcount * 5));
634        }
635
636        mon = &(rt->knownmonitors[rt->monitorcount]);
637        mon->monitorid = monid;
638        mon->laststart = 0;
639
640        rt->monitorcount ++;
641        return mon;
642}
643
644static int add_new_streamsock(recvstream_t *rt, streamsource_t src) {
645
646        streamsock_t *ssock = NULL;
647        ndag_monitor_t *mon = NULL;
648        int i;
649
650        /* TODO consider replacing this with a list or vector so we can
651         * easily remove sources that are no longer in use, rather than
652         * just setting the sock to -1 and having to check them every
653         * time we want to read a packet.
654         */
655        if (rt->sourcecount == 0) {
656                rt->sources = (streamsock_t *)malloc(sizeof(streamsock_t) * 10);
657        } else if ((rt->sourcecount % 10) == 0) {
658                rt->sources = (streamsock_t *)realloc(rt->sources,
659                        sizeof(streamsock_t) * (rt->sourcecount + 10));
660        }
661
662        ssock = &(rt->sources[rt->sourcecount]);
663
664        ssock->sock = join_multicast_group(src.groupaddr, src.localiface,
665                        NULL, src.port, &(ssock->srcaddr));
666
667        if (ssock->sock < 0) {
668                return -1;
669        }
670
671        for (i = 0; i < rt->monitorcount; i++) {
672                if (rt->knownmonitors[i].monitorid == src.monitor) {
673                        mon = &(rt->knownmonitors[i]);
674                        break;
675                }
676        }
677
678        if (mon == NULL) {
679                mon = add_new_knownmonitor(rt, src.monitor);
680        }
681
682        ssock->port = src.port;
683        ssock->groupaddr = src.groupaddr;
684        ssock->expectedseq = 0;
685        ssock->monitorptr = mon;
686        ssock->saved = (char **)malloc(sizeof(char *) * ENCAP_BUFFERS);
687        ssock->startidle = 0;
688
689        for (i = 0; i < ENCAP_BUFFERS; i++) {
690                ssock->saved[i] = (char *)malloc(ENCAP_BUFSIZE);
691                ssock->savedsize[i] = 0;
692        }
693
694        for (i = 0; i < RECV_BATCH_SIZE; i++) {
695                ssock->mmsgbufs[i].msg_hdr.msg_iov = (struct iovec *)
696                                malloc(sizeof(struct iovec));
697        }
698
699        ssock->nextread = NULL;;
700        ssock->nextreadind = 0;
701        ssock->recordcount = 0;
702        rt->sourcecount += 1;
703
704        fprintf(stderr, "Added new stream %s:%u to thread %d\n",
705                        ssock->groupaddr, ssock->port, rt->threadindex);
706
707        return ssock->port;
708}
709
710static int receiver_read_messages(recvstream_t *rt) {
711
712        ndag_internal_message_t msg;
713
714        while (libtrace_message_queue_try_get(&(rt->mqueue),
715                                (void *)&msg) != LIBTRACE_MQ_FAILED) {
716                switch(msg.type) {
717                        case NDAG_CLIENT_NEWGROUP:
718                                if (add_new_streamsock(rt, msg.contents) < 0) {
719                                        return -1;
720                                }
721                                break;
722                        case NDAG_CLIENT_HALT:
723                                return 0;
724                }
725        }
726        return 1;
727
728}
729
730static inline int readable_data(streamsock_t *ssock) {
731
732        if (ssock->sock == -1) {
733                return 0;
734        }
735        if (ssock->savedsize[ssock->nextreadind] == 0) {
736                return 0;
737        }
738        /*
739        if (ssock->nextread - ssock->saved[ssock->nextreadind] >=
740                        ssock->savedsize[ssock->nextreadind]) {
741                return 0;
742        }
743        */
744        return 1;
745
746
747}
748
749static inline void reset_expected_seqs(recvstream_t *rt, ndag_monitor_t *mon) {
750
751        int i;
752        for (i = 0; i < rt->sourcecount; i++) {
753                if (rt->sources[i].monitorptr == mon) {
754                        rt->sources[i].expectedseq = 0;
755                }
756        }
757
758}
759
760static int init_receivers(streamsock_t *ssock) {
761
762        int wind = ssock->nextwriteind;
763        int i;
764        int avail = 0;
765
766        for (i = 0; i < RECV_BATCH_SIZE; i++) {
767                if (wind == ENCAP_BUFFERS) {
768                        wind = 0;
769                }
770
771                if (ssock->savedsize[wind] != 0) {
772                        /* No more empty buffers */
773                        break;
774                }
775
776                ssock->mmsgbufs[i].msg_len = 0;
777                ssock->mmsgbufs[i].msg_hdr.msg_name = ssock->srcaddr->ai_addr;
778                ssock->mmsgbufs[i].msg_hdr.msg_namelen = ssock->srcaddr->ai_addrlen;
779                ssock->mmsgbufs[i].msg_hdr.msg_iov->iov_base = ssock->saved[wind];
780                ssock->mmsgbufs[i].msg_hdr.msg_iov->iov_len = ENCAP_BUFSIZE;
781                ssock->mmsgbufs[i].msg_hdr.msg_iovlen = 1;
782                ssock->mmsgbufs[i].msg_hdr.msg_control = NULL;
783                ssock->mmsgbufs[i].msg_hdr.msg_controllen = 0;
784                ssock->mmsgbufs[i].msg_hdr.msg_flags = 0;
785
786                avail ++;
787                wind ++;
788        }
789
790        return avail;
791}
792
793static int check_ndag_received(streamsock_t *ssock, int index,
794                unsigned int msglen, recvstream_t *rt) {
795
796        ndag_encap_t *encaphdr;
797        ndag_monitor_t *mon;
798        uint8_t rectype;
799
800        /* Check that we have a valid nDAG encap record */
801        rectype = check_ndag_header(ssock->saved[index], (uint32_t)msglen);
802
803        if (rectype == NDAG_PKT_KEEPALIVE) {
804                /* Keep-alive, reset startidle and carry on. Don't
805                 * change nextwrite -- we want to overwrite the
806                 * keep-alive with usable content. */
807                return 0;
808        } else if (rectype != NDAG_PKT_ENCAPERF) {
809                fprintf(stderr, "Received invalid record on the channel for %s:%u.\n",
810                                ssock->groupaddr, ssock->port);
811                close(ssock->sock);
812                ssock->sock = -1;
813                return -1;
814        }
815
816        ssock->savedsize[index] = msglen;
817        ssock->nextwriteind ++;
818
819        if (ssock->nextwriteind >= ENCAP_BUFFERS) {
820                ssock->nextwriteind = 0;
821        }
822
823        /* Get the useful info from the encap header */
824        encaphdr=(ndag_encap_t *)(ssock->saved[index] + sizeof(ndag_common_t));
825
826        mon = ssock->monitorptr;
827
828        if (mon->laststart == 0) {
829                mon->laststart = bswap_be_to_host64(encaphdr->started);
830        } else if (mon->laststart != bswap_be_to_host64(encaphdr->started)) {
831                mon->laststart = bswap_be_to_host64(encaphdr->started);
832                reset_expected_seqs(rt, mon);
833
834                /* TODO what is a good way to indicate this to clients?
835                 * set the loss counter in the ERF header? a bit rude?
836                 * use another bit in the ERF header?
837                 * add a queryable flag to libtrace_packet_t?
838                 */
839
840        }
841
842        if (ssock->expectedseq != 0) {
843                rt->missing_records += seq_cmp(
844                                ntohl(encaphdr->seqno), ssock->expectedseq);
845        }
846        ssock->expectedseq = ntohl(encaphdr->seqno) + 1;
847        if (ssock->expectedseq == 0) {
848                ssock->expectedseq ++;
849        }
850
851        if (ssock->nextread == NULL) {
852                /* If this is our first read, set up 'nextread'
853                 * by skipping past the nDAG headers */
854                ssock->nextread = ssock->saved[0] +
855                        sizeof(ndag_common_t) + sizeof(ndag_encap_t);
856        }
857        return 1;
858
859}
860
861static int receive_from_single_socket(streamsock_t *ssock, struct timeval *tv,
862                int *gottime, recvstream_t *rt) {
863
864        int avail, ret, ndagstat, i;
865        int toret = 0;
866
867        if (ssock->sock == -1) {
868                return 0;
869        }
870
871        avail = init_receivers(ssock);
872
873        if (avail == 0) {
874                /* All buffers were full, so something must be
875                 * available. */
876                return 1;
877        }
878
879        ret = recvmmsg(ssock->sock, ssock->mmsgbufs, avail,
880                        MSG_DONTWAIT, NULL);
881
882        if (ret < 0) {
883                /* Nothing to receive right now, but we should still
884                 * count as 'ready' if at least one buffer is full */
885                if (errno == EAGAIN || errno == EWOULDBLOCK) {
886                        if (readable_data(ssock)) {
887                                toret = 1;
888                        }
889                        if (!(*gottime)) {
890                                gettimeofday(tv, NULL);
891                                *gottime = 1;
892                        }
893                        if (ssock->startidle == 0) {
894                                ssock->startidle = tv->tv_sec;
895                        } else if (tv->tv_sec - ssock->startidle > NDAG_IDLE_TIMEOUT) {
896                                fprintf(stderr,
897                                        "Closing channel %s:%u due to inactivity.\n",
898                                        ssock->groupaddr,
899                                        ssock->port);
900
901                                close(ssock->sock);
902                                ssock->sock = -1;
903                        }
904                } else {
905
906                        fprintf(stderr,
907                                "Error receiving encapsulated records from %s:%u -- %s \n",
908                                ssock->groupaddr, ssock->port,
909                                strerror(errno));
910                        close(ssock->sock);
911                        ssock->sock = -1;
912                }
913                return toret;
914        }
915        ssock->startidle = 0;
916        for (i = 0; i < ret; i++) {
917                ndagstat = check_ndag_received(ssock, ssock->nextwriteind,
918                                ssock->mmsgbufs[i].msg_len, rt);
919                if (ndagstat == -1) {
920                        break;
921                }
922
923                if (ndagstat == 1) {
924                        toret = 1;
925                }
926        }
927
928        return toret;
929}
930
931static int receive_from_sockets(recvstream_t *rt) {
932
933        int i, readybufs, gottime;
934        struct timeval tv;
935
936        readybufs = 0;
937        gottime = 0;
938
939        for (i = 0; i < rt->sourcecount; i ++) {
940                readybufs += receive_from_single_socket(&(rt->sources[i]),
941                                &tv, &gottime, rt);
942        }
943
944        return readybufs;
945
946}
947
948
949static int receive_encap_records_block(libtrace_t *libtrace, recvstream_t *rt,
950                libtrace_packet_t *packet) {
951
952        int iserr = 0;
953
954        if (packet->buf_control == TRACE_CTRL_PACKET) {
955                free(packet->buffer);
956                packet->buffer = NULL;
957        }
958
959        do {
960                /* Make sure we shouldn't be halting */
961                if ((iserr = is_halted(libtrace)) != -1) {
962                        return iserr;
963                }
964
965                /* Check for any messages from the control thread */
966                iserr = receiver_read_messages(rt);
967
968                if (iserr <= 0) {
969                        return iserr;
970                }
971
972                /* If blocking and no sources, sleep for a bit and then try
973                 * checking for messages again.
974                 */
975                if (rt->sourcecount == 0) {
976                        usleep(10000);
977                        continue;
978                }
979
980                if ((iserr = receive_from_sockets(rt)) < 0) {
981                        return iserr;
982                } else if (iserr > 0) {
983                        /* At least one of our input sockets has available
984                         * data, let's go ahead and use what we have. */
985                        break;
986                }
987
988                /* None of our sources have anything available, we can take
989                 * a short break rather than immediately trying again.
990                 */
991                if (iserr == 0) {
992                        usleep(100);
993                }
994
995        } while (1);
996
997        return iserr;
998}
999
1000static int receive_encap_records_nonblock(libtrace_t *libtrace, recvstream_t *rt,
1001                libtrace_packet_t *packet) {
1002
1003        int iserr = 0;
1004
1005        if (packet->buf_control == TRACE_CTRL_PACKET) {
1006                free(packet->buffer);
1007                packet->buffer = NULL;
1008        }
1009
1010        /* Make sure we shouldn't be halting */
1011        if ((iserr = is_halted(libtrace)) != -1) {
1012                return iserr;
1013        }
1014
1015        /* If non-blocking and there are no sources, just break */
1016        if (rt->sourcecount == 0) {
1017                return 0;
1018        }
1019
1020        return receive_from_sockets(rt);
1021}
1022
1023static streamsock_t *select_next_packet(recvstream_t *rt) {
1024        int i;
1025        streamsock_t *ssock = NULL;
1026        uint64_t earliest = 0;
1027        uint64_t currentts = 0;
1028        dag_record_t *daghdr;
1029
1030        for (i = 0; i < rt->sourcecount; i ++) {
1031                if (!readable_data(&(rt->sources[i]))) {
1032                        continue;
1033                }
1034
1035                daghdr = (dag_record_t *)(rt->sources[i].nextread);
1036                currentts = bswap_le_to_host64(daghdr->ts);
1037
1038                if (earliest == 0 || earliest > currentts) {
1039                        earliest = currentts;
1040                        ssock = &(rt->sources[i]);
1041                }
1042                /*
1043                fprintf(stderr, "%d %d %lu %lu %lu\n", rt->threadindex,
1044                                i, currentts,
1045                                rt->sources[i].recordcount,
1046                                rt->missing_records);
1047                */
1048        }
1049        return ssock;
1050}
1051
1052static int ndag_read_packet(libtrace_t *libtrace, libtrace_packet_t *packet) {
1053
1054        int rem;
1055        streamsock_t *nextavail = NULL;
1056        rem = receive_encap_records_block(libtrace, &(FORMAT_DATA->receivers[0]),
1057                        packet);
1058
1059        if (rem <= 0) {
1060                return rem;
1061        }
1062
1063        nextavail = select_next_packet(&(FORMAT_DATA->receivers[0]));
1064        if (nextavail == NULL) {
1065                return 0;
1066        }
1067
1068        /* nextread should point at an ERF header, so prepare 'packet' to be
1069         * a libtrace ERF packet. */
1070
1071        return ndag_prepare_packet_stream(libtrace,
1072                        &(FORMAT_DATA->receivers[0]), nextavail,
1073                        packet, TRACE_PREP_DO_NOT_OWN_BUFFER);
1074}
1075
1076static int ndag_pread_packets(libtrace_t *libtrace, libtrace_thread_t *t,
1077                libtrace_packet_t **packets, size_t nb_packets) {
1078
1079        recvstream_t *rt;
1080        int rem;
1081        size_t read_packets = 0;
1082        streamsock_t *nextavail = NULL;
1083
1084        rt = (recvstream_t *)t->format_data;
1085
1086
1087        do {
1088                /* Only check for messages once per batch */
1089                if (read_packets == 0) {
1090                        rem = receive_encap_records_block(libtrace, rt,
1091                                packets[read_packets]);
1092                } else {
1093                        rem = receive_encap_records_nonblock(libtrace, rt,
1094                                packets[read_packets]);
1095                }
1096
1097                if (rem < 0) {
1098                        return rem;
1099                }
1100
1101                if (rem == 0) {
1102                        break;
1103                }
1104
1105                nextavail = select_next_packet(rt);
1106                if (nextavail == NULL) {
1107                        break;
1108                }
1109
1110                ndag_prepare_packet_stream(libtrace, rt, nextavail,
1111                                packets[read_packets],
1112                                TRACE_PREP_DO_NOT_OWN_BUFFER);
1113
1114                read_packets  ++;
1115                if (read_packets >= nb_packets) {
1116                        break;
1117                }
1118        } while (1);
1119
1120        return read_packets;
1121
1122}
1123
1124static libtrace_eventobj_t trace_event_ndag(libtrace_t *libtrace,
1125                libtrace_packet_t *packet) {
1126
1127
1128        libtrace_eventobj_t event = {0,0,0.0,0};
1129        int rem;
1130        streamsock_t *nextavail = NULL;
1131
1132        /* Only check for messages once per call */
1133        rem = receiver_read_messages(&(FORMAT_DATA->receivers[0]));
1134        if (rem <= 0) {
1135                event.type = TRACE_EVENT_TERMINATE;
1136                return event;
1137        }
1138
1139        do {
1140                rem = receive_encap_records_nonblock(libtrace,
1141                                &(FORMAT_DATA->receivers[0]), packet);
1142
1143                if (rem < 0) {
1144                        trace_set_err(libtrace, TRACE_ERR_BAD_PACKET,
1145                                "Received invalid nDAG records.");
1146                        event.type = TRACE_EVENT_TERMINATE;
1147                        break;
1148                }
1149
1150                if (rem == 0) {
1151                        /* Either we've been halted or we've got no packets
1152                         * right now. */
1153                        if (is_halted(libtrace) == 0) {
1154                                event.type = TRACE_EVENT_TERMINATE;
1155                                break;
1156                        }
1157                        event.type = TRACE_EVENT_SLEEP;
1158                        event.seconds = 0.0001;
1159                        break;
1160                }
1161
1162                nextavail = select_next_packet(&(FORMAT_DATA->receivers[0]));
1163                if (nextavail == NULL) {
1164                        event.type = TRACE_EVENT_SLEEP;
1165                        event.seconds = 0.0001;
1166                        break;
1167                }
1168
1169                event.type = TRACE_EVENT_PACKET;
1170                ndag_prepare_packet_stream(libtrace,
1171                                &(FORMAT_DATA->receivers[0]), nextavail,
1172                                packet, TRACE_PREP_DO_NOT_OWN_BUFFER);
1173                event.size = trace_get_capture_length(packet) +
1174                                trace_get_framing_length(packet);
1175
1176                if (libtrace->filter) {
1177                        int filtret = trace_apply_filter(libtrace->filter,
1178                                        packet);
1179                        if (filtret == -1) {
1180                                trace_set_err(libtrace,
1181                                                TRACE_ERR_BAD_FILTER,
1182                                                "Bad BPF Filter");
1183                                event.type = TRACE_EVENT_TERMINATE;
1184                                break;
1185                        }
1186
1187                        if (filtret == 0) {
1188                                /* Didn't match filter, try next one */
1189                                libtrace->filtered_packets ++;
1190                                trace_clear_cache(packet);
1191                                continue;
1192                        }
1193                }
1194
1195                if (libtrace->snaplen > 0) {
1196                        trace_set_capture_length(packet, libtrace->snaplen);
1197                }
1198                libtrace->accepted_packets ++;
1199                break;
1200        } while (1);
1201
1202        return event;
1203}
1204
1205static void ndag_get_statistics(libtrace_t *libtrace, libtrace_stat_t *stat) {
1206
1207        int i;
1208
1209        stat->dropped_valid = 1;
1210        stat->dropped = 0;
1211        stat->received_valid = 1;
1212        stat->received = 0;
1213        stat->missing_valid = 1;
1214        stat->missing = 0;
1215
1216        /* TODO Is this thread safe? */
1217        for (i = 0; i < libtrace->perpkt_thread_count; i++) {
1218                stat->dropped += FORMAT_DATA->receivers[i].dropped_upstream;
1219                stat->received += FORMAT_DATA->receivers[i].received_packets;
1220                stat->missing += FORMAT_DATA->receivers[i].missing_records;
1221        }
1222
1223}
1224
1225static void ndag_get_thread_stats(libtrace_t *libtrace, libtrace_thread_t *t,
1226                libtrace_stat_t *stat) {
1227
1228        recvstream_t *recvr = (recvstream_t *)t->format_data;
1229
1230        if (libtrace == NULL)
1231                return;
1232        /* TODO Is this thread safe */
1233        stat->dropped_valid = 1;
1234        stat->dropped = recvr->dropped_upstream;
1235
1236        stat->received_valid = 1;
1237        stat->received = recvr->received_packets;
1238
1239        stat->missing_valid = 1;
1240        stat->missing = recvr->missing_records;
1241
1242}
1243
1244static int ndag_pregister_thread(libtrace_t *libtrace, libtrace_thread_t *t,
1245                bool reader) {
1246        recvstream_t *recvr;
1247
1248        if (!reader || t->type != THREAD_PERPKT) {
1249                return 0;
1250        }
1251
1252        recvr = &(FORMAT_DATA->receivers[t->perpkt_num]);
1253        t->format_data = recvr;
1254
1255        return 0;
1256}
1257
1258static struct libtrace_format_t ndag = {
1259
1260        "ndag",
1261        "",
1262        TRACE_FORMAT_NDAG,
1263        NULL,                   /* probe filename */
1264        NULL,                   /* probe magic */
1265        ndag_init_input,        /* init_input */
1266        NULL,                   /* config_input */
1267        ndag_start_input,       /* start_input */
1268        ndag_pause_input,       /* pause_input */
1269        NULL,                   /* init_output */
1270        NULL,                   /* config_output */
1271        NULL,                   /* start_output */
1272        ndag_fin_input,         /* fin_input */
1273        NULL,                   /* fin_output */
1274        ndag_read_packet,       /* read_packet */
1275        ndag_prepare_packet,    /* prepare_packet */
1276        NULL,                   /* fin_packet */
1277        NULL,                   /* write_packet */
1278        erf_get_link_type,      /* get_link_type */
1279        erf_get_direction,      /* get_direction */
1280        erf_set_direction,      /* set_direction */
1281        erf_get_erf_timestamp,  /* get_erf_timestamp */
1282        NULL,                   /* get_timeval */
1283        NULL,                   /* get_seconds */
1284        NULL,                   /* get_timespec */
1285        NULL,                   /* seek_erf */
1286        NULL,                   /* seek_timeval */
1287        NULL,                   /* seek_seconds */
1288        erf_get_capture_length, /* get_capture_length */
1289        erf_get_wire_length,    /* get_wire_length */
1290        erf_get_framing_length, /* get_framing_length */
1291        erf_set_capture_length, /* set_capture_length */
1292        NULL,                   /* get_received_packets */
1293        NULL,                   /* get_filtered_packets */
1294        NULL,                   /* get_dropped_packets */
1295        ndag_get_statistics,    /* get_statistics */
1296        NULL,                   /* get_fd */
1297        trace_event_ndag,       /* trace_event */
1298        NULL,                   /* help */
1299        NULL,                   /* next pointer */
1300        {true, 0},              /* live packet capture */
1301        ndag_pstart_input,      /* parallel start */
1302        ndag_pread_packets,     /* parallel read */
1303        ndag_pause_input,       /* parallel pause */
1304        NULL,
1305        ndag_pregister_thread,  /* register thread */
1306        NULL,
1307        ndag_get_thread_stats   /* per-thread stats */
1308};
1309
1310void ndag_constructor(void) {
1311        register_format(&ndag);
1312}
Note: See TracBrowser for help on using the repository browser.