source: lib/format_ndag.c @ 7e09388

cachetimestampsdevelopdpdk-ndagetsilivendag_formatrc-4.0.2rc-4.0.3rc-4.0.4ringdecrementfixringperformance
Last change on this file since 7e09388 was 7e09388, checked in by Shane Alcock <salcock@…>, 4 years ago

Fix silly bug where we weren't checking for buf index wrapping.

Also removed redundant check for (bufavail == 0) -- the following
check will catch it anyway.

  • Property mode set to 100644
File size: 42.4 KB
Line 
1
2#define _GNU_SOURCE
3
4#include "config.h"
5#include "common.h"
6#include "libtrace.h"
7#include "libtrace_int.h"
8#include "format_helper.h"
9#include "format_erf.h"
10
11#include <assert.h>
12#include <errno.h>
13#include <fcntl.h>
14#include <stdio.h>
15#include <string.h>
16#include <unistd.h>
17#include <stdlib.h>
18#include <net/if.h>
19#include <sys/types.h>
20#include <sys/socket.h>
21#include <netdb.h>
22
23#include "format_ndag.h"
24
25#define NDAG_IDLE_TIMEOUT (600)
26#define ENCAP_BUFSIZE (10000)
27#define CTRL_BUF_SIZE (10000)
28#define ENCAP_BUFFERS (1000)
29
30#define RECV_BATCH_SIZE (50)
31
32#define FORMAT_DATA ((ndag_format_data_t *)libtrace->format_data)
33
34static struct libtrace_format_t ndag;
35
36volatile int ndag_paused = 0;
37
38typedef struct monitor {
39        uint16_t monitorid;
40        uint64_t laststart;
41} ndag_monitor_t;
42
43
44typedef struct streamsource {
45        uint16_t monitor;
46        char *groupaddr;
47        char *localiface;
48        uint16_t port;
49} streamsource_t;
50
51typedef struct streamsock {
52        char *groupaddr;
53        int sock;
54        struct addrinfo *srcaddr;
55        uint16_t port;
56        uint32_t expectedseq;
57        ndag_monitor_t *monitorptr;
58        char **saved;
59        char *nextread;
60        int nextreadind;
61        int nextwriteind;
62        int savedsize[ENCAP_BUFFERS];
63        uint32_t startidle;
64        uint64_t recordcount;
65
66        int bufavail;
67
68        struct mmsghdr mmsgbufs[RECV_BATCH_SIZE];
69} streamsock_t;
70
71typedef struct recvstream {
72        streamsock_t *sources;
73        uint16_t sourcecount;
74        libtrace_message_queue_t mqueue;
75        int threadindex;
76        ndag_monitor_t *knownmonitors;
77        uint16_t monitorcount;
78
79        uint64_t dropped_upstream;
80        uint64_t missing_records;
81        uint64_t received_packets;
82} recvstream_t;
83
84typedef struct ndag_format_data {
85        char *multicastgroup;
86        char *portstr;
87        char *localiface;
88        uint16_t nextthreadid;
89        recvstream_t *receivers;
90
91        pthread_t controlthread;
92        libtrace_message_queue_t controlqueue;
93} ndag_format_data_t;
94
95enum {
96        NDAG_CLIENT_HALT = 0x01,
97        NDAG_CLIENT_RESTARTED = 0x02,   // redundant
98        NDAG_CLIENT_NEWGROUP = 0x03
99};
100
101typedef struct ndagreadermessage {
102        uint8_t type;
103        streamsource_t contents;
104} ndag_internal_message_t;
105
106
107static inline int seq_cmp(uint32_t seq_a, uint32_t seq_b) {
108
109        /* Calculate seq_a - seq_b, taking wraparound into account */
110        if (seq_a == seq_b) return 0;
111
112        if (seq_a > seq_b) {
113                return (int) (seq_a - seq_b);
114        }
115
116        /* -1 for the wrap and another -1 because we don't use zero */
117        return (int) (0xffffffff - ((seq_b - seq_a) - 2));
118}
119
120static uint8_t check_ndag_header(char *msgbuf, uint32_t msgsize) {
121        ndag_common_t *header = (ndag_common_t *)msgbuf;
122
123        if (msgsize < sizeof(ndag_common_t)) {
124                fprintf(stderr,
125                        "nDAG message does not have a complete nDAG header.\n");
126                return 0;
127        }
128
129        if (ntohl(header->magic) != NDAG_MAGIC_NUMBER) {
130                fprintf(stderr,
131                        "nDAG message does not have a valid magic number.\n");
132                return 0;
133        }
134
135        if (header->version > NDAG_EXPORT_VERSION || header->version == 0) {
136                fprintf(stderr,
137                        "nDAG message has an invalid header version: %u\n",
138                                header->version);
139                return 0;
140        }
141
142        return header->type;
143}
144
145static int join_multicast_group(char *groupaddr, char *localiface,
146        char *portstr, uint16_t portnum, struct addrinfo **srcinfo) {
147
148        struct addrinfo hints;
149        struct addrinfo *gotten;
150        struct addrinfo *group;
151        unsigned int interface;
152        char pstr[16];
153        struct group_req greq;
154        int bufsize;
155
156        int sock;
157
158        if (portstr == NULL) {
159                snprintf(pstr, 15, "%u", portnum);
160                portstr = pstr;
161        }
162
163        interface = if_nametoindex(localiface);
164        if (interface == 0) {
165                fprintf(stderr, "Failed to lookup interface %s -- %s\n",
166                                localiface, strerror(errno));
167                return -1;
168        }
169
170        hints.ai_family = PF_UNSPEC;
171        hints.ai_socktype = SOCK_DGRAM;
172        hints.ai_flags = AI_PASSIVE;
173        hints.ai_protocol = 0;
174
175        if (getaddrinfo(NULL, portstr, &hints, &gotten) != 0) {
176                fprintf(stderr,
177                        "Call to getaddrinfo failed for NULL:%s -- %s\n",
178                                portstr, strerror(errno));
179                return -1;
180        }
181
182        if (getaddrinfo(groupaddr, NULL, &hints, &group) != 0) {
183                fprintf(stderr, "Call to getaddrinfo failed for %s -- %s\n",
184                                groupaddr, strerror(errno));
185                return -1;
186        }
187
188        *srcinfo = gotten;
189        sock = socket(gotten->ai_family, gotten->ai_socktype, 0);
190        if (sock < 0) {
191                fprintf(stderr,
192                        "Failed to create multicast socket for %s:%s -- %s\n",
193                                groupaddr, portstr, strerror(errno));
194                goto sockcreateover;
195        }
196
197        if (bind(sock, (struct sockaddr *)gotten->ai_addr, gotten->ai_addrlen) < 0)
198        {
199                fprintf(stderr,
200                        "Failed to bind to multicast socket %s:%s -- %s\n",
201                                groupaddr, portstr, strerror(errno));
202                close(sock);
203                sock = -1;
204                goto sockcreateover;
205        }
206
207        greq.gr_interface = interface;
208        memcpy(&(greq.gr_group), group->ai_addr, group->ai_addrlen);
209
210        if (setsockopt(sock, IPPROTO_IP, MCAST_JOIN_GROUP, &greq,
211                        sizeof(greq)) < 0) {
212                fprintf(stderr,
213                        "Failed to join multicast group %s:%s -- %s\n",
214                                groupaddr, portstr, strerror(errno));
215                close(sock);
216                sock = -1;
217                goto sockcreateover;
218        }
219
220        bufsize = 16 * 1024 * 1024;
221        if (setsockopt(sock, SOL_SOCKET, SO_RCVBUF, &bufsize,
222                                (socklen_t)sizeof(int)) < 0) {
223
224                fprintf(stderr,
225                        "Failed to increase buffer size for multicast group %s:%s -- %s\n",
226                                groupaddr, portstr, strerror(errno));
227                close(sock);
228                sock = -1;
229                goto sockcreateover;
230        }
231
232sockcreateover:
233        freeaddrinfo(group);
234        return sock;
235}
236
237
238static int ndag_init_input(libtrace_t *libtrace) {
239
240        char *scan = NULL;
241        char *next = NULL;
242
243        libtrace->format_data = (ndag_format_data_t *)malloc(
244                        sizeof(ndag_format_data_t));
245
246        FORMAT_DATA->multicastgroup = NULL;
247        FORMAT_DATA->portstr = NULL;
248        FORMAT_DATA->localiface = NULL;
249        FORMAT_DATA->nextthreadid = 0;
250        FORMAT_DATA->receivers = NULL;
251
252        scan = strchr(libtrace->uridata, ',');
253        if (scan == NULL) {
254                trace_set_err(libtrace, TRACE_ERR_BAD_FORMAT,
255                        "Bad ndag URI. Should be ndag:<interface>,<multicast group>,<port number>");
256                return -1;
257        }
258        FORMAT_DATA->localiface = strndup(libtrace->uridata,
259                        (size_t)(scan - libtrace->uridata));
260        next = scan + 1;
261
262        scan = strchr(next, ',');
263        if (scan == NULL) {
264                FORMAT_DATA->portstr = strdup("9001");
265                FORMAT_DATA->multicastgroup = strdup(next);
266        } else {
267                FORMAT_DATA->multicastgroup = strndup(next, (size_t)(scan - next));
268
269                FORMAT_DATA->portstr = strdup(scan + 1);
270        }
271        return 0;
272}
273
274static void new_group_alert(libtrace_t *libtrace, uint16_t threadid,
275                uint16_t portnum, uint16_t monid) {
276
277        ndag_internal_message_t alert;
278
279        alert.type = NDAG_CLIENT_NEWGROUP;
280        alert.contents.groupaddr = FORMAT_DATA->multicastgroup;
281        alert.contents.localiface = FORMAT_DATA->localiface;
282        alert.contents.port = portnum;
283        alert.contents.monitor = monid;
284
285        libtrace_message_queue_put(&(FORMAT_DATA->receivers[threadid].mqueue),
286                        (void *)&alert);
287
288}
289       
290static int ndag_parse_control_message(libtrace_t *libtrace, char *msgbuf,
291                int msgsize, uint16_t *ptmap) {
292
293        int i;
294        ndag_common_t *ndaghdr = (ndag_common_t *)msgbuf;
295        uint8_t msgtype;
296
297        msgtype = check_ndag_header(msgbuf, (uint32_t)msgsize);
298        if (msgtype == 0) {
299                return -1;
300        }
301
302        msgsize -= sizeof(ndag_common_t);
303        if (msgtype == NDAG_PKT_BEACON) {
304                /* If message is a beacon, make sure every port included in the
305                 * beacon is assigned to a receive thread.
306                 */
307                uint16_t *ptr, numstreams;
308
309                if ((uint32_t)msgsize < sizeof(uint16_t)) {
310                        fprintf(stderr, "Malformed beacon (missing number of streams).\n");
311                        return -1;
312                }
313
314                ptr = (uint16_t *)(msgbuf + sizeof(ndag_common_t));
315                numstreams = ntohs(*ptr);
316                ptr ++;
317
318                if ((uint32_t)msgsize != ((numstreams + 1) * sizeof(uint16_t)))
319                {
320                        fprintf(stderr, "Malformed beacon (length doesn't match number of streams).\n");
321                        fprintf(stderr, "%u %u\n", msgsize, numstreams);
322                        return -1;
323                }
324
325                for (i = 0; i < numstreams; i++) {
326                        uint16_t streamport = ntohs(*ptr);
327
328                        if (ptmap[streamport] == 0xffff) {
329                                new_group_alert(libtrace,
330                                        FORMAT_DATA->nextthreadid, streamport,
331                                        ntohs(ndaghdr->monitorid));
332
333                                ptmap[streamport] = FORMAT_DATA->nextthreadid;
334
335                                if (libtrace->perpkt_thread_count == 0) {
336                                        FORMAT_DATA->nextthreadid = 0;
337                                } else {
338                                        FORMAT_DATA->nextthreadid =
339                                                ((FORMAT_DATA->nextthreadid + 1) % libtrace->perpkt_thread_count);
340                                }
341                        }
342
343                        ptr ++;
344                }
345        } else {
346                fprintf(stderr,
347                        "Unexpected message type on control channel: %u\n",
348                         msgtype);
349                return -1;
350        }
351
352        return 0;
353
354}
355
356static void *ndag_controller_run(void *tdata) {
357
358        libtrace_t *libtrace = (libtrace_t *)tdata;
359        uint16_t ptmap[65536];
360        int sock = -1;
361        struct addrinfo *receiveaddr = NULL;
362        fd_set listening;
363        struct timeval timeout;
364
365        /* ptmap is a dirty hack to allow us to quickly check if we've already
366         * assigned a stream to a thread.
367         */
368        memset(ptmap, 0xff, 65536 * sizeof(uint16_t));
369
370        sock = join_multicast_group(FORMAT_DATA->multicastgroup,
371                        FORMAT_DATA->localiface, FORMAT_DATA->portstr, 0,
372                        &receiveaddr);
373        if (sock == -1) {
374                trace_set_err(libtrace, TRACE_ERR_INIT_FAILED,
375                        "Unable to join multicast group for nDAG control channel");
376                trace_interrupt();
377        }
378
379        ndag_paused = 0;
380        while ((is_halted(libtrace) == -1) && !ndag_paused) {
381                int ret;
382                char buf[CTRL_BUF_SIZE];
383
384                FD_ZERO(&listening);
385                FD_SET(sock, &listening);
386
387                timeout.tv_sec = 0;
388                timeout.tv_usec = 500000;
389
390                ret = select(sock + 1, &listening, NULL, NULL, &timeout);
391                if (ret < 0) {
392                        fprintf(stderr, "Error while waiting for nDAG control messages: %s\n", strerror(errno));
393                        break;
394                }
395
396                if (!FD_ISSET(sock, &listening)) {
397                        continue;
398                }
399
400                ret = recvfrom(sock, buf, CTRL_BUF_SIZE, 0,
401                                receiveaddr->ai_addr,
402                                &(receiveaddr->ai_addrlen));
403                if (ret < 0) {
404                        fprintf(stderr, "Error while receiving nDAG control message: %s\n", strerror(errno));
405                        break;
406                }
407
408                if (ret == 0) {
409                        break;
410                }
411
412                if (ndag_parse_control_message(libtrace, buf, ret, ptmap) < 0) {
413                        fprintf(stderr, "Error while parsing nDAG control message.\n");
414                        continue;
415                }
416        }
417
418        if (sock >= 0) {
419                close(sock);
420        }
421
422        /* Control channel has fallen over, should probably encourage libtrace
423         * to halt the receiver threads as well.
424         */
425        if (!is_halted(libtrace)) {
426                trace_interrupt();
427        }
428
429        pthread_exit(NULL);
430}
431
432static int ndag_start_threads(libtrace_t *libtrace, uint32_t maxthreads)
433{
434        int ret;
435        uint32_t i;
436        /* Configure the set of receiver threads */
437
438        if (FORMAT_DATA->receivers == NULL) {
439                /* What if the number of threads changes between a pause and
440                 * a restart? Can this happen? */
441                FORMAT_DATA->receivers = (recvstream_t *)
442                                malloc(sizeof(recvstream_t) * maxthreads);
443        }
444
445        for (i = 0; i < maxthreads; i++) {
446                FORMAT_DATA->receivers[i].sources = NULL;
447                FORMAT_DATA->receivers[i].sourcecount = 0;
448                FORMAT_DATA->receivers[i].knownmonitors = NULL;
449                FORMAT_DATA->receivers[i].monitorcount = 0;
450                FORMAT_DATA->receivers[i].threadindex = i;
451                FORMAT_DATA->receivers[i].dropped_upstream = 0;
452                FORMAT_DATA->receivers[i].received_packets = 0;
453                FORMAT_DATA->receivers[i].missing_records = 0;
454
455                libtrace_message_queue_init(&(FORMAT_DATA->receivers[i].mqueue),
456                                sizeof(ndag_internal_message_t));
457        }
458
459        /* Start the controller thread */
460        /* TODO consider affinity of this thread? */
461
462        ret = pthread_create(&(FORMAT_DATA->controlthread), NULL,
463                        ndag_controller_run, libtrace);
464        if (ret != 0) {
465                return -1;
466        }
467        return maxthreads;
468}
469
470static int ndag_start_input(libtrace_t *libtrace) {
471        return ndag_start_threads(libtrace, 1);
472}
473
474static int ndag_pstart_input(libtrace_t *libtrace) {
475        if (ndag_start_threads(libtrace, libtrace->perpkt_thread_count) ==
476                        libtrace->perpkt_thread_count)
477                return 0;
478        return -1;
479}
480
481static void halt_ndag_receiver(recvstream_t *receiver) {
482        int j, i;
483        libtrace_message_queue_destroy(&(receiver->mqueue));
484
485        if (receiver->sources == NULL)
486                return;
487        for (i = 0; i < receiver->sourcecount; i++) {
488                streamsock_t src = receiver->sources[i];
489                if (src.saved) {
490                        for (j = 0; i < ENCAP_BUFFERS; j++) {
491                                if (src.saved[j]) {
492                                        free(src.saved[j]);
493                                }
494                        }
495                        free(src.saved);
496                }
497                for (j = 0; j < RECV_BATCH_SIZE; j++) {
498                        if (src.mmsgbufs[j].msg_hdr.msg_iov) {
499                                free(src.mmsgbufs[j].msg_hdr.msg_iov);
500                        }
501                }
502                close(src.sock);
503        }
504        if (receiver->knownmonitors) {
505                free(receiver->knownmonitors);
506        }
507
508        if (receiver->sources) {
509                free(receiver->sources);
510        }
511}
512
513static int ndag_pause_input(libtrace_t *libtrace) {
514        int i;
515
516        /* Close the existing receiver sockets */
517        for (i = 0; i < libtrace->perpkt_thread_count; i++) {
518               halt_ndag_receiver(&(FORMAT_DATA->receivers[i]));
519        }
520        return 0;
521}
522
523static int ndag_fin_input(libtrace_t *libtrace) {
524
525        if (FORMAT_DATA->receivers) {
526                free(FORMAT_DATA->receivers);
527        }
528        if (FORMAT_DATA->multicastgroup) {
529                free(FORMAT_DATA->multicastgroup);
530        }
531        if (FORMAT_DATA->portstr) {
532                free(FORMAT_DATA->portstr);
533        }
534        if (FORMAT_DATA->localiface) {
535                free(FORMAT_DATA->localiface);
536        }
537
538        free(libtrace->format_data);
539        return 0;
540}
541
542static int ndag_prepare_packet_stream(libtrace_t *libtrace,
543                recvstream_t *rt,
544                streamsock_t *ssock, libtrace_packet_t *packet,
545                uint32_t flags) {
546
547        dag_record_t *erfptr;
548        ndag_encap_t *encaphdr;
549        uint16_t ndag_reccount = 0;
550        int nr;
551
552        if ((flags & TRACE_PREP_OWN_BUFFER) == TRACE_PREP_OWN_BUFFER) {
553                packet->buf_control = TRACE_CTRL_PACKET;
554        } else {
555                packet->buf_control = TRACE_CTRL_EXTERNAL;
556        }
557
558        packet->trace = libtrace;
559        packet->buffer = ssock->nextread;
560        packet->header = ssock->nextread;
561        packet->type = TRACE_RT_DATA_ERF;
562
563        erfptr = (dag_record_t *)packet->header;
564
565        if (erfptr->flags.rxerror == 1) {
566                packet->payload = NULL;
567                erfptr->rlen = htons(erf_get_framing_length(packet));
568        } else {
569                packet->payload = (char *)packet->buffer +
570                                erf_get_framing_length(packet);
571        }
572
573        /* Update upstream drops using lctr */
574
575        if (erfptr->type == TYPE_DSM_COLOR_ETH) {
576                /* TODO */
577        } else {
578                if (rt->received_packets > 0) {
579                        rt->dropped_upstream += ntohs(erfptr->lctr);
580                }
581        }
582
583        rt->received_packets ++;
584        ssock->recordcount += 1;
585
586        nr = ssock->nextreadind;
587        encaphdr = (ndag_encap_t *)(ssock->saved[nr] +
588                        sizeof(ndag_common_t));
589
590        ndag_reccount = ntohs(encaphdr->recordcount);
591        if ((ndag_reccount & 0x8000) != 0) {
592                /* Record was truncated -- update rlen appropriately */
593                erfptr->rlen = htons(ssock->savedsize[nr] -
594                                (ssock->nextread - ssock->saved[nr]));
595        }
596        ssock->nextread += ntohs(erfptr->rlen);
597
598        if (ssock->nextread - ssock->saved[nr] >= ssock->savedsize[nr]) {
599                /* Read everything from this buffer, mark as empty and
600                 * move on. */
601                ssock->savedsize[nr] = 0;
602                ssock->bufavail ++;
603
604                assert(ssock->bufavail > 0 && ssock->bufavail <= ENCAP_BUFFERS);
605                nr ++;
606                if (nr == ENCAP_BUFFERS) {
607                        nr = 0;
608                }
609                ssock->nextread = ssock->saved[nr] + sizeof(ndag_common_t) +
610                                sizeof(ndag_encap_t);
611                ssock->nextreadind = nr;
612        }
613
614        packet->order = erf_get_erf_timestamp(packet);
615        packet->error = packet->payload ? ntohs(erfptr->rlen) :
616                        erf_get_framing_length(packet);
617
618        return ntohs(erfptr->rlen);
619}
620
621static int ndag_prepare_packet(libtrace_t *libtrace UNUSED,
622                libtrace_packet_t *packet UNUSED,
623                void *buffer UNUSED, libtrace_rt_types_t rt_type UNUSED,
624                uint32_t flags UNUSED) {
625
626        assert(0 && "Sending nDAG records over RT doesn't make sense! Please stop.");
627        return 0;
628
629}
630
631static ndag_monitor_t *add_new_knownmonitor(recvstream_t *rt, uint16_t monid) {
632
633        ndag_monitor_t *mon;
634
635        if (rt->monitorcount == 0) {
636                rt->knownmonitors = (ndag_monitor_t *)
637                                malloc(sizeof(ndag_monitor_t) * 5);
638        } else {
639                rt->knownmonitors = (ndag_monitor_t *)
640                            realloc(rt->knownmonitors,
641                            sizeof(ndag_monitor_t) * (rt->monitorcount * 5));
642        }
643
644        mon = &(rt->knownmonitors[rt->monitorcount]);
645        mon->monitorid = monid;
646        mon->laststart = 0;
647
648        rt->monitorcount ++;
649        return mon;
650}
651
652static int add_new_streamsock(recvstream_t *rt, streamsource_t src) {
653
654        streamsock_t *ssock = NULL;
655        ndag_monitor_t *mon = NULL;
656        int i;
657
658        /* TODO consider replacing this with a list or vector so we can
659         * easily remove sources that are no longer in use, rather than
660         * just setting the sock to -1 and having to check them every
661         * time we want to read a packet.
662         */
663        if (rt->sourcecount == 0) {
664                rt->sources = (streamsock_t *)malloc(sizeof(streamsock_t) * 10);
665        } else if ((rt->sourcecount % 10) == 0) {
666                rt->sources = (streamsock_t *)realloc(rt->sources,
667                        sizeof(streamsock_t) * (rt->sourcecount + 10));
668        }
669
670        ssock = &(rt->sources[rt->sourcecount]);
671
672        ssock->sock = join_multicast_group(src.groupaddr, src.localiface,
673                        NULL, src.port, &(ssock->srcaddr));
674
675        if (ssock->sock < 0) {
676                return -1;
677        }
678
679        for (i = 0; i < rt->monitorcount; i++) {
680                if (rt->knownmonitors[i].monitorid == src.monitor) {
681                        mon = &(rt->knownmonitors[i]);
682                        break;
683                }
684        }
685
686        if (mon == NULL) {
687                mon = add_new_knownmonitor(rt, src.monitor);
688        }
689
690        ssock->port = src.port;
691        ssock->groupaddr = src.groupaddr;
692        ssock->expectedseq = 0;
693        ssock->monitorptr = mon;
694        ssock->saved = (char **)malloc(sizeof(char *) * ENCAP_BUFFERS);
695        ssock->bufavail = ENCAP_BUFFERS;
696        ssock->startidle = 0;
697
698        for (i = 0; i < ENCAP_BUFFERS; i++) {
699                ssock->saved[i] = (char *)malloc(ENCAP_BUFSIZE);
700                ssock->savedsize[i] = 0;
701        }
702
703        for (i = 0; i < RECV_BATCH_SIZE; i++) {
704                ssock->mmsgbufs[i].msg_hdr.msg_iov = (struct iovec *)
705                                malloc(sizeof(struct iovec));
706                ssock->mmsgbufs[i].msg_hdr.msg_name = ssock->srcaddr->ai_addr;
707                ssock->mmsgbufs[i].msg_hdr.msg_namelen = ssock->srcaddr->ai_addrlen;
708                ssock->mmsgbufs[i].msg_hdr.msg_control = NULL;
709                ssock->mmsgbufs[i].msg_hdr.msg_controllen = 0;
710                ssock->mmsgbufs[i].msg_hdr.msg_flags = 0;
711                ssock->mmsgbufs[i].msg_len = 0;
712        }
713
714        ssock->nextread = NULL;;
715        ssock->nextreadind = 0;
716        ssock->recordcount = 0;
717        rt->sourcecount += 1;
718
719        fprintf(stderr, "Added new stream %s:%u to thread %d\n",
720                        ssock->groupaddr, ssock->port, rt->threadindex);
721
722        return ssock->port;
723}
724
725static int receiver_read_messages(recvstream_t *rt) {
726
727        ndag_internal_message_t msg;
728
729        while (libtrace_message_queue_try_get(&(rt->mqueue),
730                                (void *)&msg) != LIBTRACE_MQ_FAILED) {
731                switch(msg.type) {
732                        case NDAG_CLIENT_NEWGROUP:
733                                if (add_new_streamsock(rt, msg.contents) < 0) {
734                                        return -1;
735                                }
736                                break;
737                        case NDAG_CLIENT_HALT:
738                                return 0;
739                }
740        }
741        return 1;
742
743}
744
745static inline int readable_data(streamsock_t *ssock) {
746
747        if (ssock->sock == -1) {
748                return 0;
749        }
750        if (ssock->savedsize[ssock->nextreadind] == 0) {
751                return 0;
752        }
753        /*
754        if (ssock->nextread - ssock->saved[ssock->nextreadind] >=
755                        ssock->savedsize[ssock->nextreadind]) {
756                return 0;
757        }
758        */
759        return 1;
760
761
762}
763
764static inline void reset_expected_seqs(recvstream_t *rt, ndag_monitor_t *mon) {
765
766        int i;
767        for (i = 0; i < rt->sourcecount; i++) {
768                if (rt->sources[i].monitorptr == mon) {
769                        rt->sources[i].expectedseq = 0;
770                }
771        }
772
773}
774
775static int init_receivers(streamsock_t *ssock, int required) {
776
777        int wind = ssock->nextwriteind;
778        int i;
779
780        for (i = 0; i < required; i++) {
781                if (i >= RECV_BATCH_SIZE) {
782                        break;
783                }
784
785                if (wind >= ENCAP_BUFFERS) {
786                        wind = 0;
787                }
788
789                ssock->mmsgbufs[i].msg_len = 0;
790                ssock->mmsgbufs[i].msg_hdr.msg_iov->iov_base = ssock->saved[wind];
791                ssock->mmsgbufs[i].msg_hdr.msg_iov->iov_len = ENCAP_BUFSIZE;
792                ssock->mmsgbufs[i].msg_hdr.msg_iovlen = 1;
793
794                wind ++;
795        }
796
797        return i;
798}
799
800static int check_ndag_received(streamsock_t *ssock, int index,
801                unsigned int msglen, recvstream_t *rt) {
802
803        ndag_encap_t *encaphdr;
804        ndag_monitor_t *mon;
805        uint8_t rectype;
806
807        /* Check that we have a valid nDAG encap record */
808        rectype = check_ndag_header(ssock->saved[index], (uint32_t)msglen);
809
810        if (rectype == NDAG_PKT_KEEPALIVE) {
811                /* Keep-alive, reset startidle and carry on. Don't
812                 * change nextwrite -- we want to overwrite the
813                 * keep-alive with usable content. */
814                return 0;
815        } else if (rectype != NDAG_PKT_ENCAPERF) {
816                fprintf(stderr, "Received invalid record on the channel for %s:%u.\n",
817                                ssock->groupaddr, ssock->port);
818                close(ssock->sock);
819                ssock->sock = -1;
820                return -1;
821        }
822
823        ssock->savedsize[index] = msglen;
824        ssock->nextwriteind ++;
825        ssock->bufavail --;
826
827        assert(ssock->bufavail >= 0);
828
829        if (ssock->nextwriteind >= ENCAP_BUFFERS) {
830                ssock->nextwriteind = 0;
831        }
832
833        /* Get the useful info from the encap header */
834        encaphdr=(ndag_encap_t *)(ssock->saved[index] + sizeof(ndag_common_t));
835
836        mon = ssock->monitorptr;
837
838        if (mon->laststart == 0) {
839                mon->laststart = bswap_be_to_host64(encaphdr->started);
840        } else if (mon->laststart != bswap_be_to_host64(encaphdr->started)) {
841                mon->laststart = bswap_be_to_host64(encaphdr->started);
842                reset_expected_seqs(rt, mon);
843
844                /* TODO what is a good way to indicate this to clients?
845                 * set the loss counter in the ERF header? a bit rude?
846                 * use another bit in the ERF header?
847                 * add a queryable flag to libtrace_packet_t?
848                 */
849
850        }
851
852        if (ssock->expectedseq != 0) {
853                rt->missing_records += seq_cmp(
854                                ntohl(encaphdr->seqno), ssock->expectedseq);
855        }
856        ssock->expectedseq = ntohl(encaphdr->seqno) + 1;
857        if (ssock->expectedseq == 0) {
858                ssock->expectedseq ++;
859        }
860
861        if (ssock->nextread == NULL) {
862                /* If this is our first read, set up 'nextread'
863                 * by skipping past the nDAG headers */
864                ssock->nextread = ssock->saved[0] +
865                        sizeof(ndag_common_t) + sizeof(ndag_encap_t);
866        }
867        return 1;
868
869}
870
871static int receive_from_single_socket(streamsock_t *ssock, struct timeval *tv,
872                int *gottime, recvstream_t *rt) {
873
874        int ret, ndagstat, i, avail;
875        int toret = 0;
876
877        if (ssock->sock == -1) {
878                return 0;
879        }
880
881        /* Plenty of full buffers, just use the packets in those */
882        if (ssock->bufavail < RECV_BATCH_SIZE / 2) {
883                return 1;
884        }
885
886        avail = init_receivers(ssock, ssock->bufavail);
887
888        ret = recvmmsg(ssock->sock, ssock->mmsgbufs, avail,
889                        MSG_DONTWAIT, NULL);
890
891        if (ret < 0) {
892                /* Nothing to receive right now, but we should still
893                 * count as 'ready' if at least one buffer is full */
894                if (errno == EAGAIN || errno == EWOULDBLOCK) {
895                        if (readable_data(ssock)) {
896                                toret = 1;
897                        }
898                        if (!(*gottime)) {
899                                gettimeofday(tv, NULL);
900                                *gottime = 1;
901                        }
902                        if (ssock->startidle == 0) {
903                                ssock->startidle = tv->tv_sec;
904                        } else if (tv->tv_sec - ssock->startidle > NDAG_IDLE_TIMEOUT) {
905                                fprintf(stderr,
906                                        "Closing channel %s:%u due to inactivity.\n",
907                                        ssock->groupaddr,
908                                        ssock->port);
909
910                                close(ssock->sock);
911                                ssock->sock = -1;
912                        }
913                } else {
914
915                        fprintf(stderr,
916                                "Error receiving encapsulated records from %s:%u -- %s \n",
917                                ssock->groupaddr, ssock->port,
918                                strerror(errno));
919                        close(ssock->sock);
920                        ssock->sock = -1;
921                }
922                return toret;
923        }
924        ssock->startidle = 0;
925        for (i = 0; i < ret; i++) {
926                ndagstat = check_ndag_received(ssock, ssock->nextwriteind,
927                                ssock->mmsgbufs[i].msg_len, rt);
928                if (ndagstat == -1) {
929                        break;
930                }
931
932                if (ndagstat == 1) {
933                        toret = 1;
934                }
935        }
936
937        return toret;
938}
939
940static int receive_from_sockets(recvstream_t *rt) {
941
942        int i, readybufs, gottime;
943        struct timeval tv;
944
945        readybufs = 0;
946        gottime = 0;
947
948        for (i = 0; i < rt->sourcecount; i ++) {
949                readybufs += receive_from_single_socket(&(rt->sources[i]),
950                                &tv, &gottime, rt);
951        }
952
953        return readybufs;
954
955}
956
957
958static int receive_encap_records_block(libtrace_t *libtrace, recvstream_t *rt,
959                libtrace_packet_t *packet) {
960
961        int iserr = 0;
962
963        if (packet->buf_control == TRACE_CTRL_PACKET) {
964                free(packet->buffer);
965                packet->buffer = NULL;
966        }
967
968        do {
969                /* Make sure we shouldn't be halting */
970                if ((iserr = is_halted(libtrace)) != -1) {
971                        return iserr;
972                }
973
974                /* Check for any messages from the control thread */
975                iserr = receiver_read_messages(rt);
976
977                if (iserr <= 0) {
978                        return iserr;
979                }
980
981                /* If blocking and no sources, sleep for a bit and then try
982                 * checking for messages again.
983                 */
984                if (rt->sourcecount == 0) {
985                        usleep(10000);
986                        continue;
987                }
988
989                if ((iserr = receive_from_sockets(rt)) < 0) {
990                        return iserr;
991                } else if (iserr > 0) {
992                        /* At least one of our input sockets has available
993                         * data, let's go ahead and use what we have. */
994                        break;
995                }
996
997                /* None of our sources have anything available, we can take
998                 * a short break rather than immediately trying again.
999                 */
1000                if (iserr == 0) {
1001                        usleep(100);
1002                }
1003
1004        } while (1);
1005
1006        return iserr;
1007}
1008
1009static int receive_encap_records_nonblock(libtrace_t *libtrace, recvstream_t *rt,
1010                libtrace_packet_t *packet) {
1011
1012        int iserr = 0;
1013
1014        if (packet->buf_control == TRACE_CTRL_PACKET) {
1015                free(packet->buffer);
1016                packet->buffer = NULL;
1017        }
1018
1019        /* Make sure we shouldn't be halting */
1020        if ((iserr = is_halted(libtrace)) != -1) {
1021                return iserr;
1022        }
1023
1024        /* If non-blocking and there are no sources, just break */
1025        if (rt->sourcecount == 0) {
1026                return 0;
1027        }
1028
1029        return receive_from_sockets(rt);
1030}
1031
1032static streamsock_t *select_next_packet(recvstream_t *rt) {
1033        int i;
1034        streamsock_t *ssock = NULL;
1035        uint64_t earliest = 0;
1036        uint64_t currentts = 0;
1037        dag_record_t *daghdr;
1038
1039        for (i = 0; i < rt->sourcecount; i ++) {
1040                if (!readable_data(&(rt->sources[i]))) {
1041                        continue;
1042                }
1043
1044                daghdr = (dag_record_t *)(rt->sources[i].nextread);
1045                currentts = bswap_le_to_host64(daghdr->ts);
1046
1047                if (earliest == 0 || earliest > currentts) {
1048                        earliest = currentts;
1049                        ssock = &(rt->sources[i]);
1050                }
1051                /*
1052                fprintf(stderr, "%d %d %lu %lu %lu\n", rt->threadindex,
1053                                i, currentts,
1054                                rt->sources[i].recordcount,
1055                                rt->missing_records);
1056                */
1057        }
1058        return ssock;
1059}
1060
1061static int ndag_read_packet(libtrace_t *libtrace, libtrace_packet_t *packet) {
1062
1063        int rem;
1064        streamsock_t *nextavail = NULL;
1065        rem = receive_encap_records_block(libtrace, &(FORMAT_DATA->receivers[0]),
1066                        packet);
1067
1068        if (rem <= 0) {
1069                return rem;
1070        }
1071
1072        nextavail = select_next_packet(&(FORMAT_DATA->receivers[0]));
1073        if (nextavail == NULL) {
1074                return 0;
1075        }
1076
1077        /* nextread should point at an ERF header, so prepare 'packet' to be
1078         * a libtrace ERF packet. */
1079
1080        return ndag_prepare_packet_stream(libtrace,
1081                        &(FORMAT_DATA->receivers[0]), nextavail,
1082                        packet, TRACE_PREP_DO_NOT_OWN_BUFFER);
1083}
1084
1085static int ndag_pread_packets(libtrace_t *libtrace, libtrace_thread_t *t,
1086                libtrace_packet_t **packets, size_t nb_packets) {
1087
1088        recvstream_t *rt;
1089        int rem;
1090        size_t read_packets = 0;
1091        streamsock_t *nextavail = NULL;
1092
1093        rt = (recvstream_t *)t->format_data;
1094
1095
1096        do {
1097                /* Only check for messages once per batch */
1098                if (read_packets == 0) {
1099                        rem = receive_encap_records_block(libtrace, rt,
1100                                packets[read_packets]);
1101                } else {
1102                        rem = receive_encap_records_nonblock(libtrace, rt,
1103                                packets[read_packets]);
1104                }
1105
1106                if (rem < 0) {
1107                        return rem;
1108                }
1109
1110                if (rem == 0) {
1111                        break;
1112                }
1113
1114                nextavail = select_next_packet(rt);
1115                if (nextavail == NULL) {
1116                        break;
1117                }
1118
1119                ndag_prepare_packet_stream(libtrace, rt, nextavail,
1120                                packets[read_packets],
1121                                TRACE_PREP_DO_NOT_OWN_BUFFER);
1122
1123                read_packets  ++;
1124                if (read_packets >= nb_packets) {
1125                        break;
1126                }
1127        } while (1);
1128
1129        return read_packets;
1130
1131}
1132
1133static libtrace_eventobj_t trace_event_ndag(libtrace_t *libtrace,
1134                libtrace_packet_t *packet) {
1135
1136
1137        libtrace_eventobj_t event = {0,0,0.0,0};
1138        int rem;
1139        streamsock_t *nextavail = NULL;
1140
1141        /* Only check for messages once per call */
1142        rem = receiver_read_messages(&(FORMAT_DATA->receivers[0]));
1143        if (rem <= 0) {
1144                event.type = TRACE_EVENT_TERMINATE;
1145                return event;
1146        }
1147
1148        do {
1149                rem = receive_encap_records_nonblock(libtrace,
1150                                &(FORMAT_DATA->receivers[0]), packet);
1151
1152                if (rem < 0) {
1153                        trace_set_err(libtrace, TRACE_ERR_BAD_PACKET,
1154                                "Received invalid nDAG records.");
1155                        event.type = TRACE_EVENT_TERMINATE;
1156                        break;
1157                }
1158
1159                if (rem == 0) {
1160                        /* Either we've been halted or we've got no packets
1161                         * right now. */
1162                        if (is_halted(libtrace) == 0) {
1163                                event.type = TRACE_EVENT_TERMINATE;
1164                                break;
1165                        }
1166                        event.type = TRACE_EVENT_SLEEP;
1167                        event.seconds = 0.0001;
1168                        break;
1169                }
1170
1171                nextavail = select_next_packet(&(FORMAT_DATA->receivers[0]));
1172                if (nextavail == NULL) {
1173                        event.type = TRACE_EVENT_SLEEP;
1174                        event.seconds = 0.0001;
1175                        break;
1176                }
1177
1178                event.type = TRACE_EVENT_PACKET;
1179                ndag_prepare_packet_stream(libtrace,
1180                                &(FORMAT_DATA->receivers[0]), nextavail,
1181                                packet, TRACE_PREP_DO_NOT_OWN_BUFFER);
1182                event.size = trace_get_capture_length(packet) +
1183                                trace_get_framing_length(packet);
1184
1185                if (libtrace->filter) {
1186                        int filtret = trace_apply_filter(libtrace->filter,
1187                                        packet);
1188                        if (filtret == -1) {
1189                                trace_set_err(libtrace,
1190                                                TRACE_ERR_BAD_FILTER,
1191                                                "Bad BPF Filter");
1192                                event.type = TRACE_EVENT_TERMINATE;
1193                                break;
1194                        }
1195
1196                        if (filtret == 0) {
1197                                /* Didn't match filter, try next one */
1198                                libtrace->filtered_packets ++;
1199                                trace_clear_cache(packet);
1200                                continue;
1201                        }
1202                }
1203
1204                if (libtrace->snaplen > 0) {
1205                        trace_set_capture_length(packet, libtrace->snaplen);
1206                }
1207                libtrace->accepted_packets ++;
1208                break;
1209        } while (1);
1210
1211        return event;
1212}
1213
1214static void ndag_get_statistics(libtrace_t *libtrace, libtrace_stat_t *stat) {
1215
1216        int i;
1217
1218        stat->dropped_valid = 1;
1219        stat->dropped = 0;
1220        stat->received_valid = 1;
1221        stat->received = 0;
1222        stat->missing_valid = 1;
1223        stat->missing = 0;
1224
1225        /* TODO Is this thread safe? */
1226        for (i = 0; i < libtrace->perpkt_thread_count; i++) {
1227                stat->dropped += FORMAT_DATA->receivers[i].dropped_upstream;
1228                stat->received += FORMAT_DATA->receivers[i].received_packets;
1229                stat->missing += FORMAT_DATA->receivers[i].missing_records;
1230        }
1231
1232}
1233
1234static void ndag_get_thread_stats(libtrace_t *libtrace, libtrace_thread_t *t,
1235                libtrace_stat_t *stat) {
1236
1237        recvstream_t *recvr = (recvstream_t *)t->format_data;
1238
1239        if (libtrace == NULL)
1240                return;
1241        /* TODO Is this thread safe */
1242        stat->dropped_valid = 1;
1243        stat->dropped = recvr->dropped_upstream;
1244
1245        stat->received_valid = 1;
1246        stat->received = recvr->received_packets;
1247
1248        stat->missing_valid = 1;
1249        stat->missing = recvr->missing_records;
1250
1251}
1252
1253static int ndag_pregister_thread(libtrace_t *libtrace, libtrace_thread_t *t,
1254                bool reader) {
1255        recvstream_t *recvr;
1256
1257        if (!reader || t->type != THREAD_PERPKT) {
1258                return 0;
1259        }
1260
1261        recvr = &(FORMAT_DATA->receivers[t->perpkt_num]);
1262        t->format_data = recvr;
1263
1264        return 0;
1265}
1266
1267static struct libtrace_format_t ndag = {
1268
1269        "ndag",
1270        "",
1271        TRACE_FORMAT_NDAG,
1272        NULL,                   /* probe filename */
1273        NULL,                   /* probe magic */
1274        ndag_init_input,        /* init_input */
1275        NULL,                   /* config_input */
1276        ndag_start_input,       /* start_input */
1277        ndag_pause_input,       /* pause_input */
1278        NULL,                   /* init_output */
1279        NULL,                   /* config_output */
1280        NULL,                   /* start_output */
1281        ndag_fin_input,         /* fin_input */
1282        NULL,                   /* fin_output */
1283        ndag_read_packet,       /* read_packet */
1284        ndag_prepare_packet,    /* prepare_packet */
1285        NULL,                   /* fin_packet */
1286        NULL,                   /* write_packet */
1287        erf_get_link_type,      /* get_link_type */
1288        erf_get_direction,      /* get_direction */
1289        erf_set_direction,      /* set_direction */
1290        erf_get_erf_timestamp,  /* get_erf_timestamp */
1291        NULL,                   /* get_timeval */
1292        NULL,                   /* get_seconds */
1293        NULL,                   /* get_timespec */
1294        NULL,                   /* seek_erf */
1295        NULL,                   /* seek_timeval */
1296        NULL,                   /* seek_seconds */
1297        erf_get_capture_length, /* get_capture_length */
1298        erf_get_wire_length,    /* get_wire_length */
1299        erf_get_framing_length, /* get_framing_length */
1300        erf_set_capture_length, /* set_capture_length */
1301        NULL,                   /* get_received_packets */
1302        NULL,                   /* get_filtered_packets */
1303        NULL,                   /* get_dropped_packets */
1304        ndag_get_statistics,    /* get_statistics */
1305        NULL,                   /* get_fd */
1306        trace_event_ndag,       /* trace_event */
1307        NULL,                   /* help */
1308        NULL,                   /* next pointer */
1309        {true, 0},              /* live packet capture */
1310        ndag_pstart_input,      /* parallel start */
1311        ndag_pread_packets,     /* parallel read */
1312        ndag_pause_input,       /* parallel pause */
1313        NULL,
1314        ndag_pregister_thread,  /* register thread */
1315        NULL,
1316        ndag_get_thread_stats   /* per-thread stats */
1317};
1318
1319void ndag_constructor(void) {
1320        register_format(&ndag);
1321}
Note: See TracBrowser for help on using the repository browser.