source: lib/format_linux_ring.c @ 6327ce6

develop
Last change on this file since 6327ce6 was 6327ce6, checked in by Jacob Van Walraven <jcv9@…>, 22 months ago

Fix memory leak when configuring bpf filters issue #87

  • Property mode set to 100644
File size: 26.7 KB
Line 
1/*
2 *
3 * Copyright (c) 2007-2016 The University of Waikato, Hamilton, New Zealand.
4 * All rights reserved.
5 *
6 * This file is part of libtrace.
7 *
8 * This code has been developed by the University of Waikato WAND
9 * research group. For further information please see http://www.wand.net.nz/
10 *
11 * libtrace is free software; you can redistribute it and/or modify
12 * it under the terms of the GNU Lesser General Public License as published by
13 * the Free Software Foundation; either version 3 of the License, or
14 * (at your option) any later version.
15 *
16 * libtrace is distributed in the hope that it will be useful,
17 * but WITHOUT ANY WARRANTY; without even the implied warranty of
18 * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
19 * GNU Lesser General Public License for more details.
20 *
21 * You should have received a copy of the GNU Lesser General Public License
22 * along with this program.  If not, see <http://www.gnu.org/licenses/>.
23 *
24 *
25 */
26
27/* This format module deals with using the Linux Ring capture format (also
28 * known as PACKET_MMAP).
29 *
30 * Linux Ring is a LIVE capture format.
31 *
32 * This format also supports writing which will write packets out to the
33 * network as a form of packet replay. This should not be confused with the
34 * RT protocol which is intended to transfer captured packet records between
35 * RT-speaking programs.
36 */
37
38#include "config.h"
39#include "libtrace.h"
40#include "libtrace_int.h"
41#include "format_helper.h"
42#include "libtrace_arphrd.h"
43#include <stdlib.h>
44#include <errno.h>
45#include <unistd.h>
46#include <string.h>
47
48#ifdef HAVE_INTTYPES_H
49#  include <inttypes.h>
50#else
51# error "Can't find inttypes.h"
52#endif
53
54#include "format_linux_common.h"
55
56/* Get the start of the captured data. I'm not sure if tp_mac (link layer) is
57 * always guaranteed. If it's not there then just use tp_net.
58 */
59#define TP_TRACE_START(mac, net, hdrend) \
60        ((mac) > (hdrend) && (mac) < (net) ? (mac) : (net))
61
62static pthread_mutex_t pagesize_mutex;
63#ifdef HAVE_NETPACKET_PACKET_H
64/* Get current frame in the ring buffer*/
65#define GET_CURRENT_BUFFER(stream) \
66        ((void *)stream->rx_ring +                              \
67         (stream->rxring_offset *                               \
68          stream->req.tp_frame_size))
69
70/* Cached page size, the page size shouldn't be changing */
71static int pagesize = 0;
72
73
74/*
75 * Try figure out the best sizes for the ring buffer. Ensure that:
76 * - max(Block_size) == page_size << max_order
77 * - Frame_size == page_size << x (so that block_size%frame_size == 0)
78 *   This means that there will be no wasted space between blocks
79 * - Frame_size < block_size
80 * - Frame_size is as close as possible to LIBTRACE_PACKET_BUFSIZE, but not
81 *   bigger
82 * - Frame_nr = Block_nr * (frames per block)
83 * - CONF_RING_FRAMES is used a minimum number of frames to hold
84 * - Calculates based on max_order and buf_min
85 */
86static void calculate_buffers(struct tpacket_req * req, int fd, char * uri,
87                uint32_t max_order)
88{
89        struct ifreq ifr;
90        unsigned max_frame = LIBTRACE_PACKET_BUFSIZE;
91        pthread_mutex_lock(&pagesize_mutex);
92        if (pagesize == 0) {
93                pagesize = getpagesize();
94        }
95        pthread_mutex_unlock(&pagesize_mutex);
96
97        strcpy(ifr.ifr_name, uri);
98        /* Don't bother trying to set frame size above mtu linux will drop
99         * these anyway.
100         *
101         * Remember, that our frame also has to include a TPACKET header!
102         */
103        if (ioctl(fd, SIOCGIFMTU, (caddr_t)&ifr) >= 0)
104                max_frame = ifr.ifr_mtu + TPACKET_ALIGN(TPACKET2_HDRLEN);
105        if (max_frame > LIBTRACE_PACKET_BUFSIZE)
106                max_frame = LIBTRACE_PACKET_BUFSIZE;
107
108        /* Calculate frame size */
109        req->tp_frame_size = pagesize;
110        while (req->tp_frame_size < max_frame &&
111              req->tp_frame_size < LIBTRACE_PACKET_BUFSIZE) {
112                req->tp_frame_size <<= 1;
113        }
114        if (req->tp_frame_size > LIBTRACE_PACKET_BUFSIZE)
115                req->tp_frame_size >>= 1;
116
117        /* Calculate block size */
118        req->tp_block_size = pagesize << max_order;
119        /* If max order is too high this might become 0 */
120        if (req->tp_block_size == 0) {
121                calculate_buffers(req, fd, uri, max_order-1);
122                return;
123        }
124        do {
125                req->tp_block_size >>= 1;
126        } while ((CONF_RING_FRAMES * req->tp_frame_size) <= req->tp_block_size);
127        req->tp_block_size <<= 1;
128
129        /* Calculate number of blocks */
130        req->tp_block_nr = (CONF_RING_FRAMES * req->tp_frame_size)
131                / req->tp_block_size;
132        if((CONF_RING_FRAMES * req->tp_frame_size) % req->tp_block_size != 0)
133                req->tp_block_nr++;
134
135        /* Calculate packets such that we use all the space we have to
136         * allocated */
137        req->tp_frame_nr = req->tp_block_nr *
138                (req->tp_block_size / req->tp_frame_size);
139
140        /*
141        printf("MaxO 0x%x BS 0x%x BN 0x%x FS 0x%x FN 0x%x\n",
142                max_order,
143                req->tp_block_size,
144                req->tp_block_nr,
145                req->tp_frame_size,
146                req->tp_frame_nr);
147        */
148
149        /* In case we have some silly values*/
150        if (!req->tp_block_size) {
151                fprintf(stderr, "Unexpected value of zero for req->tp_block_size in calculate_buffers()\n");
152        }
153        if (!req->tp_block_nr) {
154                fprintf(stderr, "Unexpected value of zero for req->tp_block_nr in calculate_buffers()\n");
155        }
156        if (!req->tp_frame_size) {
157                fprintf(stderr, "Unexpected value of zero for req->tp_frame_size in calculate_buffers()\n");
158        }
159        if (!req->tp_frame_nr) {
160                fprintf(stderr, "Unexpected value of zero for req->tp_frame_nr in calculate_buffers()\n");
161        }
162        if (req->tp_block_size % req->tp_frame_size != 0) {
163                fprintf(stderr, "Unexpected value of zero for req->tp_block_size %% req->tp_frame_size in calculate_buffers()\n");
164        }
165}
166
167static inline int socket_to_packetmmap(char * uridata, int ring_type,
168                                        int fd,
169                                        struct tpacket_req * req,
170                                        char ** ring_location,
171                                        uint32_t *max_order,
172                                        char *error) {
173        int val;
174
175        /* Switch to TPACKET header version 2, we only try support v2 because
176         * v1 had problems with data type consistancy */
177        val = TPACKET_V2;
178        if (setsockopt(fd,
179                       SOL_PACKET,
180                       PACKET_VERSION,
181                       &val,
182                       sizeof(val)) == -1) {
183                strncpy(error, "TPACKET2 not supported", 2048);
184                return -1;
185        }
186
187        /* Try switch to a ring buffer. If it fails we assume the the kernel
188         * cannot allocate a block of that size, so decrease max_block and
189         * retry.
190         */
191        while(1) {
192                if (*max_order <= 0) {
193                        strncpy(error,
194                                "Cannot allocate enough memory for ring buffer",
195                                2048);
196                        return -1;
197                }
198                calculate_buffers(req, fd, uridata, *max_order);
199                if (setsockopt(fd,
200                               SOL_PACKET,
201                               ring_type,
202                               req,
203                               sizeof(struct tpacket_req)) == -1) {
204                        if(errno == ENOMEM) {
205                                (*max_order)--;
206                        } else {
207                                strncpy(error,
208                                        "Error setting the ring buffer size",
209                                        2048);
210                                return -1;
211                        }
212
213                } else break;
214        }
215
216        /* Map the ring buffer into userspace */
217        *ring_location = mmap(NULL,
218                              req->tp_block_size * req->tp_block_nr,
219                              PROT_READ | PROT_WRITE, MAP_SHARED, fd, 0);
220        if(*ring_location == MAP_FAILED) {
221                strncpy(error, "Failed to map memory for ring buffer", 2048);
222                return -1;
223        }
224
225        return 0;
226}
227
228/* Release a frame back to the kernel or free() if it's a malloc'd buffer
229 */
230inline static void ring_release_frame(libtrace_t *libtrace UNUSED,
231                                      libtrace_packet_t *packet)
232{
233        /* Free the old packet */
234        if(packet->buffer == NULL)
235                return;
236
237        if(packet->buf_control == TRACE_CTRL_PACKET){
238                free(packet->buffer);
239                packet->buffer = NULL;
240        }
241
242        if(packet->buf_control == TRACE_CTRL_EXTERNAL) {
243                //struct linux_format_data_t *ftd = FORMAT_DATA;
244                /* Check it's within our buffer first - consider the pause
245                 * resume case it might have already been free'd lets hope we
246                 * get another buffer */
247                // TODO: For now let any one free anything
248                /*if(LIBTRACE_BETWEEN((char *) packet->buffer,
249                                (char *) ftd->rx_ring,
250                                ftd->rx_ring +
251                                ftd->req.tp_block_size *
252                                ftd->req.tp_block_nr)){*/
253                TO_TP_HDR2(packet->buffer)->tp_status = 0;
254                packet->buffer = NULL;
255                /*}*/
256        }
257}
258
259static inline int linuxring_start_input_stream(libtrace_t *libtrace,
260                                               struct linux_per_stream_t *stream) {
261        char error[2048];
262
263        /* Unmap any previous ring buffers associated with this stream. */
264        if (stream->rx_ring != MAP_FAILED) {
265                munmap(stream->rx_ring, stream->req.tp_block_size *
266                                stream->req.tp_block_nr);
267                stream->rx_ring = MAP_FAILED;
268                stream->rxring_offset = 0;
269        }
270
271
272        /* We set the socket up the same and then convert it to PACKET_MMAP */
273        if (linuxcommon_start_input_stream(libtrace, stream) < 0)
274                return -1;
275
276        strncpy(error, "No known error", 2048);
277
278        /* Make it a packetmmap */
279        if(socket_to_packetmmap(libtrace->uridata, PACKET_RX_RING,
280                                stream->fd,
281                                &stream->req,
282                                &stream->rx_ring,
283                                &FORMAT_DATA->max_order,
284                                error) != 0) {
285                trace_set_err(libtrace, TRACE_ERR_INIT_FAILED,
286                              "Initialisation of packet MMAP failed: %s",
287                              error);
288                linuxcommon_close_input_stream(libtrace, stream);
289                return -1;
290        }
291
292        return 0;
293}
294
295static int linuxring_fin_input(libtrace_t *libtrace) {
296        size_t i;
297
298        if (libtrace->format_data) {
299                for (i = 0; i < libtrace_list_get_size(FORMAT_DATA->per_stream); ++i) {
300                        struct linux_per_stream_t *stream;
301                        stream = libtrace_list_get_index(
302                                FORMAT_DATA->per_stream, i)->data;
303                        if (stream->rx_ring != MAP_FAILED) {
304                                munmap(stream->rx_ring,
305                                                stream->req.tp_block_size *
306                                                stream->req.tp_block_nr);
307                        }
308                }
309
310                if (FORMAT_DATA->per_stream)
311                        libtrace_list_deinit(FORMAT_DATA->per_stream);
312
313                free(libtrace->format_data);
314        }
315
316        return 0;
317}
318
319
320static int linuxring_start_input(libtrace_t *libtrace)
321{
322        int ret = linuxring_start_input_stream(libtrace, FORMAT_DATA_FIRST);
323        return ret;
324}
325
326#ifdef HAVE_PACKET_FANOUT
327static int linuxring_pstart_input(libtrace_t *libtrace) {
328        return linuxcommon_pstart_input(libtrace, linuxring_start_input_stream);
329}
330#endif
331
332static int linuxring_start_output(libtrace_out_t *libtrace)
333{
334        char error[2048];
335        FORMAT_DATA_OUT->fd = socket(PF_PACKET, SOCK_RAW, 0);
336        if (FORMAT_DATA_OUT->fd==-1) {
337                free(FORMAT_DATA_OUT);
338                trace_set_err_out(libtrace, errno, "Failed to create raw socket");
339                return -1;
340        }
341
342        /* Make it a packetmmap */
343        if(socket_to_packetmmap(libtrace->uridata, PACKET_TX_RING,
344                                FORMAT_DATA_OUT->fd,
345                                &FORMAT_DATA_OUT->req,
346                                &FORMAT_DATA_OUT->tx_ring,
347                                &FORMAT_DATA_OUT->max_order,
348                                error) != 0) {
349                trace_set_err_out(libtrace, TRACE_ERR_INIT_FAILED,
350                                  "Initialisation of packet MMAP failed: %s",
351                                  error);
352                close(FORMAT_DATA_OUT->fd);
353                free(FORMAT_DATA_OUT);
354                libtrace->format_data = NULL;
355                return -1;
356        }
357
358        FORMAT_DATA_OUT->sock_hdr.sll_family = AF_PACKET;
359        FORMAT_DATA_OUT->sock_hdr.sll_protocol = 0;
360        FORMAT_DATA_OUT->sock_hdr.sll_ifindex =
361                if_nametoindex(libtrace->uridata);
362        FORMAT_DATA_OUT->sock_hdr.sll_hatype = 0;
363        FORMAT_DATA_OUT->sock_hdr.sll_pkttype = 0;
364        FORMAT_DATA_OUT->sock_hdr.sll_halen = 0;
365        FORMAT_DATA_OUT->queue = 0;
366
367        return 0;
368}
369
370static int linuxring_fin_output(libtrace_out_t *libtrace)
371{
372        /* Make sure any remaining frames get sent */
373        sendto(FORMAT_DATA_OUT->fd,
374               NULL,
375               0,
376               0,
377               (void *) &FORMAT_DATA_OUT->sock_hdr,
378               sizeof(FORMAT_DATA_OUT->sock_hdr));
379
380        /* Unmap our data area */
381        munmap(FORMAT_DATA_OUT->tx_ring,
382               FORMAT_DATA_OUT->req.tp_block_size *
383               FORMAT_DATA_OUT->req.tp_block_nr);
384
385        /* Free the socket */
386        close(FORMAT_DATA_OUT->fd);
387        FORMAT_DATA_OUT->fd=-1;
388        free(libtrace->format_data);
389        return 0;
390}
391#endif /* HAVE_NETPACKET_PACKET_H */
392
393static libtrace_linktype_t
394linuxring_get_link_type(const struct libtrace_packet_t *packet)
395{
396        uint16_t linktype = GET_SOCKADDR_HDR(packet->buffer)->sll_hatype;
397        return linuxcommon_get_link_type(linktype);
398}
399
400static libtrace_direction_t
401linuxring_get_direction(const struct libtrace_packet_t *packet) {
402        return linuxcommon_get_direction(GET_SOCKADDR_HDR(packet->buffer)->
403                                         sll_pkttype);
404}
405
406static libtrace_direction_t
407linuxring_set_direction(libtrace_packet_t *packet,
408                        libtrace_direction_t direction) {
409        return linuxcommon_set_direction(GET_SOCKADDR_HDR(packet->buffer), direction);
410}
411
412static struct timeval linuxring_get_timeval(const libtrace_packet_t *packet)
413{
414        struct timeval tv;
415        tv.tv_sec = TO_TP_HDR2(packet->buffer)->tp_sec;
416        tv.tv_usec = TO_TP_HDR2(packet->buffer)->tp_nsec / 1000;
417        return tv;
418}
419
420static struct timespec linuxring_get_timespec(const libtrace_packet_t *packet)
421{
422        struct timespec ts;
423        ts.tv_sec = TO_TP_HDR2(packet->buffer)->tp_sec;
424        ts.tv_nsec = TO_TP_HDR2(packet->buffer)->tp_nsec;
425        return ts;
426}
427
428static int linuxring_get_capture_length(const libtrace_packet_t *packet)
429{
430        return TO_TP_HDR2(packet->buffer)->tp_snaplen;
431}
432
433static int linuxring_get_wire_length(const libtrace_packet_t *packet)
434{
435        int wirelen = TO_TP_HDR2(packet->buffer)->tp_len;
436
437        /* Include the missing FCS */
438        if (trace_get_link_type(packet) == TRACE_TYPE_ETH)
439                wirelen += 4;
440
441        return wirelen;
442}
443
444static int linuxring_get_framing_length(const libtrace_packet_t *packet)
445{
446        /*
447         * Need to make frame_length + capture_length = complete capture length
448         * so include alignment whitespace. So reverse calculate from packet.
449         */
450        return (char *)packet->payload - (char *)packet->buffer;
451}
452
453static size_t linuxring_set_capture_length(libtrace_packet_t *packet,
454                                           size_t size)
455{
456        if (!packet) {
457                fprintf(stderr, "NULL packet passed into linuxring_set_capture_length()\n");
458                /* Return -1 on error? */
459                return ~0U;
460        }
461        if (size > trace_get_capture_length(packet)) {
462                /* We should avoid making a packet larger */
463                return trace_get_capture_length(packet);
464        }
465
466        /* Reset the cached capture length */
467        packet->cached.capture_length = -1;
468
469        TO_TP_HDR2(packet->buffer)->tp_snaplen = size;
470
471        return trace_get_capture_length(packet);
472}
473
474static int linuxring_prepare_packet(libtrace_t *libtrace UNUSED,
475                                    libtrace_packet_t *packet, void *buffer,
476                                    libtrace_rt_types_t rt_type, uint32_t flags)
477{
478        if (packet->buffer != buffer &&
479            packet->buf_control == TRACE_CTRL_PACKET) {
480                free(packet->buffer);
481        }
482
483        if ((flags & TRACE_PREP_OWN_BUFFER) == TRACE_PREP_OWN_BUFFER)
484                packet->buf_control = TRACE_CTRL_PACKET;
485        else
486                packet->buf_control = TRACE_CTRL_EXTERNAL;
487
488
489        packet->buffer = buffer;
490        packet->header = buffer;
491        packet->payload = (char *)buffer +
492                TP_TRACE_START(TO_TP_HDR2(packet->header)->tp_mac,
493                               TO_TP_HDR2(packet->header)->tp_net,
494                               TPACKET2_HDRLEN);
495        packet->type = rt_type;
496
497        return 0;
498}
499
500#ifdef HAVE_NETPACKET_PACKET_H
501#define LIBTRACE_MIN(a,b) ((a)<(b) ? (a) : (b))
502/* We use TP_STATUS_LIBTRACE to ensure we don't loop back on ourself
503 * and read the same packet twice if an old packet has not yet been freed */
504#define TP_STATUS_LIBTRACE 0xFFFFFFFF
505
506inline static int linuxring_read_stream(libtrace_t *libtrace,
507                                        libtrace_packet_t *packet,
508                                        struct linux_per_stream_t *stream,
509                                        libtrace_message_queue_t *queue,
510                                        uint8_t block) {
511
512        struct tpacket2_hdr *header;
513        int ret;
514        unsigned int snaplen;
515        struct pollfd pollset[2];
516
517        packet->buf_control = TRACE_CTRL_EXTERNAL;
518        packet->type = TRACE_RT_DATA_LINUX_RING;
519
520        /* Fetch the current frame */
521        header = GET_CURRENT_BUFFER(stream);
522        if ((((unsigned long) header) & (pagesize - 1)) != 0) {
523                trace_set_err(libtrace, TRACE_ERR_BAD_IO, "Linux ring packet is not correctly "
524                        "aligned to page size in linux_read_string()");
525                return -1;
526        }
527
528        /* TP_STATUS_USER means that we can use the frame.
529         * When a slot does not have this flag set, the frame is not
530         * ready for consumption.
531         */
532        while (!(header->tp_status & TP_STATUS_USER) ||
533                        header->tp_status == TP_STATUS_LIBTRACE) {
534                if ((ret=is_halted(libtrace)) != -1)
535                        return ret;
536                if (!block) {
537                        return 0;
538                }
539
540                pollset[0].fd = stream->fd;
541                pollset[0].events = POLLIN;
542                pollset[0].revents = 0;
543                if (queue) {
544                        pollset[1].fd = libtrace_message_queue_get_fd(queue);
545                        pollset[1].events = POLLIN;
546                        pollset[1].revents = 0;
547                }
548                /* Wait for more data or a message */
549                ret = poll(pollset, (queue ? 2 : 1), 500);
550                if (ret > 0) {
551                        if (pollset[0].revents == POLLIN)
552                                continue;
553                        else if (queue && pollset[1].revents == POLLIN)
554                                return READ_MESSAGE;
555                        else if (queue && pollset[1].revents) {
556                                /* Internal error */
557                                trace_set_err(libtrace,TRACE_ERR_BAD_STATE,
558                                              "Message queue error %d poll()",
559                                              pollset[1].revents);
560                                return READ_ERROR;
561                        } else {
562                                /* Try get the error from the socket */
563                                int err = ENETDOWN;
564                                socklen_t len = sizeof(err);
565                                getsockopt(stream->fd, SOL_SOCKET, SO_ERROR,
566                                           &err, &len);
567                                trace_set_err(libtrace, err,
568                                              "Socket error revents=%d poll()",
569                                              pollset[0].revents);
570                                return READ_ERROR;
571                        }
572                } else if (ret < 0) {
573                        if (errno != EINTR) {
574                                trace_set_err(libtrace,errno,"poll()");
575                                return -1;
576                        }
577                } else {
578                        /* Poll timed out - check if we should exit on next loop */
579                        continue;
580                }
581        }
582        packet->buffer = header;
583        packet->trace = libtrace;
584       
585        header->tp_status = TP_STATUS_LIBTRACE;
586
587        /* If a snaplen was configured, automatically truncate the packet to
588         * the desired length.
589         */
590        snaplen=LIBTRACE_MIN(
591                        (int)LIBTRACE_PACKET_BUFSIZE-(int)sizeof(*header),
592                        (int)FORMAT_DATA->snaplen);
593       
594        TO_TP_HDR2(packet->buffer)->tp_snaplen = LIBTRACE_MIN((unsigned int)snaplen, TO_TP_HDR2(packet->buffer)->tp_len);
595
596        /* Move to next buffer */
597        stream->rxring_offset++;
598        stream->rxring_offset %= stream->req.tp_frame_nr;
599
600        packet->order = (((uint64_t)TO_TP_HDR2(packet->buffer)->tp_sec) << 32)
601                        + ((((uint64_t)TO_TP_HDR2(packet->buffer)->tp_nsec)
602                        << 32) / 1000000000);
603
604        if (packet->order <= stream->last_timestamp) {
605                packet->order = stream->last_timestamp + 1;
606        }
607
608        stream->last_timestamp = packet->order;
609
610        /* We just need to get prepare_packet to set all our packet pointers
611         * appropriately */
612        if (linuxring_prepare_packet(libtrace, packet, packet->buffer,
613                                packet->type, 0))
614                return -1;
615        return  linuxring_get_framing_length(packet) + 
616                                linuxring_get_capture_length(packet);
617
618}
619
620static int linuxring_read_packet(libtrace_t *libtrace, libtrace_packet_t *packet) {
621        return linuxring_read_stream(libtrace, packet, FORMAT_DATA_FIRST, NULL, 1);
622}
623
624#ifdef HAVE_PACKET_FANOUT
625static int linuxring_pread_packets(libtrace_t *libtrace,
626                                   libtrace_thread_t *t,
627                                   libtrace_packet_t *packets[],
628                                   size_t nb_packets) {
629        size_t i;
630        int ret;
631
632        for (i = 0; i < nb_packets; i++) {
633                ret = linuxring_read_stream(libtrace, packets[i],
634                                t->format_data, &t->messages, i == 0 ? 1 : 0);
635                packets[i]->error = ret;
636                if (ret < 0) {
637                        return ret;
638                }
639
640                if (ret == 0) {
641                        if (is_halted(libtrace) == READ_EOF) {
642                                return READ_EOF;
643                        }
644                        return i;
645                }
646        }
647
648        return nb_packets;
649}
650#endif
651
652/* Non-blocking read */
653static libtrace_eventobj_t linuxring_event(libtrace_t *libtrace,
654                                           libtrace_packet_t *packet)
655{
656        struct tpacket2_hdr *header;
657        libtrace_eventobj_t event = {0,0,0.0,0};
658
659        /* We must free the old packet, otherwise select() will instantly
660         * return */
661        ring_release_frame(libtrace, packet);
662
663        /* Fetch the current frame */
664        header = GET_CURRENT_BUFFER(FORMAT_DATA_FIRST);
665        if (header->tp_status & TP_STATUS_USER &&
666            header->tp_status != TP_STATUS_LIBTRACE) {
667                /* We have a frame waiting */
668                event.size = trace_read_packet(libtrace, packet);
669                event.type = TRACE_EVENT_PACKET;
670        } else {
671                /* Ok we don't have a packet waiting */
672                event.type = TRACE_EVENT_IOWAIT;
673                event.fd = FORMAT_DATA_FIRST->fd;
674        }
675
676        return event;
677}
678
679/**
680 * Free any resources being kept for this packet, Note: libtrace
681 * will ensure all fields are zeroed correctly.
682 */
683static void linuxring_fin_packet(libtrace_packet_t *packet)
684{
685        libtrace_t *libtrace = packet->trace;
686
687        if (packet->buffer == NULL)
688                return;
689        if (!packet->trace) {
690                fprintf(stderr, "Linux ring packet is not attached to a valid "
691                        "trace, Unable to release it, in linuxring_fin_packet()\n");
692                return;
693        }
694
695        /* If we own the packet (i.e. it's not a copy), we need to free it */
696        if (packet->buf_control == TRACE_CTRL_EXTERNAL) {
697                /* If we don't have a ring its already been destroyed */
698                if (FORMAT_DATA_FIRST->rx_ring != MAP_FAILED)
699                        ring_release_frame(packet->trace, packet);
700                else
701                        packet->buffer = NULL;
702        }
703}
704
705static int linuxring_write_packet(libtrace_out_t *libtrace,
706                                  libtrace_packet_t *packet)
707{
708        struct tpacket2_hdr *header;
709        struct pollfd pollset;
710        struct socket_addr;
711        int ret;
712        unsigned max_size;
713        void * off;
714
715        if (trace_get_link_type(packet) == TRACE_TYPE_NONDATA)
716                return 0;
717
718        max_size = FORMAT_DATA_OUT->req.tp_frame_size -
719                TPACKET2_HDRLEN + sizeof(struct sockaddr_ll);
720
721        header = (void *)FORMAT_DATA_OUT->tx_ring +
722                (FORMAT_DATA_OUT->txring_offset *
723                 FORMAT_DATA_OUT->req.tp_frame_size);
724
725        while(header->tp_status != TP_STATUS_AVAILABLE) {
726                /* if none available: wait on more data */
727                pollset.fd = FORMAT_DATA_OUT->fd;
728                pollset.events = POLLOUT;
729                pollset.revents = 0;
730                ret = poll(&pollset, 1, 1000);
731                if (ret < 0 && errno != EINTR) {
732                        perror("poll");
733                        return -1;
734                }
735                if(ret == 0) {
736                        /* Timeout something has gone wrong - maybe the queue is
737                         * to large so try issue another send command
738                         */
739                        ret = sendto(FORMAT_DATA_OUT->fd,
740                                     NULL,
741                                     0,
742                                     0,
743                                     (void *)&FORMAT_DATA_OUT->sock_hdr,
744                                     sizeof(FORMAT_DATA_OUT->sock_hdr));
745                        if (ret < 0) {
746                                trace_set_err_out(libtrace, errno,
747                                                  "sendto after timeout "
748                                                  "failed");
749                                return -1;
750                        }
751                }
752        }
753
754        header->tp_len = trace_get_capture_length(packet);
755
756        /* We cannot write the whole packet so just write part of it */
757        if (header->tp_len > max_size)
758                header->tp_len = max_size;
759
760        /* Fill packet - no sockaddr_ll in header when writing to the TX_RING */
761        off = ((void *)header) + (TPACKET2_HDRLEN - sizeof(struct sockaddr_ll));
762        memcpy(off, (char *)packet->payload, header->tp_len);
763
764        /* 'Send it' and increase ring pointer to the next frame */
765        header->tp_status = TP_STATUS_SEND_REQUEST;
766        FORMAT_DATA_OUT->txring_offset = (FORMAT_DATA_OUT->txring_offset + 1) %
767                FORMAT_DATA_OUT->req.tp_frame_nr;
768
769        /* Notify kernel there are frames to send */
770        FORMAT_DATA_OUT->queue ++;
771        FORMAT_DATA_OUT->queue %= TX_MAX_QUEUE;
772        if(FORMAT_DATA_OUT->queue == 0){
773                ret = sendto(FORMAT_DATA_OUT->fd,
774                                NULL,
775                                0,
776                                MSG_DONTWAIT,
777                                (void *)&FORMAT_DATA_OUT->sock_hdr,
778                                sizeof(FORMAT_DATA_OUT->sock_hdr));
779                if (ret < 0) {
780                        trace_set_err_out(libtrace, errno, "sendto failed");
781                        return -1;
782                }
783        }
784        return header->tp_len;
785
786}
787
788static void linuxring_help(void)
789{
790        printf("linuxring format module: $Revision: 1793 $\n");
791        printf("Supported input URIs:\n");
792        printf("\tring:eth0\n");
793        printf("\n");
794        printf("Supported output URIs:\n");
795        printf("\tring:eth0\n");
796        printf("\n");
797        return;
798}
799
800static struct libtrace_format_t linuxring = {
801        "ring",
802        "$Id$",
803        TRACE_FORMAT_LINUX_RING,
804        linuxcommon_probe_filename,     /* probe filename */
805        NULL,                           /* probe magic */
806        linuxcommon_init_input,         /* init_input */
807        linuxcommon_config_input,       /* config_input */
808        linuxring_start_input,          /* start_input */
809        linuxcommon_pause_input,        /* pause_input */
810        linuxcommon_init_output,        /* init_output */
811        NULL,                           /* config_output */
812        linuxring_start_output,         /* start_ouput */
813        linuxring_fin_input,            /* fin_input */
814        linuxring_fin_output,           /* fin_output */
815        linuxring_read_packet,          /* read_packet */
816        linuxring_prepare_packet,       /* prepare_packet */
817        linuxring_fin_packet,           /* fin_packet */
818        linuxring_write_packet,         /* write_packet */
819        NULL,                           /* flush_output */
820        linuxring_get_link_type,        /* get_link_type */
821        linuxring_get_direction,        /* get_direction */
822        linuxring_set_direction,        /* set_direction */
823        NULL,                           /* get_erf_timestamp */
824        linuxring_get_timeval,          /* get_timeval */
825        linuxring_get_timespec,         /* get_timespec */
826        NULL,                           /* get_seconds */
827        NULL,                           /* seek_erf */
828        NULL,                           /* seek_timeval */
829        NULL,                           /* seek_seconds */
830        linuxring_get_capture_length,   /* get_capture_length */
831        linuxring_get_wire_length,      /* get_wire_length */
832        linuxring_get_framing_length,   /* get_framing_length */
833        linuxring_set_capture_length,   /* set_capture_length */
834        NULL,                           /* get_received_packets */
835        NULL,                           /* get_filtered_packets */
836        NULL,                           /* get_dropped_packets */
837        linuxcommon_get_statistics,     /* get_statistics */
838        linuxcommon_get_fd,             /* get_fd */
839        linuxring_event,                /* trace_event */
840        linuxring_help,                 /* help */
841        NULL,                           /* next pointer */
842#ifdef HAVE_PACKET_FANOUT
843        {true, -1},                     /* Live, no thread limit */
844        linuxring_pstart_input,         /* pstart_input */
845        linuxring_pread_packets,        /* pread_packets */
846        linuxcommon_pause_input,        /* ppause */
847        linuxcommon_fin_input,          /* p_fin */
848        linuxcommon_pregister_thread,   /* register thread */
849        NULL,                           /* unregister thread */
850        NULL                            /* get thread stats */
851#else
852        NON_PARALLEL(true)
853#endif
854};
855#else /* HAVE_NETPACKET_PACKET_H */
856
857static void linuxring_help(void)
858{
859        printf("linuxring format module: $Revision: 1793 $\n");
860        printf("Not supported on this host\n");
861}
862
863static struct libtrace_format_t linuxring = {
864        "ring",
865        "$Id$",
866        TRACE_FORMAT_LINUX_RING,
867        NULL,                           /* probe filename */
868        NULL,                           /* probe magic */
869        NULL,                           /* init_input */
870        NULL,                           /* config_input */
871        NULL,                           /* start_input */
872        NULL,                           /* pause_input */
873        NULL,                           /* init_output */
874        NULL,                           /* config_output */
875        NULL,                           /* start_ouput */
876        NULL,                           /* fin_input */
877        NULL,                           /* fin_output */
878        NULL,                           /* read_packet */
879        linuxring_prepare_packet,       /* prepare_packet */
880        NULL,                           /* fin_packet */
881        NULL,                           /* write_packet */
882        NULL,                           /* flush_output */
883        linuxring_get_link_type,        /* get_link_type */
884        linuxring_get_direction,        /* get_direction */
885        linuxring_set_direction,        /* set_direction */
886        NULL,                           /* get_erf_timestamp */
887        linuxring_get_timeval,          /* get_timeval */
888        linuxring_get_timespec,         /* get_timespec */
889        NULL,                           /* get_seconds */
890        NULL,                           /* seek_erf */
891        NULL,                           /* seek_timeval */
892        NULL,                           /* seek_seconds */
893        linuxring_get_capture_length,   /* get_capture_length */
894        linuxring_get_wire_length,      /* get_wire_length */
895        linuxring_get_framing_length,   /* get_framing_length */
896        linuxring_set_capture_length,   /* set_capture_length */
897        NULL,                           /* get_received_packets */
898        NULL,                           /* get_filtered_packets */
899        NULL,                           /* get_dropped_packets */
900        linuxcommon_get_statistics,     /* get_statistics */
901        NULL,                           /* get_fd */
902        NULL,                           /* trace_event */
903        linuxring_help,                 /* help */
904        NULL,                           /* next pointer */
905        NON_PARALLEL(true)
906};
907#endif /* HAVE_NETPACKET_PACKET_H */
908
909/* TODO: Figure out how to give this format preference over the linux native
910 * formate if the user only specifies an interface */
911void linuxring_constructor(void)
912{
913        pthread_mutex_init(&pagesize_mutex, NULL);
914        register_format(&linuxring);
915}
Note: See TracBrowser for help on using the repository browser.