source: lib/trace_parallel.c @ 1101175

4.0.1-hotfixescachetimestampsdevelopdpdk-ndagetsilivelibtrace4ndag_formatpfringrc-4.0.1rc-4.0.2rc-4.0.3rc-4.0.4ringdecrementfixringperformanceringtimestampfixes
Last change on this file since 1101175 was 1101175, checked in by Shane Alcock <salcock@…>, 6 years ago

Polish up all the documentation in libtrace_parallel.h

Removed trace_get_local, trace_set_local, trace_get_tls and trace_set_tls.
These are all covered by parameters to the callback functions, so seem
redundant now.

Moved tv_to_usec into libtrace_int.h.

  • Property mode set to 100644
File size: 82.0 KB
Line 
1/*
2 * This file is part of libtrace
3 *
4 * Copyright (c) 2007,2008,2009,2010 The University of Waikato, Hamilton,
5 * New Zealand.
6 *
7 * All rights reserved.
8 *
9 * This code has been developed by the University of Waikato WAND
10 * research group. For further information please see http://www.wand.net.nz/
11 *
12 * libtrace is free software; you can redistribute it and/or modify
13 * it under the terms of the GNU General Public License as published by
14 * the Free Software Foundation; either version 2 of the License, or
15 * (at your option) any later version.
16 *
17 * libtrace is distributed in the hope that it will be useful,
18 * but WITHOUT ANY WARRANTY; without even the implied warranty of
19 * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
20 * GNU General Public License for more details.
21 *
22 * You should have received a copy of the GNU General Public License
23 * along with libtrace; if not, write to the Free Software
24 * Foundation, Inc., 59 Temple Place, Suite 330, Boston, MA  02111-1307  USA
25 *
26 * $Id$
27 *
28 */
29
30
31#define _GNU_SOURCE
32#include "common.h"
33#include "config.h"
34#include <assert.h>
35#include <errno.h>
36#include <fcntl.h>
37#include <stdio.h>
38#include <stdlib.h>
39#include <string.h>
40#include <sys/stat.h>
41#include <sys/types.h>
42#ifndef WIN32
43#include <sys/socket.h>
44#endif
45#include <stdarg.h>
46#include <sys/param.h>
47
48#ifdef HAVE_LIMITS_H
49#  include <limits.h>
50#endif
51
52#ifdef HAVE_SYS_LIMITS_H
53#  include <sys/limits.h>
54#endif
55
56#ifdef HAVE_NET_IF_ARP_H
57#  include <net/if_arp.h>
58#endif
59
60#ifdef HAVE_NET_IF_H
61#  include <net/if.h>
62#endif
63
64#ifdef HAVE_NETINET_IN_H
65#  include <netinet/in.h>
66#endif
67
68#ifdef HAVE_NET_ETHERNET_H
69#  include <net/ethernet.h>
70#endif
71
72#ifdef HAVE_NETINET_IF_ETHER_H
73#  include <netinet/if_ether.h>
74#endif
75
76#include <time.h>
77#ifdef WIN32
78#include <sys/timeb.h>
79#endif
80
81#include "libtrace.h"
82#include "libtrace_parallel.h"
83
84#ifdef HAVE_PCAP_BPF_H
85#  include <pcap-bpf.h>
86#else
87#  ifdef HAVE_NET_BPF_H
88#    include <net/bpf.h>
89#  endif
90#endif
91
92
93#include "libtrace_int.h"
94#include "format_helper.h"
95#include "rt_protocol.h"
96#include "hash_toeplitz.h"
97
98#include <pthread.h>
99#include <signal.h>
100#include <unistd.h>
101#include <ctype.h>
102
103static inline int delay_tracetime(libtrace_t *libtrace, libtrace_packet_t *packet, libtrace_thread_t *t);
104extern int libtrace_parallel;
105
106struct mem_stats {
107        struct memfail {
108           uint64_t cache_hit;
109           uint64_t ring_hit;
110           uint64_t miss;
111           uint64_t recycled;
112        } readbulk, read, write, writebulk;
113};
114
115
116#ifdef ENABLE_MEM_STATS
117// Grrr gcc wants this spelt out
118__thread struct mem_stats mem_hits = {{0},{0},{0},{0}};
119
120
121static void print_memory_stats() {
122        uint64_t total;
123#if defined(HAVE_PTHREAD_SETNAME_NP) && defined(__linux__)
124        char t_name[50];
125        pthread_getname_np(pthread_self(), t_name, sizeof(t_name));
126
127        fprintf(stderr, "Thread ID#%d - %s\n", (int) pthread_self(), t_name);
128#else
129        fprintf(stderr, "Thread ID#%d\n", (int) pthread_self());
130#endif
131
132        total = mem_hits.read.cache_hit + mem_hits.read.ring_hit + mem_hits.read.miss;
133        if (total) {
134                fprintf(stderr, "\tRead:\n\t---CHits=%"PRIu64"\n\t---RHits=%"PRIu64"\n\t---Misses=%"PRIu64"\n\t---Recycled=%"PRIu64"\n",
135                                mem_hits.read.cache_hit, mem_hits.read.ring_hit, mem_hits.read.miss, mem_hits.read.recycled);
136                fprintf(stderr, "\t---Total=%"PRIu64"\n\t---Miss %%=%f\n",
137                                total, (double) mem_hits.read.miss / (double) total * 100.0);
138        }
139
140        total = mem_hits.readbulk.cache_hit + mem_hits.readbulk.ring_hit + mem_hits.readbulk.miss;
141        if (total) {
142                fprintf(stderr, "\tReadbulk:\n\t---CHits=%"PRIu64"\n\t---RHits=%"PRIu64"\n\t---Misses=%"PRIu64"\n\t---Recycled=%"PRIu64"\n",
143                                mem_hits.readbulk.cache_hit, mem_hits.readbulk.ring_hit, mem_hits.readbulk.miss, mem_hits.readbulk.recycled);
144
145
146                fprintf(stderr, "\t---Total=%"PRIu64"\n\t---Miss %%=%f\n",
147                                total, (double) mem_hits.readbulk.miss / (double) total * 100.0);
148        }
149
150        total = mem_hits.write.cache_hit + mem_hits.write.ring_hit + mem_hits.write.miss;
151        if (total) {
152                fprintf(stderr, "\tWrite:\n\t---CHits=%"PRIu64"\n\t---RHits=%"PRIu64"\n\t---Misses=%"PRIu64"\n\t---Recycled=%"PRIu64"\n",
153                                mem_hits.write.cache_hit, mem_hits.write.ring_hit, mem_hits.write.miss, mem_hits.write.recycled);
154
155                fprintf(stderr, "\t---Total=%"PRIu64"\n\t---Miss %%=%f\n",
156                                total, (double) mem_hits.write.miss / (double) total * 100.0);
157        }
158
159        total = mem_hits.writebulk.cache_hit + mem_hits.writebulk.ring_hit + mem_hits.writebulk.miss;
160        if (total) {
161                fprintf(stderr, "\tWritebulk:\n\t---CHits=%"PRIu64"\n\t---RHits=%"PRIu64"\n\t---Misses=%"PRIu64"\n\t---Recycled=%"PRIu64"\n",
162                                mem_hits.writebulk.cache_hit, mem_hits.writebulk.ring_hit, mem_hits.writebulk.miss, mem_hits.writebulk.recycled);
163
164                fprintf(stderr, "\t---Total=%"PRIu64"\n\t---Miss %%=%f\n",
165                                total, (double) mem_hits.writebulk.miss / (double) total * 100.0);
166        }
167}
168#else
169static void print_memory_stats() {}
170#endif
171
172static const libtrace_generic_t gen_zero = {0};
173
174/* This should optimise away the switch to nothing in the explict cases */
175inline void send_message(libtrace_t *trace, libtrace_thread_t *thread,
176                const enum libtrace_messages type,
177                libtrace_generic_t data, libtrace_thread_t *sender) {
178
179        fn_cb_dataless fn = NULL;
180        enum libtrace_messages switchtype;
181        libtrace_callback_set_t *cbs = NULL;
182
183        if (thread == &trace->reporter_thread) {
184                cbs = trace->reporter_cbs;
185        } else {
186                cbs = trace->perpkt_cbs;
187        }
188
189        if (cbs == NULL)
190                return;
191
192        if (type >= MESSAGE_USER)
193                switchtype = MESSAGE_USER;
194        else
195                switchtype = (enum libtrace_messages) type;
196
197        switch (switchtype) {
198        case MESSAGE_STARTING:
199                if (cbs->message_starting)
200                        thread->user_data = (*cbs->message_starting)(trace,
201                                        thread, trace->global_blob);
202                return;
203        case MESSAGE_FIRST_PACKET:
204                if (cbs->message_first_packet)
205                                (*cbs->message_first_packet)(trace, thread,
206                                trace->global_blob, thread->user_data,
207                                sender);
208                return;
209        case MESSAGE_TICK_COUNT:
210                if (cbs->message_tick_count)
211                        (*cbs->message_tick_count)(trace, thread,
212                                        trace->global_blob, thread->user_data,
213                                        data.uint64);
214                return;
215        case MESSAGE_TICK_INTERVAL:
216                if (cbs->message_tick_interval)
217                        (*cbs->message_tick_interval)(trace, thread,
218                                        trace->global_blob, thread->user_data,
219                                        data.uint64);
220                return;
221        case MESSAGE_STOPPING:
222                fn = cbs->message_stopping;
223                break;
224        case MESSAGE_RESUMING:
225                fn = cbs->message_resuming;
226                break;
227        case MESSAGE_PAUSING:
228                fn = cbs->message_pausing;
229                break;
230        case MESSAGE_USER:
231                if (cbs->message_user)
232                        (*cbs->message_user)(trace, thread, trace->global_blob,
233                                        thread->user_data, type, data);
234                return;
235        case MESSAGE_RESULT:
236                if (cbs->message_result)
237                        (*cbs->message_result)(trace, thread,
238                                        trace->global_blob, thread->user_data,
239                                        data.res);
240                return;
241
242        /* These should be unused */
243        case MESSAGE_DO_PAUSE:
244        case MESSAGE_DO_STOP:
245        case MESSAGE_POST_REPORTER:
246        case MESSAGE_PACKET:
247                return;
248        }
249
250        if (fn)
251                (*fn)(trace, thread, trace->global_blob, thread->user_data);
252}
253
254DLLEXPORT void trace_destroy_callback_set(libtrace_callback_set_t *cbset) {
255        free(cbset);
256}
257
258DLLEXPORT libtrace_callback_set_t *trace_create_callback_set() {
259        libtrace_callback_set_t *cbset;
260
261        cbset = (libtrace_callback_set_t *)malloc(sizeof(libtrace_callback_set_t));
262        memset(cbset, 0, sizeof(libtrace_callback_set_t));
263        return cbset;
264}
265
266/*
267 * This can be used once the hasher thread has been started and internally after
268 * verify_configuration.
269 */
270DLLEXPORT bool trace_has_dedicated_hasher(libtrace_t * libtrace)
271{
272        return libtrace->hasher_thread.type == THREAD_HASHER;
273}
274
275DLLEXPORT bool trace_has_reporter(libtrace_t * libtrace)
276{
277        assert(libtrace->state != STATE_NEW);
278        return libtrace->reporter_thread.type == THREAD_REPORTER && libtrace->reporter_cbs;
279}
280
281/**
282 * When running the number of perpkt threads in use.
283 * TODO what if the trace is not running yet, or has finished??
284 *
285 * @brief libtrace_perpkt_thread_nb
286 * @param t The trace
287 * @return
288 */
289DLLEXPORT int trace_get_perpkt_threads(libtrace_t * t) {
290        return t->perpkt_thread_count;
291}
292
293/**
294 * Changes the overall traces state and signals the condition.
295 *
296 * @param trace A pointer to the trace
297 * @param new_state The new state of the trace
298 * @param need_lock Set to true if libtrace_lock is not held, otherwise
299 *        false in the case the lock is currently held by this thread.
300 */
301static inline void libtrace_change_state(libtrace_t *trace,
302        const enum trace_state new_state, const bool need_lock)
303{
304        UNUSED enum trace_state prev_state;
305        if (need_lock)
306                pthread_mutex_lock(&trace->libtrace_lock);
307        prev_state = trace->state;
308        trace->state = new_state;
309
310        if (trace->config.debug_state)
311                fprintf(stderr, "Trace(%s) state changed from %s to %s\n",
312                        trace->uridata, get_trace_state_name(prev_state),
313                        get_trace_state_name(trace->state));
314
315        pthread_cond_broadcast(&trace->perpkt_cond);
316        if (need_lock)
317                pthread_mutex_unlock(&trace->libtrace_lock);
318}
319
320/**
321 * Changes a thread's state and broadcasts the condition variable. This
322 * should always be done when the lock is held.
323 *
324 * Additionally for perpkt threads the state counts are updated.
325 *
326 * @param trace A pointer to the trace
327 * @param t A pointer to the thread to modify
328 * @param new_state The new state of the thread
329 * @param need_lock Set to true if libtrace_lock is not held, otherwise
330 *        false in the case the lock is currently held by this thread.
331 */
332static inline void thread_change_state(libtrace_t *trace, libtrace_thread_t *t,
333        const enum thread_states new_state, const bool need_lock)
334{
335        enum thread_states prev_state;
336        if (need_lock)
337                pthread_mutex_lock(&trace->libtrace_lock);
338        prev_state = t->state;
339        t->state = new_state;
340        if (t->type == THREAD_PERPKT) {
341                --trace->perpkt_thread_states[prev_state];
342                ++trace->perpkt_thread_states[new_state];
343        }
344
345        if (trace->config.debug_state)
346                fprintf(stderr, "Thread %d state changed from %d to %d\n",
347                        (int) t->tid, prev_state, t->state);
348
349        if (trace->perpkt_thread_states[THREAD_FINISHED] == trace->perpkt_thread_count)
350                libtrace_change_state(trace, STATE_FINISHED, false);
351
352        pthread_cond_broadcast(&trace->perpkt_cond);
353        if (need_lock)
354                pthread_mutex_unlock(&trace->libtrace_lock);
355}
356
357/**
358 * This is valid once a trace is initialised
359 *
360 * @return True if the format supports parallel threads.
361 */
362static inline bool trace_supports_parallel(libtrace_t *trace)
363{
364        assert(trace);
365        assert(trace->format);
366        if (trace->format->pstart_input)
367                return true;
368        else
369                return false;
370}
371
372void libtrace_zero_thread(libtrace_thread_t * t) {
373        t->accepted_packets = 0;
374        t->filtered_packets = 0;
375        t->recorded_first = false;
376        t->tracetime_offset_usec = 0;
377        t->user_data = 0;
378        t->format_data = 0;
379        libtrace_zero_ringbuffer(&t->rbuffer);
380        t->trace = NULL;
381        t->ret = NULL;
382        t->type = THREAD_EMPTY;
383        t->perpkt_num = -1;
384}
385
386// Ints are aligned int is atomic so safe to read and write at same time
387// However write must be locked, read doesn't (We never try read before written to table)
388libtrace_thread_t * get_thread_table(libtrace_t *libtrace) {
389        int i = 0;
390        pthread_t tid = pthread_self();
391
392        for (;i<libtrace->perpkt_thread_count ;++i) {
393                if (pthread_equal(tid, libtrace->perpkt_threads[i].tid))
394                        return &libtrace->perpkt_threads[i];
395        }
396        return NULL;
397}
398
399static libtrace_thread_t * get_thread_descriptor(libtrace_t *libtrace) {
400        libtrace_thread_t *ret;
401        if (!(ret = get_thread_table(libtrace))) {
402                pthread_t tid = pthread_self();
403                // Check if we are reporter or something else
404                if (libtrace->hasher_thread.type == THREAD_REPORTER &&
405                                pthread_equal(tid, libtrace->reporter_thread.tid))
406                        ret = &libtrace->reporter_thread;
407                else if (libtrace->hasher_thread.type == THREAD_HASHER &&
408                         pthread_equal(tid, libtrace->hasher_thread.tid))
409                        ret = &libtrace->hasher_thread;
410                else
411                        ret = NULL;
412        }
413        return ret;
414}
415
416DLLEXPORT void libtrace_make_packet_safe(libtrace_packet_t *pkt) {
417        // Duplicate the packet in standard malloc'd memory and free the
418        // original, This is a 1:1 exchange so the ocache count remains unchanged.
419        if (pkt->buf_control != TRACE_CTRL_PACKET) {
420                libtrace_packet_t *dup;
421                dup = trace_copy_packet(pkt);
422                /* Release the external buffer */
423                trace_fin_packet(pkt);
424                /* Copy the duplicated packet over the existing */
425                memcpy(pkt, dup, sizeof(libtrace_packet_t));
426                /* Free the packet structure */
427                free(dup);
428        }
429}
430
431/**
432 * Makes a libtrace_result_t safe, used when pausing a trace.
433 * This will call libtrace_make_packet_safe if the result is
434 * a packet.
435 */
436DLLEXPORT void libtrace_make_result_safe(libtrace_result_t *res) {
437        if (res->type == RESULT_PACKET) {
438                libtrace_make_packet_safe(res->value.pkt);
439        }
440}
441
442/**
443 * Holds threads in a paused state, until released by broadcasting
444 * the condition mutex.
445 */
446static void trace_thread_pause(libtrace_t *trace, libtrace_thread_t *t) {
447        ASSERT_RET(pthread_mutex_lock(&trace->libtrace_lock), == 0);
448        thread_change_state(trace, t, THREAD_PAUSED, false);
449        while (trace->state == STATE_PAUSED || trace->state == STATE_PAUSING) {
450                ASSERT_RET(pthread_cond_wait(&trace->perpkt_cond, &trace->libtrace_lock), == 0);
451        }
452        thread_change_state(trace, t, THREAD_RUNNING, false);
453        ASSERT_RET(pthread_mutex_unlock(&trace->libtrace_lock), == 0);
454}
455
456/**
457 * Sends a packet to the user, expects either a valid packet or a TICK packet.
458 *
459 * @param trace The trace
460 * @param t The current thread
461 * @param packet A pointer to the packet storage, which may be set to null upon
462 *               return, or a packet to be finished.
463 * @param tracetime If true packets are delayed to match with tracetime
464 * @return 0 is successful, otherwise if playing back in tracetime
465 *         READ_MESSAGE(-2) can be returned in which case the packet is not sent.
466 *
467 * @note READ_MESSAGE will only be returned if tracetime is true.
468 */
469static inline int dispatch_packet(libtrace_t *trace,
470                                  libtrace_thread_t *t,
471                                  libtrace_packet_t **packet,
472                                  bool tracetime) {
473
474        if ((*packet)->error > 0) {
475                if (tracetime) {
476                        if (delay_tracetime(trace, packet[0], t) == READ_MESSAGE)
477                                return READ_MESSAGE;
478                }
479                t->accepted_packets++;
480                if (trace->perpkt_cbs->message_packet)
481                        *packet = (*trace->perpkt_cbs->message_packet)(trace, t, trace->global_blob, t->user_data, *packet);
482                trace_fin_packet(*packet);
483        } else {
484                assert((*packet)->error == READ_TICK);
485                libtrace_generic_t data = {.uint64 = trace_packet_get_order(*packet)};
486                send_message(trace, t, MESSAGE_TICK_COUNT, data, t);
487        }
488        return 0;
489}
490
491/**
492 * Sends a batch of packets to the user, expects either a valid packet or a
493 * TICK packet.
494 *
495 * @param trace The trace
496 * @param t The current thread
497 * @param packets [in,out] An array of packets, these may be null upon return
498 * @param nb_packets The total number of packets in the list
499 * @param empty [in,out] A pointer to an integer storing the first empty slot,
500 * upon return this is updated
501 * @param offset [in,out] The offset into the array, upon return this is updated
502 * @param tracetime If true packets are delayed to match with tracetime
503 * @return 0 is successful, otherwise if playing back in tracetime
504 *         READ_MESSAGE(-2) can be returned in which case the packet is not sent.
505 *
506 * @note READ_MESSAGE will only be returned if tracetime is true.
507 */
508static inline int dispatch_packets(libtrace_t *trace,
509                                  libtrace_thread_t *t,
510                                  libtrace_packet_t *packets[],
511                                  int nb_packets, int *empty, int *offset,
512                                  bool tracetime) {
513        for (;*offset < nb_packets; ++*offset) {
514                int ret;
515                ret = dispatch_packet(trace, t, &packets[*offset], tracetime);
516                if (ret == 0) {
517                        /* Move full slots to front as we go */
518                        if (packets[*offset]) {
519                                if (*empty != *offset) {
520                                        packets[*empty] = packets[*offset];
521                                        packets[*offset] = NULL;
522                                }
523                                ++*empty;
524                        }
525                } else {
526                        /* Break early */
527                        assert(ret == READ_MESSAGE);
528                        return READ_MESSAGE;
529                }
530        }
531
532        return 0;
533}
534
535/**
536 * Pauses a per packet thread, messages will not be processed when the thread
537 * is paused.
538 *
539 * This process involves reading packets if a hasher thread is used. As such
540 * this function can fail to pause due to errors when reading in which case
541 * the thread should be stopped instead.
542 *
543 *
544 * @brief trace_perpkt_thread_pause
545 * @return READ_ERROR(-1) or READ_EOF(0) or 1 if successfull
546 */
547static int trace_perpkt_thread_pause(libtrace_t *trace, libtrace_thread_t *t,
548                                     libtrace_packet_t *packets[],
549                                     int nb_packets, int *empty, int *offset) {
550        libtrace_packet_t * packet = NULL;
551
552        /* Let the user thread know we are going to pause */
553        send_message(trace, t, MESSAGE_PAUSING, gen_zero, t);
554
555        /* Send through any remaining packets (or messages) without delay */
556
557        /* First send those packets already read, as fast as possible
558         * This should never fail or check for messages etc. */
559        ASSERT_RET(dispatch_packets(trace, t, packets, nb_packets, empty,
560                                    offset, false), == 0);
561
562        libtrace_ocache_alloc(&trace->packet_freelist, (void **) &packet, 1, 1);
563        /* If a hasher thread is running, empty input queues so we don't lose data */
564        if (trace_has_dedicated_hasher(trace)) {
565                // The hasher has stopped by this point, so the queue shouldn't be filling
566                while(!libtrace_ringbuffer_is_empty(&t->rbuffer) || t->format_data) {
567                        int ret = trace->pread(trace, t, &packet, 1);
568                        if (ret == 1) {
569                                if (packet->error > 0) {
570                                        store_first_packet(trace, packet, t);
571                                }
572                                ASSERT_RET(dispatch_packet(trace, t, &packet, false), == 0);
573                                if (packet == NULL)
574                                        libtrace_ocache_alloc(&trace->packet_freelist, (void **) &packet, 1, 1);
575                        } else if (ret != READ_MESSAGE) {
576                                /* Ignore messages we pick these up next loop */
577                                assert (ret == READ_EOF || ret == READ_ERROR);
578                                /* Verify no packets are remaining */
579                                /* TODO refactor this sanity check out!! */
580                                while (!libtrace_ringbuffer_is_empty(&t->rbuffer)) {
581                                        ASSERT_RET(trace->pread(trace, t, &packet, 1), <= 0);
582                                        // No packets after this should have any data in them
583                                        assert(packet->error <= 0);
584                                }
585                                libtrace_ocache_free(&trace->packet_freelist, (void **) &packet, 1, 1);
586                                return -1;
587                        }
588                }
589        }
590        libtrace_ocache_free(&trace->packet_freelist, (void **) &packet, 1, 1);
591
592        /* Now we do the actual pause, this returns when we resumed */
593        trace_thread_pause(trace, t);
594        send_message(trace, t, MESSAGE_RESUMING, gen_zero, t);
595        return 1;
596}
597
598/**
599 * The is the entry point for our packet processing threads.
600 */
601static void* perpkt_threads_entry(void *data) {
602        libtrace_t *trace = (libtrace_t *)data;
603        libtrace_thread_t *t;
604        libtrace_message_t message = {0};
605        libtrace_packet_t *packets[trace->config.burst_size];
606        size_t i;
607        //int ret;
608        /* The current reading position into the packets */
609        int offset = 0;
610        /* The number of packets last read */
611        int nb_packets = 0;
612        /* The offset to the first NULL packet upto offset */
613        int empty = 0;
614
615        /* Wait until trace_pstart has been completed */
616        ASSERT_RET(pthread_mutex_lock(&trace->libtrace_lock), == 0);
617        t = get_thread_table(trace);
618        assert(t);
619        if (trace->state == STATE_ERROR) {
620                thread_change_state(trace, t, THREAD_FINISHED, false);
621                ASSERT_RET(pthread_mutex_unlock(&trace->libtrace_lock), == 0);
622                pthread_exit(NULL);
623        }
624        ASSERT_RET(pthread_mutex_unlock(&trace->libtrace_lock), == 0);
625
626        if (trace->format->pregister_thread) {
627                trace->format->pregister_thread(trace, t, trace_is_parallel(trace));
628        }
629
630        /* Fill our buffer with empty packets */
631        memset(&packets, 0, sizeof(void*) * trace->config.burst_size);
632        libtrace_ocache_alloc(&trace->packet_freelist, (void **) packets,
633                              trace->config.burst_size,
634                              trace->config.burst_size);
635
636        /* ~~~~~~~~~~~ Setup complete now we loop ~~~~~~~~~~~~~~~ */
637
638        /* Let the per_packet function know we have started */
639        send_message(trace, t, MESSAGE_STARTING, gen_zero, t);
640        send_message(trace, t, MESSAGE_RESUMING, gen_zero, t);
641
642        for (;;) {
643
644                if (libtrace_message_queue_try_get(&t->messages, &message) != LIBTRACE_MQ_FAILED) {
645                        int ret;
646                        switch (message.code) {
647                                case MESSAGE_DO_PAUSE: // This is internal
648                                        ret = trace_perpkt_thread_pause(trace, t,
649                                              packets, nb_packets, &empty, &offset);
650                                        if (ret == READ_EOF) {
651                                                goto eof;
652                                        } else if (ret == READ_ERROR) {
653                                                goto error;
654                                        }
655                                        assert(ret == 1);
656                                        continue;
657                                case MESSAGE_DO_STOP: // This is internal
658                                        goto eof;
659                        }
660                        send_message(trace, t, message.code, message.data, 
661                                        message.sender);
662                        /* Continue and the empty messages out before packets */
663                        continue;
664                }
665
666
667                /* Do we need to read a new set of packets MOST LIKELY we do */
668                if (offset == nb_packets) {
669                        /* Refill the packet buffer */
670                        if (empty != nb_packets) {
671                                // Refill the empty packets
672                                libtrace_ocache_alloc(&trace->packet_freelist,
673                                                      (void **) &packets[empty],
674                                                      nb_packets - empty,
675                                                      nb_packets - empty);
676                        }
677                        if (!trace->pread) {
678                                assert(packets[0]);
679                                nb_packets = trace_read_packet(trace, packets[0]);
680                                packets[0]->error = nb_packets;
681                                if (nb_packets > 0)
682                                        nb_packets = 1;
683                        } else {
684                                nb_packets = trace->pread(trace, t, packets, trace->config.burst_size);
685                        }
686                        offset = 0;
687                        empty = 0;
688                }
689
690                /* Handle error/message cases */
691                if (nb_packets > 0) {
692                        /* Store the first packet */
693                        if (packets[0]->error > 0) {
694                                store_first_packet(trace, packets[0], t);
695                        }
696                        dispatch_packets(trace, t, packets, nb_packets, &empty,
697                                         &offset, trace->tracetime);
698                } else {
699                        switch (nb_packets) {
700                        case READ_EOF:
701                                goto eof;
702                        case READ_ERROR:
703                                goto error;
704                        case READ_MESSAGE:
705                                nb_packets = 0;
706                                continue;
707                        default:
708                                fprintf(stderr, "Unexpected error %d!!\n", nb_packets);
709                                goto error;
710                        }
711                }
712
713        }
714
715error:
716        message.code = MESSAGE_DO_STOP;
717        message.sender = t;
718        message.data.uint64 = 0;
719        trace_message_perpkts(trace, &message);
720eof:
721        /* ~~~~~~~~~~~~~~ Trace is finished do tear down ~~~~~~~~~~~~~~~~~~~~~ */
722
723        // Let the per_packet function know we have stopped
724        send_message(trace, t, MESSAGE_PAUSING, gen_zero, t);
725        send_message(trace, t, MESSAGE_STOPPING, gen_zero, t);
726
727        // Free any remaining packets
728        for (i = 0; i < trace->config.burst_size; i++) {
729                if (packets[i]) {
730                        libtrace_ocache_free(&trace->packet_freelist, (void **) &packets[i], 1, 1);
731                        packets[i] = NULL;
732                }
733        }
734
735        thread_change_state(trace, t, THREAD_FINISHED, true);
736
737        /* Make sure the reporter sees we have finished */
738        if (trace_has_reporter(trace))
739                trace_post_reporter(trace);
740
741        // Release all ocache memory before unregistering with the format
742        // because this might(it does in DPDK) unlink the formats mempool
743        // causing destroy/finish packet to fail.
744        libtrace_ocache_unregister_thread(&trace->packet_freelist);
745        if (trace->format->punregister_thread) {
746                trace->format->punregister_thread(trace, t);
747        }
748        print_memory_stats();
749
750        pthread_exit(NULL);
751}
752
753/**
754 * The start point for our single threaded hasher thread, this will read
755 * and hash a packet from a data source and queue it against the correct
756 * core to process it.
757 */
758static void* hasher_entry(void *data) {
759        libtrace_t *trace = (libtrace_t *)data;
760        libtrace_thread_t * t;
761        int i;
762        libtrace_packet_t * packet;
763        libtrace_message_t message = {0};
764        int pkt_skipped = 0;
765
766        assert(trace_has_dedicated_hasher(trace));
767        /* Wait until all threads are started and objects are initialised (ring buffers) */
768        ASSERT_RET(pthread_mutex_lock(&trace->libtrace_lock), == 0);
769        t = &trace->hasher_thread;
770        assert(t->type == THREAD_HASHER && pthread_equal(pthread_self(), t->tid));
771        if (trace->state == STATE_ERROR) {
772                thread_change_state(trace, t, THREAD_FINISHED, false);
773                ASSERT_RET(pthread_mutex_unlock(&trace->libtrace_lock), == 0);
774                pthread_exit(NULL);
775        }
776        ASSERT_RET(pthread_mutex_unlock(&trace->libtrace_lock), == 0);
777
778        /* We are reading but it is not the parallel API */
779        if (trace->format->pregister_thread) {
780                trace->format->pregister_thread(trace, t, true);
781        }
782
783        /* Read all packets in then hash and queue against the correct thread */
784        while (1) {
785                int thread;
786                if (!pkt_skipped)
787                        libtrace_ocache_alloc(&trace->packet_freelist, (void **) &packet, 1, 1);
788                assert(packet);
789
790                if (libtrace_halt) {
791                        packet->error = 0;
792                        break;
793                }
794
795                // Check for messages that we expect MESSAGE_DO_PAUSE, (internal messages only)
796                if (libtrace_message_queue_try_get(&t->messages, &message) != LIBTRACE_MQ_FAILED) {
797                        switch(message.code) {
798                                case MESSAGE_DO_PAUSE:
799                                        ASSERT_RET(pthread_mutex_lock(&trace->libtrace_lock), == 0);
800                                        thread_change_state(trace, t, THREAD_PAUSED, false);
801                                        pthread_cond_broadcast(&trace->perpkt_cond);
802                                        while (trace->state == STATE_PAUSED || trace->state == STATE_PAUSING) {
803                                                ASSERT_RET(pthread_cond_wait(&trace->perpkt_cond, &trace->libtrace_lock), == 0);
804                                        }
805                                        thread_change_state(trace, t, THREAD_RUNNING, false);
806                                        pthread_cond_broadcast(&trace->perpkt_cond);
807                                        ASSERT_RET(pthread_mutex_unlock(&trace->libtrace_lock), == 0);
808                                        break;
809                                case MESSAGE_DO_STOP:
810                                        assert(trace->started == false);
811                                        assert(trace->state == STATE_FINISHED);
812                                        /* Mark the current packet as EOF */
813                                        packet->error = 0;
814                                        break;
815                                default:
816                                        fprintf(stderr, "Hasher thread didn't expect message code=%d\n", message.code);
817                        }
818                        pkt_skipped = 1;
819                        continue;
820                }
821
822                if ((packet->error = trace_read_packet(trace, packet)) <1) {
823                        break; /* We are EOF or error'd either way we stop  */
824                }
825
826                /* We are guaranteed to have a hash function i.e. != NULL */
827                trace_packet_set_hash(packet, (*trace->hasher)(packet, trace->hasher_data));
828                thread = trace_packet_get_hash(packet) % trace->perpkt_thread_count;
829                /* Blocking write to the correct queue - I'm the only writer */
830                if (trace->perpkt_threads[thread].state != THREAD_FINISHED) {
831                        uint64_t order = trace_packet_get_order(packet);
832                        libtrace_ringbuffer_write(&trace->perpkt_threads[thread].rbuffer, packet);
833                        if (trace->config.tick_count && order % trace->config.tick_count == 0) {
834                                // Write ticks to everyone else
835                                libtrace_packet_t * pkts[trace->perpkt_thread_count];
836                                memset(pkts, 0, sizeof(void *) * trace->perpkt_thread_count);
837                                libtrace_ocache_alloc(&trace->packet_freelist, (void **) pkts, trace->perpkt_thread_count, trace->perpkt_thread_count);
838                                for (i = 0; i < trace->perpkt_thread_count; i++) {
839                                        pkts[i]->error = READ_TICK;
840                                        trace_packet_set_order(pkts[i], order);
841                                        libtrace_ringbuffer_write(&trace->perpkt_threads[i].rbuffer, pkts[i]);
842                                }
843                        }
844                        pkt_skipped = 0;
845                } else {
846                        assert(!"Dropping a packet!!");
847                        pkt_skipped = 1; // Reuse that packet no one read it
848                }
849        }
850
851        /* Broadcast our last failed read to all threads */
852        for (i = 0; i < trace->perpkt_thread_count; i++) {
853                libtrace_packet_t * bcast;
854                if (i == trace->perpkt_thread_count - 1) {
855                        bcast = packet;
856                } else {
857                        libtrace_ocache_alloc(&trace->packet_freelist, (void **) &bcast, 1, 1);
858                        bcast->error = packet->error;
859                }
860                ASSERT_RET(pthread_mutex_lock(&trace->libtrace_lock), == 0);
861                if (trace->perpkt_threads[i].state != THREAD_FINISHED) {
862                        // Unlock early otherwise we could deadlock
863                        libtrace_ringbuffer_write(&trace->perpkt_threads[i].rbuffer, bcast);
864                }
865                ASSERT_RET(pthread_mutex_unlock(&trace->libtrace_lock), == 0);
866        }
867
868        // We don't need to free the packet
869        thread_change_state(trace, t, THREAD_FINISHED, true);
870
871        libtrace_ocache_unregister_thread(&trace->packet_freelist);
872        if (trace->format->punregister_thread) {
873                trace->format->punregister_thread(trace, t);
874        }
875        print_memory_stats();
876
877        // TODO remove from TTABLE t sometime
878        pthread_exit(NULL);
879}
880
881/* Our simplest case when a thread becomes ready it can obtain an exclusive
882 * lock to read packets from the underlying trace.
883 */
884static int trace_pread_packet_first_in_first_served(libtrace_t *libtrace,
885                                                    libtrace_thread_t *t,
886                                                    libtrace_packet_t *packets[],
887                                                    size_t nb_packets) {
888        size_t i = 0;
889        //bool tick_hit = false;
890
891        ASSERT_RET(pthread_mutex_lock(&libtrace->libtrace_lock), == 0);
892        /* Read nb_packets */
893        for (i = 0; i < nb_packets; ++i) {
894                if (libtrace_halt) {
895                        break;
896                }
897                packets[i]->error = trace_read_packet(libtrace, packets[i]);
898
899                if (packets[i]->error <= 0) {
900                        /* We'll catch this next time if we have already got packets */
901                        if ( i==0 ) {
902                                ASSERT_RET(pthread_mutex_unlock(&libtrace->libtrace_lock), == 0);
903                                return packets[i]->error;
904                        } else {
905                                break;
906                        }
907                }
908                /*
909                if (libtrace->config.tick_count && trace_packet_get_order(packets[i]) % libtrace->config.tick_count == 0) {
910                        tick_hit = true;
911                }*/
912        }
913        // Doing this inside the lock ensures the first packet is always
914        // recorded first
915        if (packets[0]->error > 0) {
916                store_first_packet(libtrace, packets[0], t);
917        }
918        ASSERT_RET(pthread_mutex_unlock(&libtrace->libtrace_lock), == 0);
919        /* XXX TODO this needs to be inband with packets, or we don't bother in this case
920        if (tick_hit) {
921                libtrace_message_t tick;
922                tick.additional.uint64 = trace_packet_get_order(packets[i]);
923                tick.code = MESSAGE_TICK;
924                trace_send_message_to_perpkts(libtrace, &tick);
925        } */
926        return i;
927}
928
929/**
930 * For the case that we have a dedicated hasher thread
931 * 1. We read a packet from our buffer
932 * 2. Move that into the packet provided (packet)
933 */
934inline static int trace_pread_packet_hasher_thread(libtrace_t *libtrace,
935                                                   libtrace_thread_t *t,
936                                                   libtrace_packet_t *packets[],
937                                                   size_t nb_packets) {
938        size_t i;
939
940        /* We store the last error message here */
941        if (t->format_data) {
942                return ((libtrace_packet_t *)t->format_data)->error;
943        }
944
945        // Always grab at least one
946        if (packets[0]) // Recycle the old get the new
947                libtrace_ocache_free(&libtrace->packet_freelist, (void **) packets, 1, 1);
948        packets[0] = libtrace_ringbuffer_read(&t->rbuffer);
949
950        if (packets[0]->error <= 0 && packets[0]->error != READ_TICK) {
951                return packets[0]->error;
952        }
953
954        for (i = 1; i < nb_packets; i++) {
955                if (packets[i]) // Recycle the old get the new
956                        libtrace_ocache_free(&libtrace->packet_freelist, (void **) &packets[i], 1, 1);
957                if (!libtrace_ringbuffer_try_read(&t->rbuffer, (void **) &packets[i])) {
958                        packets[i] = NULL;
959                        break;
960                }
961
962                /* We will return an error or EOF the next time around */
963                if (packets[i]->error <= 0 && packets[0]->error != READ_TICK) {
964                        /* The message case will be checked automatically -
965                           However other cases like EOF and error will only be
966                           sent once*/
967                        if (packets[i]->error != READ_MESSAGE) {
968                                assert(t->format_data == NULL);
969                                t->format_data = packets[i];
970                        }
971                        break;
972                }
973        }
974
975        return i;
976}
977
978/**
979 * For the first packet of each queue we keep a copy and note the system
980 * time it was received at.
981 *
982 * This is used for finding the first packet when playing back a trace
983 * in trace time. And can be used by real time applications to print
984 * results out every XXX seconds.
985 */
986void store_first_packet(libtrace_t *libtrace, libtrace_packet_t *packet, libtrace_thread_t *t)
987{
988        if (!t->recorded_first) {
989                libtrace_message_t mesg = {0};
990                struct timeval tv;
991                libtrace_packet_t * dup;
992
993                /* We mark system time against a copy of the packet */
994                gettimeofday(&tv, NULL);
995                dup = trace_copy_packet(packet);
996
997                ASSERT_RET(pthread_spin_lock(&libtrace->first_packets.lock), == 0);
998                libtrace->first_packets.packets[t->perpkt_num].packet = dup;
999                memcpy(&libtrace->first_packets.packets[t->perpkt_num].tv, &tv, sizeof(tv));
1000                libtrace->first_packets.count++;
1001
1002                /* Now update the first */
1003                if (libtrace->first_packets.count == 1) {
1004                        /* We the first entry hence also the first known packet */
1005                        libtrace->first_packets.first = t->perpkt_num;
1006                } else {
1007                        /* Check if we are newer than the previous 'first' packet */
1008                        size_t first = libtrace->first_packets.first;
1009                        if (trace_get_seconds(dup) <
1010                                trace_get_seconds(libtrace->first_packets.packets[first].packet))
1011                                libtrace->first_packets.first = t->perpkt_num;
1012                }
1013                ASSERT_RET(pthread_spin_unlock(&libtrace->first_packets.lock), == 0);
1014
1015                mesg.code = MESSAGE_FIRST_PACKET;
1016                trace_message_reporter(libtrace, &mesg);
1017                trace_message_perpkts(libtrace, &mesg);
1018                t->recorded_first = true;
1019        }
1020}
1021
1022DLLEXPORT int trace_get_first_packet(libtrace_t *libtrace,
1023                                     libtrace_thread_t *t,
1024                                     const libtrace_packet_t **packet,
1025                                     const struct timeval **tv)
1026{
1027        void * tmp;
1028        int ret = 0;
1029
1030        if (t) {
1031                if (t->type != THREAD_PERPKT || t->trace != libtrace)
1032                        return -1;
1033        }
1034
1035        /* Throw away these which we don't use */
1036        if (!packet)
1037                packet = (const libtrace_packet_t **) &tmp;
1038        if (!tv)
1039                tv = (const struct timeval **) &tmp;
1040
1041        ASSERT_RET(pthread_spin_lock(&libtrace->first_packets.lock), == 0);
1042        if (t) {
1043                /* Get the requested thread */
1044                *packet = libtrace->first_packets.packets[t->perpkt_num].packet;
1045                *tv = &libtrace->first_packets.packets[t->perpkt_num].tv;
1046        } else if (libtrace->first_packets.count) {
1047                /* Get the first packet across all threads */
1048                *packet = libtrace->first_packets.packets[libtrace->first_packets.first].packet;
1049                *tv = &libtrace->first_packets.packets[libtrace->first_packets.first].tv;
1050                if (libtrace->first_packets.count == (size_t) libtrace->perpkt_thread_count) {
1051                        ret = 1;
1052                } else {
1053                        struct timeval curr_tv;
1054                        // If a second has passed since the first entry we will assume this is the very first packet
1055                        gettimeofday(&curr_tv, NULL);
1056                        if (curr_tv.tv_sec > (*tv)->tv_sec) {
1057                                if(curr_tv.tv_usec > (*tv)->tv_usec || curr_tv.tv_sec - (*tv)->tv_sec > 1) {
1058                                        ret = 1;
1059                                }
1060                        }
1061                }
1062        } else {
1063                *packet = NULL;
1064                *tv = NULL;
1065        }
1066        ASSERT_RET(pthread_spin_unlock(&libtrace->first_packets.lock), == 0);
1067        return ret;
1068}
1069
1070
1071DLLEXPORT uint64_t tv_to_usec(const struct timeval *tv)
1072{
1073        return (uint64_t) tv->tv_sec*1000000ull + (uint64_t) tv->tv_usec;
1074}
1075
1076inline static struct timeval usec_to_tv(uint64_t usec)
1077{
1078        struct timeval tv;
1079        tv.tv_sec = usec / 1000000;
1080        tv.tv_usec = usec % 1000000;
1081        return tv;
1082}
1083
1084/** Similar to delay_tracetime but send messages to all threads periodically */
1085static void* reporter_entry(void *data) {
1086        libtrace_message_t message = {0};
1087        libtrace_t *trace = (libtrace_t *)data;
1088        libtrace_thread_t *t = &trace->reporter_thread;
1089
1090        /* Wait until all threads are started */
1091        ASSERT_RET(pthread_mutex_lock(&trace->libtrace_lock), == 0);
1092        if (trace->state == STATE_ERROR) {
1093                thread_change_state(trace, t, THREAD_FINISHED, false);
1094                ASSERT_RET(pthread_mutex_unlock(&trace->libtrace_lock), == 0);
1095                pthread_exit(NULL);
1096        }
1097        ASSERT_RET(pthread_mutex_unlock(&trace->libtrace_lock), == 0);
1098
1099        if (trace->format->pregister_thread) {
1100                trace->format->pregister_thread(trace, t, false);
1101        }
1102
1103        send_message(trace, t, MESSAGE_STARTING, (libtrace_generic_t){0}, t);
1104        send_message(trace, t, MESSAGE_RESUMING, (libtrace_generic_t){0}, t);
1105
1106        while (!trace_has_finished(trace)) {
1107                if (trace->config.reporter_polling) {
1108                        if (libtrace_message_queue_try_get(&t->messages, &message) == LIBTRACE_MQ_FAILED)
1109                                message.code = MESSAGE_POST_REPORTER;
1110                } else {
1111                        libtrace_message_queue_get(&t->messages, &message);
1112                }
1113                switch (message.code) {
1114                        // Check for results
1115                        case MESSAGE_POST_REPORTER:
1116                                trace->combiner.read(trace, &trace->combiner);
1117                                break;
1118                        case MESSAGE_DO_PAUSE:
1119                                assert(trace->combiner.pause);
1120                                trace->combiner.pause(trace, &trace->combiner);
1121                                send_message(trace, t, MESSAGE_PAUSING,
1122                                                (libtrace_generic_t) {0}, t);
1123                                trace_thread_pause(trace, t);
1124                                send_message(trace, t, MESSAGE_RESUMING,
1125                                                (libtrace_generic_t) {0}, t);
1126                                break;
1127                default:
1128                        send_message(trace, t, message.code, message.data,
1129                                        message.sender);
1130                }
1131        }
1132
1133        // Flush out whats left now all our threads have finished
1134        trace->combiner.read_final(trace, &trace->combiner);
1135
1136        // GOODBYE
1137        send_message(trace, t, MESSAGE_PAUSING,(libtrace_generic_t) {0}, t);
1138        send_message(trace, t, MESSAGE_STOPPING,(libtrace_generic_t) {0}, t);
1139
1140        thread_change_state(trace, &trace->reporter_thread, THREAD_FINISHED, true);
1141        print_memory_stats();
1142        return NULL;
1143}
1144
1145/** Similar to delay_tracetime but send messages to all threads periodically */
1146static void* keepalive_entry(void *data) {
1147        struct timeval prev, next;
1148        libtrace_message_t message = {0};
1149        libtrace_t *trace = (libtrace_t *)data;
1150        uint64_t next_release;
1151        libtrace_thread_t *t = &trace->keepalive_thread;
1152
1153        /* Wait until all threads are started */
1154        ASSERT_RET(pthread_mutex_lock(&trace->libtrace_lock), == 0);
1155        if (trace->state == STATE_ERROR) {
1156                thread_change_state(trace, t, THREAD_FINISHED, false);
1157                ASSERT_RET(pthread_mutex_unlock(&trace->libtrace_lock), == 0);
1158                pthread_exit(NULL);
1159        }
1160        ASSERT_RET(pthread_mutex_unlock(&trace->libtrace_lock), == 0);
1161
1162        gettimeofday(&prev, NULL);
1163        message.code = MESSAGE_TICK_INTERVAL;
1164
1165        while (trace->state != STATE_FINISHED) {
1166                fd_set rfds;
1167                next_release = tv_to_usec(&prev) + (trace->config.tick_interval * 1000);
1168                gettimeofday(&next, NULL);
1169                if (next_release > tv_to_usec(&next)) {
1170                        next = usec_to_tv(next_release - tv_to_usec(&next));
1171                        // Wait for timeout or a message
1172                        FD_ZERO(&rfds);
1173                        FD_SET(libtrace_message_queue_get_fd(&t->messages), &rfds);
1174                        if (select(libtrace_message_queue_get_fd(&t->messages)+1, &rfds, NULL, NULL, &next) == 1) {
1175                                libtrace_message_t msg;
1176                                libtrace_message_queue_get(&t->messages, &msg);
1177                                assert(msg.code == MESSAGE_DO_STOP);
1178                                goto done;
1179                        }
1180                }
1181                prev = usec_to_tv(next_release);
1182                if (trace->state == STATE_RUNNING) {
1183                        message.data.uint64 = ((((uint64_t)prev.tv_sec) << 32) +
1184                                               (((uint64_t)prev.tv_usec << 32)/1000000));
1185                        trace_message_perpkts(trace, &message);
1186                }
1187        }
1188done:
1189
1190        thread_change_state(trace, t, THREAD_FINISHED, true);
1191        return NULL;
1192}
1193
1194/**
1195 * Delays a packets playback so the playback will be in trace time.
1196 * This may break early if a message becomes available.
1197 *
1198 * Requires the first packet for this thread to be received.
1199 * @param libtrace  The trace
1200 * @param packet    The packet to delay
1201 * @param t         The current thread
1202 * @return Either READ_MESSAGE(-2) or 0 is successful
1203 */
1204static inline int delay_tracetime(libtrace_t *libtrace, libtrace_packet_t *packet, libtrace_thread_t *t) {
1205        struct timeval curr_tv, pkt_tv;
1206        uint64_t next_release = t->tracetime_offset_usec;
1207        uint64_t curr_usec;
1208
1209        if (!t->tracetime_offset_usec) {
1210                const libtrace_packet_t *first_pkt;
1211                const struct timeval *sys_tv;
1212                int64_t initial_offset;
1213                int stable = trace_get_first_packet(libtrace, NULL, &first_pkt, &sys_tv);
1214                assert(first_pkt);
1215                pkt_tv = trace_get_timeval(first_pkt);
1216                initial_offset = (int64_t)tv_to_usec(sys_tv) - (int64_t)tv_to_usec(&pkt_tv);
1217                /* In the unlikely case offset is 0, change it to 1 */
1218                if (stable)
1219                        t->tracetime_offset_usec = initial_offset ? initial_offset: 1;
1220                next_release = initial_offset;
1221        }
1222        /* next_release == offset */
1223        pkt_tv = trace_get_timeval(packet);
1224        next_release += tv_to_usec(&pkt_tv);
1225        gettimeofday(&curr_tv, NULL);
1226        curr_usec = tv_to_usec(&curr_tv);
1227        if (next_release > curr_usec) {
1228                int ret, mesg_fd = libtrace_message_queue_get_fd(&t->messages);
1229                struct timeval delay_tv = usec_to_tv(next_release-curr_usec);
1230                fd_set rfds;
1231                FD_ZERO(&rfds);
1232                FD_SET(mesg_fd, &rfds);
1233                // We need to wait
1234                ret = select(mesg_fd+1, &rfds, NULL, NULL, &delay_tv);
1235                if (ret == 0) {
1236                        return 0;
1237                } else if (ret > 0) {
1238                        return READ_MESSAGE;
1239                } else {
1240                        assert(!"trace_delay_packet: Unexpected return from select");
1241                }
1242        }
1243        return 0;
1244}
1245
1246/* Discards packets that don't match the filter.
1247 * Discarded packets are emptied and then moved to the end of the packet list.
1248 *
1249 * @param trace       The trace format, containing the filter
1250 * @param packets     An array of packets
1251 * @param nb_packets  The number of valid items in packets
1252 *
1253 * @return The number of packets that passed the filter, which are moved to
1254 *          the start of the packets array
1255 */
1256static inline size_t filter_packets(libtrace_t *trace,
1257                                    libtrace_packet_t **packets,
1258                                    size_t nb_packets) {
1259        size_t offset = 0;
1260        size_t i;
1261
1262        for (i = 0; i < nb_packets; ++i) {
1263                // The filter needs the trace attached to receive the link type
1264                packets[i]->trace = trace;
1265                if (trace_apply_filter(trace->filter, packets[i])) {
1266                        libtrace_packet_t *tmp;
1267                        tmp = packets[offset];
1268                        packets[offset++] = packets[i];
1269                        packets[i] = tmp;
1270                } else {
1271                        trace_fin_packet(packets[i]);
1272                }
1273        }
1274
1275        return offset;
1276}
1277
1278/* Read a batch of packets from the trace into a buffer.
1279 * Note that this function will block until a packet is read (or EOF is reached)
1280 *
1281 * @param libtrace    The trace
1282 * @param t           The thread
1283 * @param packets     An array of packets
1284 * @param nb_packets  The number of empty packets in packets
1285 * @return The number of packets read, 0 on EOF (or an error/message -1,-2).
1286 */
1287static int trace_pread_packet_wrapper(libtrace_t *libtrace,
1288                                      libtrace_thread_t *t,
1289                                      libtrace_packet_t *packets[],
1290                                      size_t nb_packets) {
1291        int i;
1292        assert(nb_packets);
1293        assert(libtrace && "libtrace is NULL in trace_read_packet()");
1294        if (trace_is_err(libtrace))
1295                return -1;
1296        if (!libtrace->started) {
1297                trace_set_err(libtrace, TRACE_ERR_BAD_STATE,
1298                              "You must call libtrace_start() before trace_read_packet()\n");
1299                return -1;
1300        }
1301
1302        if (libtrace->format->pread_packets) {
1303                int ret;
1304                for (i = 0; i < (int) nb_packets; ++i) {
1305                        assert(i[packets]);
1306                        if (!(packets[i]->buf_control==TRACE_CTRL_PACKET ||
1307                              packets[i]->buf_control==TRACE_CTRL_EXTERNAL)) {
1308                                trace_set_err(libtrace,TRACE_ERR_BAD_STATE,
1309                                              "Packet passed to trace_read_packet() is invalid\n");
1310                                return -1;
1311                        }
1312                }
1313                do {
1314                        ret=libtrace->format->pread_packets(libtrace, t,
1315                                                            packets,
1316                                                            nb_packets);
1317                        /* Error, EOF or message? */
1318                        if (ret <= 0) {
1319                                return ret;
1320                        }
1321
1322                        if (libtrace->filter) {
1323                                int remaining;
1324                                remaining = filter_packets(libtrace,
1325                                                           packets, ret);
1326                                t->filtered_packets += ret - remaining;
1327                                ret = remaining;
1328                        }
1329                        for (i = 0; i < ret; ++i) {
1330                                /* We do not mark the packet against the trace,
1331                                 * before hand or after. After breaks DAG meta
1332                                 * packets and before is inefficient */
1333                                //packets[i]->trace = libtrace;
1334                                /* TODO IN FORMAT?? Like traditional libtrace */
1335                                if (libtrace->snaplen>0)
1336                                        trace_set_capture_length(packets[i],
1337                                                        libtrace->snaplen);
1338                                trace_packet_set_order(packets[i], trace_get_erf_timestamp(packets[i]));
1339                        }
1340                } while(ret == 0);
1341                return ret;
1342        }
1343        trace_set_err(libtrace, TRACE_ERR_UNSUPPORTED,
1344                      "This format does not support reading packets\n");
1345        return ~0U;
1346}
1347
1348/* Restarts a parallel trace, this is called from trace_pstart.
1349 * The libtrace lock is held upon calling this function.
1350 * Typically with a parallel trace the threads are not
1351 * killed rather.
1352 */
1353static int trace_prestart(libtrace_t * libtrace, void *global_blob,
1354                          libtrace_callback_set_t *per_packet_cbs, 
1355                          libtrace_callback_set_t *reporter_cbs) {
1356        int i, err = 0;
1357        if (libtrace->state != STATE_PAUSED) {
1358                trace_set_err(libtrace, TRACE_ERR_BAD_STATE,
1359                        "trace(%s) is not currently paused",
1360                              libtrace->uridata);
1361                return -1;
1362        }
1363
1364        assert(libtrace_parallel);
1365        assert(!libtrace->perpkt_thread_states[THREAD_RUNNING]);
1366
1367        /* Reset first packets */
1368        pthread_spin_lock(&libtrace->first_packets.lock);
1369        for (i = 0; i < libtrace->perpkt_thread_count; ++i) {
1370                assert(!!libtrace->perpkt_threads[i].recorded_first == !!libtrace->first_packets.packets[i].packet);
1371                if (libtrace->first_packets.packets[i].packet) {
1372                        trace_destroy_packet(libtrace->first_packets.packets[i].packet);
1373                        libtrace->first_packets.packets[i].packet = NULL;
1374                        libtrace->first_packets.packets[i].tv.tv_sec = 0;
1375                        libtrace->first_packets.packets[i].tv.tv_usec = 0;
1376                        libtrace->first_packets.count--;
1377                        libtrace->perpkt_threads[i].recorded_first = false;
1378                }
1379        }
1380        assert(libtrace->first_packets.count == 0);
1381        libtrace->first_packets.first = 0;
1382        pthread_spin_unlock(&libtrace->first_packets.lock);
1383
1384        /* Reset delay */
1385        for (i = 0; i < libtrace->perpkt_thread_count; ++i) {
1386                libtrace->perpkt_threads[i].tracetime_offset_usec = 0;
1387        }
1388
1389        /* Reset statistics */
1390        for (i = 0; i < libtrace->perpkt_thread_count; ++i) {
1391                libtrace->perpkt_threads[i].accepted_packets = 0;
1392                libtrace->perpkt_threads[i].filtered_packets = 0;
1393        }
1394        libtrace->accepted_packets = 0;
1395        libtrace->filtered_packets = 0;
1396
1397        /* Update functions if requested */
1398        if(global_blob)
1399                libtrace->global_blob = global_blob;
1400
1401        if (per_packet_cbs) {
1402                if (libtrace->perpkt_cbs)
1403                        trace_destroy_callback_set(libtrace->perpkt_cbs);
1404                libtrace->perpkt_cbs = trace_create_callback_set();
1405                memcpy(libtrace->perpkt_cbs, per_packet_cbs, 
1406                                sizeof(libtrace_callback_set_t));
1407        }
1408
1409        if (reporter_cbs) {
1410                if (libtrace->reporter_cbs)
1411                        trace_destroy_callback_set(libtrace->reporter_cbs);
1412
1413                libtrace->reporter_cbs = trace_create_callback_set();
1414                memcpy(libtrace->reporter_cbs, reporter_cbs, 
1415                                sizeof(libtrace_callback_set_t));
1416        }
1417
1418        if (trace_is_parallel(libtrace)) {
1419                err = libtrace->format->pstart_input(libtrace);
1420        } else {
1421                if (libtrace->format->start_input) {
1422                        err = libtrace->format->start_input(libtrace);
1423                }
1424        }
1425
1426        if (err == 0) {
1427                libtrace->started = true;
1428                libtrace_change_state(libtrace, STATE_RUNNING, false);
1429        }
1430        return err;
1431}
1432
1433/**
1434 * @return the number of CPU cores on the machine. -1 if unknown.
1435 */
1436SIMPLE_FUNCTION static int get_nb_cores() {
1437        int numCPU;
1438#ifdef _SC_NPROCESSORS_ONLN
1439        /* Most systems do this now */
1440        numCPU = sysconf(_SC_NPROCESSORS_ONLN);
1441
1442#else
1443        int mib[] = {CTL_HW, HW_AVAILCPU};
1444        size_t len = sizeof(numCPU);
1445
1446        /* get the number of CPUs from the system */
1447        sysctl(mib, 2, &numCPU, &len, NULL, 0);
1448#endif
1449        return numCPU <= 0 ? 1 : numCPU;
1450}
1451
1452/**
1453 * Verifies the configuration and sets default values for any values not
1454 * specified by the user.
1455 */
1456static void verify_configuration(libtrace_t *libtrace) {
1457
1458        if (libtrace->config.hasher_queue_size <= 0)
1459                libtrace->config.hasher_queue_size = 1000;
1460
1461        if (libtrace->config.perpkt_threads <= 0) {
1462                libtrace->perpkt_thread_count = get_nb_cores();
1463                if (libtrace->perpkt_thread_count <= 0)
1464                        // Lets just use one
1465                        libtrace->perpkt_thread_count = 1;
1466        } else {
1467                libtrace->perpkt_thread_count = libtrace->config.perpkt_threads;
1468        }
1469
1470        if (libtrace->config.reporter_thold <= 0)
1471                libtrace->config.reporter_thold = 100;
1472        if (libtrace->config.burst_size <= 0)
1473                libtrace->config.burst_size = 10;
1474        if (libtrace->config.thread_cache_size <= 0)
1475                libtrace->config.thread_cache_size = 20;
1476        if (libtrace->config.cache_size <= 0)
1477                libtrace->config.cache_size = (libtrace->config.hasher_queue_size + 1) * libtrace->perpkt_thread_count;
1478
1479        if (libtrace->config.cache_size <
1480                (libtrace->config.hasher_queue_size + 1) * libtrace->perpkt_thread_count)
1481                fprintf(stderr, "WARNING deadlocks may occur and extra memory allocating buffer sizes (packet_freelist_size) mismatched\n");
1482
1483        if (libtrace->combiner.initialise == NULL && libtrace->combiner.publish == NULL)
1484                libtrace->combiner = combiner_unordered;
1485
1486        /* Figure out if we are using a dedicated hasher thread? */
1487        if (libtrace->hasher && libtrace->perpkt_thread_count > 1) {
1488                libtrace->hasher_thread.type = THREAD_HASHER;
1489        }
1490}
1491
1492/**
1493 * Starts a libtrace_thread, including allocating memory for messaging.
1494 * Threads are expected to wait until the libtrace look is released.
1495 * Hence why we don't init structures until later.
1496 *
1497 * @param trace The trace the thread is associated with
1498 * @param t The thread that is filled when the thread is started
1499 * @param type The type of thread
1500 * @param start_routine The entry location of the thread
1501 * @param perpkt_num The perpkt thread number (should be set -1 if not perpkt)
1502 * @param name For debugging purposes set the threads name (Optional)
1503 *
1504 * @return 0 on success or -1 upon error in which case the libtrace error is set.
1505 *         In this situation the thread structure is zeroed.
1506 */
1507static int trace_start_thread(libtrace_t *trace,
1508                       libtrace_thread_t *t,
1509                       enum thread_types type,
1510                       void *(*start_routine) (void *),
1511                       int perpkt_num,
1512                       const char *name) {
1513#ifdef __linux__
1514        pthread_attr_t attrib;
1515        cpu_set_t cpus;
1516#endif
1517        int ret, i;
1518        assert(t->type == THREAD_EMPTY);
1519        t->trace = trace;
1520        t->ret = NULL;
1521        t->user_data = NULL;
1522        t->type = type;
1523        t->state = THREAD_RUNNING;
1524
1525#ifdef __linux__
1526        CPU_ZERO(&cpus);
1527        for (i = 0; i < get_nb_cores(); i++)
1528                CPU_SET(i, &cpus);
1529        pthread_attr_init(&attrib);
1530        pthread_attr_setaffinity_np(&attrib, sizeof(cpus), &cpus);
1531        ret = pthread_create(&t->tid, &attrib, start_routine, (void *) trace);
1532        pthread_attr_destroy(&attrib);
1533#else
1534        ret = pthread_create(&t->tid, NULL, start_routine, (void *) trace);
1535#endif
1536        if (ret != 0) {
1537                libtrace_zero_thread(t);
1538                trace_set_err(trace, ret, "Failed to create a thread of type=%d\n", type);
1539                return -1;
1540        }
1541        libtrace_message_queue_init(&t->messages, sizeof(libtrace_message_t));
1542        if (trace_has_dedicated_hasher(trace) && type == THREAD_PERPKT) {
1543                libtrace_ringbuffer_init(&t->rbuffer,
1544                                         trace->config.hasher_queue_size,
1545                                         trace->config.hasher_polling?
1546                                                 LIBTRACE_RINGBUFFER_POLLING:
1547                                                 LIBTRACE_RINGBUFFER_BLOCKING);
1548        }
1549#if defined(HAVE_PTHREAD_SETNAME_NP) && defined(__linux__)
1550        if(name)
1551                pthread_setname_np(t->tid, name);
1552#endif
1553        t->perpkt_num = perpkt_num;
1554        return 0;
1555}
1556
1557/** Parses the environment variable LIBTRACE_CONF into the supplied
1558 * configuration structure.
1559 *
1560 * @param[in,out] libtrace The trace from which we determine the URI and set
1561 * the configuration.
1562 *
1563 * We search for 3 environment variables and apply them to the config in the
1564 * following order. Such that the first has the lowest priority.
1565 *
1566 * 1. LIBTRACE_CONF, The global environment configuration
1567 * 2. LIBTRACE_CONF_<FORMAT>, Applied to a given format
1568 * 3. LIBTRACE_CONF_<FORMAT_URI>, Applied the specified trace
1569 *
1570 * E.g.
1571 * - int:eth0 would match LIBTRACE_CONF, LIBTRACE_CONF_INT, LIBTRACE_CONF_INT_ETH0
1572 * - dag:/dev/dag0,0 would match LIBTRACE_CONF, LIBTRACE_CONF_DAG, LIBTRACE_CONF_DAG__DEV_DAG0_0
1573 * - test.erf would match LIBTRACE_CONF, LIBTRACE_CONF_ERF, LIBTRACE_CONF_ERF_TEST_ERF
1574 *
1575 * @note All environment variables names MUST only contian
1576 * [A-Z], [0-9] and [_] (underscore) and not start with a number. Any characters
1577 * outside of this range should be captilised if possible or replaced with an
1578 * underscore.
1579 */
1580static void parse_env_config (libtrace_t *libtrace) {
1581        char env_name[1024] = "LIBTRACE_CONF_";
1582        size_t len = strlen(env_name);
1583        size_t mark = 0;
1584        size_t i;
1585        char * env;
1586
1587        /* Make our compound string */
1588        strncpy(&env_name[len], libtrace->format->name, sizeof(env_name) - len);
1589        len += strlen(libtrace->format->name);
1590        strncpy(&env_name[len], ":", sizeof(env_name) - len);
1591        len += 1;
1592        strncpy(&env_name[len], libtrace->uridata, sizeof(env_name) - len);
1593
1594        /* env names are allowed to be A-Z (CAPS) 0-9 and _ */
1595        for (i = 0; env_name[i] != 0; ++i) {
1596                env_name[i] = toupper(env_name[i]);
1597                if(env_name[i] == ':') {
1598                        mark = i;
1599                }
1600                if (!( (env_name[i] >= 'A' && env_name[i] <= 'Z') ||
1601                       (env_name[i] >= '0' && env_name[i] <= '9') )) {
1602                        env_name[i] = '_';
1603                }
1604        }
1605
1606        /* First apply global env settings LIBTRACE_CONF */
1607        env = getenv("LIBTRACE_CONF");
1608        if (env)
1609        {
1610                printf("Got env %s", env);
1611                trace_set_configuration(libtrace, env);
1612        }
1613
1614        /* Then format settings LIBTRACE_CONF_<FORMAT> */
1615        if (mark != 0) {
1616                env_name[mark] = 0;
1617                env = getenv(env_name);
1618                if (env) {
1619                        trace_set_configuration(libtrace, env);
1620                }
1621                env_name[mark] = '_';
1622        }
1623
1624        /* Finally this specific trace LIBTRACE_CONF_<FORMAT_URI> */
1625        env = getenv(env_name);
1626        if (env) {
1627                trace_set_configuration(libtrace, env);
1628        }
1629}
1630
1631DLLEXPORT bool trace_is_parallel(libtrace_t * libtrace) {
1632        if (libtrace->state == STATE_NEW)
1633                return trace_supports_parallel(libtrace);
1634        return libtrace->pread == trace_pread_packet_wrapper;
1635}
1636
1637DLLEXPORT int trace_pstart(libtrace_t *libtrace, void* global_blob,
1638                           libtrace_callback_set_t *per_packet_cbs,
1639                           libtrace_callback_set_t *reporter_cbs) {
1640        int i;
1641        int ret = -1;
1642        char name[16];
1643        sigset_t sig_before, sig_block_all;
1644        assert(libtrace);
1645
1646        ASSERT_RET(pthread_mutex_lock(&libtrace->libtrace_lock), == 0);
1647        if (trace_is_err(libtrace)) {
1648                goto cleanup_none;
1649        }
1650
1651        if (libtrace->state == STATE_PAUSED) {
1652                ret = trace_prestart(libtrace, global_blob, per_packet_cbs, 
1653                                reporter_cbs);
1654                ASSERT_RET(pthread_mutex_unlock(&libtrace->libtrace_lock), == 0);
1655                return ret;
1656        }
1657
1658        if (libtrace->state != STATE_NEW) {
1659                trace_set_err(libtrace, TRACE_ERR_BAD_STATE, "trace_pstart "
1660                              "should be called on a NEW or PAUSED trace but "
1661                              "instead was called from %s",
1662                              get_trace_state_name(libtrace->state));
1663                goto cleanup_none;
1664        }
1665
1666        /* Store the user defined things against the trace */
1667        libtrace->global_blob = global_blob;
1668
1669        /* Save a copy of the callbacks in case the user tries to change them
1670         * on us later */
1671        if (!per_packet_cbs) {
1672                trace_set_err(libtrace, TRACE_ERR_INIT_FAILED, "trace_pstart "
1673                                "requires a non-NULL set of per packet "
1674                                "callbacks.");
1675                goto cleanup_none;
1676        }
1677
1678        if (per_packet_cbs->message_packet == NULL) {
1679                trace_set_err(libtrace, TRACE_ERR_INIT_FAILED, "The per "
1680                                "packet callbacks must include a handler "
1681                                "for a packet. Please set this using "
1682                                "trace_set_packet_cb().");
1683                goto cleanup_none;
1684        }
1685
1686        libtrace->perpkt_cbs = trace_create_callback_set();
1687        memcpy(libtrace->perpkt_cbs, per_packet_cbs, sizeof(libtrace_callback_set_t));
1688       
1689        if (reporter_cbs) {
1690                libtrace->reporter_cbs = trace_create_callback_set();
1691                memcpy(libtrace->reporter_cbs, reporter_cbs, sizeof(libtrace_callback_set_t));
1692        }
1693
1694       
1695
1696
1697        /* And zero other fields */
1698        for (i = 0; i < THREAD_STATE_MAX; ++i) {
1699                libtrace->perpkt_thread_states[i] = 0;
1700        }
1701        libtrace->first_packets.first = 0;
1702        libtrace->first_packets.count = 0;
1703        libtrace->first_packets.packets = NULL;
1704        libtrace->perpkt_threads = NULL;
1705        /* Set a global which says we are using a parallel trace. This is
1706         * for backwards compatability due to changes when destroying packets */
1707        libtrace_parallel = 1;
1708
1709        /* Parses configuration passed through environment variables */
1710        parse_env_config(libtrace);
1711        verify_configuration(libtrace);
1712
1713        ret = -1;
1714        /* Try start the format - we prefer parallel over single threaded, as
1715         * these formats should support messages better */
1716        if (trace_supports_parallel(libtrace) &&
1717            !trace_has_dedicated_hasher(libtrace)) {
1718                ret = libtrace->format->pstart_input(libtrace);
1719                libtrace->pread = trace_pread_packet_wrapper;
1720        }
1721        if (ret != 0) {
1722                if (libtrace->format->start_input) {
1723                        ret = libtrace->format->start_input(libtrace);
1724                }
1725                if (libtrace->perpkt_thread_count > 1)
1726                        libtrace->pread = trace_pread_packet_first_in_first_served;
1727                else
1728                        /* Use standard read_packet */
1729                        libtrace->pread = NULL;
1730        }
1731
1732        if (ret != 0) {
1733                goto cleanup_none;
1734        }
1735
1736        /* --- Start all the threads we need --- */
1737        /* Disable signals because it is inherited by the threads we start */
1738        sigemptyset(&sig_block_all);
1739        ASSERT_RET(pthread_sigmask(SIG_SETMASK, &sig_block_all, &sig_before), == 0);
1740
1741        /* If we need a hasher thread start it
1742         * Special Case: If single threaded we don't need a hasher
1743         */
1744        if (trace_has_dedicated_hasher(libtrace)) {
1745                libtrace->hasher_thread.type = THREAD_EMPTY;
1746                ret = trace_start_thread(libtrace, &libtrace->hasher_thread,
1747                                   THREAD_HASHER, hasher_entry, -1,
1748                                   "hasher-thread");
1749                if (ret != 0)
1750                        goto cleanup_started;
1751                libtrace->pread = trace_pread_packet_hasher_thread;
1752        } else {
1753                libtrace->hasher_thread.type = THREAD_EMPTY;
1754        }
1755
1756        /* Start up our perpkt threads */
1757        libtrace->perpkt_threads = calloc(sizeof(libtrace_thread_t),
1758                                          libtrace->perpkt_thread_count);
1759        if (!libtrace->perpkt_threads) {
1760                trace_set_err(libtrace, errno, "trace_pstart "
1761                              "failed to allocate memory.");
1762                goto cleanup_threads;
1763        }
1764        for (i = 0; i < libtrace->perpkt_thread_count; i++) {
1765                snprintf(name, sizeof(name), "perpkt-%d", i);
1766                libtrace_zero_thread(&libtrace->perpkt_threads[i]);
1767                ret = trace_start_thread(libtrace, &libtrace->perpkt_threads[i],
1768                                   THREAD_PERPKT, perpkt_threads_entry, i,
1769                                   name);
1770                if (ret != 0)
1771                        goto cleanup_threads;
1772        }
1773
1774        /* Start the reporter thread */
1775        if (reporter_cbs) {
1776                if (libtrace->combiner.initialise)
1777                        libtrace->combiner.initialise(libtrace, &libtrace->combiner);
1778                ret = trace_start_thread(libtrace, &libtrace->reporter_thread,
1779                                   THREAD_REPORTER, reporter_entry, -1,
1780                                   "reporter_thread");
1781                if (ret != 0)
1782                        goto cleanup_threads;
1783        }
1784
1785        /* Start the keepalive thread */
1786        if (libtrace->config.tick_interval > 0) {
1787                ret = trace_start_thread(libtrace, &libtrace->keepalive_thread,
1788                                   THREAD_KEEPALIVE, keepalive_entry, -1,
1789                                   "keepalive_thread");
1790                if (ret != 0)
1791                        goto cleanup_threads;
1792        }
1793
1794        /* Init other data structures */
1795        libtrace->perpkt_thread_states[THREAD_RUNNING] = libtrace->perpkt_thread_count;
1796        ASSERT_RET(pthread_spin_init(&libtrace->first_packets.lock, 0), == 0);
1797        libtrace->first_packets.packets = calloc(libtrace->perpkt_thread_count,
1798                                                 sizeof(*libtrace->first_packets.packets));
1799        if (libtrace->first_packets.packets == NULL) {
1800                trace_set_err(libtrace, errno, "trace_pstart "
1801                              "failed to allocate memory.");
1802                goto cleanup_threads;
1803        }
1804
1805        if (libtrace_ocache_init(&libtrace->packet_freelist,
1806                             (void* (*)()) trace_create_packet,
1807                             (void (*)(void *))trace_destroy_packet,
1808                             libtrace->config.thread_cache_size,
1809                             libtrace->config.cache_size * 4,
1810                             libtrace->config.fixed_count) != 0) {
1811                trace_set_err(libtrace, TRACE_ERR_INIT_FAILED, "trace_pstart "
1812                              "failed to allocate ocache.");
1813                goto cleanup_threads;
1814        }
1815
1816        /* Threads don't start */
1817        libtrace->started = true;
1818        libtrace_change_state(libtrace, STATE_RUNNING, false);
1819
1820        ret = 0;
1821        goto success;
1822cleanup_threads:
1823        if (libtrace->first_packets.packets) {
1824                free(libtrace->first_packets.packets);
1825                libtrace->first_packets.packets = NULL;
1826        }
1827        libtrace_change_state(libtrace, STATE_ERROR, false);
1828        ASSERT_RET(pthread_mutex_unlock(&libtrace->libtrace_lock), == 0);
1829        if (libtrace->hasher_thread.type == THREAD_HASHER) {
1830                pthread_join(libtrace->hasher_thread.tid, NULL);
1831                libtrace_zero_thread(&libtrace->hasher_thread);
1832        }
1833
1834        if (libtrace->perpkt_threads) {
1835                for (i = 0; i < libtrace->perpkt_thread_count; i++) {
1836                        if (libtrace->perpkt_threads[i].type == THREAD_PERPKT) {
1837                                pthread_join(libtrace->perpkt_threads[i].tid, NULL);
1838                                libtrace_zero_thread(&libtrace->perpkt_threads[i]);
1839                        } else break;
1840                }
1841                free(libtrace->perpkt_threads);
1842                libtrace->perpkt_threads = NULL;
1843        }
1844
1845        if (libtrace->reporter_thread.type == THREAD_REPORTER) {
1846                pthread_join(libtrace->reporter_thread.tid, NULL);
1847                libtrace_zero_thread(&libtrace->reporter_thread);
1848        }
1849
1850        if (libtrace->keepalive_thread.type == THREAD_KEEPALIVE) {
1851                pthread_join(libtrace->keepalive_thread.tid, NULL);
1852                libtrace_zero_thread(&libtrace->keepalive_thread);
1853        }
1854        ASSERT_RET(pthread_mutex_lock(&libtrace->libtrace_lock), == 0);
1855        libtrace_change_state(libtrace, STATE_NEW, false);
1856        assert(libtrace->perpkt_thread_states[THREAD_RUNNING] == 0);
1857        libtrace->perpkt_thread_states[THREAD_FINISHED] = 0;
1858cleanup_started:
1859        if (libtrace->pread == trace_pread_packet_wrapper) {
1860                if (libtrace->format->ppause_input)
1861                        libtrace->format->ppause_input(libtrace);
1862        } else {
1863                if (libtrace->format->pause_input)
1864                        libtrace->format->pause_input(libtrace);
1865        }
1866        ret = -1;
1867success:
1868        ASSERT_RET(pthread_sigmask(SIG_SETMASK, &sig_before, NULL), == 0);
1869cleanup_none:
1870        ASSERT_RET(pthread_mutex_unlock(&libtrace->libtrace_lock), == 0);
1871        return ret;
1872}
1873
1874DLLEXPORT int trace_set_starting_cb(libtrace_callback_set_t *cbset,
1875                fn_cb_starting handler) {
1876        cbset->message_starting = handler;
1877        return 0;
1878}
1879
1880DLLEXPORT int trace_set_pausing_cb(libtrace_callback_set_t *cbset,
1881                fn_cb_dataless handler) {
1882        cbset->message_pausing = handler;
1883        return 0;
1884}
1885
1886DLLEXPORT int trace_set_resuming_cb(libtrace_callback_set_t *cbset,
1887                fn_cb_dataless handler) {
1888        cbset->message_resuming = handler;
1889        return 0;
1890}
1891
1892DLLEXPORT int trace_set_stopping_cb(libtrace_callback_set_t *cbset,
1893                fn_cb_dataless handler) {
1894        cbset->message_stopping = handler;
1895        return 0;
1896}
1897
1898DLLEXPORT int trace_set_packet_cb(libtrace_callback_set_t *cbset,
1899                fn_cb_packet handler) {
1900        cbset->message_packet = handler;
1901        return 0;
1902}
1903
1904DLLEXPORT int trace_set_first_packet_cb(libtrace_callback_set_t *cbset,
1905                fn_cb_first_packet handler) {
1906        cbset->message_first_packet = handler;
1907        return 0;
1908}
1909
1910DLLEXPORT int trace_set_tick_count_cb(libtrace_callback_set_t *cbset,
1911                fn_cb_tick handler) {
1912        cbset->message_tick_count = handler;
1913        return 0;
1914}
1915
1916DLLEXPORT int trace_set_tick_interval_cb(libtrace_callback_set_t *cbset,
1917                fn_cb_tick handler) {
1918        cbset->message_tick_interval = handler;
1919        return 0;
1920}
1921
1922DLLEXPORT int trace_set_result_cb(libtrace_callback_set_t *cbset,
1923                fn_cb_result handler) {
1924        cbset->message_result = handler;
1925        return 0;
1926}
1927
1928DLLEXPORT int trace_set_user_message_cb(libtrace_callback_set_t *cbset,
1929                fn_cb_usermessage handler) {
1930        cbset->message_user = handler;
1931        return 0;
1932}
1933
1934/*
1935 * Pauses a trace, this should only be called by the main thread
1936 * 1. Set started = false
1937 * 2. All perpkt threads are paused waiting on a condition var
1938 * 3. Then call ppause on the underlying format if found
1939 * 4. The traces state is paused
1940 *
1941 * Once done you should be able to modify the trace setup and call pstart again
1942 * TODO add support to change the number of threads.
1943 */
1944DLLEXPORT int trace_ppause(libtrace_t *libtrace)
1945{
1946        libtrace_thread_t *t;
1947        int i;
1948        assert(libtrace);
1949
1950        t = get_thread_table(libtrace);
1951        // Check state from within the lock if we are going to change it
1952        ASSERT_RET(pthread_mutex_lock(&libtrace->libtrace_lock), == 0);
1953
1954        /* If we are already paused, just treat this as a NOOP */
1955        if (libtrace->state == STATE_PAUSED) {
1956                ASSERT_RET(pthread_mutex_unlock(&libtrace->libtrace_lock), == 0);
1957                return 0;
1958        }
1959        if (!libtrace->started || libtrace->state != STATE_RUNNING) {
1960                trace_set_err(libtrace,TRACE_ERR_BAD_STATE, "You must call trace_start() before calling trace_ppause()");
1961                return -1;
1962        }
1963
1964        libtrace_change_state(libtrace, STATE_PAUSING, false);
1965        ASSERT_RET(pthread_mutex_unlock(&libtrace->libtrace_lock), == 0);
1966
1967        // Special case handle the hasher thread case
1968        if (trace_has_dedicated_hasher(libtrace)) {
1969                if (libtrace->config.debug_state)
1970                        fprintf(stderr, "Hasher thread is running, asking it to pause ...");
1971                libtrace_message_t message = {0};
1972                message.code = MESSAGE_DO_PAUSE;
1973                trace_message_thread(libtrace, &libtrace->hasher_thread, &message);
1974                // Wait for it to pause
1975                ASSERT_RET(pthread_mutex_lock(&libtrace->libtrace_lock), == 0);
1976                while (libtrace->hasher_thread.state == THREAD_RUNNING) {
1977                        ASSERT_RET(pthread_cond_wait(&libtrace->perpkt_cond, &libtrace->libtrace_lock), == 0);
1978                }
1979                ASSERT_RET(pthread_mutex_unlock(&libtrace->libtrace_lock), == 0);
1980                if (libtrace->config.debug_state)
1981                        fprintf(stderr, " DONE\n");
1982        }
1983
1984        if (libtrace->config.debug_state)
1985                fprintf(stderr, "Asking perpkt threads to pause ...");
1986        // Stop threads, skip this one if it's a perpkt
1987        for (i = 0; i < libtrace->perpkt_thread_count; i++) {
1988                if (&libtrace->perpkt_threads[i] != t) {
1989                        libtrace_message_t message = {0};
1990                        message.code = MESSAGE_DO_PAUSE;
1991                        ASSERT_RET(trace_message_thread(libtrace, &libtrace->perpkt_threads[i], &message), != -1);
1992                        if(trace_has_dedicated_hasher(libtrace)) {
1993                                // The hasher has stopped and other threads have messages waiting therefore
1994                                // If the queues are empty the other threads would have no data
1995                                // So send some message packets to simply ask the threads to check
1996                                // We are the only writer since hasher has paused
1997                                libtrace_packet_t *pkt;
1998                                libtrace_ocache_alloc(&libtrace->packet_freelist, (void **) &pkt, 1, 1);
1999                                pkt->error = READ_MESSAGE;
2000                                libtrace_ringbuffer_write(&libtrace->perpkt_threads[i].rbuffer, pkt);
2001                        }
2002                } else {
2003                        fprintf(stderr, "Mapper threads should not be used to pause a trace this could cause any number of problems!!\n");
2004                }
2005        }
2006
2007        if (t) {
2008                // A perpkt is doing the pausing, interesting, fake an extra thread paused
2009                // We rely on the user to *not* return before starting the trace again
2010                thread_change_state(libtrace, t, THREAD_PAUSED, true);
2011        }
2012
2013        // Wait for all threads to pause
2014        ASSERT_RET(pthread_mutex_lock(&libtrace->libtrace_lock), == 0);
2015        while(libtrace->perpkt_thread_states[THREAD_RUNNING]) {
2016                ASSERT_RET(pthread_cond_wait(&libtrace->perpkt_cond, &libtrace->libtrace_lock), == 0);
2017        }
2018        ASSERT_RET(pthread_mutex_unlock(&libtrace->libtrace_lock), == 0);
2019
2020        if (libtrace->config.debug_state)
2021                fprintf(stderr, " DONE\n");
2022
2023        // Deal with the reporter
2024        if (trace_has_reporter(libtrace)) {
2025                if (libtrace->config.debug_state)
2026                        fprintf(stderr, "Reporter thread is running, asking it to pause ...");
2027                if (pthread_equal(pthread_self(), libtrace->reporter_thread.tid)) {
2028                        libtrace->combiner.pause(libtrace, &libtrace->combiner);
2029                        thread_change_state(libtrace, &libtrace->reporter_thread, THREAD_PAUSED, true);
2030               
2031                } else {
2032                        libtrace_message_t message = {0};
2033                        message.code = MESSAGE_DO_PAUSE;
2034                        trace_message_thread(libtrace, &libtrace->reporter_thread, &message);
2035                        // Wait for it to pause
2036                        ASSERT_RET(pthread_mutex_lock(&libtrace->libtrace_lock), == 0);
2037                        while (libtrace->reporter_thread.state == THREAD_RUNNING) {
2038                                ASSERT_RET(pthread_cond_wait(&libtrace->perpkt_cond, &libtrace->libtrace_lock), == 0);
2039                        }
2040                        ASSERT_RET(pthread_mutex_unlock(&libtrace->libtrace_lock), == 0);
2041                }
2042                if (libtrace->config.debug_state)
2043                        fprintf(stderr, " DONE\n");
2044        }
2045
2046        /* Cache values before we pause */
2047        if (libtrace->stats == NULL)
2048                libtrace->stats = trace_create_statistics();
2049        // Save the statistics against the trace
2050        trace_get_statistics(libtrace, NULL);
2051        if (trace_is_parallel(libtrace)) {
2052                libtrace->started = false;
2053                if (libtrace->format->ppause_input)
2054                        libtrace->format->ppause_input(libtrace);
2055                // TODO What happens if we don't have pause input??
2056        } else {
2057                int err;
2058                err = trace_pause(libtrace);
2059                // We should handle this a bit better
2060                if (err)
2061                        return err;
2062        }
2063
2064        // Only set as paused after the pause has been called on the trace
2065        libtrace_change_state(libtrace, STATE_PAUSED, true);
2066        return 0;
2067}
2068
2069/**
2070 * Stop trace finish prematurely as though it meet an EOF
2071 * This should only be called by the main thread
2072 * 1. Calls ppause
2073 * 2. Sends a message asking for threads to finish
2074 * 3. Releases threads which will pause
2075 */
2076DLLEXPORT int trace_pstop(libtrace_t *libtrace)
2077{
2078        int i, err;
2079        libtrace_message_t message = {0};
2080        assert(libtrace);
2081
2082        // Ensure all threads have paused and the underlying trace format has
2083        // been closed and all packets associated are cleaned up
2084        // Pause will do any state checks for us
2085        err = trace_ppause(libtrace);
2086        if (err)
2087                return err;
2088
2089        // Now send a message asking the threads to stop
2090        // This will be retrieved before trying to read another packet
2091
2092        message.code = MESSAGE_DO_STOP;
2093        trace_message_perpkts(libtrace, &message);
2094        if (trace_has_dedicated_hasher(libtrace))
2095                trace_message_thread(libtrace, &libtrace->hasher_thread, &message);
2096
2097        for (i = 0; i < libtrace->perpkt_thread_count; i++) {
2098                trace_message_thread(libtrace, &libtrace->perpkt_threads[i], &message);
2099        }
2100
2101        /* Now release the threads and let them stop - when the threads finish
2102         * the state will be set to finished */
2103        libtrace_change_state(libtrace, STATE_FINISHING, true);
2104        return 0;
2105}
2106
2107DLLEXPORT int trace_set_hasher(libtrace_t *trace, enum hasher_types type, fn_hasher hasher, void *data) {
2108        int ret = -1;
2109        if ((type == HASHER_CUSTOM && !hasher) || (type == HASHER_BALANCE && hasher)) {
2110                return -1;
2111        }
2112
2113        // Save the requirements
2114        trace->hasher_type = type;
2115        if (hasher) {
2116                trace->hasher = hasher;
2117                trace->hasher_data = data;
2118        } else {
2119                trace->hasher = NULL;
2120                trace->hasher_data = NULL;
2121        }
2122
2123        // Try push this to hardware - NOTE hardware could do custom if
2124        // there is a more efficient way to apply it, in this case
2125        // it will simply grab the function out of libtrace_t
2126        if (trace_supports_parallel(trace) && trace->format->config_input)
2127                ret = trace->format->config_input(trace, TRACE_OPTION_HASHER, &type);
2128
2129        if (ret == -1) {
2130                /* We have to deal with this ourself */
2131                if (!hasher) {
2132                        switch (type)
2133                        {
2134                                case HASHER_CUSTOM:
2135                                case HASHER_BALANCE:
2136                                        return 0;
2137                                case HASHER_BIDIRECTIONAL:
2138                                        trace->hasher = (fn_hasher) toeplitz_hash_packet;
2139                                        trace->hasher_data = calloc(1, sizeof(toeplitz_conf_t));
2140                                        toeplitz_init_config(trace->hasher_data, 1);
2141                                        return 0;
2142                                case HASHER_UNIDIRECTIONAL:
2143                                        trace->hasher = (fn_hasher) toeplitz_hash_packet;
2144                                        trace->hasher_data = calloc(1, sizeof(toeplitz_conf_t));
2145                                        toeplitz_init_config(trace->hasher_data, 0);
2146                                        return 0;
2147                        }
2148                        return -1;
2149                }
2150        } else {
2151                /* If the hasher is hardware we zero out the hasher and hasher
2152                 * data fields - only if we need a hasher do we do this */
2153                trace->hasher = NULL;
2154                trace->hasher_data = NULL;
2155        }
2156
2157        return 0;
2158}
2159
2160// Waits for all threads to finish
2161DLLEXPORT void trace_join(libtrace_t *libtrace) {
2162        int i;
2163
2164        /* Firstly wait for the perpkt threads to finish, since these are
2165         * user controlled */
2166        for (i=0; i< libtrace->perpkt_thread_count; i++) {
2167                ASSERT_RET(pthread_join(libtrace->perpkt_threads[i].tid, NULL), == 0);
2168                // So we must do our best effort to empty the queue - so
2169                // the producer (or any other threads) don't block.
2170                libtrace_packet_t * packet;
2171                assert(libtrace->perpkt_threads[i].state == THREAD_FINISHED);
2172                while(libtrace_ringbuffer_try_read(&libtrace->perpkt_threads[i].rbuffer, (void **) &packet))
2173                        if (packet) // This could be NULL iff the perpkt finishes early
2174                                trace_destroy_packet(packet);
2175        }
2176
2177        /* Now the hasher */
2178        if (trace_has_dedicated_hasher(libtrace)) {
2179                pthread_join(libtrace->hasher_thread.tid, NULL);
2180                assert(libtrace->hasher_thread.state == THREAD_FINISHED);
2181        }
2182
2183        // Now that everything is finished nothing can be touching our
2184        // buffers so clean them up
2185        for (i = 0; i < libtrace->perpkt_thread_count; i++) {
2186                // Its possible 1 packet got added by the reporter (or 1 per any other thread) since we cleaned up
2187                // if they lost timeslice before-during a write
2188                libtrace_packet_t * packet;
2189                while(libtrace_ringbuffer_try_read(&libtrace->perpkt_threads[i].rbuffer, (void **) &packet))
2190                        trace_destroy_packet(packet);
2191                if (trace_has_dedicated_hasher(libtrace)) {
2192                        assert(libtrace_ringbuffer_is_empty(&libtrace->perpkt_threads[i].rbuffer));
2193                        libtrace_ringbuffer_destroy(&libtrace->perpkt_threads[i].rbuffer);
2194                }
2195                // Cannot destroy vector yet, this happens with trace_destroy
2196        }
2197
2198        if (trace_has_reporter(libtrace)) {
2199                pthread_join(libtrace->reporter_thread.tid, NULL);
2200                assert(libtrace->reporter_thread.state == THREAD_FINISHED);
2201        }
2202
2203        // Wait for the tick (keepalive) thread if it has been started
2204        if (libtrace->keepalive_thread.type == THREAD_KEEPALIVE) {
2205                libtrace_message_t msg = {0};
2206                msg.code = MESSAGE_DO_STOP;
2207                trace_message_thread(libtrace, &libtrace->keepalive_thread, &msg);
2208                pthread_join(libtrace->keepalive_thread.tid, NULL);
2209        }
2210
2211        libtrace_change_state(libtrace, STATE_JOINED, true);
2212        print_memory_stats();
2213}
2214
2215DLLEXPORT int libtrace_thread_get_message_count(libtrace_t * libtrace,
2216                                                libtrace_thread_t *t)
2217{
2218        int ret;
2219        if (t == NULL)
2220                t = get_thread_descriptor(libtrace);
2221        if (t == NULL)
2222                return -1;
2223        ret = libtrace_message_queue_count(&t->messages);
2224        return ret < 0 ? 0 : ret;
2225}
2226
2227DLLEXPORT int libtrace_thread_get_message(libtrace_t * libtrace,
2228                                          libtrace_thread_t *t,
2229                                          libtrace_message_t * message)
2230{
2231        int ret;
2232        if (t == NULL)
2233                t = get_thread_descriptor(libtrace);
2234        if (t == NULL)
2235                return -1;
2236        ret = libtrace_message_queue_get(&t->messages, message);
2237        return ret < 0 ? 0 : ret;
2238}
2239
2240DLLEXPORT int libtrace_thread_try_get_message(libtrace_t * libtrace,
2241                                              libtrace_thread_t *t,
2242                                              libtrace_message_t * message)
2243{
2244        if (t == NULL)
2245                t = get_thread_descriptor(libtrace);
2246        if (t == NULL)
2247                return -1;
2248        if (libtrace_message_queue_try_get(&t->messages, message) != LIBTRACE_MQ_FAILED)
2249                return 0;
2250        else
2251                return -1;
2252}
2253
2254DLLEXPORT int trace_message_thread(libtrace_t * libtrace, libtrace_thread_t *t, libtrace_message_t * message)
2255{
2256        int ret;
2257        if (!message->sender)
2258                message->sender = get_thread_descriptor(libtrace);
2259
2260        ret = libtrace_message_queue_put(&t->messages, message);
2261        return ret < 0 ? 0 : ret;
2262}
2263
2264DLLEXPORT int trace_message_reporter(libtrace_t * libtrace, libtrace_message_t * message)
2265{
2266        if (!trace_has_reporter(libtrace) ||
2267            !(libtrace->reporter_thread.state == THREAD_RUNNING
2268              || libtrace->reporter_thread.state == THREAD_PAUSED))
2269                return -1;
2270
2271        return trace_message_thread(libtrace, &libtrace->reporter_thread, message);
2272}
2273
2274DLLEXPORT int trace_post_reporter(libtrace_t *libtrace)
2275{
2276        libtrace_message_t message = {0};
2277        message.code = MESSAGE_POST_REPORTER;
2278        return trace_message_reporter(libtrace, (void *) &message);
2279}
2280
2281DLLEXPORT int trace_message_perpkts(libtrace_t * libtrace, libtrace_message_t * message)
2282{
2283        int i;
2284        int missed = 0;
2285        if (message->sender == NULL)
2286                message->sender = get_thread_descriptor(libtrace);
2287        for (i = 0; i < libtrace->perpkt_thread_count; i++) {
2288                if (libtrace->perpkt_threads[i].state == THREAD_RUNNING ||
2289                    libtrace->perpkt_threads[i].state == THREAD_PAUSED) {
2290                        libtrace_message_queue_put(&libtrace->perpkt_threads[i].messages, message);
2291                } else {
2292                        missed += 1;
2293                }
2294        }
2295        return -missed;
2296}
2297
2298/**
2299 * Publishes a result to the reduce queue
2300 * Should only be called by a perpkt thread, i.e. from a perpkt handler
2301 */
2302DLLEXPORT void trace_publish_result(libtrace_t *libtrace, libtrace_thread_t *t, uint64_t key, libtrace_generic_t value, int type) {
2303        libtrace_result_t res;
2304        res.type = type;
2305        res.key = key;
2306        res.value = value;
2307        assert(libtrace->combiner.publish);
2308        libtrace->combiner.publish(libtrace, t->perpkt_num, &libtrace->combiner, &res);
2309        return;
2310}
2311
2312DLLEXPORT void trace_set_combiner(libtrace_t *trace, const libtrace_combine_t *combiner, libtrace_generic_t config){
2313        if (combiner) {
2314                trace->combiner = *combiner;
2315                trace->combiner.configuration = config;
2316        } else {
2317                // No combiner, so don't try use it
2318                memset(&trace->combiner, 0, sizeof(trace->combiner));
2319        }
2320}
2321
2322DLLEXPORT uint64_t trace_packet_get_order(libtrace_packet_t * packet) {
2323        return packet->order;
2324}
2325
2326DLLEXPORT uint64_t trace_packet_get_hash(libtrace_packet_t * packet) {
2327        return packet->hash;
2328}
2329
2330DLLEXPORT void trace_packet_set_order(libtrace_packet_t * packet, uint64_t order) {
2331        packet->order = order;
2332}
2333
2334DLLEXPORT void trace_packet_set_hash(libtrace_packet_t * packet, uint64_t hash) {
2335        packet->hash = hash;
2336}
2337
2338DLLEXPORT bool trace_has_finished(libtrace_t * libtrace) {
2339        return libtrace->state == STATE_FINISHED || libtrace->state == STATE_JOINED;
2340}
2341
2342/**
2343 * @return True if the trace is not running such that it can be configured
2344 */
2345static inline bool trace_is_configurable(libtrace_t *trace) {
2346        return trace->state == STATE_NEW ||
2347                        trace->state == STATE_PAUSED;
2348}
2349
2350DLLEXPORT int trace_set_perpkt_threads(libtrace_t *trace, int nb) {
2351        if (!trace_is_configurable(trace)) return -1;
2352
2353        /* TODO consider allowing an offset from the total number of cores i.e.
2354         * -1 reserve 1 core */
2355        if (nb >= 0) {
2356                trace->config.perpkt_threads = nb;
2357                return 0;
2358        } else {
2359                return -1;
2360        }
2361}
2362
2363DLLEXPORT int trace_set_tick_interval(libtrace_t *trace, size_t millisec) {
2364        if (!trace_is_configurable(trace)) return -1;
2365
2366        trace->config.tick_interval = millisec;
2367        return 0;
2368}
2369
2370DLLEXPORT int trace_set_tick_count(libtrace_t *trace, size_t count) {
2371        if (!trace_is_configurable(trace)) return -1;
2372
2373        trace->config.tick_count = count;
2374        return 0;
2375}
2376
2377DLLEXPORT int trace_set_tracetime(libtrace_t *trace, bool tracetime) {
2378        if (!trace_is_configurable(trace)) return -1;
2379
2380        trace->tracetime = tracetime;
2381        return 0;
2382}
2383
2384DLLEXPORT int trace_set_cache_size(libtrace_t *trace, size_t size) {
2385        if (!trace_is_configurable(trace)) return -1;
2386
2387        trace->config.cache_size = size;
2388        return 0;
2389}
2390
2391DLLEXPORT int trace_set_thread_cache_size(libtrace_t *trace, size_t size) {
2392        if (!trace_is_configurable(trace)) return -1;
2393
2394        trace->config.thread_cache_size = size;
2395        return 0;
2396}
2397
2398DLLEXPORT int trace_set_fixed_count(libtrace_t *trace, bool fixed) {
2399        if (!trace_is_configurable(trace)) return -1;
2400
2401        trace->config.fixed_count = fixed;
2402        return 0;
2403}
2404
2405DLLEXPORT int trace_set_burst_size(libtrace_t *trace, size_t size) {
2406        if (!trace_is_configurable(trace)) return -1;
2407
2408        trace->config.burst_size = size;
2409        return 0;
2410}
2411
2412DLLEXPORT int trace_set_hasher_queue_size(libtrace_t *trace, size_t size) {
2413        if (!trace_is_configurable(trace)) return -1;
2414
2415        trace->config.hasher_queue_size = size;
2416        return 0;
2417}
2418
2419DLLEXPORT int trace_set_hasher_polling(libtrace_t *trace, bool polling) {
2420        if (!trace_is_configurable(trace)) return -1;
2421
2422        trace->config.hasher_polling = polling;
2423        return 0;
2424}
2425
2426DLLEXPORT int trace_set_reporter_polling(libtrace_t *trace, bool polling) {
2427        if (!trace_is_configurable(trace)) return -1;
2428
2429        trace->config.reporter_polling = polling;
2430        return 0;
2431}
2432
2433DLLEXPORT int trace_set_reporter_thold(libtrace_t *trace, size_t thold) {
2434        if (!trace_is_configurable(trace)) return -1;
2435
2436        trace->config.reporter_thold = thold;
2437        return 0;
2438}
2439
2440DLLEXPORT int trace_set_debug_state(libtrace_t *trace, bool debug_state) {
2441        if (!trace_is_configurable(trace)) return -1;
2442
2443        trace->config.debug_state = debug_state;
2444        return 0;
2445}
2446
2447static bool config_bool_parse(char *value, size_t nvalue) {
2448        if (strncmp(value, "true", nvalue) == 0)
2449                return true;
2450        else if (strncmp(value, "false", nvalue) == 0)
2451                return false;
2452        else
2453                return strtoll(value, NULL, 10) != 0;
2454}
2455
2456/* Note update documentation on trace_set_configuration */
2457static void config_string(struct user_configuration *uc, char *key, size_t nkey, char *value, size_t nvalue) {
2458        assert(key);
2459        assert(value);
2460        assert(uc);
2461        if (strncmp(key, "cache_size", nkey) == 0
2462            || strncmp(key, "cs", nkey) == 0) {
2463                uc->cache_size = strtoll(value, NULL, 10);
2464        } else if (strncmp(key, "thread_cache_size", nkey) == 0
2465                   || strncmp(key, "tcs", nkey) == 0) {
2466                uc->thread_cache_size = strtoll(value, NULL, 10);
2467        } else if (strncmp(key, "fixed_count", nkey) == 0
2468                   || strncmp(key, "fc", nkey) == 0) {
2469                uc->fixed_count = config_bool_parse(value, nvalue);
2470        } else if (strncmp(key, "burst_size", nkey) == 0
2471                   || strncmp(key, "bs", nkey) == 0) {
2472                uc->burst_size = strtoll(value, NULL, 10);
2473        } else if (strncmp(key, "tick_interval", nkey) == 0
2474                   || strncmp(key, "ti", nkey) == 0) {
2475                uc->tick_interval = strtoll(value, NULL, 10);
2476        } else if (strncmp(key, "tick_count", nkey) == 0
2477                   || strncmp(key, "tc", nkey) == 0) {
2478                uc->tick_count = strtoll(value, NULL, 10);
2479        } else if (strncmp(key, "perpkt_threads", nkey) == 0
2480                   || strncmp(key, "pt", nkey) == 0) {
2481                uc->perpkt_threads = strtoll(value, NULL, 10);
2482        } else if (strncmp(key, "hasher_queue_size", nkey) == 0
2483                   || strncmp(key, "hqs", nkey) == 0) {
2484                uc->hasher_queue_size = strtoll(value, NULL, 10);
2485        } else if (strncmp(key, "hasher_polling", nkey) == 0
2486                   || strncmp(key, "hp", nkey) == 0) {
2487                uc->hasher_polling = config_bool_parse(value, nvalue);
2488        } else if (strncmp(key, "reporter_polling", nkey) == 0
2489                   || strncmp(key, "rp", nkey) == 0) {
2490                uc->reporter_polling = config_bool_parse(value, nvalue);
2491        } else if (strncmp(key, "reporter_thold", nkey) == 0
2492                   || strncmp(key, "rt", nkey) == 0) {
2493                uc->reporter_thold = strtoll(value, NULL, 10);
2494        } else if (strncmp(key, "debug_state", nkey) == 0
2495                   || strncmp(key, "ds", nkey) == 0) {
2496                uc->debug_state = config_bool_parse(value, nvalue);
2497        } else {
2498                fprintf(stderr, "No matching option %s(=%s), ignoring\n", key, value);
2499        }
2500}
2501
2502DLLEXPORT int trace_set_configuration(libtrace_t *trace, const char *str) {
2503        char *pch;
2504        char key[100];
2505        char value[100];
2506        char *dup;
2507        assert(str);
2508        assert(trace);
2509
2510        if (!trace_is_configurable(trace)) return -1;
2511
2512        dup = strdup(str);
2513        pch = strtok (dup," ,.-");
2514        while (pch != NULL)
2515        {
2516                if (sscanf(pch, "%99[^=]=%99s", key, value) == 2) {
2517                        config_string(&trace->config, key, sizeof(key), value, sizeof(value));
2518                } else {
2519                        fprintf(stderr, "Error parsing option %s\n", pch);
2520                }
2521                pch = strtok (NULL," ,.-");
2522        }
2523        free(dup);
2524
2525        return 0;
2526}
2527
2528DLLEXPORT int trace_set_configuration_file(libtrace_t *trace, FILE *file) {
2529        char line[1024];
2530        if (!trace_is_configurable(trace)) return -1;
2531
2532        while (fgets(line, sizeof(line), file) != NULL)
2533        {
2534                trace_set_configuration(trace, line);
2535        }
2536
2537        if(ferror(file))
2538                return -1;
2539        else
2540                return 0;
2541}
2542
2543DLLEXPORT void trace_free_packet(libtrace_t *libtrace, libtrace_packet_t *packet) {
2544        assert(packet);
2545        /* Always release any resources this might be holding */
2546        trace_fin_packet(packet);
2547        libtrace_ocache_free(&libtrace->packet_freelist, (void **) &packet, 1, 1);
2548}
2549
2550DLLEXPORT libtrace_info_t *trace_get_information(libtrace_t * libtrace) {
2551        if (libtrace->format)
2552                return &libtrace->format->info;
2553        else
2554                return NULL;
2555}
Note: See TracBrowser for help on using the repository browser.