pktgen网络测试工具介绍

摘要:
可以看出,它可以满足大多数网卡的测试要求。pktgen的配置和统计都是使用/proc文件系统完成的。/proc文件系统是一种由软件创建的特殊类型的文件系统。内核使用/proc文件系统将信息导出到外部世界。外部世界也可以通过它配置内核状态下某些进程的参数。Linux发行版中的许多工具(如pstopuptime)都是通过/proc实现的。在大多数情况下,我们只使用/proc来读取数据,pktgen中的配置命令使用/proc的写数据函数。罗伯特测试结果表明,正确的中断亲和性绑定可以将传输率提高60%。

  网上有很多讲解pktgen的文章,但总是不够全面细致,看完之后自己还是不会写pktgen测试脚本,为此本文对pktgen进行详细的阐述,让大家看完本文后能够自己动手写pktgen shell.

  1.pktgen简介

  pktgen是一个位于linux内核层的高性能网络测试工具,由瑞士皇家理工大学的TSlab实验室的Robert Olsson开发的(现在应该不在皇家理工了),主要用来测试网络驱动与网卡设备,支持多线程,能够产生随机mac地址、IP地址、UDP端口号的数据包,pktgen 的作者使用多CPU处理器在不同的PCI总线(pci 、pcie等总线)上用千兆以太网卡做过测试(pktgen的表现依赖于CPU处理速率、内存延时、pci总线速率等硬件参数),发送数据速率甚至可以大于10GBit/s。可见是可以满足大多数的网卡等测试需求。

  pktgen的配置与统计信息查看都使用/proc文件系统完成,/proc文件系统是一种特殊的,有软件创建的文件系统,内核使用/proc文件系统向外界导出信息,外界也可以通过它配置内核态的一些进程的参数,如ps top uptime等linux发行版中的很多工具就是通过/proc实现的.在大多情况下,我们只用/proc读出数据(用于调试内核驱动等),而在pktgen中配置命令就用到了/proc的写入数据功能。

  2.使用pktgen进行发包实验

 现在版本的linux发行版大多加入了pktgen,使用以下命令加载pktgen模块:

1
#modprobe pktgen

  然后你将在你的电脑的/proc/net/pktgen看到以下文件:

1
kpktgend_0  kpktgend_1  kpktgend_2  kpktgend_3  pgctrl

  其中kpktgen_*的多少是根据你的CPU的个数决定的,如我的机子的CPU数目为4,则有四个此文件。

  通过命令cat /proc/net/pktgen/pgctrl可以查看pktgen的版本等信息:

1
#cat /proc/net/pktgen/pgctrl<br>Packet Generator for packet performance testing. Version: 2.74

  2.1使用pktgen一些需要注意的地方

  1)中断亲和力

  当使用某个线程(kpktgend_x)通过某个端口(ethx)发送(接受)数据时,我们应该把这个端口所对应的中断绑定到某一个CPU上,从而防止CPU的变动(操作系统引起的)导致CPU缓存的丢失。具体做法如下

  首先,通过以下命令查看ethx所对应的中断,在这里我们以eth3为例


# cat /proc/interrupts | grep eth3

47: 45836 0 0 0 PCI-MSI-edge eth3-TxRx-0
48: 45836 0 0 0 PCI-MSI-edge eth3-TxRx-1
49: 45836 0 0 0 PCI-MSI-edge eth3-TxRx-2
50: 45836 0 0 0 PCI-MSI-edge eth3-TxRx-3
51: 0 0 0 0 PCI-MSI-edge eth3:lsc

 由上可以看出eth3使用了五个中断号,为47-51,我们在这里将其都绑定在CPU0上

echo 1 > /proc/irq/47/smp_affinity
echo 1 > /proc/irq/48/smp_affinity
echo 1 > /proc/irq/49/smp_affinity
echo 1 > /proc/irq/50/smp_affinity
echo 1 > /proc/irq/51/smp_affinity

在文件 /proc/irq/51/smp_affinity里面,使用的是16进制数,从低位到高位分别表示CPU0-->CPUn,1表示绑定,0表示不绑定。1就是0001,表示只绑定cpu0,如果是5,就是0101,表示绑定cpu0和cpu2

当然若你分开绑定的话,在大数据流的时候可以均摊CPU的负担,可能对最高性能有所提升,具体就不清楚了,这个应该还和Intel网卡的多队列相关了,有关分析有待进一步实验。

Robert测试结果说明,正确的中断亲和力绑定,对发送速率有60%的提升。

  2)clone_skb:限制内存的分配(clone_skb应该只是复制skb的结构体,不复制数据区)

    此部分还没有看懂,应该是跟cpu高速缓存相关,先放着,不懂并不影响后面的实验。

  3)延时:减小发送速率

    在发送一个数据包后延时一会,延时的单位是ns级,从而达到减小发送速率的目的。若延时时间大于发送时间,应该是可以通过此功能达到每秒发送特定数据包个数的效果,即安特定的频率发送数据包。

  2.2搭建实验环境

 1)实验拓扑如下

1
2
3
4
5
6
7
8
9
10
11
12
13
1
+-----------+           +-----------+
2
| Host1     |           |  Host2     |
3
|       eth1 +-----------+nf0       |
4
|           |           |           |
5
|           |           |           |
6
7
+-----------+           +-----------+

  首先我们看下一个简单代码,对pktgen的shell 控制有个直观感受,你可以先试着看看此代码,也可以直接跳过,先看看下面的内容,然后再回过来看此代码

复制代码
#!/bin/sh
# pktgen.conf -- Sample configuration for send on two devices on a UP system

#modprobe pktgen

if [[ `lsmod | grep pktgen` == "" ]];then
   modprobe pktgen
fi

if [[ $1 == "" ]];then
   pktsize=550
else
   pktsize=$1
fi

function pgset() {
    local result

    echo $1 > $PGDEV

    result=`cat $PGDEV | fgrep "Result: OK:"`
    if [ "$result" = "" ]; then
         cat $PGDEV | fgrep Result:
    fi
}

function pg() {
    echo inject > $PGDEV
    cat $PGDEV
}

# On UP systems only one thread exists -- so just add devices
# We use eth1, eth1

echo "Adding devices to run".

PGDEV=/proc/net/pktgen/kpktgend_0
pgset "rem_device_all"
pgset "add_device eth1"
pgset "max_before_softirq 1"

# Configure the individual devices
echo "Configuring devices"

PGDEV=/proc/net/pktgen/eth1

pgset "clone_skb 1000"
pgset "pkt_size $pktsize"
pgset "src_mac 00:1B:21:90:4B:E4"
pgset "flag IPSRC_RND"
pgset "src_min 10.0.0.2"
pgset "src_max 10.0.0.255"
pgset "dst 10.0.0.1"
pgset "dst_mac  00:4E:46:31:30:00"
pgset "count 0"

# Time to run

PGDEV=/proc/net/pktgen/pgctrl
echo "pkgsize:$pktsize"
echo "Running... ctrl^C to stop"

pgset "start"

echo "Done"
复制代码

 

  2)pktgen所有命令解释如下

pktgen命令

Pktgen控制命令

start

所有的线程开始发送

stop

停止

线程的控制命令

add_device

添加某个端口到某个线程

rem_device_all

删除绑定在某个线程的所有端口

max_before_softirq

在最多发送多少个数据包后,执行do_softirq()

端口命令

debug

调试

clone_skb

对每个skb进行多少个复制,0表示不复制。对于Dos等测试必须至零

clear_counters

清空计数器,一般程序自动清空

pkt_size

链路包的大小(前去CRC的值)

min_pkt_size

数据包最小值

max_pkt_size

      最大值

flags

包的分片数量?

count

发送数据包的个数,0 表示一直发送

delay

发送两个数据包之间的延时

dst

目的IP

dst_min

目的IP的最小值

dst_max

         最大值

src_min

源IP最小值

src_max

     最大值

dst6

目的IPv6地址

src6

源IPv6地址

dstmac

目的mac

srcmac

源mac

src_mac_count

源mac的数量,从srcmac设置的mac开始轮询

dst_mac_count

同上

udp_src_min

最小源udp端口号

udp_src_max

最大源udp端口号

udp_dst_min

最小目的udp端口号

udp_dst_max

最大目的udp端口号

flows

并发流的个数

flowlen

流的长度

Flags

IPSRC_RND

IPDST_RND

TXSIZE_RND

UDPSRC_RND

UDPDST_RND

MACSRC_RND

MACDST_RND

PSRC_RND 源IP随机发送

  

  3)配置实例

  通过/proc接口配置pktgen,首先为了方便起见定义两个配置函数

复制代码
function pgset() {
    local result

    echo $1 > $PGDEV

    result=`cat $PGDEV | fgrep "Result: OK:"`
    if [ "$result" = "" ]; then
         cat $PGDEV | fgrep Result:
    fi
}

function pg() {
    echo inject > $PGDEV
    cat $PGDEV
}
复制代码

  pktgen.conf-1 :在当CPU系统中将eth1 eth2 绑定到线程0,部分代码如下

PGDEV=/proc/net/pktgen/kpktgend_0
pgset "rem_device_all"
pgset "add_device eth1"
pgset "add_device eth2"

  pktgen.conf-2: eth1使用线程0 eth2使用线程1发送,部分代码如下

复制代码
PGDEV=/proc/net/pktgen/kpktgend_0
pgset "rem_device_all"
pgset "add_device eth1"

PGDEV=/proc/net/pktgen/kpktgend_1
pgset "rem_device_all"
pgset "add_device eth2"
复制代码

  pktgen.conf-3:在双cpu系统中 eth1 eth2都使用线程0发送,部分代码如下

复制代码
PGDEV=/proc/net/pktgen/kpktgend_0
pgset "rem_device_all"
pgset "add_device eth1"
pgset  "add_device eth2"

PGDEV=/proc/net/pktgen/kpktgend_1
pgset "rem_device_all"
复制代码

  pktgen.conf-4:用于Dos测试的脚本,注意clone_skb 0,部分代码如下

PGDEV=/proc/net/pktgen/eth1
pgset "clone_skb 0"
pgset "flag IPDST_RND"
pgset "dst_min 10.0.0.0"
pgset "dst_max 10.255.255.255"

  pktgen.conf-5:用于路由流测试的脚本,同样注意 clone_skb 0

复制代码
PGDEV=/proc/net/pktgen/eth1
pgset "clone_skb 0"
pgset "flag IPDST_RND"
pgset "dst_min 10.0.0.0"
pgset "dst_max 10.255.255.255"
#8k concurrent flows at 4 pkts
pgset "flows 8192"
pgset "flowlen 4"
复制代码

  最后贴一个比较复杂的脚本:

复制代码
#Script contributed by Grant Grundler
# <grundler@parisc-linux.org>
# Note! 10 devices
PGDEV=/proc/net/pktgen/kpktgend_0
pgset "rem_device_all"
pgset "add_device eth3"
pgset "add_device eth5"
pgset "add_device eth7"
pgset "add_device eth9"
pgset "add_device eth11"
pgset "max_before_softirq 10000"
PGDEV=/proc/net/pktgen/kpktgend_1
pgset "rem_device_all"
pgset "add_device eth2"
pgset "add_device eth4"
pgset "add_device eth6"
pgset "add_device eth8"
pgset "add_device eth10"
pgset "max_before_softirq 10000"
# Configure the individual devices
for i in 2 3 4 5 6 7 8 9 10 11
do
PGDEV=/proc/net/pktgen/eth$i
echo "Configuring $PGDEV"
pgset "clone_skb 500000"
pgset "min_pkt_size 60"
pgset "max_pkt_size 60"
pgset "dst 192.168.3.10$i"
pgset "dst_mac 01:02:03:04:05:0$i"
pgset "count 0"
done
echo "Running... CTRL-C to stop"
PGDEV=/proc/net/pktgen/pgctrl
pgset "start"
tail -2 /proc/net/pktgen/eth*
复制代码

免责声明:文章转载自《pktgen网络测试工具介绍》仅用于学习参考。如对内容有疑问,请及时联系本站处理。

上篇小程序之模板消息Android把自己应用加入到系统文件分享中下篇

宿迁高防,2C2G15M,22元/月;香港BGP,2C5G5M,25元/月 雨云优惠码:MjYwNzM=

相关文章

利用C#线程窗口调试多线程程序

       从网上的资料判断,调试多线程程序似乎就一下3种方法。 1、在日志的某个地方写日志文件。 优点:不会干扰程序的执行,特别是对网络的多线程通信。 缺点:每次都需要打开日志文件以查看进程运行的信息。 2、利用断点进行调试。 优点:直观,可以直接看到运行过程的值 缺点:在多个线程设置断点,可能让程序跳来跳去,还需要额外地分出一部分精力用来理清程序...

Android使用SurfaceView实现墨迹天气的风车效果

SurfaceView也是继承自View,它和我们以前接触到的View(Button、TextView等)最大的不同是,SurfaceView可以有一个单独的线程进行绘制,这个线程区别于UI线程(主线程),因此SurfaceView绘制并不占用主线程资源。 SurfaceView实现通常是自定义,继承SurfaceView并实现SurfaceHolder....

Unity应用架构设计(10)——绕不开的协程和多线程(Part 2)

在上一回合谈到,客户端应用程序的所有操作都在主线程上进行,所以一些比较耗时的操作可以在异步线程上去进行,充分利用CPU的性能来达到程序的最佳性能。对于Unity而言,又提供了另外一种『异步』的概念,就是协程(Coroutine),通过反编译,它本质上还是在主线程上的优化手段,并不属于真正的多线程(Thread)。那么问题来了,怎样在Unity中使用多线程呢...

Linux 线程占用CPU过高定位分析

今天朋友问我一个Linux程序CPU占用涨停了,该如何分析, CPU占用过高,模拟CPU占用过高的情况 先上一段代码: 1 #include <iostream> 2 #include <thread> 3 #include <vector> 4 5 6 int main(int argc, char *...

【数据库开发】数据库连接池及其工作原理

对于一个简单的数据库应用,由于对于数据库的访问不是很频繁。这时可以简单地在需要访问数据库时,就新创建一个连接,用完后就关闭它,这样做也不会带来什么明显的性能上的开销。但是对于一个复杂的数据库应用,情况就完全不同了。频繁的建立、关闭连接,会极大的减低系统的性能,因为对于连接的使用成了系统性能的瓶颈。 连接复用。通过建立一个数据库连接池以及一套连接使用管理...

Android 异步框架 RxJava2

观察者模式的概念 RxJava是android的异步框架,官方介绍是可观测的序列,组成异步基于事件程序的库。特点是观察者模式,基于事件流的链式调用,随着异步操作调度过程复杂的情况下,程序逻辑也变得越来越复杂,但RxJava依然能够保持简洁。 简单的说观察者A与被观察者B建立订阅关系,当被观察者B发生某种改变时,立即通知观察者A 添加依赖 compile '...