CN101069170A

CN101069170A - 数据包队列、调度和排序

Info

Publication number: CN101069170A
Application number: CNA2005800346009A
Authority: CN
Inventors: 格雷格·A·鲍查德; 托马斯·F·汉姆尔; 理查德·E·科斯勒; 穆罕默德·R·休斯塞恩; 李彦志
Original assignee: Cavium Networks LLC
Current assignee: Kaiwei International Co; Marvell Asia Pte Ltd
Priority date: 2004-09-10
Filing date: 2005-09-01
Publication date: 2007-11-07
Anticipated expiration: 2025-09-01
Also published as: CN101040256A; US9141548B2; CN101053234B; CN101128804B; US20140317353A1; US7941585B2; US20060059310A1; CN101128804A; CN100533372C; CN101069170B; US20060059286A1; CN101036117B; CN101036117A; US20060059316A1; CN101053234A

Abstract

本发明提供了一种在多核网络服务处理器中进行有序化，同步化和调度任务的方法和机制。每个任务都被标识符限定如何实现任务的同步化和有序化。通过在不同处理器内核上并行的处理拥有不同标识符的任务，来提高处理器的吞吐量。数据包处理可以被分成不同的阶段，根据有序化，同步化对各个阶段的约束，每个阶段都有不同的标识符。依据阶段的不同，内核启动标识符转换操作。一种专用的标识符交换总线使得标识符交换操作的延时最小化。

Description

数据包队列、调度和排序

技术领域

本发明是2004年12月6日提交的第11/005,490号美国专利的继续，其要求于2004年9月10日提交的第60/609,211号美国临时申请的权益。上述申请的全部教导在此通过引证并入本文。

背景技术

开放式通信系统互联参考模块(OSI)用于限定在传输媒体上通信的七个网络协议层(L1-L7)。上层负责端到端的通信，下层负责本地通信。网络应用系统需要处理、过滤和交换L3到L7网络协议层，例如，L7网络协议层的超文本传输协议(HTTP)和简单邮件传输协议(SMTP)，L4网络协议层的传输控制协议(TCP)。除处理网络协议层外，网络应用系统需要基于通过L4-L7网络协议层(包括防火墙，虚拟专用网(VPN)，安全套接字协议层(SSL)，入侵检测系统(IDS)，互联网协议安全性(IPSec)，线速的反病毒(AV)and反垃圾邮功能)的安全性来同时保证这些协议的访问和内容。

网络处理器可以提供高吞吐量的L2和L3层上的网络协议处理，也就是说，完成数据包的处理以便以线速度传输数据包。通常，处理L4-L7层网络协议的通用的处理器需要非常智能的处理能力。例如，传输控制协议(TCP)——L4的传输控制协议(TCP)需要一些加强计算的工作，包括计算信息包在整个有效载荷上的校验和，管理TCP片段缓冲器，和在一个连接中保持多计时器。虽然通用处理器可以完成所述加强计算的工作，但是它不能提供足以处理数据以致能够以线速转发的性能。

发明内容

一种网络服务处理器，包括数据包任务排序模块，这个遵循L4-L7层网络协议建立起的模块通过一个或多于一个的核心处理器来调度和排列数据包(数据包处理操作)。需要排序的任务被排入容量无限的输入队列里，这是通过允许输入队列扩充外部存储器以致即使在数据包任务排序模块没有新的任务可调度的情况下任务仍可加入输入队列来实现的。因此，即使在数据包处理程序忙碌的情况下，将新任务放入输入序列的操作也没有被延迟。数据在进入数据包处理模块前已经在外部存储器中排好顺序了。

数据包处理任务(总任务)通过特殊的数据包处理方式来实现，它包含多个数据包处理操作(多段任务)。每一段任务都有相关联的标识符。这些标识符允许任务被调度以致任务可以通过多个处理器内核并行操作，同时确保任务的执行是有序的和同步的。数据包处理操作的调度、排序允许数据被处理，这样数据就可以以线速传播，就是说以网络数据传输速率来传播。

依据本发明理论，一种用于调度、排序处理数据包的系统和方法提高了网络服务处理器的吞吐量。网络服务处理器包括多个独立的处理器和任务排序模块。每一个处理器都并行的执行任务。任务排序模块根据与任务相关的标识符动态的调度任务，使之在处理器中并行的执行，这样，任务就可以被有序的同步被执行了。

任务排序模块包括存储需要处理器处理任务的输入队列，和多个正在传输的表单。输入队列中的任务可以被存储在任务排序模块里，也可以被存储在任务排序模块的外部存储器里，所以任务队列是无限的队列。通过允许任务队列是无限序列，任务可以先存放在外部存储器里，之后在移存到数据包处理器的任务排序模块里，这里的任务是被优先处理的。任务包括，例如，IPSec加密，IPSec解密，碎片整理，虚拟专用网络数据包的合成，或者调整TCP的序列号。至少有一个处理器用来执行控制平台操作，另一个处理器执行数据平台操作。

每一个正在传输的表单都关联着一个与这个标单相关联的正在传输的任务的标识符。在输入队列里的任务被任务排序模块所调度。通过移动任务，任务被从输入序列里调到正在传输表单里。正在传输表单的选取是根据与这个任务相关联的标识符实现的。

任务指令模块也包括针对每一个处理器的一组校验码。成组的校验码在输入序列里以组的形式区分出了哪一组任务会被处理器接受，这样就实现了预先安排好处理器从组中接受的任务。

网络服务处理器也包括可以控制任务被添加到序列中的时间的计时器。标识符包括标识符的类别。正在传输的表单里存储的任务应当具有原子的标识符类型，只有在任务是表单中是首位的时候才被某个多元处理器处理。另一个正在传输表单可以存储具有序标识符类型，它存放的是所有可被执行的任务，任务只有在表单首位时才能被某个多元处理器移动。

为了减少标识符转换操作的延迟时间，即，更改与某标识符相关联的任务的操作，专用的标识符转换总线被连接在处理器和任务指令模块之间，用来显示标识符转换操作被数据包处理任务排序单元转换完成的信息。内核启动标识符转换操作通过存储指令，根据监视存储指令，分组任务排序模块更改标识符，并将任务移到与更该的标识符相关联的正在传输中队列中。

限定每个数据包处理操作是如何被执行的能力允许接受到数据包的上层网络以线速继续传输数据包。此外，扩展输入序列到外部存储器中的能力可以实现在网络服务处理器忙碌的时候任务有序排队。

附图说明

前面所描述的和本发明的其他目的，特征和优势将在下面更详细清晰的描述中具体的体现，如所附的图表所示，其中在各个附图中相同的数字表示相同的部件。这些附图不是严格按比例绘制，重点在于说明本项发明的原理。

图1是根据本发明的原理的包括网络服务处理器的安全设备的框图；

图2是图1所示的网络服务处理器的框图；

图3是图2中所示的网络服务处理器的数据包输入输出处理单元的示意图；

图4解释说明了可以被存储在L2高速缓存里或者动态随机存储存储器内的任务序列；

图5解释说明了一种数据包处理任务的进入；

图6解释说明了任务进出数据包处理/执行单元的状态；

图7是数据包处理/执行任务载入各个数据包处理/执行单元的框图；

图8是专用标识符转换总线耦合数据包处理/执行单元内核和IO网桥。

具体实施方式

本发明的优选的实施方案的描述如下。

图1是根据本发明的原理的包括网络服务处理器100的一种网络服务处理器的安全设备102的框图。安全设备102是单机版的系统，可以把接收到的数据包在一个以太网端口和另一个以太网端口直接进行数据交换，并可以在向前传输接收到的数据包之前执行多种安全操作。例如，安全设备102可以在将所接收到的数据包继续传输到局域网之前，在从广域网接收的数据包上进行安全操作。网络服务处理器100包括数据包处理硬件，缓冲器，工作调度，指令，同步和连贯性支持，遵照本发明的理论来加速数据包处理任务的执行。

网络服务处理器100将开放式互联网的L2-L7层网络协议内嵌在接收到的数据包中。如本领域内的普通技术人员所熟知的，开放系统互联基本参考模块(OSI)限定网络互联时在传输媒体上的七个网络协议层(L1-7)。物理层(L1)表示实际接口，传输媒体和设备之间的电气和物理的连接。数据链路层(L2)传输数据帧。网络层(L3)将数据格式化分组。运输层(L4)进行端到端的传输。会话层(L5)组织管理设备之间的通信，例如，确定是半双工工作还是双工工作。表示层(L6)管理数据格式和语法表示，例如，句法，控制码，特殊图表和字符集。应用层(L7)允许用户之间的通讯，例如，文件传输和电子邮件。

网络服务处理器为上层网络协议(例如，L4-L7层)，进行调度、排列任务(数据包处理操作)。数据包处理任务(总任务)通过特殊的数据包处理方式来实现，包括多个数据包处理操作(多段任务)。每一段任务都有一个相关联的标识符。这些标识符允许任务通过网络服务处理器的多个处理器内核并行的调度，并确保了任务的执行是有序的和同步的。任务的排序和调度允许接收到的上层网络的协议被处理并以线速向前传递。线速是网络数据传输和接收的速率。通过以线速将网络协议向前传送，使得网络服务处理器没有消减网络数据的传输速率。

网络服务处理器100包括多个以太网媒体访问控制端口，其带有标准的简化千兆字节媒体独立端口(RGMII)连接芯片PHYs104a，104b.。

网络服务处理器100通过物理端口PHYs 104a，104b从以太网端口(Gig E)接收数据包，按照L7-L2层网络协议处理所接收到的数据包，并通过物理端口PHYs 104a，104b传输数据包到网络上别的中继器，或最终目的地，或通过PCI总线106进行更进一步的主处理机的处理。网络服务处理器可以包括网络安全协议，如防火墙，应用防火墙，虚拟专用网(VPN)包括互联网协议安全性(IPSec)和/或安全套接字协议层(SSL)，入侵检测系统(IDS)和反病毒(AV)。

网络服务处理器100中的动态随机存取存储器控制着与网络服务处理器100连接的外部动态随机存取存储器108的存取。动态随机存取存储器108存储通过网络服务处理器100的处理，从PHYs端口104a，104b接收数据，或外部设备端口(PCI-X)106接收数据。在一个实施方案中，动态随机存取存储器支持64或128字节的双精度的数据率II同步动态随机存取存储器(DDRIISDRAM)的操作达800MHz。

当网络服务处理器100启动或重新启动时，启动总线110将提供必要的启动代码，这些代码是被存储在快速存储器112中，并被网络服务处理器100所执行的。应用代码可以越过启动总线110写入网络服务处理器100，通过PCI总线连接执行只读快速存存储器标准的设备114，或高容量设备，譬如说磁盘。

混杂的I/O端口116提供辅助接口，如通用输入输出接口(GPIO)，快存，IEEE 802两线制管理接口(MDIO)，全球异步接收-发送(UARTs)和串行接口。

网络服务处理器100包括另一种用来控制低时延存储器DRAM 118的存储控制器。低时延存储器DRAM 118被用在允许快照的网络服务器和安全应用程序中，它包括字符串匹配功能，字符串匹配在侵入窃密检测系统(IDS)或反病毒(AV)的应用程序中被要求。

图2是图1所示的网络服务处理器100的框图。网络服务处理器100使用多元化处理内核202来传递高性能的请求。网络请求被分类为数据平台或控制平台操作。内核202中的每一个可以专门用于执行数据平台或控制平台操作。数据平台的操作包括传输数据包的分组操作。控制平台操作包括处理部分高级复杂的协议，如网络安全协议(IP Sec)，传输控制协议(TCP)，和安全套接层(SSL)。数据平台操作可以包括处理其他部分高级复杂的协议。

数据包输入单元214为每一个数据包创建和分配任务队列条目。这个任务队列条目包含指向缓冲器的指针，缓冲器是存储在L2高速缓存212或DRAM108(图1)中的。任务队列条目将在稍后结合图4进行介绍。

数据包输入/输出的处理是通过接口单元210a，210b，数据包输入单元(数据包输入)214和数据包输出单元(PKO)218执行的。输入控制器和接口单元210a，210b执行所有的接收到的数据包的分析和检查内核202的释放的结果。

数据包通过SPI-4.2或RGM II接口被接口单元210a或210b接收。数据包也可以被PCI接口224接收。接口单元210a，210b对接收到的数据包执行L2网络协议的预处理操作，这是通过检查接收到的数据包中所包括的L2层网络协议头的各个字段来实现的。在接口单元210a，210b用L2层网络协议处理过数据包后，数据包被传送到数据包输入单元214。数据包输入单元214对接收到的数据包中包括的L3和L4层网络协议头名进行预处理。预处理包括对传输控制协议(TCP)/用户数据包协议(UDP)(L3层网络协议)的检查。

数据包输入单元214将数据包按一定格式写入二级的高速缓存器212或DRAM108的缓存中，这种存储格式适于在至少一个处理内核202在更高层次的网络协议中的高层的软件来执行。数据包输入单元214支持可编程的缓冲区大小，可以通过多个缓冲器来分散数据包来支持数量大的数据包的输入。

处理器内核202的数据包排序/任务(POW)模块228序列，和调度任务(数据包处理操作)。处理内核处理的所有任务都是在任务队列的条目中被定义的。工作可以包括数据包处理操作，例如，执行被任务队列的条目限定的L4-L7层数据包处理操作。每个独立的数据包处理操作都是内核对接收到的存储在存储器中的数据包的处理。例如，任务可以是处理接收到的防火墙/虚拟专用网(VPN)的数据包。在传送数据包之前，对接收到的防火墙/虚拟专用网(VPN)的数据包进行的处理工作包括以下几个数据包处理操作(分任务)：(1)接收到的数据包进行碎片整理；(2)IPSec解码；(3)IPSec加密；(4)网址翻译(NAT)或调整TCP序列号。

因为一些数据包处理操作要求有序，有的数据包处理操作既要求有序又要求同步，所以每个分任务都被分配了一个标识符来限定被执行的操作的形式。

内核202的POW模块228(以同步为例)任务返回一个指向队列条目的指针来描述这个任务。每一个分任务(数据包处理操作)都有一组相关联的校验码和标签。

标识符被内核用来排序和同步化预先安排好的任务。标识符包括标识符的值和类型。标识符的值允许同一个数据流(从源头到目的地)的任务被排序和同步化。标识符的类型选择了任务是怎样被同步化和排序的。这里有三种不同的标签类型：有序的(次序是被保证的)，原子的(次序和原子性被保证)和空(没有次序是被保证的)。当没有其他的内核可以同时访问同一个数据结构，这个内核访问数据结构(或具有标识符)“原子的”。因此，原子性保证了一个内核至多有一个给定的标识符。任务相关的初始标识符是依据任务的源发站的。标识符可以通过被内核初始化的标识符转换操作来更改。

例如，当处理防火墙/虚拟专用网(VPN)的数据包时，一些处理阶段仅要求有序的，而其他有的既要求有序，也要求同步化。一种有序的标识符类型可以被用在碎片整理阶段，这样同一数据流的碎片就是有序的。原子类型的标识符可以被用在网络安全协议在使用同样网络安全协议通道的数据包之间提供同步化操作。因此，在内核完成了对数据包的分组化操作后，在对数据包进行IPSec操作前，内核为了下一阶段的数据包处理操作(IPSec解码)对标识符进行了初始化标识符转换操作。在标识符转换操作完成后，IPSec操作可以被同一个内核或是其他的内核执行。

一组标识符被用来选择一个或多个内核来对任务进行初始调度。因为所有的任务并不是平等的，标识符组允许不同的任务在不同的内核上执行。例如，通过限定标识符组哪个内核将会接收任务，数据包处理可以从一组内核转到另一组上。为了将一个任务从一组内核转移到另一组上，或为了避免一个工作内核需要长的同步化延迟时间，内核可以打乱预先安排好的工作。内核打乱已经安排好的任务是通过初始化标识符转换操作为将标识符类型转换为空来实现的。当重新安排任务时，标识符组被POW模块用来选择内核来将没有安排好的任务安排好。

在更详细的介绍POW模块的操作之前，先介绍另一种模块。在数据包被内核202处理后，数据包输出单元(PKO)218从L2高速缓存或DRAM中读取数据包，执行L4网络协议进行后续处理(例如，生产TCP/UDP检查和)，通过接口单元210a，210b传输数据包，释放用于存储数据包的L2高速缓存212或DRAM108。

网络服务处理器100还包括专用的应用程序并行处理器，它可以减轻内核202的负担，从而提高了网络服务处理器的吞吐量。应用程序并行处理器包括精确有限自动机DFA并行处理器244，和压缩/解压缩并行处理器208。

每一个处理器内核202都是一个双重事件、带有指令高速缓冲存储器206的超级标量处理器，，一级数据高速缓冲存储器204，密码术算法嵌入式硬件加速器(密码加速模块)200，可以越过低时延存储器总线230直接存取低时延存储器。低时延存储器118的直接读取通道通过L2高速缓冲存储器212可以直接从内核202和DFA并行处理器244中存取。

网络服务处理器100还包括子系统存储器。存储器子系统包括每个内核202中都有一级数据高速缓冲存储器204，指令高速缓冲存储器，二级数据高速缓冲存储器212，外部DRAM存储器的DRAM控制器216，外部低时延存储器的接口230。

存储器子系统的建立是为了支持多元内核，协调存储器为加强网络应用的满意度而要求的高吞吐量和低时延之间的关系。所有的内核202和I/O并行处理设备共享二级高速缓冲存储器212和外部DRAM存储器108(图1)。

每个内核202都通过相干存储器总线234与L2高速缓冲存储器耦合。相干存储器总线234是内核202，I/O网桥(IOB)232，二级高速缓冲存储器和控制器212之间的所有的存储器和I/O事务的通讯渠道。

自由池分配器(FPA)236保持二级缓冲存储器212和DRAM的自由存储的指针池。带宽有效的堆栈(后进先出(LIFO))被应用于各个自由指针池。如果一个指针池对于自由池分配器(FPA)236来说太大，自由池分配器(FPA)236就会在二级高速缓冲存储器212或DRAM中建立一个树/列表结构，在指针池中应用自由存储器来存储额外的指针。

I/O网桥(IOB)232管理所有的协议，仲裁和提供相干的I/O分割。IOB232包括238网桥，读取添加单元(FAU)240。网桥238包括缓存序列用来存储I/O总线，相干存储器总线，数据包输入单元214和数据包输出单元218之间转移的信息。

读取添加单元(FAU)240是2KB的寄存器，支持读，写，原子数读取-添加，和原子更新操作。读取添加单元(FAU)240可以从内核202和数据包输出单元218存取。寄存器中存储着使用率高的数值，因此就降低这些值的通信量。FAU240中的寄存器被用来保存从数据包输出单元218传输的数据包的输出序列的长度。

PCI接口控制器224有DMA驱动，允许处理器内核202在网络服务处理器的本地存储器和远程(PCI)存储器之间异步的移动数据。

图3是详细介绍了图2中所示的网络服务处理器的数据包输入输出处理单元。

正如在图1和图2中已经讨论过的，数据包可以从接口单元210a，210b或PCI接口224中任何一个接收。接口单元210a，210b和数据包输入单元214对接收到的数据包进行分析，并检查内核202释放的结果。接口单元210a，210b通过检测接收到的数据包中L2层网络协议的尾部来检查普通错误。例如，L2层网络协议尾部的帧检查序列(FCS)存储着CRC计算发射器发射的数据包的帧的比特的结果。接口单元210a，210b同样也对同一个CRC进行计算，并把结构与存储在FCS中的值相比较。当有错误发生的时候接口单元210a，210b将不接收数据，就是说在这种情况下会有数据包丢失。如果接口单元210a，210b接收数据包，自由池分配器(FPA)236为此数据包在L2高速缓冲存储器或DRAM中分配存储区，数据包别存储在存储器中。

数据包输入单元214包括数据包输入处理(PIP)单元302和输入分组数据单元(IPD)300。数据包输入单元214用FPA236的一个指针池来存储从二级高速缓冲存储器或DRAM中接收的数据包，另一个指针池分配任务进入序列。任务进入序列将在稍后结合图4一起讨论。

I/O总线包括入站总线(IOBI)和出站总线(IOBO)，数据包输出总线(POB)，PKO专用总线(PKOB)，输入分组数据总线(IPDB)，和相关联的控制。接口单元210a，210b将接收到的数据包中的64位的分组的碎片放到IOBI总线上。数据包输入单元214的IPD300将IOBI每一个要处理的64位分组的碎片锁存。IPD300累计64位的分组的碎片成128字节的高速缓冲存储块。之后，IPD300将高速缓冲存储块发送到IPDB总线。I/O网桥232传输高速缓冲存储块到相关存储总线(CMB)。

数据包输入单元214对接收到的数据包中包括的L3和L4层网络协议头进行预处理。例如，L3网络协议对IP协议头的预处理包括检查IP版本字段确定IP版本是版本4还是版本6，校验头检查和字段存储在存活时间字段的值大于0，并检查选择字段。数据包输入单元214支持网络协议版本4(Ipv4)和版本6(Ipv6)通讯。L4预处理TCP/UDP协议头包括校验端口数字字段，检查和字段，储存在长度字段和标签字段的值。为了内核更高一层的处理操作，数据包输入单元214还提取存在L3和L4网络协议头的值。

数据包排序/任务(POW)单元228执行硬件任务队列，硬件任务安排，基于标识符的同步化和为了内核整理和安排任务。任务进入队列通过数据包输入单元214加载给每一个到达的数据包的任务队列。任务进入序列是最重要的描述符用来描述内核执行的任务，将在后面的图4中一起介绍。任务进入队列可以被PIP/IPD模块214或内核202创建。PIP/IPD模块214在每一个数据包到达的时候将任务提交给数据包整理/任务(POW)单元228。

被存储在L2高速缓冲存储器/DRAM中的任务队列条目限定的任务通过一系列POW数据序列中的一个进入数据包整理/任务(POW)单元228。在一个具体实施方案中，有8个POW输入序列，POW模块包括2048个POW条目。POW条目将在后面和图5一起描述。POW模块228使用POW条目来次序，排列和同步化被任务队列条目限定的任务。POW模块228存储了一个指向POW条目的任务队列条目的指针，提供这个指针指向内核对任务的要求做出反应的任务队列条目。

不同的POW数据序列可以被用来提供不同的服务水平。数据包数据处理单元(PIP)302可以将数据包分配到POW 228八个输入任务序列中的一个内核，通过使用系统缺省值，虚拟局域网优先权(VLAN)和IP不同数值可基于每一个端口进行配置。

计时器单元242被用来安排内核的工作任务。计时器单元管理环有数量可编程的存储段存储在二级高速缓冲存储器212或DRAM 108(图1)中。每个存储段存储计时器登陆的表单。每个计时器入口存储任务队列条目指针。每个环中存储段之间的时间段是可编程的。在每一个数据段周期到期的时候，环内下一个数据段被处理，数据段中存储在计时器入口的任务队列条目指针限定的任务是已经安排好的。

图4解释说明任务队列条目400可以被存储在L2高速缓冲存储器212或者动态随机存储存储器108内。任务队列条目400的字402，404被数据包整理/任务模块(POW)228使用，用来排列内核要处理的任务。

词402包括存储硬件检查和的硬件检查和字段412，和下一个指针字段414用于存储指向下一个任务队列条目的指针，处理存储器输入序列。在一个具体实施方案中，硬件检查和是硬件生产16位分组数据的和，已经在数据包外计算过的。下一个指针字段414被用来链接任务队列条目。

词404包括长度字段416，输入端口(iprt)字段418，QOS字段420，分组字段422，TT字段424和标识符字段426。长度字段416存储任务队列条目400中分组数据的总的字节数。在一个具体实施方案中，长度范围可以从1到65535字节。输入端口字段418存储了数据包进入的端口。QOS字段420存储了数据包输入单元214选择的POW模块228中的输入序列。数据包输入单元214可以根据接收到的数据包的每个端口或字段的系统设定值选择输入序列，例如，基于VLAN地址，或DSCP字段。分组字段422存储任务需要的内核组的数量。TT字段424存储了任务队列条目的初始标识符类型。标识符类型可以是空，有序的或原子的。IP和非IP的数据包，Ipv4和Ipv6的数据包，TCP和非TCP数据包的标识符类型是不一样的。标识符的初始值是由IPD单元300分配的，基于数据包到达的端口号，IP源和目标地址，IP协议下一协议头值，TCP/UDP源和目标端口。POW模块228读取QOS字段的值选择输入序列。POW在向输入序列添加任务时读取分组字段，TT字段和标识符字段的值。

任务队列条目的词404中的标识符字段426允许给每一个任务加标识符。PIP/IPD模块214创建初始标识符信息，并将其存储在任务队列条目里。例如，PIP/IPD模块可以通过执行标准的TCP五元组(IP源地址，IP目标地址，IP协议，TCP源端口，TCP目标端口)的一部分来限定“流”。分组/次序任务模块(POW)228使用初始标识符信息实现同步化，次序化和调度。当两个任务共享一个标识符值时，它们是有序的和/或者同步的，标识符值存储在标识符字段426中，标识符类型存储在字404的TT字段424中。当两个任务拥有不同的标识符或标识符类型值时，它们是不相关的，可以在不同的内核下完全并行的处理。同样的流有同样的标识符值，所以它可以次序化和同步化。不同的流有不同的标识符值，所以它们会是无次序和不同步的，所以它们可以在不同的内核上并行的执行。

词406保存关于分组数据的信息，例如，在输入数据包处理中从数据包头部提取出的信息。信息可以包括在L2协议头是否有虚拟局域网标识，数据包是UDP还是TCP的，L2协议头目标MAC地址字段是分散的还是复选的，数据包是否需要网络安全协议解码。信息还包括用来存储分组数据的缓冲器的号。

词408是缓冲器描述符。地址字段436存储缓冲器中分组数据的第一字符的地址。长度字段434存储缓冲器中分组数据的字节数。在一个具体实施方案中，池字段432和1字段428被设定为“0”，后备字段430将地址字段436中存储的高速缓冲存储器块的数量存储在缓冲器的前端。

词410根据数据包的类型存储分组数据。存队列条目的分组数据的格式未在本发明中限定。

POW模块228有多个POW条目隶属于多种表单，包括POW输入序列。通常，每个POW条目包括指向存储在L2高速缓冲存储器/DRAM的指针。任务队列条目可以扩展POW的输入序列。

图5示意了POW条目500。POW条目500存储任务序列指针(WQP)502。在一个具体实施方案中，WQP是L2高速缓冲存储器212或DRAM 208的64比特的校准指针，指向任务队列条目400。

POW条目500还存储着关联任务队列条目400描述的分配给当前标识符504的值和标识符506的类型，用来实现在POW模块228中POW条目与多种表单链接的与任务相关的当前组或组508。

POW模块228通过标识符值和标识符类型排序安排好时间进度的任务。标识符值允许同一流(具有同一源和目的地)的任务被排序和同步化。例如，标识符值可以是标准的TCP五元组(IP源地址，IP目标地址，IP协议，TCP源端口，TCP目标端口)的一部分，在限定“流”的数据包的头部。同样的流有同样的标识符值，所以它可以次序化和同步化。不同的流有不同的标识符值，所以它们会是无次序和不同步的，所以它们可以在不同的内核上并行的执行。在一个具体实施方案中，标识符值是32位的。标识符类型506是次序化和同步化被执行的类型。

在一个具体实施方案中，每个被POW识别的任务都被分配了以下三种标识符类型中的一种：空，有序的，原子的。无序的通过无叙标识符类型来实现。有序通过任务有有序的标识符类型实现。有序的和原子的通过让任务有原子的标识符类型实现。两个拥有原子的标识符的任务不能同时拥有同一个标识符值。

不同类型的任务使用的同样的POW模块228。因为所有的任务都是不平等的，POW支持多元组。在一个实施方案中，POW模块支持16个不同的组。组提供在不同的内核上执行不同功能的操作，所有的核共享同一个POW模块228。例如，通过限定标识符组哪个内核将会接收任务，数据包处理可以从一组内核转到另一组上，第一组执行任务的第一阶段工作，下一组执行任务的下一阶段任务。组允许各个核具体要求它所接收的任务的类型，POW模块228可以动态的将任务分配给可用的内核。

处理器内核202向POW模块228请求任务。一般，内核轮询POW模块来找到任务。然后，在某些情况下，当POW模块中有内核的任务时，它可以被选择中断内核。就是说，POW模块228基于内核接收任务的组来选择安排任务。POW模块228每个核都有成组屏蔽寄存器。每组屏蔽寄存器都是按位屏蔽，一组一位，允许内核对它接收任务的组具体结合。

如果内核不接收和任务相关的组的话，POW模块228为内核调度任务。内核成组屏蔽寄存器的值为0，阻止了内核继续接收任何新任务。在一个16组的实施方案中，组屏蔽寄存器有16按位屏蔽，一组一位。位单元为“1”设置内核的隶属成员在反应组里。

图6示出了任务通过POW模块228的状态。任务通过一系列输入系列604进入POW模块228，并被POW条目500识别，可以被存储在L2高速缓冲存储器/DRAM中，或POW模块中。根据一个输入序列604中的POW条目606的表单，任务被POW模块调度以响应内核的开始工作的指令。

任务被调度，将POW模块中的来自输入序列604的POW条目移至正在传输的队列中。正在传输的队列是根据存储在POW条目500内的标识符/类型值来选择的。16个内核，每个内核一个POW条目，被这16个POW条目所标识的任务可以被并行的调度。在任务由POW模块初始化调度成为控制队列后，通过内核执行标识符转换操作，调度任务608可以在正在传输的队列中移动。

安排好进度的任务可以被内核打乱进度安排。没有进度安排的任务610保持在正在传输的队列里，稍后将被POW模块重新安排进度，在POW模块的一个内核可以通过一个标识符转换612来将标识符的类型由空改为有序的或是原子的来实现将没有安排进度的任务(来自POW模块的远景)安排进度。

图7是POW模块228多种表单的POW条目500的框图。POW条目500在输入队列704a-c或正在传输的队列706a-c出排队。POW条目500还可以在自由表单702或与内核202相关联。

任务进入POW模块通过输入队列704a-c。在实施方案中，表示了三个输入队列704a-c。每个输入队列704a-c包括指向POW条目表单的输入头和尾指针712，指向存储在存储器710中的任务进入队列708的表单的输入队列存储器的头和尾指针714，存储器710在POW模块228外部。

虽然POW条目500的数量是有限的，但是POW模块228有无限的任务队列。如果POW条目500无法在自由表单702下使用，POW模块228通过输入队列存储器头尾指针(存储器表单)714加任务进入队列，从而将任务添加到输入队列中。如果POW模块通过任务进入队列708添加任务，稍后，一旦POW条目500可用，任务将自动从存储器710移到POW条目500内，和直接添加在输入队列704a-c的任务一起按次序排列。

两个POW条目500在第一输入队列704a里，在第一输入队列头部，输入队列头指针712指向POW条目。第一输入队列被存储在存储器中的任务队列708扩展。输入队列存储器头指针714指向任务进入队列708。第二输入队列504b是空；就是说没有POW条目。在第三输入队列504c中有一个POW条目500。

在自由表单702中的POW条目500可以分配给任何一个输入队列704a-c。如果POW条目500在自由表单702上是有效的，POW模块228从自由表单702为输入队列704a-c分配POW条目500，并在分配的POW条目存储标识符值，标识符类型和任务进入队列相关组。存储在存储器710中的任务进入队列(WQP)400的指针也存储在POW条目500中。通过把POW条目放在自由表单702上，使它自由。

内核202从POW模块228请求任务，POW模块228调度在输入队列704a-c被POW条目检验过的任务给提出请求的内核。接到内核中的一个提出的任务请求时，POW模块调度在输入队列704a-c的POW条目500。被调度的POW条目500是基于存储在POW条目500的组字段508的组检验，组被发出请求的内核支持，内核被内核716的内核分组屏蔽寄存器检验。POW条目被调度通过将它移到正在传输的表单706a-c中实现。正在传输的表单的选择是基于标识符/类型值，标识符/类型值存储在POW条目500的标识符值字段504和标识符类型字段506中。被POW条目检验的，在正在传输表单(队列)706a-c中的任务被称为“正在传输”任务。

POW模块包括一系列质量服务特征以不同方式优先考虑输入队列，使任务顺利的通过单元。一个质量服务特征是阈值，用来限制独立的输入队列704a-c使用的POW条目的数量。每个输入队列704a-c有一个相关的POW条目的最大数值。当POW条目的最大数值达到了，输入队列704a-c通过使用任务进行队列708来扩展输入队列704a-c。每一个输入队列也都有一个自由POW的最小数值。当有效的POW条目的数值小于最小值，没有POW条目分配给输入队列。

另一个质量服务特征是控制输入队列遍历的机制。当POW模块要为内核202调度新的任务时，它并行的遍历所有的输入队列704a-c。搜索按环进行。在一个实施方案中，POW模块使用的32环通过配置环字段配置。在另一实施方案中，有8个输入队列，每个配置环是一个8位位屏蔽，指明了环可以包含的输入队列。输入队列的优先权是依据它可以参与的环的数量。例如，拥有最高优先权的输入队列参与所有的32个环，最低优先权的输入队列参与32个环中的一个。因此，假设每个队列都有调度条目，最高优先权的队列调度的每32个条目中最低优先权的输入队列调度的条目。

将任务调度到内核，POW模块228首先扫描未计划表单610上面没有时间安排的任务。之后，POW模块扫描输入队列，从当前环和当前输入队列开始。当前环中遗留下的队列连续的被任务首先扫描。环扫描是循环进行的。每个输入队列都按次序被扫描，不同的输入队列按照环配置的指示扫描。当POW模块从输入队列中找到可调度的任务，它将任务发送给内核，根据标识符将任务移到正在传输的队列中，更新当前队列/环，所以下次请求的任务开始的队列/环跟随着最近一次找到可调度任务的位置。

从概念上讲，POW条目在正在传输的队列中有组织的按先进先出(FIFO)秩序，带有一个和每一个单独的标识符，和类型、值组合在一起的标识符相关联的正在传输的队列706a-c。正在传输队列的POW条目有两个标识符类型中的一个(原子的或有序的)。在某些情况下，当任务的标识符未决，转换为空标识符类型时，POW模块可以将任务从有序的表单移到无序的表单中。

在任何给定时间，只有一个任务可以被调度给特定的内核202。因此，可以调度的任务数被内核数量限制。在一个实施方案中，有16个处理器的内核202允许16个任务被调度。

与内核202的结合的POW模块228使用存储在POW条目500的标识符/类型值以实现次序化和同步化相关的任务，并允许不相关的任务无次序和非同步化。允许高效的多核处理。当两个任务共享同样的标识符值和标识符类型时，这两个任务是相关的，有序的和同步化的。当两个任务有不同的标识符和标识符类型值时，被POW条目检验的两个任务可以并行的在不同的内核202上执行。

图7示出了三个按FIFO要求存储的带有POW条目的正在传输的表单706a-c。当POW模块228从输入队列704a-c调度任务，或是重新安排没有分排的任务时，任务进行正在传输的表单706a-c。只有带有原子化和次序化标识符类型的POW条目才被存储在正在传输队列706a-c中。在图7所举的例子中，数据包的POW条目带有标识符“O7”，即，标识符7和标识符类型为次序化(O)被存储在正在传输的表单706中。带有标识符“A5”的POW条目，即，标识符5和标识符类型为原子化(A)的被存储在正在传输的表单706b中。带有标识符“A7”的POW条目，即，标识符7和标识符类型为原子化(A)的被存储在正在传输的表单“A7”中。

输入队列中的POW条目500或任务进入队列708，存储着分配给任务的初始标识符值。数据包输入单元214或内核202根据任务的发生者，对标识符进行初始化赋值。一个任务的标识符值504和标识符类型506可以通过内核执行的标识符转换命令进行转换。

由于POW条目检验的正在传输在不同处理阶段的进度中的正在传输队列表单的任务，标识符类型来执行标识符转换。标识符转换可以使POW条目从一个正在传输的表单移到另一个正在传输的表单，或正在传输的表单中的任务无序或完成。标识符转换将在稍后结合图8介绍。

POW模块在标识符转换过程中保持条理。每一个在正在传输任务执行恒值系列标识符转换，当正在传输任务恒值进行每个标识符转换，每个都具有同样的标识符/类型值。如果以下情况为真，POW模块可以整理流中所有的数据包：(1)所有来自同样流的数据包，通过同一输入队列，进入POW模块，带有同样初始标识符值和组；(2)来自同样流的数据包被同一列非空(次序化或原子化)标识符转换序列处理。

在每一个队列的基础上，POW模块保持被输入队列704a-c中的任务进入队列708校验的任务的有序性。输入队列704a-c中的POW条目500校验的任务可以不按次序调用。当POW模块搜索可调度任务搜索到不可以被马上调度的任务时，POW模块调度就跳过输入队列704a-c的POW条目500。POW模块不跳过被POW条目限定有序或是空的任务。因此，POW模块调度在输入队列请求里拥有这些标识符类型和同样组鉴定的任务。POW模块跳过POW条目定义的标识符类型为原子的，标识符值不可以马上被调度的，所以只有在输入队列里被POW条目校验了的，有确保的标识符次序，标识符类型为原子的标识符有同样的组。POW模块跳过输入队列里POW条目检验的不是要求的组，所以输入队列入口有不同组校验的POW条目直接时无序的。

在任务被调度后，任务的传输和次序都是基于标识符和标识符类型值的。正在传输的任务的调度次序不是依靠与任务有关的组校验。被调度的任务是POW模块“传输中”的任务的一个子集。标识符值为原子或次序的任务，在完成标识符转换后保持调度安排。内核可以去掉正在传输的任务的调度安排，POW模块可以稍后给这个任务再加上调度安排。正在传输中的任务同样也包括被内核去掉调度安排的任务。去掉调度安排的任务保持在正在传输的队列中，可以稍后被重新调度，但是这个任务目前不是正被内核执行着的。去掉任务的调度安排可以用来实现“任务流水化”，通过传递一个任务从一组到另一组。这一方法同样可以被用来避免让大的同步延迟的任务消耗内核，可以使任务可打断。去掉调度安排的任务被分配一个类型为空的标识符类型。POW模块需要一个比从输入队列里调度一个新的任务更高的优先级，来重新调度安排之前被去掉调度安排的任务。

组验证用来决定在正在传输任务中被去掉调度安排的任务，重新被调度的内核。POW模块从不强迫有不同标识符值，或不同标识符类型值的传输中的任务有序化和同步化。传输队列中的任务自由的并行处理。

先进先出FIFO执行了所有有序化和同步化约束。标识符类型为有序的任务，FIFO指明了任务的次序。任一个标识符值类型为有序的POW条目都可以被执行，但是只有在表单头的POW条目才可以离开传输中的表单。传出中的表单706a是有序的，因此三个任务都成功的转为有序标识符。正在传输中的百哦大706a的头不能有一个未决的转换，但是其余的任务可以未决的转换，转成不同的次序，或是原子类型标识符。如果不是在传输表单的头部的任务有一个未决的移动，例如，由于未决的有序或原子的标识符转换，转移只有在头移动后才能发生。

有标识符为原子类型的任务，FIFO指明了次序，任务将被转换为原子类型的表单。传输表单中，第一原子类型的任务是唯一一个成功转换为原子类型标识符的。因此，只有POW条目表单的第一任务，是原子标识符值类型时，POW条目才可以在任何时间被执行。在传输队列的A7中，A7的转换完全是为了传输队列中头条目，但是对于POW条目定义的其他任务转换就是未决的。任何原子传输队列中的任务都不可以有一个未决的标识符来转换为不同的标识符。

在有序的和原子的标识符转换时，POW模块移动指针到POW条目，从一个传输队列的头到另一个传输队列的尾部。指针的移动晚上了一个转为有序标识符类型的转换，但是，对于原子标识符类型，在POW条目到达传输队列头部之前，转换是没有完成的。因此，在传输队列头部的被POW条目校验的任务不可能是未定的转换。传输队列中A5只有一个POW条目，因此，不会有未决的标识符转换。POW条目校验的一个任务具有原子的标识符。

内核可以被传输中的任务或无调度安排的任务调度。图7表示了五个内核。内核0连有一个POW条目，但是这个条目是没有被调度的。内核1是无调度的，就是说它没有附加的POW。内核2，内核3，内核4被调度安排在传输中的任务里。内核当前正处在有序的状态，或者可以有一个未决的转换，转换成其他状态。内核3有一个转为原子状态的未决的转换。内核4处在有序的转头，没有未决转换。

为响应内核的任务请求，POW模块可以调度安排无调度的任务来详细这个请求。无调度的任务与任务队列里的任务相比，有更改的优先权。POW模块不调度安排拥有未决任务转换的任务，不调度输入队列中有原子标识符类型的POW条目，除非输入队列中POW条目有一个空标识符类型即刻无调度。

如在图6中讨论过的，当无调度的内核(从POW模块全局考虑)执行一个标识符转换操作时，任务仍然进入POW模块。任务以这种形式进入POW模块，立刻就把调度。在它被调度后，无法区分它与其他调度安排的任务。

POW模块在循环期间可以为所有的内核提前读取任务，否则内核将空闲。因此这种处理可以以最小的延迟得到任务，排除了总线争抢。总线是用来把任务从单元移进移出的。然而，与内核相关的成组屏蔽的改变和标识符转换操作，使提前读取任务无效。

图8是与内核、POW模块和IO网桥相耦合的专用标识符转换总线的示意框图。一个标识符转换操作包括请求和完成：(1)内核将新标识符传送给POW模块；(2)POW模块向内核指示出标识符转换的成功完成。内核转换新的标识符主要通过一个输入/输出(I/O)存储机制。标识符转换操作是从内核执行一个I/O存储指令，在内核里设定一个未决标识符转换开始的。在一个实施方案中，标识符转换的存储包括存储一个操作码在操作码字段，标识符存储在存储器数据部分。这一存储器进入内核202的写缓冲器，被相关存储总线234被反射，通过IO网桥(IOB)/FAU232，到达IO总线304，进入POW模块228。

每个内核都有各自的未决转换位800。从每个内核拷贝的未决转换802被存储在IOB/FAU 232中。另外，POW模块存储了未决转换的状态。当内核开始转换操作时，内核内部的未决转换被设置，通过执行一个存储指令，存储地址是被POW模块指定的IO空间物理地址。当一个适当的子集被使用在地址里时，例如，地址位<42:40>，响应内核的未决转换位在内核内被设定。当遵循同一存储指令时，FAU也位内核设定未决转换位。FAU用未决转换位来推迟选择请求，直到转换完成后。一个内核最多可以有一个没有完成的标识符转换，所有仅有一个未决转换位被请求。

接到内核202的标识符转换请求，POW模块228在POW条目500转换标识符值和/或标识符类型，依据标识符值和标识符类型，移动POW条目500到另一个传输表单706a-c，在专用的标识符转换总线804上，提供一个标识符转换完成的标识。POW模块的标识符转换的完成，清除了各自内核和FAU中未决标识符转换位800。标识符转换操作有独立的转换请求和转换完成等待操作。当任务的有序性和原子性和要求吻合时，POW模块完成一个要求的标识符值转换。独立的转换操作允许内核重叠延迟，因为当标识符转换是未决时，转换请求其他的任务和去掉任务的调度安排，因此避免了长的同步化延迟。

标识符转换完成在专用转换总线804上发送。在一个实施方案中，转换总线804有5位，5位中的4位时用来特殊的内核(16个中的一个)来编址的，另一个位(有效位)时用来指示转换在给定循环里是否有效。当POW模块成功的完成一个标识符转换操作后，清除掉内核的未决转换状态，在转换总线804上的4位对内核ID编码，然后通过设置有效位使其生效。内核和IOB/FAU都检测转换总线804，当POW模块指出标识符转换成功完成，内核和IOB/FAU清除被内核ID选中的内核的未决转换位800。

专用的转换总线804将完成标识符转换所需的相关的I/O总线的带宽最小化，仅需要5根线(位/信号)。带宽被最小化，因为当每个内核仅需要考虑它当地的未决转换位800的值，内核可以在当地轮询所有完成的标识符转换。高效轮询是非常重要的，因为高效的去除调度安排要求轮询。专用的转换总线804同样也允许IOB/FAU操作被推迟，直到标识符转换完成。专用的转换总线804对于一系列应用很重要。专用的转换总线804还最小化了完成转换的延迟。

标识符转换有最高优先权，可用最小延迟完成，包括总线争用转移POW模块请求，如果没有同步化/有序化冲突。

POW模块同步化支持是非常灵活的，可以被用在很多不同方面。一个同步化具体应用将在下面表1所示的防火墙/虚拟专用网(VPN)数据包处理中介绍。这个具体应用例假设每个数据包的处理可以被分成六个应用阶段：(1)碎片整理，(2)网络安全协议解码，(3)查找，(4)处理，(5)网络安全协议加密，(6)输出队列。应用例假设应用的是网络协议(IP)版本4。然而，本领域内的普通技术人员很容易就可以修改成6版。

阶段	标识符类型	标识符值(阶段ID/阶段标签)
阶段	标识符类型	标识符值(阶段ID/阶段标签)	碎片整理	有序的	{0，散列(IPSrc，IPdest)}
网络安全协议解码	原子的	{1，IPSEC SPI/SPA}	碎片整理	有序的	{0，散列(IPSrc，IPdest)}
网络安全协议解码	原子的	{1，IPSEC SPI/SPA}	查找	原子的	{2，散列(IPsrc，IPdest，IPprot，IPsrcport，IPdestport)}
处理	有序的	{3，散列(IPSrc，Ipdest，IPport，IPsrcport，IPdestport)}	查找	原子的	{2，散列(IPsrc，IPdest，IPprot，IPsrcport，IPdestport)}
处理	有序的	{3，散列(IPSrc，Ipdest，IPport，IPsrcport，IPdestport)}	网络安全协议加密	原子的	{4，IPSEC SPI/SPA}
输出队列	原子的	{5，Output Queue Index}	网络安全协议加密	原子的	{4，IPSEC SPI/SPA}

表一

在碎片整理阶段，IP输入数据包被碎片整理。普通技术人员所熟知的，由于网络可以传输的IP数据包尺寸的限制，大的IP数据包的数据字段是分段的，并且这些碎片以一系列小的IP数据包形式发送。碎片偏移字段在每个段的头部，用来从新对碎片排序。网络安全协议解码阶段对数据包进行网络安全协议解码。查找阶段查找数据流记录，更新状态。处理阶段对需要在发送数据包前执行的操作进行处理。例如，数据包可以要求网络地址翻译(NAT)或调整TCP序列号。网络安全协议解码阶段对数据包执行网络安全协议解码操作。输出阶段将数据放到输出队列中，从处理器中输出。

每个应用阶段都分配了一个阶段校验码(0-5)。分配给各个阶段的标识符值504包括阶段校验码，阶段标题。阶段校验码允许不同的处理阶段平行的在流水线方式下执行，通过允许在不同阶段，但具有同样数据流校验码和标识符校验码的数据包，在不同的内核里同步执行。在同一数据流里的多数据包，如果它们有不同的阶段标识符值，它们可以在同一流里在不同的内核内自由的执行。

不同阶段校验码保证了在同一流里所有数据包的处理次序(和同样的方向)。目标是展示出POW模块不同的标识符值，以实现尽可能多的任务并行，同时也保证了关键数据结构通道的适当同步化。

一般来说，阶段标题是散列结构，使用数据包头部的一系列字段来尽可能多的区分数据流，所以来自同一数据流的两个数据包产生同样的散列值。阶段标题可以是关键数据结构的索引，或是散列结果和索引的结合。

参照表1，碎片整理阶段有一个有序的标识符类型506，标识符校验码504包括一个阶段校验码0，和阶段标题，阶段标题来自对包括在数据包中的IP来源地址和IP目标地址的散列结果。输入数据包在碎片整理阶段被整理。所有的输入数据包进入这个阶段，一些数据包被分段，少数被整理了碎片的数据包离开这个阶段。所有在同一流里进入的数据包，碎片或不是碎片的，对于IP源头和IP目标地址字段有同样的值，而且同样的阶段标题，所有它们是有序的。来自同一数据流，优化碎片和碎片整理的数据包按次序进入下一阶段。

进入这一阶段并且没有离开的碎片转换成空标识符类型，并不在进入其他阶段。当最后一个碎片创建完成了一个数据包的碎片整理，碎片整理过的数据包进入下一阶段，所有碎片整理数据包呈现了输入碎片的任务顺序。这给了碎片整理数据包最理想的次序；就好像最后一个输入碎片一出现，它就出现了一样，即使被需要用来从多路输入碎片，创建碎片整理数据包的软件处理时间可能很大。

IPSec解码阶段，数据包需要的网络安全协议被解码。如果不需要，这一阶段就被跳过。标识符类型是原子，阶段校验码是“1”，阶段标题来源于AH和ESP协议中执行的安全参数标志(SPI)和安全性关联(SA)。网络安全协议包括独立的鉴别标题(AH)，安全有效负荷(ESP)，IP负荷压缩(Ipcomp)，和网络关键交换(IKE)。IPSec是因特网网络工作小组(IETF)在请求说明(RFC)2401中定义的标准，见网址www.ietf.org/rfc/rfc2401.txt。

一般来说，IPSec处理要求使用同样网络安全协议通道的不同的数据包之间同步，例如，数据结构的错误修正窗口。错误修正窗口是一个32位的计数器，用来决定入站的AH或EH数据包是否需要自动修正。这一结构具体指明了一个原子的标识符，这一标识符覆盖了整个数据包解码的IPSec安全相关(SA)协议。阶段标识符值独一无二的限定SA，所以在入站标识符转换完成后，内核可以自由的访问隧道数据结构，知道下一个标识符转换。

所有来自同一个数据流的数据包拥有同样的IPSec SPI/SA值，并保留着它们离开这个阶段的次序。来自别的数据流，使用同样通道的数据包串行通过这一阶段，并会按次序离开，但是在下一阶段它们将会有不同的标识符，所以在进入下一阶段时它们是无序的。

查找阶段查找数据流(由5个元组构成的)的记录和更新状态。实施例表示假设记录状态防火墙。防火墙组织网络中的计算机直接与外部网络相通讯。相反，所有的通讯都是通过代理服务器进行的，代理服务器来决定是否安全让某个具体的信息或文件通过网络。记录状态防火墙记录网络连接的轨迹，例如TCP流通过防火墙。在流的第一数据包，捷径流记录不存在，所以流必须有效和被存储等待下一个数据包。阶段的标题选择了一个特殊的散列表元。因此，原子的标识符序列进入表元，散列数据结构没有更进一步的同步化的要求。在前面的数据包更新高速缓冲存储器状态之前，来自流的数据包不会评论(或更改)流的状态。

这种高速缓存结构会花费较长的时间来最初的审批和缓存数据流的状态，与处理下面的数据包的时间相比。因此，一些数据包在查找成功前，需要等待审批的完成。对于一些协议，如TCP，在同一个流里，上面这种情况是不会发生的，但是对于其他协议或数据包来自不同的流，长时间的等待还是可能的，就是说，很不幸，冲突在同一个散列表元里发生。POW模块提供的碎片整理操作可以被用在这种长时间等待的情况下。当前任务可以被碎片整理，别的任务被执行，当原子标识符有效后，POW模块可以重新调度任务。

处理阶段对数据包进行处理，在数据包被发送之前这是必需的。例如，数据包可能需要网络地址翻译(NAT)或TCP序列号调整。NAT翻译，是企业网或其他专用网(称为子域)IP地址与互联网IP地址之间的转换。处理阶段使用有序标识符类型，带有散列流校验码来做阶段标题。这尽可能精确的使同一流的数据包按顺序离开这一阶段。数据包可以在查找阶段或处理阶段被遗漏，不执行任何更高阶段的任务。

IPSec解码阶段，对需要的数据包进行IPSec解码。如果不需要，这一阶段就被跳过。标签的使用同IPSec解码阶段。

输出阶段将数据包放到输出队列上，从处理器输出。标识符类型时原子的，进入同步化关键数据结构所要求的。阶段标识符校验精确的输出队列，所以仅参照使用同一输出队列的被序列化。例如QOS计算，随机早期检查(RED)可以在这一阶段被使用，根据输出队列的大小，来断定是否丢失数据包。

一种标识符转换操作限定从一个阶段到下一个阶段的转折点。PIP/IPD单元为数据包生成初始标识符，就是碎片整理阶段。标识符是有序的，标识符值有阶段标识id＝0，阶段标签＝散列(IPsrc，IPdest)。POW模块调度带有初始标识符的任务。POW模块中最后一个转换(标识符类型空，将任务从POW模块移走)，是调度下一数据包任务的一部分。因此，没有加密/解码阶段，处理IPSec数据包仅要求三个标识符转换。因为每个阶段都有独一无二的标识符值，不同的流可以被多核并行处理。

虽然本发明已经对关于其优选的实施方案进行了具体的描述和介绍，但本领域技术人员应当理解，在不脱离本发明所附权利要求保护的范围的情况下，本发明在形式和细节上可以进行多种改变。

Claims

1.一种网络服务处理器，该处理器包括：

多个独立的处理器，每个处理器并行处理任务；

基于与任务相关联的标识符，任务排序模块动态地调度安排任务以被处理器并行处理，以致任务的执行是有序和同步的。

2.如权利要求1中所述的网络服务处理器，被处理器执行的任务存储在输入队列里。

3.如权利要求2中所述的网络服务处理器，其中任务排序模块进一步包括：

多个正在传输的表单，每个正在传输的表单与不同的标识符相关，以用于跟踪与这个标识符相关的传输任务，任务排序模块依据与任务相关的标识符，将在输入队列里的任务调度到正在传输的表单里。

4.如权利要求2中所述的网络服务处理器，其中任务排序模块进一步包括：

每个处理器具有校验码组，校验码组指明处理器会接收任务的组，任务排序模块在输入队列通过组来区分任务，以致任务被调度到从组接收任务的处理器中。

5.如权利要求2中所述的网络服务处理器，其中输入队列中的任务可以被存储在任务排序模块或任务排序模块的外部存储器中。

6.如权利要求1中所述的网络服务处理器，进一步包括：计时器，该计时器用来控制任务加入输入队列的时间。

7.如权利要求5中所述的网络服务处理器，其中标识符包括标识符类型和存储标识符类型为原子的任务的正在传输表单，表明只有在表单头部的任务可以被多个处理器的其中之一执行。

8.如权利要求5中所述的网络服务处理器，其中标识符包括标识符类型和存储标识符类型为有序的任务的正在传输表单，表明所有表单里的任务都是可执行的，任务只有从表单头部才可以被多个处理器的其中之一移除。

9.如权利要求1中所述的网络服务处理器，进一步包括：

在处理器和任务排序模块之间连接的专用的标识符转换总线，用于传输分组任务排序模块的标识符转换操作完成的指示。

10.如权利要求9中所述的网络服务处理器，其中内核通过存储指令和根据监视到存储指令来启动标识符转换操作，分组任务排序模块更改标识符，并将任务移到与更该的标识符相关联的正在传输中队列中。

11.如权利要求1中所述的网络服务处理器，其中任务是执行IPSec解码。

12.如权利要求1中所述的网络服务处理器，其中任务是执行IPSec加密。

13.如权利要求1中所述的网络服务处理器，其中任务是对虚拟专用网数据包进行碎片整理。

14.如权利要求1中所述的网络服务处理器，其中任务是调整TCP序列号。

15.如权利要求2中所述的网络服务处理器，其中每个输入队列都有指定的优先权值。

16.如权利要求2中所述的网络服务处理器，其中每个输入队列都被指定存储一类任务。

17.如权利要求1中所述的网络服务处理器，其中至少处理器之一执行控制平台操作，另一个处理器执行数据平台操作。

18.一种处理网络服务处理器中数据包的方法，该方法包括：

通过多个独立的处理器并行处理任务；以及

基于与任务相关联的标识符，通过处理器动态调并行处理任务，以致任务的执行是有序和同步的。

19.如权利要求18所述的方法，进一步包括：

基于与任务相关联的标识符，将存储在输入队列的任务调度到多个正在传输的表单之一中，每个正在传输的表单都与不同的标识符相关联，以用于跟踪与此标识符相关联的正在传输中的任务。

20.如权利要求19所述的方法，进一步包括：

按组区分输入队列中的任务，以致任务被调度到从组接收任务的处理器中，组校验码指明将要接收任务的处理器的组。

21.如权利要求19所述的方法，其中输入队列中的任务可以被存储在任务排序模块或任务排序模块的外部存储器中。

22.如权利要求18所述的方法，进一步包括：

控制，当任务加入输入队列时通过计时器控制。

23.如权利要求18所述的方法，其中标识符包括标识符类型和存储标识符类型为原子的任务的正在传输表单，表明只有在表单头部的任务才可以被多个处理器的其中之一执行。

24.如权利要求18所述的方法，其中标识符包括标识符类型和存储标识符类型为有序的任务的正在传输表单，表明所有表单里的任务都是可执行的，任务只有从表单头部才可以被多个处理器中的其中之一移除。

25.如权利要求18所述的方法，进一步包括：

在专用的标识符转换总线上通过分组任务排序模块传输标识符转换操作完成的指示，所述专用的标识符转换总线与处理器和任务排序模块连接。

26.如权利要求25所述的方法，进一步包括：

通过执行存储指令启动标识符转换操作；以及

根据监视存储指令，更改标识符并将任务移到与更该的标识符相关联的正在传输中队列中。

27.如权利要求18所述的方法，其中任务是执行IPSec解码。

28.如权利要求18所述的方法，其中任务是执行IPSec加密。

29.如权利要求18所述的方法，其中任务是对虚拟专用网数据包进行碎片整理。

30.如权利要求18所述的方法，其中任务是调整TCP序列号。

31.如权利要求19所述的方法，其中每个输入队列都有指定的优先权值。

32.如权利要求19所述的方法，其中每个输入队列都被指定存储一类任务。

33.如权利要求19所述的方法，其中至少处理器之一执行控制平台操作，另一个处理器执行数据平台操作。

34.一种网络服务处理器中用来处理数据包的装置，该装置包括：

用于并行处理任务的设备；以及

基于与任务相关联的标识符，用于动态调度任务被并行执行以致任务的执行是有序和同步的设备。