基于FPGA的CORDIC算法实现——Verilog版

旧城等待， 2022-05-20 04:49 275阅读 0赞

目前，学习与开发FPGA的程序员们大多使用的是Verilog HDL语言（以下简称为Verilog），关于Verilog的诸多优点一休哥就不多介绍了，在此，我们将重点放在Verilog的运算操作上。  
我们都知道，在Verilog中，运算一般分为逻辑运算（与或非等）与算术运算（加减乘除等）。而在一开始学习Verilog时，老司机一定会提醒我们，“切记，千万别用‘/’除、‘%’取模（有的也叫取余）和‘\*\*’幂。”这话说的不无道理，因为这三个运算是不可综合的。但，需清楚理解的是，不可综合的具体意思为不能综合为简单的模块，当我们在程序中调用了这些运算时，‘/’除和‘%’取模在Quartus软件中是可以综合的，因此可以正常调用运行，但是会消耗一些逻辑资源，而且会产生延时，即这两个运算的处理时间会很长，可能会大于时序控制时钟的单周期时间。此时呢，我们会建议你调用IP核来实现运算操作，虽然这样也会消耗许多逻辑资源，但产生的延时相对较小满足了你基本的需求。  
问题好像迎刃而解了，可是仔细一想，除了这些运算，我们还剩下什么？对呀，三角函数，反三角函数，对数函数，指数函数呢，这些函数我们在高中就学习了的呀，难道在FPGA中就没有用武之地吗？有人会说，查找表呗，首先将某个运算的所有可能的输入与输出对一一罗列出来，然后放进Rom中，然后根据输入查表得到输出。这个方法虽然有效的避免了延时问题，却是一个十分消耗资源的方法，不适合资源紧张的设计。那么，就真的没有办法了吗？  
答案就是咱们今天的标题了，CORDIC，而且CORDIC是一个比较全能的算法，通过这一原理，我们可以实现三角函数，反三角函数，对数函数，指数函数等多种运算。接下来，一休哥就带领大家来学习CORDIC的原理吧。（题外话：请相信一休哥，本文不会让你感到太多痛苦~）  
本文将分三个小部分来展开介绍：  
1、CORDIC的基本原理介绍  
2、CORDIC的具体操作流程介绍  
3、CORDIC的旋转模式——Verilog仿真  
本文涉及到的全部资料链接：  
链接：[http://pan.baidu.com/s/1gfrJzMj][http_pan.baidu.com_s_1gfrJzMj] 密码：x92u

# 一、CORDIC的基本原理介绍 #

CORDIC算法是一个“化繁为简”的算法，将许多复杂的运算转化为一种“仅需要移位和加法”的迭代操作。CORDIC算法有旋转和向量两个模式，分别可以在圆坐标系、线性坐标系和双曲线坐标系使用，从而可以演算出8种运算，而结合这8种运算也可以衍生出其他许多运算。下表展示了8种运算在CORDIC算法中实现的条件。  
![这里写图片描述][SouthEast]  
首先，我们先从旋转模式下的圆坐标系讲起，这也是CORDIC方法最初的用途。

## 1、CORDIC的几何原理介绍 ##

假设在xy坐标系中有一个点P1（x1，y1），将P1点绕原点旋转θ角后得到点P2（x2，y2）。  
![这里写图片描述][SouthEast 1]  
于是可以得到P1和P2的关系。  
x2 = x1cosθ – y1sinθ = cosθ(x1 – y1tanθ)  
y2 = y1cosθ + x1sinθ = cosθ(y1 +x1tanθ)  
以上就是CORDIC的几何原理部分，而我们该如何深入理解这个几何原理的真正含义呢？  
从原理中，我们可以知道，当已知一个点P1的坐标，并已知该点P1旋转的角度θ，则可以根据上述公式求得目标点P2的坐标。然后，麻烦来了，我们需要用FPGA去执行上述运算操作，而FPGA的Verilog语言根本不支持三角函数运算。因此，我们需要对上述式子进行简化操作，将复杂的运算操作转换为一种单一的“迭代位移”算法。那么，接下来我们介绍优化算法部分。

## 2、CORDIC的优化算法介绍 ##

我们先介绍算法的优化原理：将旋转角θ细化成若干分固定大小的角度θi，并且规定θi满足tanθi = 2-i，因此∑θi的值在\[-99.7°，99.7°\]范围内，如果旋转角θ超出此范围，则运用简单的三角运算操作即可（加减π）。  
然后我们需要修改几何原理部分的假设，假设在xy坐标系中有一个点P0（x0，y0），将P0点绕原点旋转θ角后得到点Pn（xn，yn）。  
于是可以得到P0和Pn的关系。  
xn = x0cosθ – y0sinθ = cosθ(x0 – y0tanθ)  
yn = y0cosθ + x0sinθ = cosθ(y0 + x0tanθ)  
然后，我们将旋转角θ细化成θi，由于每次的旋转角度θi是固定不变的（因为满足tanθi = 2-i），如果一直朝着一个方向旋转则∑θi一定会超过θ（如果θ在\[-99.7°，99.7°\]范围内）。因此我们需要对θi设定一个方向值di。如果旋转角已经大于θ，则di为-1，表示下次旋转为顺时针，即向θ靠近；如果旋转角已经小于θ，则di为1，表示下次旋转为逆时针，即也向θ靠近。然后我们可以得到每次旋转的角度值diθi，设角度剩余值为zi+1，则有zi+1 = zi - diθi，其中z0为θ。如此随着i的增大，角度剩余值zi+1将会趋近于0，此时运算结束。（注：可以发现，di与zi的符号位相同）  
第一次旋转θ0，d0为旋转方向：  
x1 = cosθ0(x0 – d0y0tanθ0)  
y1 = cosθ0(y0 + d0x0tanθ0)  
第二次旋转θ1，d1为旋转方向：  
x2 = cosθ1(x1 – d1y1tanθ1) = cosθ1cosθ0(x0 – d0y0tanθ0 – d1y0tanθ1 – d1d0 x0tanθ1 tanθ0)  
y2 = cosθ1(y1 + d1x1tanθ1) = cosθ1cosθ0(y0 + d0x0tanθ0 + d1x0tanθ1 – d1d0y0tanθ1 tanθ0)  
大家可能已经发现了，在我们旋转的过程中，式子里一直会有tanθi和cosθi，而每次都可以提取出cosθi。虽然我们的FPGA无法计算tanθi，但我们知道tanθi = 2-i，因此可以执行和tanθi效果相同的移位操作2-i来取代tanθi。而对于cosθi，我们可以事先全部提取出来，然后等待迭代结束之后（角度剩余值zi+1趋近于0，一般当系统设置最大迭代次数为16时zi+1已经很小了），然后计算出∏cosθi的值即可。  
总结一下：  
迭代公式有三：  
xi+1 = xi – d iy i2-i，提取了cosθi，2-i等效替换了tanθi之后  
yi+1 = yi + d ix i2-i，提取了cosθi，2-i等效替换了tanθi之后  
zi+1 = zi - diθi  
其中i从0开始迭代，假设当i = n-1时，zn趋近于0，迭代结束。然后对结果乘上∏cosθi（i从0至n-1），于是得到点Pn（xn∏cosθi，yn∏cosθi），此时的点Pn就近似等于之前假设中的点Pn（xn，yn）了，所以此时的点Pn同样满足之前假设得到的公式：  
xn∏cosθi = x0cosθ – y0sinθ  
yn∏cosθi = y0cosθ + x0sinθ  
由于i从0至n-1，所以上式可以转化成下式：  
xn = 1/∏cosθi(x0cosθ – y0sinθ)，（其中i从0至n-1）  
yn = 1/∏cosθi(y0cosθ + x0sinθ)，（其中i从0至n-1）  
注意：上式中的xn，yn是经过迭代后的结果，而不是之前假设中的点Pn（xn，yn）。了解这点是十分重要的。  
根据高中学的三角函数关系，可以知道cosθi = 1/\[(1+tan2θi)^0.5\] = 1/\[(1+2-2i)^0.5\]，而1/\[(1+2-2i)^0.5\]的极值为1，因此我们可以得出一个结论：当i的次数很大时，∏cosθi的值趋于一个常数。  
关于如何计算∏cosθi的代码如下所示：

close all;
    clear;
    clc;
    % 初始化
    die = 16;%迭代次数
    jiao = zeros(die,1);%每次旋转的角度
    cos_value = zeros(die,1);%每次旋转的角度的余弦值
    K = zeros(die,1);%余弦值的N元乘积
    K_1 = zeros(die,1);%余弦值的N元乘积的倒数
    for i = 1 : die
        a = 2^(-(i-1));
        jiao(i) = atan(a);
        cos_value(i) = cos(jiao(i));
        if( i == 1)
            K(i) = cos_value(i);
            K_1(i) = 1/K(i);
        else
            K(i) = K(i-1)*cos_value(i);
            K_1(i) = 1/K(i);
        end
    end
    jiao = vpa(rad2deg(jiao)*256,10) 
    cos_value = vpa(cos_value,10)
    K = vpa(K,10)
    K_1 = vpa(K_1,10)

*  1
 *  2
 *  3
 *  4
 *  5
 *  6
 *  7
 *  8
 *  9
 *  10
 *  11
 *  12
 *  13
 *  14
 *  15
 *  16
 *  17
 *  18
 *  19
 *  20
 *  21
 *  22
 *  23
 *  24
 *  25
 *  26

![这里写图片描述][SouthEast 2]  
从上表也可以看出，当迭代次数为16，i=15时，cosθi的值已经非常趋近于1了，∏cosθi的值则约等于0.607253，1/∏cosθi为1.64676。所以当迭代次数等于16时，通过迭代得到的点Pn坐标已经非常接近之前假设中的点Pn。所以，当迭代次数等于16时，这个式子是成立的。  
xn = 1/∏cosθi(x0cosθ – y0sinθ)，（其中i从0至n-1）  
yn = 1/∏cosθi(y0cosθ + x0sinθ)，（其中i从0至n-1）  
此时，已知条件有三个x0、y0和θ。通过16次迭代，我们可以得到xn和yn。而式中的∏cosθi是个随i变化的值，我们可以预先将其值存入系统中。  
然后，我们人为设置x0 = ∏cosθi，y0 = 0，则根据等式，xn = cosθ，yn = sinθ。其中1/∏cosθi的值我们也同样预先存入系统中。如此，我们就实现了正弦和余弦操作了。

# 二、CORDIC的具体操作流程介绍 #

## 1、CORDIC的旋转模式 ##

由于算法较复杂，一休哥再总结一些具体的操作流程。  
1、 设置迭代次数为16，则x0 = 0.607253，y0 = 0，并输入待计算的角度θ，θ在\[-99.7°，99.7°\]范围内。  
2、 根据三个迭代公式进行迭代，i从0至15：  
xi+1 = xi – d iy i2-i  
yi+1 = yi + d ix i2-i  
zi+1 = zi - diθi  
注：z0 = θ，di与zi同符号。  
3、 经过16次迭代计算后，得到的x16 和y16分别为cosθ和sinθ。  
至此，关于CORDIC的三角函数cosθ和sinθ的计算原理讲解结束。  
关于CORDIC算法计算三角函数cosθ和sinθ的MATLAB代码如下所示：

close all;
    clear;
    clc;
    % 初始化
    die = 16;%迭代次数
    x = zeros(die+1,1);
    y = zeros(die+1,1);
    z = zeros(die+1,1);
    x(1) = 0.607253;%初始设置
    z(1) = pi/4;%待求角度θ
    %迭代操作
    for i = 1:die
        if z(i) >= 0
            d = 1;
        else
            d = -1;
        end
        x(i+1) = x(i) - d*y(i)*(2^(-(i-1)));
        y(i+1) = y(i) + d*x(i)*(2^(-(i-1)));
        z(i+1) = z(i) - d*atan(2^(-(i-1)));
    end
    cosa = vpa(x(17),10)
    sina = vpa(y(17),10)
    c = vpa(z(17),10)

*  1
 *  2
 *  3
 *  4
 *  5
 *  6
 *  7
 *  8
 *  9
 *  10
 *  11
 *  12
 *  13
 *  14
 *  15
 *  16
 *  17
 *  18
 *  19
 *  20
 *  21
 *  22
 *  23
 *  24

## 2、CORDIC的向量模式 ##

讲完了旋转模式后，我们接着讲讲向量模式下的圆坐标系。  
在这里，我们需从头来过了，假设在xy坐标系中有一个点P0（x0，y0），将P0点绕原点旋转θ角后得到点Pn（xn，0），θ在\[-99.7°，99.7°\]范围内。  
于是可以得到P0和Pn的关系：  
xn = x0cosθ – y0sinθ = cosθ(x0 – y0tanθ)  
yn = y0cosθ + x0sinθ = cosθ(y0 + x0tanθ) = 0  
如何得到Pn（xn，yn）一直是我们的目标。而此时，我们还是列出那几个等式：  
根据三个迭代公式进行迭代，i从0至15：  
xi+1 = xi – d iy i2-i  
yi+1 = yi + d ix i2-i  
zi+1 = zi - diθi  
不过此时我们尝试改变初始条件：  
设置迭代次数为16，则x0 = x，y0 = y，z0 = 0，di与yi的符号相反。表示，经过n次旋转，使Pn靠近x轴。  
因此，当迭代结束之后，Pn将近似接近x轴，此时yn = 0，可知旋转了θ，即zn = θ = arctan(y/x)。  
而  
xn = 1/∏cosθi(x0cosθ – y0sinθ)，（其中i从0至n-1）  
yn = 1/∏cosθi(y0cosθ + x0sinθ)，（其中i从0至n-1）  
因此，可得ycosθ + xsinθ = 0，  
xn = 1/∏cosθi(xcosθ – ysinθ) = 1/∏cosθi\{ \[ (xcosθ – ysinθ)^2\]^(1/2)\}  
= 1/∏cosθi\{ \[ x2cos2θ + y2sin2θ – 2xysinθcosθ\]^(1/2)\}  
= 1/∏cosθi\{ \[ x2cos2θ + y2sin2θ + y2 cos2θ + x2sin2θ\]^(1/2)\}  
= 1/∏cosθi\{ \[ x2 + y2\]^(1/2)\}  
由上可以知道，我们通过迭代，就算出了反正切函数zn = θ = arctan(y/x)，以及向量OP0（x，y）的长度 d = xn \* ∏cosθi。  
关于反正切函数，一休哥要多啰嗦几句了，由于θ在\[-99.7°，99.7°\]范围内，所以我们输入向量OP0（x，y）时，需要保证其在第一、四象限。  
关于CORDIC算法计算反三角函数arctanθ的MATLAB代码如下所示：

close all;
    clear;
    clc;
    % 初始化
    die = 16;%迭代次数
    x = zeros(die+1,1);
    y = zeros(die+1,1);
    z = zeros(die+1,1);
    x(1) = 100;%初始设置
    y(1) = 200;%初始设置
    k = 0.607253;%初始设置
    %迭代操作
    for i = 1:die
        if y(i) >= 0
            d = -1;
        else
            d = 1;
        end
        x(i+1) = x(i) - d*y(i)*(2^(-(i-1)));
        y(i+1) = y(i) + d*x(i)*(2^(-(i-1)));
        z(i+1) = z(i) - d*atan(2^(-(i-1)));
    end
    d = vpa(x(17)*k,10)
    a = vpa(y(17),10)
    c = vpa(rad2deg(z(17)),10)

*  1
 *  2
 *  3
 *  4
 *  5
 *  6
 *  7
 *  8
 *  9
 *  10
 *  11
 *  12
 *  13
 *  14
 *  15
 *  16
 *  17
 *  18
 *  19
 *  20
 *  21
 *  22
 *  23
 *  24
 *  25

# 三、CORDIC的旋转模式——Verilog仿真 #

一休哥在编写CORDIC算法时，采用了16级流水线，仿真效果十分明显。以下是顶层文件的代码。  
为了避免浮点运算，为了满足精度要求，一休哥对每个变量都放大了2^16倍，并且引入了有符号型reg和算术右移。  
关于Verilog代码的编写，一休哥已经不想多说了，因为代码是完全符合我之前所讲的CORDIC的原理与MATLAB仿真代码。相信大家在看完本文的前两个部分之后，对Verilog的理解应该不是难事儿。

module Cordic_Test
    (
        CLK_50M,RST_N,
        Phase,
        Sin,Cos,Error
    );
    
    input                       CLK_50M;
    input                       RST_N;
    input       [31:0]          Phase;
    output      [31:0]          Sin;
    output      [31:0]          Cos;
    output      [31:0]          Error;
    
    `define rot0  32'd2949120       //45度*2^16
    `define rot1  32'd1740992       //26.5651度*2^16
    `define rot2  32'd919872        //14.0362度*2^16
    `define rot3  32'd466944        //7.1250度*2^16
    `define rot4  32'd234368        //3.5763度*2^16
    `define rot5  32'd117312        //1.7899度*2^16
    `define rot6  32'd58688         //0.8952度*2^16
    `define rot7  32'd29312         //0.4476度*2^16
    `define rot8  32'd14656         //0.2238度*2^16
    `define rot9  32'd7360          //0.1119度*2^16
    `define rot10 32'd3648          //0.0560度*2^16
    `define rot11 32'd1856          //0.0280度*2^16
    `define rot12 32'd896           //0.0140度*2^16
    `define rot13 32'd448           //0.0070度*2^16
    `define rot14 32'd256           //0.0035度*2^16
    `define rot15 32'd128           //0.0018度*2^16
    
    parameter Pipeline = 16;
    parameter K = 32'h09b74;    //K=0.607253*2^16,32'h09b74,
    
    reg signed  [31:0]      Sin;
    reg signed  [31:0]      Cos;
    reg signed  [31:0]      Error;
    reg signed  [31:0]      x0=0,y0=0,z0=0;
    reg signed  [31:0]      x1=0,y1=0,z1=0;
    reg signed  [31:0]      x2=0,y2=0,z2=0;
    reg signed  [31:0]      x3=0,y3=0,z3=0;
    reg signed  [31:0]      x4=0,y4=0,z4=0;
    reg signed  [31:0]      x5=0,y5=0,z5=0;
    reg signed  [31:0]      x6=0,y6=0,z6=0;
    reg signed  [31:0]      x7=0,y7=0,z7=0;
    reg signed  [31:0]      x8=0,y8=0,z8=0;
    reg signed  [31:0]      x9=0,y9=0,z9=0;
    reg signed  [31:0]      x10=0,y10=0,z10=0;
    reg signed  [31:0]      x11=0,y11=0,z11=0;
    reg signed  [31:0]      x12=0,y12=0,z12=0;
    reg signed  [31:0]      x13=0,y13=0,z13=0;
    reg signed  [31:0]      x14=0,y14=0,z14=0;
    reg signed  [31:0]      x15=0,y15=0,z15=0;
    reg signed  [31:0]      x16=0,y16=0,z16=0;
    reg         [ 1:0]      Quadrant [Pipeline:0];
    
    always @ (posedge CLK_50M or negedge RST_N)
    begin
        if(!RST_N)
        begin
            x0 <= 1'b0;                         
            y0 <= 1'b0;
            z0 <= 1'b0;
        end
        else
        begin
            x0 <= K;
            y0 <= 32'd0;
            z0 <= Phase[15:0] << 16;
        end
    end
    
    always @ (posedge CLK_50M or negedge RST_N)
    begin
        if(!RST_N)
        begin
            x1 <= 1'b0;                         
            y1 <= 1'b0;
            z1 <= 1'b0;
        end
        else if(z0[31])
        begin
          x1 <= x0 + y0;
          y1 <= y0 - x0;
          z1 <= z0 + `rot0;
        end
        else
        begin
          x1 <= x0 - y0;
          y1 <= y0 + x0;
          z1 <= z0 - `rot0;
        end
    end
    
    always @ (posedge CLK_50M or negedge RST_N)
    begin
        if(!RST_N)
        begin
            x2 <= 1'b0;                         
            y2 <= 1'b0;
            z2 <= 1'b0;
        end
        else if(z1[31])
       begin
            x2 <= x1 + (y1 >>> 1);
            y2 <= y1 - (x1 >>> 1);
            z2 <= z1 + `rot1;
       end
       else
       begin
           x2 <= x1 - (y1 >>> 1);
           y2 <= y1 + (x1 >>> 1);
           z2 <= z1 - `rot1;
       end
    end
    
    always @ (posedge CLK_50M or negedge RST_N)
    begin
        if(!RST_N)
        begin
            x3 <= 1'b0;                         
            y3 <= 1'b0;
            z3 <= 1'b0;
        end
        else if(z2[31])
       begin
           x3 <= x2 + (y2 >>> 2);
           y3 <= y2 - (x2 >>> 2);
           z3 <= z2 + `rot2;
       end
       else
       begin
           x3 <= x2 - (y2 >>> 2);
           y3 <= y2 + (x2 >>> 2);
           z3 <= z2 - `rot2;
       end
    end
    
    always @ (posedge CLK_50M or negedge RST_N)
    begin
        if(!RST_N)
        begin
            x4 <= 1'b0;                         
            y4 <= 1'b0;
            z4 <= 1'b0;
        end
        else if(z3[31])
       begin
           x4 <= x3 + (y3 >>> 3);
           y4 <= y3 - (x3 >>> 3);
           z4 <= z3 + `rot3;
       end
       else
       begin
           x4 <= x3 - (y3 >>> 3);
           y4 <= y3 + (x3 >>> 3);
           z4 <= z3 - `rot3;
       end
    end
    
    always @ (posedge CLK_50M or negedge RST_N)
    begin
        if(!RST_N)
        begin
            x5 <= 1'b0;                         
            y5 <= 1'b0;
            z5 <= 1'b0;
        end
        else if(z4[31])
       begin
           x5 <= x4 + (y4 >>> 4);
           y5 <= y4 - (x4 >>> 4);
           z5 <= z4 + `rot4;
       end
       else
       begin
           x5 <= x4 - (y4 >>> 4);
           y5 <= y4 + (x4 >>> 4);
           z5 <= z4 - `rot4;
       end
    end
    
    always @ (posedge CLK_50M or negedge RST_N)
    begin
        if(!RST_N)
        begin
            x6 <= 1'b0;                         
            y6 <= 1'b0;
            z6 <= 1'b0;
        end
        else if(z5[31])
       begin
           x6 <= x5 + (y5 >>> 5);
           y6 <= y5 - (x5 >>> 5);
           z6 <= z5 + `rot5;
       end
       else
       begin
           x6 <= x5 - (y5 >>> 5);
           y6 <= y5 + (x5 >>> 5);
           z6 <= z5 - `rot5;
       end
    end
    
    always @ (posedge CLK_50M or negedge RST_N)
    begin
        if(!RST_N)
        begin
            x7 <= 1'b0;                         
            y7 <= 1'b0;
            z7 <= 1'b0;
        end
        else if(z6[31])
       begin
           x7 <= x6 + (y6 >>> 6);
           y7 <= y6 - (x6 >>> 6);
           z7 <= z6 + `rot6;
       end
       else
       begin
           x7 <= x6 - (y6 >>> 6);
           y7 <= y6 + (x6 >>> 6);
           z7 <= z6 - `rot6;
       end
    end
    
    always @ (posedge CLK_50M or negedge RST_N)
    begin
        if(!RST_N)
        begin
            x8 <= 1'b0;                         
            y8 <= 1'b0;
            z8 <= 1'b0;
        end
        else if(z7[31])
       begin
           x8 <= x7 + (y7 >>> 7);
           y8 <= y7 - (x7 >>> 7);
           z8 <= z7 + `rot7;
       end
       else
       begin
           x8 <= x7 - (y7 >>> 7);
           y8 <= y7 + (x7 >>> 7);
           z8 <= z7 - `rot7;
       end
    end
    
    always @ (posedge CLK_50M or negedge RST_N)
    begin
        if(!RST_N)
        begin
            x9 <= 1'b0;                         
            y9 <= 1'b0;
            z9 <= 1'b0;
        end
        else if(z8[31])
       begin
           x9 <= x8 + (y8 >>> 8);
           y9 <= y8 - (x8 >>> 8);
           z9 <= z8 + `rot8;
       end
       else
       begin
           x9 <= x8 - (y8 >>> 8);
           y9 <= y8 + (x8 >>> 8);
           z9 <= z8 - `rot8;
       end
    end
    
    always @ (posedge CLK_50M or negedge RST_N)
    begin
        if(!RST_N)
        begin
            x10 <= 1'b0;                        
            y10 <= 1'b0;
            z10 <= 1'b0;
        end
        else if(z9[31])
       begin
           x10 <= x9 + (y9 >>> 9);
           y10 <= y9 - (x9 >>> 9);
           z10 <= z9 + `rot9;
       end
       else
       begin
           x10 <= x9 - (y9 >>> 9);
           y10 <= y9 + (x9 >>> 9);
           z10 <= z9 - `rot9;
       end
    end
    
    always @ (posedge CLK_50M or negedge RST_N)
    begin
        if(!RST_N)
        begin
            x11 <= 1'b0;                        
            y11 <= 1'b0;
            z11 <= 1'b0;
        end
        else if(z10[31])
       begin
           x11 <= x10 + (y10 >>> 10);
           y11 <= y10 - (x10 >>> 10);
           z11 <= z10 + `rot10;
       end
       else
       begin
           x11 <= x10 - (y10 >>> 10);
           y11 <= y10 + (x10 >>> 10);
           z11 <= z10 - `rot10;
       end
    end
    
    always @ (posedge CLK_50M or negedge RST_N)
    begin
        if(!RST_N)
        begin
            x12 <= 1'b0;                        
            y12 <= 1'b0;
            z12 <= 1'b0;
        end
        else if(z11[31])
       begin
           x12 <= x11 + (y11 >>> 11);
           y12 <= y11 - (x11 >>> 11);
           z12 <= z11 + `rot11;
       end
       else
       begin
           x12 <= x11 - (y11 >>> 11);
           y12 <= y11 + (x11 >>> 11);
           z12 <= z11 - `rot11;
       end
    end
    
    always @ (posedge CLK_50M or negedge RST_N)
    begin
        if(!RST_N)
        begin
            x13 <= 1'b0;                        
            y13 <= 1'b0;
            z13 <= 1'b0;
        end
        else if(z12[31])
       begin
           x13 <= x12 + (y12 >>> 12);
           y13 <= y12 - (x12 >>> 12);
           z13 <= z12 + `rot12;
       end
       else
       begin
           x13 <= x12 - (y12 >>> 12);
           y13 <= y12 + (x12 >>> 12);
           z13 <= z12 - `rot12;
       end
    end
    
    always @ (posedge CLK_50M or negedge RST_N)
    begin
        if(!RST_N)
        begin
            x14 <= 1'b0;                        
            y14 <= 1'b0;
            z14 <= 1'b0;
        end
        else if(z13[31])
       begin
           x14 <= x13 + (y13 >>> 13);
           y14 <= y13 - (x13 >>> 13);
           z14 <= z13 + `rot13;
       end
       else
       begin
           x14 <= x13 - (y13 >>> 13);
           y14 <= y13 + (x13 >>> 13);
           z14 <= z13 - `rot13;
       end
    end
    
    always @ (posedge CLK_50M or negedge RST_N)
    begin
        if(!RST_N)
        begin
            x15 <= 1'b0;                        
            y15 <= 1'b0;
            z15 <= 1'b0;
        end
        else if(z14[31])
       begin
           x15 <= x14 + (y14 >>> 14);
           y15 <= y14 - (x14 >>> 14);
           z15 <= z14 + `rot14;
       end
       else
       begin
           x15 <= x14 - (y14 >>> 14);
           y15 <= y14 + (x14 >>> 14);
           z15 <= z14 - `rot14;
       end
    end
    
    always @ (posedge CLK_50M or negedge RST_N)
    begin
        if(!RST_N)
        begin
            x16 <= 1'b0;                        
            y16 <= 1'b0;
            z16 <= 1'b0;
        end
        else if(z15[31])
       begin
           x16 <= x15 + (y15 >>> 15);
           y16 <= y15 - (x15 >>> 15);
           z16 <= z15 + `rot15;
       end
       else
       begin
           x16 <= x15 - (y15 >>> 15);
           y16 <= y15 + (x15 >>> 15);
           z16 <= z15 - `rot15;
       end
    end
    
    always @ (posedge CLK_50M or negedge RST_N)
    begin
        if(!RST_N)
        begin
            Quadrant[0] <= 1'b0;
            Quadrant[1] <= 1'b0;
            Quadrant[2] <= 1'b0;
            Quadrant[3] <= 1'b0;
            Quadrant[4] <= 1'b0;
            Quadrant[5] <= 1'b0;
            Quadrant[6] <= 1'b0;
            Quadrant[7] <= 1'b0;
            Quadrant[8] <= 1'b0;
            Quadrant[9] <= 1'b0;
            Quadrant[10] <= 1'b0;
            Quadrant[11] <= 1'b0;
            Quadrant[12] <= 1'b0;
            Quadrant[13] <= 1'b0;
            Quadrant[14] <= 1'b0;
            Quadrant[15] <= 1'b0;
            Quadrant[16] <= 1'b0;
        end
        else
        begin
            Quadrant[0] <= Phase[17:16];
            Quadrant[1] <= Quadrant[0];
            Quadrant[2] <= Quadrant[1];
            Quadrant[3] <= Quadrant[2];
            Quadrant[4] <= Quadrant[3];
            Quadrant[5] <= Quadrant[4];
            Quadrant[6] <= Quadrant[5];
            Quadrant[7] <= Quadrant[6];
            Quadrant[8] <= Quadrant[7];
            Quadrant[9] <= Quadrant[8];
            Quadrant[10] <= Quadrant[9];
            Quadrant[11] <= Quadrant[10];
            Quadrant[12] <= Quadrant[11];
            Quadrant[13] <= Quadrant[12];
            Quadrant[14] <= Quadrant[13];
            Quadrant[15] <= Quadrant[14];
            Quadrant[16] <= Quadrant[15];
        end
    end
    
    always @ (posedge CLK_50M or negedge RST_N)
    begin
        if(!RST_N)
        begin
            Cos <= 1'b0;
            Sin <= 1'b0;
            Error <= 1'b0;
        end
        else
        begin
            Error <= z16;
            case(Quadrant[16])
                2'b00: //if the Phase is in first Quadrant,the Sin(X)=Sin(A),Cos(X)=Cos(A)
                    begin
                        Cos <= x16;
                        Sin <= y16;
                    end
                2'b01: //if the Phase is in second Quadrant,the Sin(X)=Sin(A+90)=CosA,Cos(X)=Cos(A+90)=-SinA
                    begin
                        Cos <= ~(y16) + 1'b1;//-Sin
                        Sin <= x16;//Cos
                    end
                2'b10: //if the Phase is in third Quadrant,the Sin(X)=Sin(A+180)=-SinA,Cos(X)=Cos(A+180)=-CosA
                    begin
                        Cos <= ~(x16) + 1'b1;//-Cos
                        Sin <= ~(y16) + 1'b1;//-Sin
                    end
                2'b11: //if the Phase is in forth Quadrant,the Sin(X)=Sin(A+270)=-CosA,Cos(X)=Cos(A+270)=SinA
                    begin
                        Cos <= y16;//Sin
                        Sin <= ~(x16) + 1'b1;//-Cos
                    end
            endcase
        end
    end
    
    endmodule

*  1
 *  2
 *  3
 *  4
 *  5
 *  6
 *  7
 *  8
 *  9
 *  10
 *  11
 *  12
 *  13
 *  14
 *  15
 *  16
 *  17
 *  18
 *  19
 *  20
 *  21
 *  22
 *  23
 *  24
 *  25
 *  26
 *  27
 *  28
 *  29
 *  30
 *  31
 *  32
 *  33
 *  34
 *  35
 *  36
 *  37
 *  38
 *  39
 *  40
 *  41
 *  42
 *  43
 *  44
 *  45
 *  46
 *  47
 *  48
 *  49
 *  50
 *  51
 *  52
 *  53
 *  54
 *  55
 *  56
 *  57
 *  58
 *  59
 *  60
 *  61
 *  62
 *  63
 *  64
 *  65
 *  66
 *  67
 *  68
 *  69
 *  70
 *  71
 *  72
 *  73
 *  74
 *  75
 *  76
 *  77
 *  78
 *  79
 *  80
 *  81
 *  82
 *  83
 *  84
 *  85
 *  86
 *  87
 *  88
 *  89
 *  90
 *  91
 *  92
 *  93
 *  94
 *  95
 *  96
 *  97
 *  98
 *  99
 *  100
 *  101
 *  102
 *  103
 *  104
 *  105
 *  106
 *  107
 *  108
 *  109
 *  110
 *  111
 *  112
 *  113
 *  114
 *  115
 *  116
 *  117
 *  118
 *  119
 *  120
 *  121
 *  122
 *  123
 *  124
 *  125
 *  126
 *  127
 *  128
 *  129
 *  130
 *  131
 *  132
 *  133
 *  134
 *  135
 *  136
 *  137
 *  138
 *  139
 *  140
 *  141
 *  142
 *  143
 *  144
 *  145
 *  146
 *  147
 *  148
 *  149
 *  150
 *  151
 *  152
 *  153
 *  154
 *  155
 *  156
 *  157
 *  158
 *  159
 *  160
 *  161
 *  162
 *  163
 *  164
 *  165
 *  166
 *  167
 *  168
 *  169
 *  170
 *  171
 *  172
 *  173
 *  174
 *  175
 *  176
 *  177
 *  178
 *  179
 *  180
 *  181
 *  182
 *  183
 *  184
 *  185
 *  186
 *  187
 *  188
 *  189
 *  190
 *  191
 *  192
 *  193
 *  194
 *  195
 *  196
 *  197
 *  198
 *  199
 *  200
 *  201
 *  202
 *  203
 *  204
 *  205
 *  206
 *  207
 *  208
 *  209
 *  210
 *  211
 *  212
 *  213
 *  214
 *  215
 *  216
 *  217
 *  218
 *  219
 *  220
 *  221
 *  222
 *  223
 *  224
 *  225
 *  226
 *  227
 *  228
 *  229
 *  230
 *  231
 *  232
 *  233
 *  234
 *  235
 *  236
 *  237
 *  238
 *  239
 *  240
 *  241
 *  242
 *  243
 *  244
 *  245
 *  246
 *  247
 *  248
 *  249
 *  250
 *  251
 *  252
 *  253
 *  254
 *  255
 *  256
 *  257
 *  258
 *  259
 *  260
 *  261
 *  262
 *  263
 *  264
 *  265
 *  266
 *  267
 *  268
 *  269
 *  270
 *  271
 *  272
 *  273
 *  274
 *  275
 *  276
 *  277
 *  278
 *  279
 *  280
 *  281
 *  282
 *  283
 *  284
 *  285
 *  286
 *  287
 *  288
 *  289
 *  290
 *  291
 *  292
 *  293
 *  294
 *  295
 *  296
 *  297
 *  298
 *  299
 *  300
 *  301
 *  302
 *  303
 *  304
 *  305
 *  306
 *  307
 *  308
 *  309
 *  310
 *  311
 *  312
 *  313
 *  314
 *  315
 *  316
 *  317
 *  318
 *  319
 *  320
 *  321
 *  322
 *  323
 *  324
 *  325
 *  326
 *  327
 *  328
 *  329
 *  330
 *  331
 *  332
 *  333
 *  334
 *  335
 *  336
 *  337
 *  338
 *  339
 *  340
 *  341
 *  342
 *  343
 *  344
 *  345
 *  346
 *  347
 *  348
 *  349
 *  350
 *  351
 *  352
 *  353
 *  354
 *  355
 *  356
 *  357
 *  358
 *  359
 *  360
 *  361
 *  362
 *  363
 *  364
 *  365
 *  366
 *  367
 *  368
 *  369
 *  370
 *  371
 *  372
 *  373
 *  374
 *  375
 *  376
 *  377
 *  378
 *  379
 *  380
 *  381
 *  382
 *  383
 *  384
 *  385
 *  386
 *  387
 *  388
 *  389
 *  390
 *  391
 *  392
 *  393
 *  394
 *  395
 *  396
 *  397
 *  398
 *  399
 *  400
 *  401
 *  402
 *  403
 *  404
 *  405
 *  406
 *  407
 *  408
 *  409
 *  410
 *  411
 *  412
 *  413
 *  414
 *  415
 *  416
 *  417
 *  418
 *  419
 *  420
 *  421
 *  422
 *  423
 *  424
 *  425
 *  426
 *  427
 *  428
 *  429
 *  430
 *  431
 *  432
 *  433
 *  434
 *  435
 *  436
 *  437
 *  438
 *  439
 *  440
 *  441
 *  442
 *  443
 *  444
 *  445
 *  446
 *  447
 *  448
 *  449
 *  450
 *  451
 *  452
 *  453
 *  454
 *  455
 *  456
 *  457
 *  458
 *  459
 *  460
 *  461
 *  462
 *  463
 *  464
 *  465
 *  466
 *  467
 *  468
 *  469
 *  470
 *  471
 *  472
 *  473
 *  474
 *  475
 *  476
 *  477
 *  478
 *  479
 *  480
 *  481
 *  482
 *  483
 *  484
 *  485
 *  486
 *  487
 *  488
 *  489
 *  490
 *  491
 *  492
 *  493
 *  494
 *  495
 *  496
 *  497
 *  498
 *  499
 *  500
 *  501
 *  502
 *  503
 *  504
 *  505
 *  506
 *  507

以下是testbench文件代码

`timescale 1 ps/ 1 ps
    
    module Cordic_Test_tb;
    
    // Inputs
    reg                         CLK_50M;
    reg                         RST_N;
    reg             [15:0]      cnt;
    reg             [15:0]      cnt_n;
    reg             [31:0]      Phase;
    reg             [31:0]      Phase_n;
    wire            [31:0]      Sin;
    wire            [31:0]      Cos;
    wire            [31:0]      Error;
    
    // Instantiate the Unit Under Test (UUT)
    Cordic_Test                 uut 
    (
        .CLK_50M                (CLK_50M    ),
        .RST_N                  (RST_N      ),
        .Phase                  (Phase      ),
        .Sin                    (Sin        ),
        .Cos                    (Cos        ),
        .Error                  (Error      )
    );
    
    initial
    begin
        #0 CLK_50M = 1'b0;
        #10000 RST_N = 1'b0;
        #10000 RST_N = 1'b1;
        #10000000 $stop;
    end 
    
    always #10000 
    begin
        CLK_50M = ~CLK_50M;
    end
    
    always @ (posedge CLK_50M or negedge RST_N)
    begin
        if(!RST_N)
            cnt <= 1'b0;
        else
            cnt <= cnt_n;
    end
    
    always @ (*)
    begin
        if(cnt == 16'd359)
            cnt_n = 1'b0;
        else
            cnt_n = cnt + 1'b1;
    end
    
    //生成相位0-359度,Phase[17:16]为相位的象限,Phase[15:10]为相位的值
    always @ (posedge CLK_50M or negedge RST_N)
    begin
        if(!RST_N)
            Phase <= 1'b0;
        else
            Phase <= Phase_n;
    end
    
    always @ (*)
    begin
        if(cnt <= 16'd90)
            Phase_n = cnt;
        else if(cnt > 16'd90 && cnt <= 16'd180)
            Phase_n = {2'd01,cnt - 16'd90};
        else if(cnt > 16'd180 && cnt <= 16'd270)
            Phase_n = {2'd10,cnt - 16'd180};
        else if(cnt > 16'd270)
            Phase_n = {2'd11,cnt - 16'd270};
    end
    
    endmodule

最后来一张效果图，可以发现，我们的16级流水线已经正常的运行起来了，由于我们仿真输入的相位值为0-359度循环，因此sin和cos也循环了~~~  
![这里写图片描述][SouthEast 3]

[http_pan.baidu.com_s_1gfrJzMj]: http://pan.baidu.com/s/1gfrJzMj
[SouthEast]: /images/20220520/db9e89972cb641be8d5e030da21885dc.png
[SouthEast 1]: /images/20220520/5aff76899c794ca0b24f88e1f48ed0d5.png
[SouthEast 2]: /images/20220520/64f83054a26f44c085f8018423b6c484.png
[SouthEast 3]: /images/20220520/1b8565a4cafc4157ba427ba279289ec6.png