• 数字IC前端学习笔记:数字乘法器的优化设计(华莱士树乘法器)


    相关阅读

    数字IC前端icon-default.png?t=N7T8https://blog.csdn.net/weixin_45791458/category_12173698.html?spm=1001.2014.3001.5482


            进位保留乘法器依旧保留着阵列的排列规则,只是进位是沿斜下角,如果能使用树形结构来规划这些进位保留加法器,就能获得更短的关键路径延迟和更小的器件开销,这种结构的乘法器被称为华莱士树(Wallace)乘法器。图1所示为使用四位华莱士树乘法器的例子,图中总共有十六个部分积,分别通过被乘数和乘数的各位相与(通过与门)得到,图中的斜杠/代表一个全加器,连接的分别是右上角的本位和以及左下角给高位的进位,带反斜杠\的/表示是半加器。

    图1 华莱士树乘法器的覆盖过程

            第一阶段华莱士将所有的部分积按行,每三行分组,在组内使用保留进位加法器(有全加器和半加器两种)压缩,当组内某一列含有三个部分积,则使用全加器压缩;若含有两个部分积,则使用半加器压缩,含有一个部分积,则不压缩。分组时的多余行不进行压缩,直接传递到下一阶段(在这里指的是第四行)。       

            下一阶段中,继续三行分一组,进行压缩,直到最后得到两行部分积,此时使用一个普通的多位传播进位加法器或者超前进位加法器等进行(两数相加)向量合并。可以看到只需要两个阶段,十六个部分积就可被压缩至两行。这个结构使用了五个全加器和三个半加器(不包括最后的向量合并器)。 

            具体的Verilog代码实现见附录,Modelsim软件仿真如图2所示。使用Synopsis的综合工具Design Compiler综合的结果如图3所示,综合使用了0.13μm工艺库

    图2 华莱士树乘法器仿真结果

    图3 华莱士树乘法器综合结果

            在Design Compiler中使用report_timing命令,可以得到关键路径的延迟,如图4所示,可以看出延迟仅有1.39ns。性能优于进位保留乘法器,远由于普通的阵列乘法器,这是由于此时将部分分组并分别处理,结果大约能在三级加法器的延迟后得到。

    图4 华莱士树乘法器关键路径报告

            在Design Compiler中使用report_area命令,报告所设计电路的面积占用情况,如图5所示,可以看到这个面积略大于阵列乘法器,这是由最后的向量合并加法器贡献的,所以这个面积随着数据位宽的增加不会迅速变大。如果不考虑向量合并加法器的影响,阵列乘法器使用了八个全加器和四个半加器,进位保留乘法器使用了六个全加器和六个半加器,而华莱士树乘法器仅仅用了五个全加器和三个半加器,该实现减少了位宽较大乘法器的硬件开销,同时对传播延时的优化也很显著。

     图5 华莱士树乘法器面积报告

            进位保留乘法器的Verilog代码如下所示。

    1. module Wallace_Multiplier (
    2. input [3:0] A ,
    3. input [3:0] B ,
    4. output [7:0] Sum
    5. );
    6. wire [3:0] partial_product [3:0];
    7. wire [3:0] W_level1_c,W_level1_carry;
    8. wire [3:0] W_level2_c,W_level2_carry;
    9. assign partial_product[0]=B[0]?A:0;
    10. assign partial_product[1]=B[1]?A:0;
    11. assign partial_product[2]=B[2]?A:0;
    12. assign partial_product[3]=B[3]?A:0;
    13. // level1
    14. Adder_half adder_half_u1 (
    15. .Mult1 (partial_product[0][1]),
    16. .Mult2 (partial_product[1][0]),
    17. .Res (Sum[1]),
    18. .Carry(W_level1_carry[0])
    19. );
    20. Adder adder_u1 (
    21. .Mult1 (partial_product[0][2]),
    22. .Mult2 (partial_product[1][1]),
    23. .I_carry (partial_product[2][0]),
    24. .Res (W_level1_c[1]),
    25. .Carry (W_level1_carry[1])
    26. );
    27. Adder adder_u2 (
    28. .Mult1 (partial_product[0][3]),
    29. .Mult2 (partial_product[1][2]),
    30. .I_carry (partial_product[2][1]),
    31. .Res (W_level1_c[2]),
    32. .Carry (W_level1_carry[2])
    33. );
    34. Adder_half adder_half_u2 (
    35. .Mult1 (partial_product[1][3]),
    36. .Mult2 (partial_product[2][2]),
    37. .Res (W_level1_c[3]),
    38. .Carry(W_level1_carry[3])
    39. );
    40. // level2
    41. Adder_half adder_half_u3 (
    42. .Mult1 (W_level1_c[1]),
    43. .Mult2 (W_level1_carry[0]),
    44. .Res (Sum[2]),
    45. .Carry(W_level2_carry[0])
    46. );
    47. Adder adder_u3 (
    48. .Mult1 (W_level1_c[2]),
    49. .Mult2 (W_level1_carry[1]),
    50. .I_carry (partial_product[3][0]),
    51. .Res (W_level2_c[1]),
    52. .Carry (W_level2_carry[1])
    53. );
    54. Adder adder_u4 (
    55. .Mult1 (W_level1_c[3]),
    56. .Mult2 (W_level1_carry[2]),
    57. .I_carry (partial_product[3][1]),
    58. .Res (W_level2_c[2]),
    59. .Carry (W_level2_carry[2])
    60. );
    61. Adder adder_u5 (
    62. .Mult1 (W_level1_carry[3]),
    63. .Mult2 (partial_product[2][3]),
    64. .I_carry (partial_product[3][2]),
    65. .Res (W_level2_c[3]),
    66. .Carry (W_level2_carry[3])
    67. );
    68. assign Sum[7:3]={partial_product[3][3],W_level2_c[3:1]}+{W_level2_carry[3:0]};
    69. assign Sum[0]=partial_product[0][0];
    70. endmodule

  • 相关阅读:
    全国批发市场情况萧条,进销存系统或是业务转机
    IDEA报Error:java:无效的源发行版13解决方式
    Vue 3使用 Iconify 作为图标库与图标离线加载的方法、 Icones 开源在线图标浏览库的使用
    抗住大批量请求的高并发架构设计经验
    新手投资如何分配股票仓位?诺奖得主的秘诀是什么?| 附代码【邢不行】
    SQL union all的使用
    利用X6 制作一个简单的流程图工具
    软件测试工程师规划需要学什么技能?资深测试分析总结......
    C++ 惯用法之 Copy-Swap 拷贝交换
    tornado之模板语法
  • 原文地址:https://blog.csdn.net/weixin_45791458/article/details/133611299