• 机器语言编写helloworld


    kvmtool下载编译

    git clone https://github.com/kvmtool/kvmtool.git 下载后进入到目录执行make即可。

    补码

    计算机怎么表示负数?以四位有符号数为例,使用高位作为符号位,最高位为0表示正数,为1表示负数,其余三位用来表示值。在计算机中,我们将这种表示方式称为原码。例如:

    十进制 二进制 十进制 二进制
    2 0010 -2 1010

    使用原码表示时,数字0有两种编码:0000和1000。因此,如果使用原码,在设计系统时就需要额外的电路区分+0和-0更糟糕的是如果一个数的正数相加应为0,2 - 2为例:2 - 2 = 2 + (-2) = 0010 + 1010 = 1100 = -4 这明显不对,也就是说,原码不能正确计算减法。怎么办呢?聪明的人类发现使用补码表示数字就可以加减法了。

    即:正数的反码和补码都是原码,负数的反码是除符号位以外按位取反,补码是在反码基础上+1。使用补码重新计算 2 - 2:2 + (-2) = 0010 + 1110 = 0000

    ASCII码

    计算机用高低电平分别表示0和1,所有的数据在存储和运算时都要使用二进制表示,如果我们想用数字表示文本,就要对每一个文本进行编码,目的就是文本转换成数值。具体用哪些二进制是数字表示哪个符号,美国国家标准协会制定了美国信息交换标准代码(American Standard Code for Information Interchange)简称ASCII。ASCII使用8位编码,最多可以表示256个字符,hello world使用的编码就是为:68 65 6C 6C 6F 77 6F 72 6C 64

    写外设指令

    操作码 指令 描述
    EE out DX,AL 将寄存器AL中的字节输出到寄存器DX中的I/O端口地址

    第一列为操作码,第二列为汇编语法描述的指令,第三列是指令意义的详细描述。从描述中我们可以得到,EE操作码它会自动到寄存器AX中读取源操作数,到寄存器DX中读取目的操作数。out为操作码的助记符,AL为8位寄存器,DX是16位寄存器,ASCII码是8位的,串口的地址0x3F8(IBM计算机外设地址)是需要使用16位的表示的。

    根据写串口指令的格式,我们的程序流程细化为:在执行EE命令前,将串口地址0x3F8存入寄存器DX,将字符存入寄存器AL。

    准备源操作数

    由out指令可见,在运行指令之前需要将字符A存储到寄存器AL中。x86提供了数据复制指令mov,用于将数据从原操作数复制到目的操作数。原操作数是一个8位立即数,目的操作数是r8,表示一个8位寄存器。

    操作码 指令 描述
    B0+rb mov r8,imm8 将一个8位立即数复制到一个8位寄存器

    指令编码为(B0+rb)ib。根据x86手册,其中rb表示使用操作码的低三位编码目的操作数,即将目的操作寄存器r8的编码嵌入操作吗的低三位。寄存器AL对应的编码为0,因此B0+rb最终编码为B0。

    指令编码中的ib对应原操作数,其中i表示立即数,b表示立即数的宽度是一个字节。所以,ib表示跟在操作码之后的是一个8位立即数,和字符对应的ASCII码组合最终(B0+rb)ib的编码分别为:B068 B065 B06C B06C B06F B077 B06F B072 B06C B064。

    准备目的操作数

    我们需要将串口地址写到寄存器DX中,实质是将一个16位立即数复制到一个16位寄存器, 这显然还是一个数据复制操作

    操作码 指令 描述
    B8+rw mov r16,imm16 将一个16位立即数复制到一个16位寄存器

    这个格式mov指令也接受两个操作数,只不过是16位的。指令编码中的rw表示使用操作码的低三位编码目的操作数,即将目的操作寄存器r16的编码嵌入操作码的低三位。根据x86手册,寄存器DX对应的编码为2,因此B8+rw编码为BA。

    指令编码的iw中的i表示立即数,w表示立即数的宽度是一个字,即两个字节。所以iw表示跟在操作码之后的是一个16位立即数,这里即串口地址。不过x86处理器使用小端模式,所以最终(B8+rw)iw的编码为BAF803。

    跳转指令

    我们的程序循环向串口输出字符串helloworld,在向串口输出后,需要跳转到程序开始的位置,因此需要一个跳转指令jmp,格式如下。

    操作码 指令 描述
    EB cb jmp rel8 跳转到指令指针+rel8的位置

    jmp指令后接一个rel8。rel是relative的缩写,表示相对的意思,8代表8位,因此可以跳转到相对这条指令-128~127的范围。在指令编码中操作码EB之后“cb”就是这个8位的相对偏移。

    如果我们想让指令指针指向程序开头,即B0所在的内存地址,那么jmp需要向后跳转35个字节。因为是向后跳转,所以是-35,又因为计算机中使用的是补码,所以我们需要转换一下,根据原码转补码的规则-35的原码是10100011,补码就为11011101,使用16进制表示,即DD。

    至此,我们就完成了这段程序的机器语言编码:

    ba f8 03
    b0 68
    ee
    b0 65
    ee
    b0 6c
    ee
    b0 6c
    ee
    b0 6f
    ee
    b0 77
    ee
    b0 6f
    ee
    b0 72
    ee
    b0 6c
    ee
    b0 64
    ee
    eb dd
    

    创建程序文件

    我们使用vim以二进制模式打开一个文件,vim -b hello_world.bin。按i进入插入模式,然后输入我们的代码
    。输入完成后,按下ESC返回标准模式。在标准模式下按下“:”键,进入命令行模式。在“:”的后面输入将16进制转为二进制命令:

    :%! xxd -p -r
    

    "%"表示整个文件内容,”%!“一起使用表示将整个文件内容作为后面xxd的输入,然后使用xxd从16进制转为二进制的输出替换整个文件内容。-p 表示不需要任何格式,-r意为反过来。最后输入:“wq”保存退出

    使用kvmtool运行程序

    sudo kvmtool/lkvm run -c 1 -k hello_world.bin
    

    在这里插入图片描述


    __EOF__

  • 本文作者: 放飞梦想
  • 本文链接: https://www.cnblogs.com/chengmf/p/18107375
  • 关于博主: 评论和私信会在第一时间回复。或者直接私信我。
  • 版权声明: 本博客所有文章除特别声明外,均采用 BY-NC-SA 许可协议。转载请注明出处!
  • 声援博主: 如果您觉得文章对您有帮助,可以点击文章右下角推荐一下。
  • 相关阅读:
    shiro入门基础
    Redis系列24:Redis使用规范
    隐私保护协议
    PHP代码审计2—这些函数必知必会
    剑指 Offer 18. 删除链表的节点
    git的使用场景
    管理团队相关的梳理
    论文阅读之Dynamic Routing Between Capsules(2017)
    UNet网络模型学习总结
    java基础知识面试题目
  • 原文地址:https://www.cnblogs.com/chengmf/p/18107375