Gate A20与保护模式 大家都知道,8088/8086只有20位地址线,按理它的寻址空间是2^20,应该是1024KB,但PC机的寻址结构是segment:offset,segment和offset都是16位的寄存器,最大值是0ffffh,换算成物理地址的计算方法是把segment左移4位,再加上offset,所以segment:offset所能表达的寻址空间最大应为0ffff0h + 0ffffh = 10ffefh(前面的0ffffh是segment=0ffffh并向左移动4位的结果,后面的0ffffh是可能的最大offset),这个计算出的10ffefh是多大呢?大约是1088KB,就是说,segment:offset的地址表达能力,超过了20位地址线的物理寻址能力,你说这是不是有点麻烦。在早先,由于所有的机器都没有那么大的内存,加上地址线只有20位,所以当你用segment:offset的方式企图寻址100000h这个地址时,由于没有实际的第21位地址线,你实际寻址的内存是00000h的位置,如果你企图寻址100001h这个地址时,你实际得到的内容是地址00001h上的内容,所以这个事对实际使用几乎没有任何影响,但是后来就不行了,出现了80286,地址线达到了24位,使segment:offset寻址100000h--10ffefh这将近64K的存储器成为可能,为了保持向下兼容,于是出现了A20 Gate,这是后话,我们后面再细说。 我们可能经常听到一些只有在PC机上才有的一些关于存储器的专有名词,包括:常规内存(Conventional Memory)、上位内存区(Upper Memory Area)、高端内存区(High Memory Area)和扩展内存(Extended Memory),我尽量把这几个东东说明白,这需要下面这张著名的图。 这张图很清楚地说明了问题,大家都知道,DOS下的“常规内存”只有640K,这640K就是从0--A0000H这段地址空间;所谓“上位内存区”,指的就是20位地址线所能寻址到的1M地址空间的上面384K空间,就是从A0001H--100000H这段地址空间,也就是我们说的用于ROM和系统设备的地址区域,这384K空间和常规内存的640K空间加起来就是20位地址线所能寻址的完整空间1024KB;由于80286和80386的出现使PC机的地址线从20位变成24位又变成32位,寻址能力极大地增加,1M以上的内存寻址空间,我们统称为“扩展内存”;这里面绝大部分内存区域只能在保护模式下才能寻址到,但有一部分既可以在保护模式下,也可以在实模式下寻址,这就是我们前面提到过的地址100000h--10ffefh之间的这块内存,为了表明其特殊性,我们把这块有趣的内存区叫做“高端内存”。 前面我们提过由于IBM的愚蠢设计给PC机的内存结构埋下了麻烦的伏笔,现在我们来说说这个麻烦。我们都见过PC机上的内存条,但是由于上位内存区的存在,这个内存条上的地址居然不能连续,就是说,这个内存条上要有0--A0000H的地址空间,还要有100000h--最大内存容量的地址空间,中间的384K地址空间必须留出来给ROM用,在现如今一个芯片就好几兆的情况下,你说这个内存条应该怎么做,当然我相信一定是可以做出来的,但肯定很麻烦,如果当初IBM把这个“上位内存区”放在地址低端,就是0--6000h这一部分,岂不是这个麻烦就没有了?! 但是,实际的内存条上地址都是连续的,并没有人把这段地址空间留出来给ROM使用,原因很简单,采用技术手段把这段地址空间空出来,比浪费这384K内存的成本还要高,所以在这个地址区域就出现了很奇怪的现象,ROM和RAM的地址重叠。 实际上,往往ROM并不能完全覆盖整个384K区域,这样就会有一些地址没有被ROM占用,那么这部分地址上的RAM仍然是可以使用的。实际上,和ROM重叠的这384K RAM一般也不会被浪费,说到这里,不得不说所谓的ROM Shadowing了,RAM和ROM的性能是有很大差异的,RAM的存取速度要远远大于ROM,而且RAM可以32位存取,ROM通常只能16位,所以目前的PC机对这块RAM和ROM重叠的区域的处理采用一种ROM Shadowing的技术方式,当机器加电后,先让ROM有效,RAM无效,然后读出ROM内容,再让ROM无效,RAM有效,把读出的ROM内容放到相同地址的RAM中,并把相应位置的RAM设定为只读,这样就把ROM搬到了RAM中,地址完全一样,只是性能比使用ROM要高些,这块RAM就好像ROM的Shadow一样。 回到我们的主题A20 Gate,出现80286以后,为了保持和8086的兼容,PC机在设计上在第21条地址线(也就是A20)上做了一个开关,当这个开关打开时,这条地址线和其它地址线一样可以使用,当这个开关关闭时,第21条地址线(A20)恒为0,这个开关就叫做A20 Gate,很显然,在实模式下要访问高端内存区,这个开关必须打开,在保护模式下,由于使用32位地址线,如果A20恒等于0,那么系统只能访问奇数兆的内存,即只能访问0--1M、2-3M、4-5M......,这显然是不行的,所以在保护模式下,这个开关也必须打开。 下面我们来看一下PC机是怎么实现A20 Gate的。 早期的PC机,控制键盘有一个单独的单片机8042,现如今这个芯片已经给集成到了其它大片子中,但其功能和使用方法还是一样,当PC机刚刚出现A20 Gate的时候,估计实在找不到控制它的地方了,同时为这点小事也不值得增加芯片,于是工程师使用这个8042键盘控制器来控制A20 Gate,但A20 Gate真的和键盘一点关系也没有,我们先从软件的角度简单介绍一下8042这个芯片。 8042有4个寄存器1个8-bit长的Input buffer;Write-Only;1个8-bit长的Output buffer; Read-Only;1个8-bit长的Status Register;Read-Only;1个8-bit长的Control Register;Read/Write。 有两个端口地址:60h和64h。读60h端口,读output buffer写60h端口,写input buffer读64h端口,读Status Register 对Control Register的操作相对要复杂一些,首先要向64h端口写一个命令(20h为读命令,60h为写命令),然后根据命令从60h端口读出Control Register的数据或者向60h端口写入Control Register的数据(64h端口还可以接受许多其它的命令)。 先来看看Status Register的定义,我们后面要用bit 0和bit 1: bit meaning ----------------------------------------------------------------------- 0 output register (60h) 中有数据 1 input register (60h/64h) 有数据 2 系统标志(上电复位后被置为0) 3 data in input register is command (1) or data (0) 4 1=keyboard enabled, 0=keyboard disabled (via switch) 5 1=transmit timeout (data transmit not complete) 6 1=receive timeout (data transmit not complete) 7 1=even parity rec'd, 0=odd parity rec'd (should be odd) 除了这些资源外,8042还有3个内部端口:Input Port、Outport Port和Test Port,这三个端口的操作都是通过向64h发送命令,然后在60h进行读写的方式完成,其中本文要操作的A20 Gate被定义在Output Port的bit 1上,所以我们有必要对Outport Port的操作及端口定义做一个说明。读Output Port向64h发送0d0h命令,然后从60h读取Output Port的内容写Output Port向64h发送0d1h命令,然后向60h写入Output Port的数据 另外我们还应该介绍两个命令:禁止键盘操作命令向64h发送0adh打开键盘操作命令向64h发送0aeh 有了这些命令和知识,我们可以考虑操作A20 Gate了,有关8042芯片更详细的资料,请参考该芯片的Data Sheet。 如何打开和关闭A20 Gate。 理论上讲,我们只要操作8042芯片的输出端口(64h)的bit 1,就可以控制A20 Gate,但实际上,当你准备向8042的输入缓冲区里写数据时,可能里面还有其它数据没有处理,所以,我们要首先禁止键盘操作,同时等待数据缓冲区中没有数据以后,才能真正地去操作8042打开或者关闭A20 Gate。打开A20 Gate的具体步骤大致如下: 1.关闭中断; 2.等待8042 Input buffer为空; 3.发送禁止键盘操作命令; 4.等待8042 Input buffer为空; 5.发送读取8042 Output Port命令; 6.等待8042 Output buffer有数据; 7.读取8042 Output buffer,并保存得到的字节; 8.等待8042 Input buffer为空; 9.发送Write 8042 Output Port命令到8042 Input buffer; 10.等待8042 Input buffer为空; 11.将从8042 Output Port得到的字节的第2位置1(或清0),然后写入8042 Input buffer; 12.等待,直到8042 Input buffer为空为止; 13.发送允许键盘操作命令到8042 Input buffer; 14. 打开中断。 下面是完成打开A20 Gate的代码: A20Enable: cli ;1.关闭中断 call WaitInbufEmpty ;2.等待8042 Input buffer为空; mov al, 0adh mov dx, 64h out dx, al ;3.发送禁止键盘操作命令 call WaitInbufEmpty ;4.等待8042 Input buffer为空; mov al, 0d0h mov dx, 64h out dx, al ;5.发送读取8042 Output Port命令; call WaitOutbufFull ;6.等待8042 Output buffer有数据; mov dx, 60h in al, dx ;7.读取8042 Output buffer push ax ;保存读取的数据 call WaitInbufEmpty ;8.等待8042 Input buffer为空; mov al, 0d1h mov dx, 64h out dx, al ;9.发送写 8042 Output Port命令 call WaitInbufEmpty ;10.等待8042 Input buffer为空 pop ax or al, 02h ;11.将从8042 Output Port得到的字节的bit 1置1 mov dx, 60h out dx, al ;写入Output Port call WaitInbufEmpty ;12.等待8042 Input buffer为空 mov al, 0aeh mov dx, 64h out dx, al ;13.发送允许键盘操作命令 sti ;开中断 ret WaitInbufEmpty: mov dx, 64h in al, dx ;读取Status Register test al, 02h jnz WaitInbufEmpty retWaitOutbufFull: mov dx, 64h in al, dx test al, 01 ;读取Status Register jz WaitOutbufFull ret 后来,由于感觉使用8042控制A20运行太慢了(确实,那么长的代码,中间还要若干次的wait),所以后来又出现了所谓的Fast A20,实际上,现在的大多数机器都是Fast A20,Fast A20使用92h端口控制A20,同时BIOS里提供了一个软中断来控制A20: 入口:ah=24h al=0 关闭A20 1 打开A20 2 读取A20状态 int 15h 返回:如果BIOS支持此功能,CF=0,否则CF=1 CF=0时,AX返回当前A20状态,1=打开,0=关闭 像8042中的Output Port中的定义一样,92h端口的bit 1控制着A20,为1时打开,为0时关闭,从92h中读一个byte可以看a20的当前状态,所以对92h的操作如下:读A20状态mov dx, 92hin al, dx如果al的bit 1为1表示a20打开,否则为0打开A20mov dx, 92hmov al, 02out dx, al关闭A20mov dx, 92hmov al, 0out dx, al 特别要注意的是,大家从这篇文章的文字中可能也能感觉到,A20 Gate的设计本身就让人感觉很别扭,不是那么流畅,所以和A20有关的事情就难免也会有相同的感觉,很奇怪的是,上面介绍的三种方法并不是在每台机器上都适用,所以如果你要做一个商业软件其中要操作A20,那一定要三种方式联合使用才比较稳妥,否则会有意想不到的结果,LINUX公开的启动代码中就是这么做的 在DOS下有时我们会在config.sys中写上一句:dos=high,这句就会把驻留的DOS放到高端内存区域去,怎么放的呢?关键点就是打开A20,然后把DOS从常规内存搬到100000h起始的区域去,并把在常规内存中占用的内存释放掉,当然说起来容易,实际做的时候还有很多细节要处理。 说到DOS=HIGH,就不得不提醒大家另一件事,如果在config.sys中有dos=high这一句,那么恐怕92h的方法和BIOS的方法都会不完全灵验(至于操作8042的方法灵不灵我没有试),这是DOS做了手脚,因为DOS被放到了高端内存中,为了保证DOS能正常运行,它不允许你把A20给关掉,遇到这种情况不要惊慌,不是我写得不对,确实是DOS太狡猾了。 还有最后一点要特别注意,92h的bit 0是给机器发复位信号的(8042 Output Port的bit 0也是),所以在向92h写数据时,千万不要让bit 0为1,否则机器会重新启动,如果你的应用程序需要重新启动机器,这也是方法之一,比jmp 0ffffh:0来的还要干脆。 原文作者的连接应该是这个:http://hengch.blog.163.com/blog/static/107800672009013104623747/