×
嵌入式 > 嵌入式开发 > 详情

ARM Linux 的启动过程

发布时间:2020-08-10 发布时间:
|

1. kernel运行的史前时期和内存布局

arm平台下,zImage.bin压缩镜像是由bootloader加载到物理内存,然后跳到zImage.bin里一段程序,它专门于将被压缩的kernel解压缩到KERNEL_RAM_PADDR开始的一段内存中,接着跳进真正的kernel去执行。该kernel的执行起点是stext函数,定义于arch/arm/kernel/head.S。

在分析stext函数前,先介绍此时内存的布局如下图所示

在开发板tqs3c2440中,SDRAM连接到内存控制器的Bank6中,它的开始内存地址是0x30000000,大小为64M,即0x20000000。 ARM Linux kernel将SDRAM的开始地址定义为PHYS_OFFSET。经bootloader加载kernel并由自解压部分代码运行后,最终kernel被放置到KERNEL_RAM_PADDR(=PHYS_OFFSET + TEXT_OFFSET,即0x30008000)地址上的一段内存,经此放置后,kernel代码以后均不会被移动。

在进入kernel代码前,即bootloader和自解压缩阶段,ARM未开启MMU功能。因此kernel启动代码一个重要功能是设置好相应的页表,并开启MMU功能。为了支持MMU功能,kernel镜像中的所有符号,包括代码段和数据段的符号,在链接时都生成了它在开启MMU时,所在物理内存地址映射到的虚拟内存地址。

以arm kernel第一个符号(函数)stext为例,在编译链接,它生成的虚拟地址是0xc0008000,而放置它的物理地址为0x30008000(还记得这是PHYS_OFFSET+TEXT_OFFSET吗?)。实际上这个变换可以利用简单的公式进行表示:va = pa – PHYS_OFFSET + PAGE_OFFSET。Arm linux最终的kernel空间的页表,就是按照这个关系来建立。

之所以较早提及arm linux 的内存映射,原因是在进入kernel代码,里面所有符号地址值为清一色的0xCXXXXXXX地址,而此时ARM未开启MMU功能,故在执行stext函数第一条执行时,它的PC值就是stext所在的内存地址(即物理地址,0x30008000)。因此,下面有些代码,需要使用地址无关技术。

2.一览stext函数

stext函数定义在Arch/arm/kernel/head.S,它的功能是获取处理器类型和机器类型信息,并创建临时的页表,然后开启MMU功能,并跳进第一个C语言函数start_kernel。

stext函数的在前置条件是:MMU, D-cache, 关闭; r0 = 0, r1 = machine nr, r2 = atags prointer.

代码如下:

[cpp]view plaincopy
  1. .section".text.head","ax"
  2. (stext)
  3. /*设置CPU运行模式为SVC,并关中断*/
  4. msrcpsr_c,#PSR_F_BIT|PSR_I_BIT|SVC_MODE@ensuresvcmode
  5. @andirqsdisabled
  6. mrcp15,0,r9,c0,c0@getprocessorid
  7. bl__lookup_processor_type@r5=procinfor9=cupid
  8. /*r10指向cpu对应的proc_info记录*/
  9. movsr10,r5@invalidprocessor(r5=0)?
  10. beq__error_p@yes,errorp
  11. bl__lookup_machine_type@r5=machinfo
  12. /*r8指向开发板对应的arch_info记录*/
  13. movsr8,r5@invalidmachine(r5=0)?
  14. beq__error_a@yes,errora
  15. /*__vet_atags函数涉及bootloader造知kernel物理内存的情况,我们暂时不分析它。*/
  16. bl__vet_atags
  17. /*创建临时页表*/
  18. bl__create_page_tables
  19. /*
  20. *ThefollowingcallsCPUspecificcodeinapositionindependent
  21. *manner.Seearch/arm/mm/proc-*.Sfordetails.r10=baseof
  22. *xxx_proc_infostructureselectedby__lookup_machine_type
  23. *above.Onreturn,theCPUwillbereadyfortheMMUtobe
  24. *turnedon,andr0willholdtheCPUcontrolregistervalue.
  25. */
  26. /*这里的逻辑关系相当复杂,先是从proc_info结构中的中跳进__arm920_setup函数,
  27. *然后执__enable_mmu函数。最后在__enable_mmu函数通过movpc,r13来执行__switch_data,
  28. *__switch_data函数在最后一条语句,鱼跃龙门,跳进第一个C语言函数start_kernel。
  29. */
  30. ldrr13,__switch_data@addresstojumptoafter
  31. @mmuhasbeenenabled
  32. adrlr,__enable_mmu@return(PIC)address
  33. addpc,r10,#PROCINFO_INITFUNC
  34. OC(stext)
[cpp]view plaincopy
  1. .section".text.head","ax"
  2. (stext)
  3. /*设置CPU运行模式为SVC,并关中断*/
  4. msrcpsr_c,#PSR_F_BIT|PSR_I_BIT|SVC_MODE@ensuresvcmode
  5. @andirqsdisabled
  6. mrcp15,0,r9,c0,c0@getprocessorid
  7. bl__lookup_processor_type@r5=procinfor9=cupid
  8. /*r10指向cpu对应的proc_info记录*/
  9. movsr10,r5@invalidprocessor(r5=0)?
  10. beq__error_p@yes,errorp
  11. bl__lookup_machine_type@r5=machinfo
  12. /*r8指向开发板对应的arch_info记录*/
  13. movsr8,r5@invalidmachine(r5=0)?
  14. beq__error_a@yes,errora
  15. /*__vet_atags函数涉及bootloader造知kernel物理内存的情况,我们暂时不分析它。*/
  16. bl__vet_atags
  17. /*创建临时页表*/
  18. bl__create_page_tables
  19. /*
  20. *ThefollowingcallsCPUspecificcodeinapositionindependent
  21. *manner.Seearch/arm/mm/proc-*.Sfordetails.r10=baseof
  22. *xxx_proc_infostructureselectedby__lookup_machine_type
  23. *above.Onreturn,theCPUwillbereadyfortheMMUtobe
  24. *turnedon,andr0willholdtheCPUcontrolregistervalue.
  25. */
  26. /*这里的逻辑关系相当复杂,先是从proc_info结构中的中跳进__arm920_setup函数,
  27. *然后执__enable_mmu函数。最后在__enable_mmu函数通过movpc,r13来执行__switch_data,
  28. *__switch_data函数在最后一条语句,鱼跃龙门,跳进第一个C语言函数start_kernel。
  29. */
  30. ldrr13,__switch_data@addresstojumptoafter
  31. @mmuhasbeenenabled
  32. adrlr,__enable_mmu@return(PIC)address
  33. addpc,r10,#PROCINFO_INITFUNC
  34. OC(stext)


3 __lookup_processor_type 函数

__lookup_processor_type 函数是一个非常讲究技巧的函数,如果你将它领会,也将领会kernel了一些魔法。

Kernel代码将所有CPU信息的定义都放到.proc.info.init段中,因此可以认为.proc.info.init段就是一个数组,每个元素都定义了一个或一种CPU的信息。目前__lookup_processor_type使用该元素的前两个字段cpuid和mask来匹配当前CPUID,如果满足CPUID & mask == cpuid,则找到当前cpu的定义并返回。

下面是tqs3c2440开发板,CPU的定义信息,cpuid = 0x41009200,mask = 0xff00fff0。如果是码是运行在tqs3c2440开发板上,那么函数返回下面的定义:

[cpp]view plaincopy
  1. .section".proc.info.init",#alloc,#execinstr
  2. .type__arm920_proc_info,#object
  3. __arm920_proc_info:
  4. .long0x41009200
  5. .long0xff00fff0
  6. .longPMD_TYPE_SECT|\
  7. PMD_SECT_BUFFERABLE|\
  8. PMD_SECT_CACHEABLE|\
  9. PMD_BIT4|\
  10. PMD_SECT_AP_WRITE|\
  11. PMD_SECT_AP_READ
  12. .longPMD_TYPE_SECT|\
  13. PMD_BIT4|\
  14. PMD_SECT_AP_WRITE|\
  15. PMD_SECT_AP_READ
  16. /*__arm920_setup函数在stext的未尾被调用,请往回看。*/
  17. b__arm920_setup
  18. .longcpu_arch_name
  19. .longcpu_elf_name
  20. .longHWCAP_SWP|HWCAP_HALF|HWCAP_THUMB
  21. .longcpu_arm920_name
  22. .longarm920_processor_functions
  23. .longv4wbi_tlb_fns
  24. .longv4wb_user_fns
  25. #ifndefCONFIG_CPU_DCACHE_WRITETHROUGH
  26. .longarm920_cache_fns
  27. #else
  28. .longv4wt_cache_fns
  29. #endif
  30. .size__arm920_proc_info,.-__arm920_proc_info
[cpp]view plaincopy
  1. .section".proc.info.init",#alloc,#execinstr
  2. .type__arm920_proc_info,#object
  3. __arm920_proc_info:
  4. .long0x41009200
  5. .long0xff00fff0
  6. .longPMD_TYPE_SECT|\
  7. PMD_SECT_BUFFERABLE|\
  8. PMD_SECT_CACHEABLE|\
  9. PMD_BIT4|\
  10. PMD_SECT_AP_WRITE|\
  11. PMD_SECT_AP_READ
  12. .longPMD_TYPE_SECT|\
  13. PMD_BIT4|\
  14. PMD_SECT_AP_WRITE|\
  15. PMD_SECT_AP_READ
  16. /*__arm920_setup函数在stext的未尾被调用,请往回看。*/
  17. b__arm920_setup
  18. .longcpu_arch_name
  19. .longcpu_elf_name
  20. .longHWCAP_SWP|HWCAP_HALF|HWCAP_THUMB
  21. .longcpu_arm920_name
  22. .longarm920_processor_functions
  23. .longv4wbi_tlb_fns
  24. .longv4wb_user_fns
  25. #ifndefCONFIG_CPU_DCACHE_WRITETHROUGH
  26. .longarm920_cache_fns
  27. #else
  28. .longv4wt_cache_fns
  29. #endif
  30. .size__arm920_proc_info,.-__arm920_proc_info


[cpp]view plaincopy
  1. /*
  2. *ReadprocessorIDregister(CP#15,CR0),andlookupinthelinker-built
  3. *supportedprocessorlist.Notethatwecantusetheabsoluteaddresses
  4. *forthe__proc_infolistssincewearentrunningwiththeMMUon
  5. *(andtherefore,wearenotinthecorrectaddressspace).Wehaveto
  6. *calculatetheoffset.
  7. *
  8. *r9=cpuid
  9. *Returns:
  10. *r3,r4,r6corrupted
  11. *r5=proc_infopointerinphysicaladdressspace
  12. *r9=cpuid(preserved)
  13. */
  14. __lookup_processor_type:
  15. /*adr是相对寻址,它的寻计算结果是将当前PC值加上3f符号与PC的偏移量,
  16. *而PC是物理地址,因此r3的结果也是3f符号的物理地址*/
  17. adrr3,3f
  18. /*r5值为__proc_info_bein,r6值为__proc_ino_end,而r7值为.,
  19. *也即3f符号的链接地址。请注意,在链接期间,__proc_info_begin和
  20. *__proc_info_end以及.均是链接地址,也即虚执地址。
  21. */
  22. ldmdar3,{r5-r7}
  23. /*r3为3f的物理地址,而r7为3f的虚拟地址。结果是r3为虚拟地址与物理地址的差值,即PHYS_OFFSET-PAGE_OFFSET。*/
  24. subr3,r3,r7@getoffsetbetweenvirt&phys
  25. /*r5为__proc_info_begin的物理地址,即r5指针__proc_info数组的首地址*/
  26. addr5,r5,r3@convertvirtaddressesto
  27. /*r6为__proc_info_end的物理地址*/
  28. addr6,r6,r3@physicaladdressspace
  29. /*读取r5指向的__proc_info数组元素的CPUID和mask值*/
  30. 1:ldmiar5,{r3,r4}@value,mask
  31. /*将当前CPUID和mask相与,并与数组元素中的CPUID比较是否相同
  32. *若相同,则找到当前CPU的__proc_info定义,r5指向访元素并返回。
  33. */
  34. andr4,r4,r9@maskwantedbits
  35. teqr3,r4
  36. beq2f
  37. /*r5指向下一个__proc_info元素*/
  38. addr5,r5,#PROC_INFO_SZ@sizeof(proc_info_list)
  39. /*是否遍历完所有__proc_info元素*/
  40. cmpr5,r6
  41. blo1b
  42. /*找不到则返回NULL*/
  43. movr5,#0@unknownprocessor
  44. 2:movpc,lr
  45. ENDPROC(__lookup_processor_type)
  46. .long__proc_info_begin
  47. .long__proc_info_end
  48. 3:.long.
  49. .long__arch_info_begin
  50. .long__arch_info_end
[cpp]view plaincopy
  1. /*
  2. *ReadprocessorIDregister(CP#15,CR0),andlookupinthelinker-built
  3. *supportedprocessorlist.Notethatwecantusetheabsoluteaddresses
  4. *forthe__proc_infolistssincewearentrunningwiththeMMUon
  5. *(andtherefore,wearenotinthecorrectaddressspace).Wehaveto
  6. *calculatetheoffset.
  7. *
  8. *r9=cpuid
  9. *Returns:
  10. *r3,r4,r6corrupted
  11. *r5=proc_infopointerinphysicaladdressspace
  12. *r9=cpuid(preserved)
  13. */
  14. __lookup_processor_type:
  15. /*adr是相对寻址,它的寻计算结果是将当前PC值加上3f符号与PC的偏移量,
  16. *而PC是物理地址,因此r3的结果也是3f符号的物理地址*/
  17. adrr3,3f
  18. /*r5值为__proc_info_bein,r6值为__proc_ino_end,而r7值为.,
  19. *也即3f符号的链接地址。请注意,在链接期间,__proc_info_begin和
  20. *__proc_info_end以及.均是链接地址,也即虚执地址。
  21. */
  22. ldmdar3,{r5-r7}
  23. /*r3为3f的物理地址,而r7为3f的虚拟地址。结果是r3为虚拟地址与物理地址的差值,即PHYS_OFFSET-PAGE_OFFSET。*/
  24. subr3,r3,r7@getoffsetbetweenvirt&phys
  25. /*r5为__proc_info_begin的物理地址,即r5指针__proc_info数组的首地址*/
  26. addr5,r5,r3@convertvirtaddressesto
  27. /*r6为__proc_info_end的物理地址*/
  28. addr6,r6,r3@physicaladdressspace
  29. /*读取r5指向的__proc_info数组元素的CPUID和mask值*/
  30. 1:ldmiar5,{r3,r4}@value,mask
  31. /*将当前CPUID和mask相与,并与数组元素中的CPUID比较是否相同
  32. *若相同,则找到当前CPU的__proc_info定义,r5指向访元素并返回。
  33. */
  34. andr4,r4,r9@maskwantedbits
  35. teqr3,r4
  36. beq2f
  37. /*r5指向下一个__proc_info元素*/
  38. addr5,r5,#PROC_INFO_SZ@sizeof(proc_info_list)
  39. /*是否遍历完所有__proc_info元素*/
  40. cmpr5,r6
  41. blo1b
  42. /*找不到则返回NULL*/
  43. movr5,#0@unknownprocessor
  44. 2:movpc,lr
  45. ENDPROC(__lookup_processor_type)
  46. .long__proc_info_begin
  47. .long__proc_info_end
  48. 3:.long.
  49. .long__arch_info_begin
  50. .long__arch_info_end

4 __lookup_machine_type 函数

__lookup_machine_type 和__lookup_processor_type像对孪生兄弟,它们的行为都是很类似的:__lookup_machine_type根据r1寄存器的机器编号到.arch.info.init段的数组中依次查找机器编号与r1相同的记录。它使了与它孪生兄弟同样的手法进行虚拟地址到物理地址的转换计算。

在介绍函数,我们先分析tqs3c2440开发板的机器信息的定义:

[cpp]view plaincopy
  1. Arch/arm/include/asm/mach/arch.h
  2. #defineMACHINE_START(_type,_name)\
  3. staticconststructmachine_desc__mach_desc_##_type\
  4. __used\
  5. __attribute__((__section__(".arch.info.init")))={\
  6. .nr=MACH_TYPE_##_type,\
  7. .name=_name,
  8. #defineMACHINE_END\
  9. };
[cpp]view plaincopy
  1. Arch/arm/include/asm/mach/arch.h
  2. #defineMACHINE_START(_type,_name)\
  3. staticconststructmachine_desc__mach_desc_##_type\
  4. __used\
  5. __attribute__((__section__(".arch.info.init")))={\
  6. .nr=MACH_TYPE_##_type,\
  7. .name=_name,
  8. #defineMACHINE_END\
  9. };


MACHINE_START宏用于定义一个.arch.info.init段的数组元素。.nr元素就是函数要比较的变量。Tqs3c2440开发板相应的定义如下:

[cpp]view plaincopy
  1. MACHINE_START(S3C2440,"TQ2440")
  2. .phys_io=S3C2410_PA_UART,
  3. .io_pg_offst=(((u32)S3C24XX_VA_UART)>>18)&0xfffc,
  4. .boot_params=S3C2410_SDRAM_PA+0x100,
  5. .init_irq=s3c24xx_init_irq,
  6. .map_io=tq2440_map_io,
  7. .init_machine=tq2440_machine_init,
  8. .timer=&s3c24xx_timer,
  9. MACHINE_END
[cpp]view plaincopy
  1. MACHINE_START(S3C2440,"TQ2440")
  2. .phys_io=S3C2410_PA_UART,
  3. .io_pg_offst=(((u32)S3C24XX_VA_UART)>>18)&0xfffc,
  4. .boot_params=S3C2410_SDRAM_PA+0x100,
  5. .init_irq=s3c24xx_init_irq,
  6. .map_io=tq2440_map_io,
  7. .init_machine=tq2440_machine_init,
  8. .timer=&s3c24xx_timer,
  9. MACHINE_END


这是一个struct machine_desc结构,在后面的C代码(start_kernel开始执行的代码)会使用该变量对象。在tqs3c2440开发中的__lookup_machine_type函数就是返回该对象指针。

这里涉及很多函数指针,它们都是在start_kernel函数里在各种阶段进行初始化的回函数。如map_io指向的tq2440_map_io就是在建立好内核页表后,再调用它来针对开发板的各种IO端口来建立相关的映射和页表。

至于__loopup_machine_type的代码就不作详细分析,请对比__lookup_processor_type来自行分析。代码如下:

[cpp]view plaincopy
  1. /*
  2. *Lookupmachinearchitectureinthelinker-buildlistofarchitectures.
  3. *Notethatwecantusetheabsoluteaddressesforthe__arch_info
  4. *listssincewearentrunningwiththeMMUon(andtherefore,weare
  5. *notinthecorrectaddressspace).Wehavetocalculatetheoffset.
  6. *
  7. *r1=machinearchitecturenumber
  8. *Returns:
  9. *r3,r4,r6corrupted
  10. *r5=mach_infopointerinphysicaladdressspace
  11. */
  12. __lookup_machine_type:
  13. adrr3,3b
  14. ldmiar3,{r4,r5,r6}
  15. subr3,r3,r4@getoffsetbetweenvirt&phys
  16. addr5,r5,r3@convertvirtaddressesto
  17. addr6,r6,r3@physicaladdressspace
  18. 1:ldrr3,[r5,#MACHINFO_TYPE]@getmachinetype
  19. teqr3,r1@matchesloadernumber?
  20. beq2f@found
  21. addr5,r5,#SIZEOF_MACHINE_DESC@nextmachine_desc
  22. cmpr5,r6
  23. blo1b
  24. movr5,#0@unknownmachine
  25. 2:movpc,lr
  26. ENDPROC(__lookup_machine_type)
[cpp]view plaincopy
  1. /*
  2. *Lookupmachinearchitectureinthelinker-buildlistofarchitectures.
  3. *Notethatwecantusetheabsoluteaddressesforthe__arch_info
  4. *listssincewearentrunningwiththeMMUon(andtherefore,weare
  5. *notinthecorrectaddressspace).Wehavetocalculatetheoffset.
  6. *
  7. *r1=machinearchitecturenumber
  8. *Returns:
  9. *r3,r4,r6corrupted
  10. *r5=mach_infopointerinphysicaladdressspace
  11. */
  12. __lookup_machine_type:
  13. adrr3,3b
  14. ldmiar3,{r4,r5,r6}
  15. subr3,r3,r4@getoffsetbetweenvirt&phys
  16. addr5,r5,r3@convertvirtaddressesto
  17. addr6,r6,r3@physicaladdressspace
  18. 1:ldrr3,[r5,#MACHINFO_TYPE]@getmachinetype
  19. teqr3,r1@matchesloadernumber?
  20. beq2f@found
  21. addr5,r5,#SIZEOF_MACHINE_DESC@nextmachine_desc
  22. cmpr5,r6
  23. blo1b
  24. movr5,#0@unknownmachine
  25. 2:movpc,lr
  26. ENDPROC(__lookup_machine_type)

5. 为kernel建立临时页表

前面提及到,kernel里面的所有符号在链接时,都使用了虚拟地址值。在完成基本的初始化后,kernel代码将跳到第一个C语言函数start_kernl来执行,在哪个时候,这些虚拟地址必须能够对它所存放在真正内存位置,否则运行将为出错。为此,CPU必须开启MMU,但在开启MMU前,必须为虚拟地址到物理地址的映射建立相应的面表。在开启MMU后,kernel指并不马上将PC值指向start_kernl,而是要做一些C语言运行期的设置,如堆栈,重定义等工作后才跳到start_kernel去执行。在此过程中,PC值还是物理地址,因此还需要为这段内存空间建立va = pa的内存映射关系。当然,本函数建立的所有页表都会在将来paging_init销毁再重建,这是临时过度性的映射关系和页表。

在介绍__create_table_pages前,先认识一个macro pgtbl,它将KERNL_RAM_PADDR – 0x4000的值赋给rd寄存器,从下面的使用中可以看它,该值是页表在物理内存的基础,也即页表放在kernel开始地址下的16K的地方。

[cpp]view plaincopy
  1. .macropgtbl,rd
  2. ldr\rd,=(KERNEL_RAM_PADDR-0x4000)
  3. .endm
[cpp]view plaincopy
  1. .macropgtbl,rd
  2. ldr\rd,=(KERNEL_RAM_PADDR-0x4000)
  3. .endm


[cpp]view plaincopy
  1. /*
  2. *Setuptheinitialpagetables.Weonlysetupthebarest
  3. *amountwhicharerequiredtogetthekernelrunning,which
  4. *generallymeansmappinginthekernelcode.
  5. *
  6. *r8=machinfo
  7. *r9=cpuid
  8. *r10=procinfo
  9. *
  10. *Returns:
  11. *r0,r3,r6,r7corrupted
  12. *r4=physicalpagetableaddress
  13. */
  14. __create_page_tables:
  15. /*r4=KERNEL_RAM_PADDR–0x4000=0x30004000
  16. *后面的C代码中的swapper_pg_dir变量,它的值也指向0x30004000
  17. *内存地址,不过它的值是虚拟内存地址,即0xc0004000
  18. */
  19. pgtblr4@pagetableaddress
  20. /*将从r4到KERNEL_RAP_PADDR的16K页表空间清空。*/
  21. movr0,r4
  22. movr3,#0
  23. addr6,r0,#0x4000
  24. 1:strr3,[r0],#4
  25. strr3,[r0],#4
  26. strr3,[r0],#4
  27. strr3,[r0],#4
  28. teqr0,r6
  29. bne1b
  30. /*还记得r10指向开发板相应的proc_info元素吗?这里它将的mm_mmuflags值读到r7中。
  31. *PROCINFO_MM_MMUFLAGS值为8,可对应上面列出来的__arm920_proc_info结构或你相应开发板结构的值来查看该mmu_flags值。
  32. *这里的flags就是用于设置目录项的flags。查看该mmu_flags的定义,发现它是要求一级页表是section。
  33. */
  34. ldrr7,[r10,#PROCINFO_MM_MMUFLAGS]@mm_mmuflags
  35. /*
  36. *CreateidentitymappingforfirstMBofkernelto
  37. *caterfortheMMUenable.Thisidentitymapping
  38. *willberemovedbypaging_init().Weuseourcurrentprogram
  39. *countertodeterminecorrespondingsectionbaseaddress.
  40. */
  41. /*r3=((pc>>20)<<20)|r7,即取PC以1M向下对齐的地址。R6=pc>>20也即r6=0x300(pgd_idx),
  42. *即PC对所有1M内存空间,在页表中的下标。
  43. *R7值表明该目录项是section,即它映射的大小是1M。故刚好一个目录项就可以映射kernel上的1M空间。
  44. *这个暂时的va=pa映射只建立1M大小内存的,而不需要建立整个kernel镜像范围的映射。
  45. *因为这个va=pa的映射只有当前汇编语言才使用,一量跳进start_kernl后,这将不会用到了。而汇编代码在链接时,
  46. *已将它安排到代码段的最前面了。
  47. movr6,pc,lsr#20@startofkernelsection
  48. orrr3,r7,r6,lsl#20@flags+kernelbase
  49. /*将目录内空写到页表相应位置,即((uint32_t*)r4)[pgd_idx]=r3*/
  50. strr3,[r4,r6,lsl#2]@identitymapping
  51. /*上面代码段为[pc&(~0xfffff),(pc+0xfffff)&(~0xfffff)]的物理内存空间建立了va=pa的映射关系。*/
  52. /*下面为kernel镜像所占有空间,即KERNL_START到KERNEL_END建立内存映射,
  53. *映射关系为:va=pa–PHYS+PAGR_OFFSET。注意,这里的KENEL_START是kernel空间开始的虚拟地址。
  54. *这里的目录表项同样是section,即一个项映射1M的内存。
  55. */
  56. /*KERNEL_START=PAGE_OFFSET+TEXT_OFFSET,
  57. *r0=((uint32_t*)(r4))[(KERNEL_START&0xff000000)>>20],
  58. *即r0指向KERNEL_START&0xff000000(即kernel以16M向下对齐的)虚拟地址,所在项表目录中的位置。
  59. addr0,r4,#(KERNEL_START&0xff000000)>>18
  60. /*r0=((uint32_t*)r0)[(KERNEL_START&0x00f00000)>>20]
  61. *执行前r0指向kernel以16M向下对齐的虚执地址,而这里再加上KERNEL_START未以16M向对齐部分的偏移量。
  62. *将原来r3的值写到页表目录中。R3的值就是之前已建立好va=pa映射的那个PA值。
  63. */
  64. strr3,[r0,#(KERNEL_START&0x00f00000)>>18]!
  65. /*r6为kernel镜像的尾部虚拟地址。*/
  66. ldrr6,=(KERNEL_END-1)
  67. /*指向下一个即将要填写的目录项*/
  68. addr0,r0,#4
  69. /*r6指向KERNEL_END-1虚拟地址所在的目录表项的位置*/
  70. addr6,r4,r6,lsr#18
  71. 1:cmpr0,r6
  72. /*每填一个目录项,后一个比前一个所指向的物理地址大1M。*/
  73. addr3,r3,#1<<20
  74. strlsr3,[r0],#4
  75. bls1b
  76. #ifdefCONFIG_XIP_KERNEL
  77. /*忽略,不分析这种情况*/
  78. #endif
  79. /*通常kernel的启动参数由bootloader放到了物理内存的第1个M上,所以需要为RAM上的第1个M建立映射。
  80. *上面已为PHYS_OFFSET+TEXT_OFFSET建立了映射,如果TEXT_OFFSET小于0x00100000的话,
  81. *上面代码应该也为SDRAM的第一个M建立了映射,但如果大于0x0010000则不会。
  82. *所以这里无论如何均为SDRAM的第一个M建立映射(不知分析对否,还请指正)。
  83. */
  84. addr0,r4,#PAGE_OFFSET>>18
  85. orrr6,r7,#(PHYS_OFFSET&0xff000000)
  86. .if(PHYS_OFFSET&0x00f00000)
  87. orrr6,r6,#(PHYS_OFFSET&0x00f00000)
  88. .endif
  89. strr6,[r0]
  90. #ifdefCONFIG_DEBUG_LL
  91. /*略去*/
  92. #ifdefined(CONFIG_ARCH_NETWINDER)||defined(CONFIG_ARCH_CATS)
  93. /*略去*/
  94. #endif
  95. #ifdefCONFIG_ARCH_RPC
  96. /*略去*/
  97. #endif
  98. #endif
  99. movpc,lr
  100. ENDPROC(__create_page_tables)
[cpp]view plaincopy
  1. /*
  2. *Setuptheinitialpagetables.Weonlysetupthebarest
  3. *amountwhicharerequiredtogetthekernelrunning,which
  4. *generallymeansmappinginthekernelcode.
  5. *
  6. *r8=machinfo
  7. *r9=cpuid
  8. *r10=procinfo
  9. *
  10. *Returns:
  11. *r0,r3,r6,r7corrupted
  12. *r4=physicalpagetableaddress
  13. */
  14. __create_page_tables:
  15. /*r4=KERNEL_RAM_PADDR–0x4000=0x30004000
  16. *后面的C代码中的swapper_pg_dir变量,它的值也指向0x30004000
  17. *内存地址,不过它的值是虚拟内存地址,即0xc0004000
  18. */
  19. pgtblr4@pagetableaddress
  20. /*将从r4到KERNEL_RAP_PADDR的16K页表空间清空。*/
  21. movr0,r4
  22. movr3,#0
  23. addr6,r0,#0x4000
  24. 1:strr3,[r0],#4
  25. strr3,[r0],#4
  26. strr3,[r0],#4
  27. strr3,[r0],#4
  28. teqr0,r6
  29. bne1b
  30. /*还记得r10指向开发板相应的proc_info元素吗?这里它将的mm_mmuflags值读到r7中。
  31. *PROCINFO_MM_MMUFLAGS值为8,可对应上面列出来的__arm920_proc_info结构或你相应开发板结构的值来查看该mmu_flags值。
  32. *这里的flags就是用于设置目录项的flags。查看该mmu_flags的定义,发现它是要求一级页表是section。
  33. */
  34. ldrr7,[r10,#PROCINFO_MM_MMUFLAGS]@mm_mmuflags
  35. /*
  36. *CreateidentitymappingforfirstMBofkernelto
  37. *caterfortheMMUenable.Thisidentitymapping
  38. *willberemovedbypaging_init().Weuseourcurrentprogram
  39. *countertodeterminecorrespondingsectionbaseaddress.
  40. */
  41. /*r3=((pc>>20)<<20)|r7,即取PC以1M向下对齐的地址。R6=pc>>20也即r6=0x300(pgd_idx),
  42. *即PC对所有1M内存空间,在页表中的下标。
  43. *R7值表明该目录项是section,即它映射的大小是1M。故刚好一个目录项就可以映射kernel上的1M空间。
  44. *这个暂时的va=pa映射只建立1M大小内存的,而不需要建立整个kernel镜像范围的映射。
  45. *因为这个va=pa的映射只有当前汇编语言才使用,一量跳进start_kernl后,这将不会用到了。而汇编代码在链接时,
  46. *已将它安排到代码段的最前面了。
  47. movr6,pc,lsr#20@startofkernelsection
  48. orrr3,r7,r6,lsl#20@flags+kernelbase
  49. /*将目录内空写到页表相应位置,即((uint32_t*)r4)[pgd_idx]=r3*/
  50. strr3,[r4,r6,lsl#2]@identitymapping
  51. /*上面代码段为[pc&(~0xfffff),(pc+0xfffff)&(~0xfffff)]的物理内存空间建立了va=pa的映射关系。*/
  52. /*下面为kernel镜像所占有空间,即KERNL_START到KERNEL_END建立内存映射,
  53. *映射关系为:va=pa–PHYS+PAGR_OFFSET。注意,这里的KENEL_START是kernel空间开始的虚拟地址。
  54. *这里的目录表项同样是section,即一个项映射1M的内存。
  55. */
  56. /*KERNEL_START=PAGE_OFFSET+TEXT_OFFSET,
  57. *r0=((uint32_t*)(r4))[(KERNEL_START&0xff000000)>>20],
  58. *即r0指向KERNEL_START&0xff000000(即kernel以16M向下对齐的)虚拟地址,所在项表目录中的位置。
  59. addr0,r4,#(KERNEL_START&0xff000000)>>18
  60. /*r0=((uint32_t*)r0)[(KERNEL_START&0x00f00000)>>20]
  61. *执行前r0指向kernel以16M向下对齐的虚执地址,而这里再加上KERNEL_START未以16M向对齐部分的偏移量。
  62. *将原来r3的值写到页表目录中。R3的值就是之前已建立好va=pa映射的那个PA值。
  63. */
  64. strr3,[r0,#(KERNEL_START&0x00f00000)>>18]!
  65. /*r6为kernel镜像的尾部虚拟地址。*/
  66. ldrr6,=(KERNEL_END-1)
  67. /*指向下一个即将要填写的目录项*/
  68. addr0,r0,#4
  69. /*r6指向KERNEL_END-1虚拟地址所在的目录表项的位置*/
  70. addr6,r4,r6,lsr#18
  71. 1:cmpr0,r6
  72. /*每填一个目录项,后一个比前一个所指向的物理地址大1M。*/
  73. addr3,r3,#1<<20
  74. strlsr3,[r0],#4
  75. bls1b
  76. #ifdefCONFIG_XIP_KERNEL
  77. /*忽略,不分析这种情况*/
  78. #endif
  79. /*通常kernel的启动参数由bootloader放到了物理内存的第1个M上,所以需要为RAM上的第1个M建立映射。
  80. *上面已为PHYS_OFFSET+TEXT_OFFSET建立了映射,如果TEXT_OFFSET小于0x00100000的话,
  81. *上面代码应该也为SDRAM的第一个M建立了映射,但如果大于0x0010000则不会。
  82. *所以这里无论如何均为SDRAM的第一个M建立映射(不知分析对否,还请指正)。
  83. */
  84. addr0,r4,#PAGE_OFFSET>>18
  85. orrr6,r7,#(PHYS_OFFSET&0xff000000)
  86. .if(PHYS_OFFSET&0x00f00000)
  87. orrr6,r6,#(PHYS_OFFSET&0x00f00000)
  88. .endif
  89. strr6,[r0]
  90. #ifdefCONFIG_DEBUG_LL
  91. /*略去*/
  92. #ifdefined(CONFIG_ARCH_NETWINDER)||defined(CONFIG_ARCH_CATS)
  93. /*略去*/
  94. #endif
  95. #ifdefCONFIG_ARCH_RPC
  96. /*略去*/
  97. #endif
  98. #endif
  99. movpc,lr
  100. ENDPROC(__create_page_tables)

一口气将__create_pages_table分析完,但里涉及的代码还是需要细细品读。尤其是右移20位和18位两个地方与页表目录项的地址关系比较复杂。执行完该函数后,虚拟内存和物理内存的映射关系如下图所示:

6. 开启MMU

看完页表的建立,想必开启MMU的代码也是小菜一碟吧。此函数的主要功能是将页表的基址加到cp15中的面表指针寄存器,同时设置域访问(domain access)寄存器。

[cpp]view plaincopy
  1. /*
  2. *SetupcommonbitsbeforefinallyenablingtheMMU.Essentially
  3. *thisisjustloadingthepagetablepointeranddomainaccess
  4. *registers.
  5. */
  6. __enable_mmu:
  7. /*这里设置是否为非对齐内存访问产生异常*/
  8. #ifdefCONFIG_ALIGNMENT_TRAP
  9. orrr0,r0,#CR_A
  10. #else
  11. bicr0,r0,#CR_A
  12. #endif
  13. /*是否禁用数据缓存功能*/
  14. #ifdefCONFIG_CPU_DCACHE_DISABLE
  15. bicr0,r0,#CR_C
  16. #endif
  17. /*是否禁用CPU_BPREDICT?,不是很清楚此选项*/
  18. #ifdefCONFIG_CPU_BPREDICT_DISABLE
  19. bicr0,r0,#CR_Z
  20. #endif
  21. /*是否禁用指令缓存功能*/
  22. #ifdefCONFIG_CPU_ICACHE_DISABLE
  23. bicr0,r0,#CR_I
  24. #endif
  25. /*设置域访问寄存器的值。这里设置每个domain的属性是否上面建立的页表中,
  26. *每个目录项的damon值一起进行访问控制检查。具体情况请参考ARM处理器手册。
  27. */
  28. movr5,#(domain_val(DOMAIN_USER,DOMAIN_MANAGER)|\
  29. domain_val(DOMAIN_KERNEL,DOMAIN_MANAGER)|\
  30. domain_val(DOMAIN_TABLE,DOMAIN_MANAGER)|\
  31. domain_val(DOMAIN_IO,DOMAIN_CLIENT))
  32. mcrp15,0,r5,c3,c0,0@loaddomainaccessregister
  33. mcrp15,0,r4,c2,c0,0@loadpagetablepointer
  34. b__turn_mmu_on
  35. ENDPROC(__enable_mmu)
  36. /*
  37. *EnabletheMMU.Thiscompletelychangesthestructureofthevisible
  38. *memoryspace.Youwillnotbeabletotraceexecutionthroughthis.
  39. *Ifyouhaveanenquiryaboutthis,*please*checkthelinux-arm-kernel
  40. *mailinglistarchivesBEFOREsendinganotherposttothelist.
  41. *
  42. *r0=cp#15controlregister
  43. *r13=*virtual*addresstojumptouponcompletion
  44. *
  45. *otherregistersdependonthefunctioncalleduponcompletion
  46. */
  47. .align5
  48. __turn_mmu_on:
  49. movr0,r0
  50. /*将r0的值写到控制寄存器中。这里,终于开启MMU功能了。
  51. *查阅手册说控制寄存器的0位置1表示开启MMU,但这里r0的第0是多少呢(还请大家指正)
  52. */
  53. mcrp15,0,r0,c1,c0,0@writecontrolreg
  54. mrcp15,0,r3,c0,c0,0@readidreg
  55. /*这里的两个mov似乎是否流水线有关的,开启MMU语句后面几条是不能进行内存寻址的。但仍未搞明白具体东西的。*/
  56. movr3,r3
  57. movr3,r3
  58. /*转跳到r13的函数中去,r13为__mmap_switched函数的虚拟地址,
  59. *从stext函数的未尾可以找到它的赋值。故从此开始pc的值就真正在内存的虚拟地址空间了。
  60. */
  61. movpc,r13
  62. ENDPROC(__turn_mmu_on)
[cpp]view plaincopy
  1. /*
  2. *SetupcommonbitsbeforefinallyenablingtheMMU.Essentially
  3. *thisisjustloadingthepagetablepointeranddomainaccess
  4. *registers.
  5. */
  6. __enable_mmu:
  7. /*这里设置是否为非对齐内存访问产生异常*/
  8. #ifdefCONFIG_ALIGNMENT_TRAP
  9. orrr0,r0,#CR_A
  10. #else
  11. bicr0,r0,#CR_A
  12. #endif
  13. /*是否禁用数据缓存功能*/
  14. #ifdefCONFIG_CPU_DCACHE_DISABLE
  15. bicr0,r0,#CR_C
  16. #endif
  17. /*是否禁用CPU_BPREDICT?,不是很清楚此选项*/
  18. #ifdefCONFIG_CPU_BPREDICT_DISABLE
  19. bicr0,r0,#CR_Z
  20. #endif
  21. /*是否禁用指令缓存功能*/
  22. #ifdefCONFIG_CPU_ICACHE_DISABLE
  23. bicr0,r0,#CR_I
  24. #endif
  25. /*设置域访问寄存器的值。这里设置每个domain的属性是否上面建立的页表中,
  26. *每个目录项的damon值一起进行访问控制检查。具体情况请参考ARM处理器手册。
  27. */
  28. movr5,#(domain_val(DOMAIN_USER,DOMAIN_MANAGER)|\
  29. domain_val(DOMAIN_KERNEL,DOMAIN_MANAGER)|\
  30. domain_val(DOMAIN_TABLE,DOMAIN_MANAGER)|\
  31. domain_val(DOMAIN_IO,DOMAIN_CLIENT))
  32. mcrp15,0,r5,c3,c0,0@loaddomainaccessregister
  33. mcrp15,0,r4,c2,c0,0@loadpagetablepointer
  34. b__turn_mmu_on
  35. ENDPROC(__enable_mmu)
  36. /*
  37. *EnabletheMMU.Thiscompletelychangesthestructureofthevisible
  38. *memoryspace.Youwillnotbeabletotraceexecutionthroughthis.
  39. *Ifyouhaveanenquiryaboutthis,*please*checkthelinux-arm-kernel
  40. *mailinglistarchivesBEFOREsendinganotherposttothelist.
  41. *
  42. *r0=cp#15controlregister
  43. *r13=*virtual*addresstojumptouponcompletion
  44. *
  45. *otherregistersdependonthefunctioncalleduponcompletion
  46. */
  47. .align5
  48. __turn_mmu_on:
  49. movr0,r0
  50. /*将r0的值写到控制寄存器中。这里,终于开启MMU功能了。
  51. *查阅手册说控制寄存器的0位置1表示开启MMU,但这里r0的第0是多少呢(还请大家指正)
  52. */
  53. mcrp15,0,r0,c1,c0,0@writecontrolreg
  54. mrcp15,0,r3,c0,c0,0@readidreg
  55. /*这里的两个mov似乎是否流水线有关的,开启MMU语句后面几条是不能进行内存寻址的。但仍未搞明白具体东西的。*/
  56. movr3,r3
  57. movr3,r3
  58. /*转跳到r13的函数中去,r13为__mmap_switched函数的虚拟地址,
  59. *从stext函数的未尾可以找到它的赋值。故从此开始pc的值就真正在内存的虚拟地址空间了。
  60. */
  61. movpc,r13
  62. ENDPROC(__turn_mmu_on)

7.__mmap_switched函数

__mmap_switched函数专用来设置C语言的执行环境,比如重定位工作,堆栈,以及BSS段的清零。

__switch_data变量先定义了一系里面处量的数据,如重定位和数据段的地址,BSS段的地址,pocessor_id和__mach_arch_type变量的地址等。

[cpp]view plaincopy
  1. .type__switch_data,%object
  2. __switch_data:
  3. .long__mmap_switched
  4. .long__data_loc@r4
  5. .long_data@r5
  6. .long__bss_start@r6
  7. .long_end@r7
  8. .longprocessor_id@r4
  9. .long__machine_arch_type@r5
  10. .long__atags_pointer@r6
  11. .longcr_alignment@r7
  12. .longinit_thread_union+THREAD_START_SP@sp
  13. /*
  14. *ThefollowingfragmentofcodeisexecutedwiththeMMUoninMMUmode,
  15. *andusesabsoluteaddresses;thisisnotpositionindependent.
  16. *
  17. *r0=cp#15controlregister
  18. *r1=machineID
  19. *r2=atagspointer
  20. *r9=processorID
  21. */
  22. __mmap_switched:
  23. adrr3,__switch_data+4
  24. /*r4=__data_loc,r5=_data,r6=_bss_start,r7=_end*/
  25. ldmiar3!,{r4,r5,r6,r7}
  26. /*下面这段代码类似于这段C代码,即将整个数据段从__data_loc拷贝到_data段。
  27. *if(__data_loc==_data||_data!=_bass_start)
  28. *memcpy(_data,__data_loc,_bss_start-_data);
  29. */
  30. cmpr4,r5@Copydatasegmentifneeded
  31. 1:cmpner5,r6
  32. ldrnefp,[r4],#4
  33. strnefp,[r5],#4
  34. bne1b
  35. /*将BSS段,也即从_bss_start到_end的内存清零。*/
  36. movfp,#0@ClearBSS(andzerofp)
  37. 1:cmpr6,r7
  38. strccfp,[r6],#4
  39. bcc1b
  40. /*r4=processor_id,
  41. *r5=__machine_arch_type
  42. *r6=__atags_pointer
  43. *r7=cr_alignment
  44. *sp=init_thread_union+THREAD_START_SP
  45. *为什么将栈顶指针设置为init_thread_union+THREAD_START_SP
  46. *init_head_union变量是一个大小为THREAD_SIZE的union,它在编译时,放到数据段的前面。
  47. *初步估计这块空间是内核堆栈。故在跳入C语言代码时,它SP的值设置为init_thread_union+THREAD_START_SP。
  48. *注意THREAD_START_SP定义为THREAD_SIZE–8,中间为什么留出8个字节呢?是与ARM的堆栈操作有关吗?还有用专向start_kernel函数传递参数?
  49. */
  50. ldmiar3,{r4,r5,r6,r7,sp}
  51. strr9,[r4]@SaveprocessorID
  52. strr1,[r5]@Savemachinetype
  53. strr2,[r6]@Saveatagspointer
  54. bicr4,r0,#CR_A@ClearAbit
  55. /*cr_alignment变量的后面接着放置cr_no_alignment,
  56. *r0为打开alignment检测时,控制寄存器的值,而r4为关闭时的值,
  57. *这里分将将打开和关闭alignment检查的控制寄存器的值写到
  58. *cr_alignment和cr_no_alignement变量中。
  59. */
  60. stmiar7,{r0,r4}@Savecontrolregistervalues
  61. /*跳到start_kernel函数,此函数代码用纯C来实现,它会调用各个平台的相关初始化函数,
  62. *来实现不同平台的初始化工作。至此,armlinux的启动工作完成。
  63. */
  64. bstart_kernel
  65. ENDPROC(__mmap_switched)
[cpp]view plaincopy
  1. .type__switch_data,%object
  2. __switch_data:
  3. .long__mmap_switched
  4. .long__data_loc@r4
  5. .long_data@r5
  6. .long__bss_start@r6
  7. .long_end@r7
  8. .longprocessor_id@r4
  9. .long__machine_arch_type@r5
  10. .long__atags_pointer@r6
  11. .longcr_alignment@r7
  12. .longinit_thread_union+THREAD_START_SP@sp
  13. /*
  14. *ThefollowingfragmentofcodeisexecutedwiththeMMUoninMMUmode,
  15. *andusesabsoluteaddresses;thisisnotpositionindependent.
  16. *
  17. *r0=cp#15controlregister
  18. *r1=machineID
  19. *r2=atagspointer
  20. *r9=processorID
  21. */
  22. __mmap_switched:
  23. adrr3,__switch_data+4
  24. /*r4=__data_loc,r5=_data,r6=_bss_start,r7=_end*/
  25. ldmiar3!,{r4,r5,r6,r7}
  26. /*下面这段代码类似于这段C代码,即将整个数据段从__data_loc拷贝到_data段。
  27. *if(__data_loc==_data||_data!=_bass_start)
  28. *memcpy(_data,__data_loc,_bss_start-_data);
  29. */
  30. cmpr4,r5@Copydatasegmentifneeded
  31. 1:cmpner5,r6
  32. ldrnefp,[r4],#4
  33. strnefp,[r5],#4
  34. bne1b
  35. /*将BSS段,也即从_bss_start到_end的内存清零。*/
  36. movfp,#0@ClearBSS(andzerofp)
  37. 1:cmpr6,r7
  38. strccfp,[r6],#4
  39. bcc1b
  40. /*r4=processor_id,
  41. *r5=__machine_arch_type
  42. *r6=__atags_pointer
  43. *r7=cr_alignment
  44. *sp=init_thread_union+THREAD_START_SP
  45. *为什么将栈顶指针设置为init_thread_union+THREAD_START_SP
  46. *init_head_union变量是一个大小为THREAD_SIZE的union,它在编译时,放到数据段的前面。
  47. *初步估计这块空间是内核堆栈。故在跳入C语言代码时,它SP的值设置为init_thread_union+THREAD_START_SP。
  48. *注意THREAD_START_SP定义为THREAD_SIZE–8,中间为什么留出8个字节呢?是与ARM的堆栈操作有关吗?还有用专向start_kernel函数传递参数?
  49. */
  50. ldmiar3,{r4,r5,r6,r7,sp}
  51. strr9,[r4]@SaveprocessorID
  52. strr1,[r5]@Savemachinetype
  53. strr2,[r6]@Saveatagspointer
  54. bicr4,r0,#CR_A@ClearAbit
  55. /*cr_alignment变量的后面接着放置cr_no_alignment,
  56. *r0为打开alignment检测时,控制寄存器的值,而r4为关闭时的值,
  57. *这里分将将打开和关闭alignment检查的控制寄存器的值写到
  58. *cr_alignment和cr_no_alignement变量中。
  59. */
  60. stmiar7,{r0,r4}@Savecontrolregistervalues
  61. /*跳到start_kernel函数,此函数代码用纯C来实现,它会调用各个平台的相关初始化函数,
  62. *来实现不同平台的初始化工作。至此,armlinux的启动工作完成。
  63. */
  64. bstart_kernel
  65. ENDPROC(__mmap_switched)



『本文转载自网络,版权归原作者所有,如有侵权请联系删除』

热门文章 更多
楼道智能化照明系统电路设计详解