<kbd id="afajh"><form id="afajh"></form></kbd>
<strong id="afajh"><dl id="afajh"></dl></strong>
    <del id="afajh"><form id="afajh"></form></del>
        1. <th id="afajh"><progress id="afajh"></progress></th>
          <b id="afajh"><abbr id="afajh"></abbr></b>
          <th id="afajh"><progress id="afajh"></progress></th>

          Linux物理內(nèi)存初始化

          共 5121字,需瀏覽 11分鐘

           ·

          2020-10-12 10:15


          背景

          1. Kernel版本:4.14

          2. ARM64處理器,Contex-A53,雙核

          3. 使用工具:Source Insight 3.5, Visio

          1. 介紹

          讓我們思考幾個(gè)樸素的問(wèn)題?

          1. 系統(tǒng)是怎么知道物理內(nèi)存的?

          2. 在內(nèi)存管理真正初始化之前,內(nèi)核的代碼執(zhí)行需要分配內(nèi)存該怎么處理?

          我們先來(lái)嘗試回答第一個(gè)問(wèn)題,看過(guò)dts文件的同學(xué)應(yīng)該見(jiàn)過(guò)memory的節(jié)點(diǎn),以arch/arm64/boot/dts/freescale/fsl-ls208xa.dtsi為例:

          	memory@80000000 {		device_type = "memory";		reg = <0x00000000 0x80000000 0 0x80000000>;		      /* DRAM space - 1, size : 2 GB DRAM */	};

          這個(gè)節(jié)點(diǎn)描述了內(nèi)存的起始地址及大小,事實(shí)上內(nèi)核在解析dtb文件時(shí)會(huì)去讀取該memory節(jié)點(diǎn)的內(nèi)容,從而將檢測(cè)到的內(nèi)存注冊(cè)進(jìn)系統(tǒng)。

          那么新的問(wèn)題又來(lái)了?Uboot會(huì)將kernel imagedtb拷貝到內(nèi)存中,并且將dtb物理地址告知kernelkernel需要從該物理地址上讀取到dtb文件并解析,才能得到最終的內(nèi)存信息,dtb的物理地址需要映射到虛擬地址上才能訪(fǎng)問(wèn),但是這個(gè)時(shí)候paging_init還沒(méi)有調(diào)用,也就是說(shuō)物理地址的映射還沒(méi)有完成,那該怎么辦呢?沒(méi)錯(cuò),Fixed map機(jī)制出現(xiàn)了。

          第二個(gè)問(wèn)題答案:當(dāng)所有物理內(nèi)存添加進(jìn)系統(tǒng)后,在mm_init之前,系統(tǒng)會(huì)使用memblock模塊來(lái)對(duì)內(nèi)存進(jìn)行管理。

          開(kāi)啟探索之旅吧!

          2. early_fixmap_init

          簡(jiǎn)單來(lái)說(shuō),Fixed map指的是虛擬地址中的一段區(qū)域,在該區(qū)域中所有的線(xiàn)性地址是在編譯階段就確定好的,這些虛擬地址需要在boot階段去映射到物理地址上。?

          來(lái)張圖片看看虛擬地址空間:

          圖中fixed: 0xffffffbefe7fd000 - 0xffffffbefec00000,描述的就是Fixed map的區(qū)域。

          那么這段區(qū)域中的詳細(xì)一點(diǎn)的布局是怎樣呢?看看arch/arm64/include/asm/fixmap.h中的enum fixed_address結(jié)構(gòu)就清晰了,圖來(lái)了:

          從圖中可以看出,如果要訪(fǎng)問(wèn)DTB所在的物理地址,那么需要將該物理地址映射到Fixed map中的區(qū)域,然后訪(fǎng)問(wèn)該區(qū)域中的虛擬地址即可。訪(fǎng)問(wèn)IO空間也是一樣的道理,下文也會(huì)講述到。

          那么來(lái)看看early_fixmap_init函數(shù)的關(guān)鍵代碼吧:

          void __init early_fixmap_init(void){	pgd_t *pgd;	pud_t *pud;	pmd_t *pmd;	unsigned long addr = FIXADDR_START;              /* (1) */
          pgd = pgd_offset_k(addr); /* (2) */ if (CONFIG_PGTABLE_LEVELS > 3 && !(pgd_none(*pgd) || pgd_page_paddr(*pgd) == __pa_symbol(bm_pud))) { /* * We only end up here if the kernel mapping and the fixmap * share the top level pgd entry, which should only happen on * 16k/4 levels configurations. */ BUG_ON(!IS_ENABLED(CONFIG_ARM64_16K_PAGES)); pud = pud_offset_kimg(pgd, addr); } else { if (pgd_none(*pgd)) __pgd_populate(pgd, __pa_symbol(bm_pud), PUD_TYPE_TABLE); /* (3) */ pud = fixmap_pud(addr); } if (pud_none(*pud)) __pud_populate(pud, __pa_symbol(bm_pmd), PMD_TYPE_TABLE); /* (4) */ pmd = fixmap_pmd(addr); __pmd_populate(pmd, __pa_symbol(bm_pte), PMD_TYPE_TABLE); /* (5) */......}

          關(guān)鍵點(diǎn):

          1. FIXADDR_START,定義了Fixed map區(qū)域的起始地址,位于arch/arm64/include/asm/fixmap.h中;

          2. pgd_offset_k(addr),獲取addr地址對(duì)應(yīng)pgd全局頁(yè)表中的entry,而這個(gè)pgd全局頁(yè)表正是swapper_pg_dir全局頁(yè)表;

          3. bm_pud的物理地址寫(xiě)到pgd全局頁(yè)目錄表中;

          4. bm_pmd的物理地址寫(xiě)到pud頁(yè)目錄表中;

          5. bm_pte的物理地址寫(xiě)到pmd頁(yè)表目錄表中;

          bm_pud/bm_pmd/bm_pte是三個(gè)全局?jǐn)?shù)組,相當(dāng)于是中間的頁(yè)表,存放各級(jí)頁(yè)表的entry,定義如下:

          static pte_t bm_pte[PTRS_PER_PTE] __page_aligned_bss;static pmd_t bm_pmd[PTRS_PER_PMD] __page_aligned_bss __maybe_unused;static pud_t bm_pud[PTRS_PER_PUD] __page_aligned_bss __maybe_unused;

          事實(shí)上,early_fixmap_init只是建立了一個(gè)映射的框架,具體的物理地址和虛擬地址的映射沒(méi)有去填充,這個(gè)是由使用者具體在使用時(shí)再去填充對(duì)應(yīng)的pte entry。比如像fixmap_remap_fdt()函數(shù),就是典型的填充pte entry的過(guò)程,完成最后的一步映射,然后才能讀取dtb文件。

          來(lái)一張圖片就懂了,是透徹的懂了:

          3. early_ioremap_init

          如果在boot早期需要操作IO設(shè)備的話(huà),那么ioremap就用上場(chǎng)了,由于跟實(shí)際的內(nèi)存管理關(guān)系不太大,不再太深入的分析。

          簡(jiǎn)單來(lái)說(shuō),ioremap的空間為7 * 256K的區(qū)域,保存在slot_vir[]數(shù)組中,當(dāng)需要進(jìn)行IO操作的時(shí)候,最終會(huì)調(diào)用到__early_ioremap函數(shù),在該函數(shù)中去填充對(duì)應(yīng)的pte entry,從而完成最終的虛擬地址和物理地址的映射。

          4. memblock

          上文講的內(nèi)容都只是鋪墊,為了能正確訪(fǎng)問(wèn)DTB文件并且解析得到物理地址信息。從入口到最終添加的調(diào)用過(guò)程如下圖:

          所以,這個(gè)章節(jié)的重點(diǎn)就是memblock模塊,這個(gè)是早期的內(nèi)存分配管理器,我不禁想起了之前在Nuttx中的內(nèi)存池實(shí)現(xiàn)了,細(xì)節(jié)已然不太清晰了,但是框架性的思維都大同小異。

          4.1 結(jié)構(gòu)體


          總共由三個(gè)數(shù)據(jù)結(jié)構(gòu)來(lái)描述:

          • struct memblock定義了一個(gè)全局變量,用來(lái)維護(hù)所有的物理內(nèi)存;

          • struct memblock_type代表系統(tǒng)中的內(nèi)存類(lèi)型,包括實(shí)際使用的內(nèi)存和保留的內(nèi)存;

          • struct memblock_region用來(lái)描述具體的內(nèi)存區(qū)域,包含在struct memblock_type中的regions數(shù)組中,最多可以存放128個(gè)。

          直接上個(gè)代碼吧:

          static struct memblock_region memblock_memory_init_regions[INIT_MEMBLOCK_REGIONS] __initdata_memblock;static struct memblock_region memblock_reserved_init_regions[INIT_MEMBLOCK_REGIONS] __initdata_memblock;#ifdef CONFIG_HAVE_MEMBLOCK_PHYS_MAPstatic struct memblock_region memblock_physmem_init_regions[INIT_PHYSMEM_REGIONS] __initdata_memblock;#endif
          struct memblock memblock __initdata_memblock = { .memory.regions = memblock_memory_init_regions, .memory.cnt = 1, /* empty dummy entry */ .memory.max = INIT_MEMBLOCK_REGIONS, .memory.name = "memory",
          .reserved.regions = memblock_reserved_init_regions, .reserved.cnt = 1, /* empty dummy entry */ .reserved.max = INIT_MEMBLOCK_REGIONS, .reserved.name = "reserved",
          #ifdef CONFIG_HAVE_MEMBLOCK_PHYS_MAP .physmem.regions = memblock_physmem_init_regions, .physmem.cnt = 1, /* empty dummy entry */ .physmem.max = INIT_PHYSMEM_REGIONS, .physmem.name = "physmem",#endif
          .bottom_up = false, .current_limit = MEMBLOCK_ALLOC_ANYWHERE,};

          定義的memblock為全局變量,在定義的時(shí)候就進(jìn)行了初始化。初始化的時(shí)候,regions指向的也是靜態(tài)全局的數(shù)組,其中數(shù)組的大小為INIT_MEMBLOCK_REGIONS,也就是128個(gè),限制了這些內(nèi)存塊的個(gè)數(shù)了,實(shí)際在代碼中可以看到,當(dāng)超過(guò)這個(gè)數(shù)值時(shí),數(shù)組會(huì)以2倍的速度動(dòng)態(tài)擴(kuò)大。

          初始化完了后,大體是這個(gè)樣子的:

          4.2 memblock_add/memblock_remove

          memblock子模塊,基本的邏輯都是圍繞內(nèi)存的添加和移除操作來(lái)展開(kāi),最終是通過(guò)調(diào)用memblock_add_range/memblock_remove_range來(lái)實(shí)現(xiàn)的。

          • memblock_add_range

          圖中的左側(cè)是函數(shù)的執(zhí)行流程圖,執(zhí)行效果是右側(cè)部分。右側(cè)部分畫(huà)的是一個(gè)典型的情況,實(shí)際的情況可能有多種,但是核心的邏輯都是對(duì)插入的region進(jìn)行判斷,如果出現(xiàn)了物理地址范圍重疊的部分,那就進(jìn)行split操作,最終對(duì)具有相同flagregion進(jìn)行merge操作。

          • memblock_remove_range

          該函數(shù)執(zhí)行的一個(gè)典型case效果如下圖所示:假如現(xiàn)在需要移除掉一片區(qū)域,而該區(qū)域跨越了多個(gè)region,則會(huì)先調(diào)用memblock_isolate_range來(lái)對(duì)這片區(qū)域進(jìn)行切分,最后再調(diào)用memblock_isolate_range對(duì)區(qū)域范圍內(nèi)的region進(jìn)行移除操作。

          當(dāng)調(diào)用memblock_alloc函數(shù)進(jìn)行地址分配時(shí),最后也是調(diào)用memblock_add_range來(lái)實(shí)現(xiàn)的,申請(qǐng)的這部分內(nèi)存最終會(huì)添加到reserved類(lèi)型中,畢竟已經(jīng)分配出去了,其他人也不應(yīng)該使用了。

          5. arm64_memblock_init

          當(dāng)物理內(nèi)存都添加進(jìn)系統(tǒng)之后,arm64_memblock_init會(huì)對(duì)整個(gè)物理內(nèi)存進(jìn)行整理,主要的工作就是將一些特殊的區(qū)域添加進(jìn)reserved內(nèi)存中。函數(shù)執(zhí)行完后,如下圖所示:

          • 其中淺綠色的框表示的都是保留的內(nèi)存區(qū)域, 剩下的部分就是可以實(shí)際去使用的內(nèi)存了。

          物理內(nèi)存大體面貌就有了,后續(xù)就需要進(jìn)行內(nèi)存的頁(yè)表映射,完成實(shí)際的物理地址到虛擬地址的映射了。



          #推薦閱讀:
          ? ??專(zhuān)輯|Linux文章匯總
          ? ??專(zhuān)輯|程序人生
          ? ??專(zhuān)輯|C語(yǔ)言


          嵌入式Linux
          微信掃描二維碼,關(guān)注我的公眾號(hào)?
          瀏覽 46
          點(diǎn)贊
          評(píng)論
          收藏
          分享

          手機(jī)掃一掃分享

          分享
          舉報(bào)
          評(píng)論
          圖片
          表情
          推薦
          點(diǎn)贊
          評(píng)論
          收藏
          分享

          手機(jī)掃一掃分享

          分享
          舉報(bào)
          <kbd id="afajh"><form id="afajh"></form></kbd>
          <strong id="afajh"><dl id="afajh"></dl></strong>
            <del id="afajh"><form id="afajh"></form></del>
                1. <th id="afajh"><progress id="afajh"></progress></th>
                  <b id="afajh"><abbr id="afajh"></abbr></b>
                  <th id="afajh"><progress id="afajh"></progress></th>
                  最近日韩中文字幕中文翻译歌词 | 亚洲欧美大香蕉 | 国产无码福利在线视频 | 美女国产一区二区 | 日本成人激情视频 |