計算機科班學(xué)習(xí) OS 的正確姿勢!
大家好,我是小北。
今天單獨討論下,如何學(xué)習(xí)操作系統(tǒng)這個話題。
操作系統(tǒng)發(fā)展到今天,已經(jīng)非常復(fù)雜了,像 Windows、Linux 任意一個都是幾千萬行代碼級別,想靠個人完全搞懂,幾乎是不可能的了。
所以需要先明確一下我們學(xué)習(xí)的目的,不同的學(xué)習(xí)目的,適用不同的方法,這里我僅僅列一下作為一名開發(fā)人員,我們掌握 OS 的幾種目標(biāo):
第一種:
知曉 OS 基本概念:看在線課程原理部分的視頻或者看《現(xiàn)代操作系統(tǒng)》之類的書,可大致知道OS的概念;
第二種:
理解OS基本原理: 在1的基礎(chǔ)上,完成與 OS 相關(guān)的課程練習(xí)題,可進一步理解 OS 基本原理,練習(xí)題可以參考學(xué)堂在線清華OS課程的練習(xí)題:

第三種:
掌握 OS 部分核心功能實現(xiàn)(細(xì)節(jié)):在 2 的基礎(chǔ)上,能夠通過編程完成類似 ?xv6 的幾個 lab ,
比如 xv6 就會涉及以下模塊:
Booting a PC Memory Management Multitasking File system, Spawn and Shell Network Driver
每個模塊代碼量都不會很多,但是麻雀雖小,五臟俱全,通過自己動手實現(xiàn) thread、spinlock、semaphore 這些東西,會讓你理解更加深刻。
當(dāng)然,在往上走就是去研究最新 Linux Kernel,研究一些子模塊了,有些還需要閱讀最新的 System 領(lǐng)域論文。
最新的 Linux Kernel ?里有很多新的算法、研究結(jié)果不斷的加入。
當(dāng)然,這就超出了我所能掌握的范疇了哈哈。
不過說實話,如果你還在校大二大三,我真的墻裂建議你去做一些國外的計算機 lab,比如OS、Network。
等到畢業(yè)了,幾乎就不太可能從頭開始系統(tǒng)學(xué)習(xí)那些基礎(chǔ)知識了,除非你能自己閉關(guān)兩三年,啥也不做,待在一個地方專心修煉。
好好珍惜在學(xué)校大把的空閑時間,做一些讓在專業(yè)上讓自己受益一生的事情。
這里我可以列舉幾個,國內(nèi)不少喜歡 System 的同學(xué)都會去跟 MIT、CMU、UCB 這些計算機名校的課程。
比如 MIT 的 6.824 Distributed System、6.830 Database Systems、MIT 6.828 Operating System Engineering .....
xv6
6.828 就是今天要介紹的主角:
MIT6.828:Operating System Engineering
官網(wǎng)主頁:https://pdos.csail.mit.edu/6.828/2020/index.html
在官網(wǎng),包含了Schedule、Labs、xv6-book 等等。
尤其是 xv6-lab 包含了操作系統(tǒng)中最為核心的模塊:

每個模塊都搭好了框架,留下最為核心的部分給我們?nèi)崿F(xiàn),你可以把這個看做一種「完形填空」:
System Call、Page tables Traps Lazy allocation、Copy On-Write Multithreading、Lock File System、mmpa network driver
如果想看視頻的話可以去 Youtube 或者 B站:
MIT 6.828: Operating System Engineering :https://www.bilibili.com/video/BV1px411E7ST
ucore
如果你想找一個國內(nèi)的類似 xv6 的 lab,那么這里推薦清華大學(xué) ucore OS。
它其實也是起源于MIT CSAIL PDOS課題組開發(fā)的 xv6 & jos、哈佛大學(xué)開發(fā)的 OS161教學(xué)操作系統(tǒng)、以及Linux-2.4 內(nèi)核。
然后清華的老師在這個基礎(chǔ)上,增加、調(diào)整了一些代碼,為清華大學(xué) OS 課程設(shè)計的一個lab。
另外,這個課程的很多資料、文檔都是中文的,還有清華老師的配套視頻課程。
清華大學(xué)-操作系統(tǒng):https://www.xuetangx.com/course/THU08091000267/5883104
順便推薦幾本經(jīng)典的書籍吧:
書名(英文):Operating Systems : Design and Implementation (3rd Edition)
書名(中文):操作系統(tǒng):設(shè)計及實現(xiàn) (第三版)
原作者:Andrew S. Tanenbaum / Albert S. Woodhull
翻譯者:王鵬、尤晉元、朱鵬、敖青云
Operating System (操作系統(tǒng))
書名(英文):Operating System Concepts (7th Edition)
書名(中文):操作系統(tǒng)概念 (第七版)
原作者:Abraham Silberschatz / Peter Baer Galvin / Greg Gagne
另外還有諸如《現(xiàn)代操作系統(tǒng)》、《Operating Systems: Three Easy Pieces》之類的。
尤其是 《Operating Systems: Three Easy Pieces》,閱讀體驗比較好,討論問題由淺入深。
而書名也是很有意思,Three Easy Piece是為了致敬費曼的關(guān)于物理學(xué)的書籍:《Six Easy Pieces: Essentials Of Physics Explained By Its Most Brilliant Teacher》。
用作者的話說,操作系統(tǒng)只有物理學(xué)一半難,那就叫 《Three Easy Pieces》好了。
Three 也是指代本書三個部分:
虛擬化(Virtualization) 并發(fā)(Concurrency) 持久化(Persistence)
操作系統(tǒng)這門課,易學(xué)難精,但是掌握到日常編程和面試夠用還是比較容易的。
那么畢業(yè)生或者說你去準(zhǔn)備校招面試應(yīng)該達到怎樣的水平:
OS 四大模塊的理論知識: 進程與線程管理、內(nèi)存管理、IO與文件系統(tǒng)、設(shè)備管理 了解 Linux 內(nèi)核部分實現(xiàn)原理,如內(nèi)存管理、進程管理、虛擬文件系統(tǒng)等 了解和熟悉常用的系統(tǒng)調(diào)用已經(jīng) System API
其中內(nèi)存、進程、IO 是重點,這幾塊也是和編程關(guān)系最密切的,這里推薦先挑本偏理論的書看看,了解操作系統(tǒng)的全貌:
《現(xiàn)代操作系統(tǒng)》 《操作系統(tǒng)—精髓與設(shè)計原理》
不必全看,兩者任選一本都不錯,我自己是仔細(xì)看了第二本,因為是我們教材,同時挑著看了現(xiàn)代操作系統(tǒng)部分章節(jié)。
操作系統(tǒng)包含的知識
這部分看完你應(yīng)該對下面這些話題有一個清晰認(rèn)知了:
操作系統(tǒng)由哪些構(gòu)成 進程的狀態(tài)、切換、調(diào)度 進程間通信方式(共享內(nèi)存、管道、消息) 進程和線程的區(qū)別 線程的實現(xiàn)方式(一對一、多對一等) 互斥與同步(信號量、管程、鎖) 死鎖檢測與避免 并發(fā)經(jīng)典的問題:讀者寫者、哲學(xué)家就餐問題 為什么需要虛擬內(nèi)存,MMU 具體如何做地址轉(zhuǎn)換的 內(nèi)存為什么分段、分頁 頁面置換算法 文件系統(tǒng)是如何組織的 虛擬文件系統(tǒng)(VFS)是如何抽象的 ...
但是這還不夠,看完偏理論的書,當(dāng)面試官問「進程和線程的區(qū)別」時。
大概只能回答出「進程是資源分配的最小單位,線程是CPU調(diào)度的最小單位,balabala...」這樣正確卻普通的答案。
但是如果你了解 Linux 內(nèi)核的實現(xiàn),就可以實際出發(fā),講講 Linux 中進程和線程是如何創(chuàng)建的,區(qū)別在哪里。
比如在 Linux 中進程和線程實際上都是用一個結(jié)構(gòu)體 task_struct來表示一個執(zhí)行任務(wù)的實體。進程創(chuàng)建調(diào)用fork 系統(tǒng)調(diào)用,而線程創(chuàng)建則是 pthread_create 方法,但是這兩個方法最終都會調(diào)用到 do_fork 來做具體的創(chuàng)建操作 ,區(qū)別就在于傳入的參數(shù)不同。
深究下去,你會發(fā)現(xiàn) Linux 實現(xiàn)線程的方式簡直太巧妙了,實際上根本沒有線程,它創(chuàng)建的就是進程,只不過通過參數(shù)指定多個進程之間共享某些資源(如虛擬內(nèi)存、頁表、文件描述符等),函數(shù)調(diào)用棧、寄存器等線程私有數(shù)據(jù)則獨立。
這樣是不是非常符合理論書上的定義:同一進程內(nèi)的多個線程共享該進程的資源,但線程并不擁有資源,只是使用他們。
這也算符合 Unix 的哲學(xué)了— KISS(Keep It Simple, Stupid)。
但是在其它提供了專門線程支持的系統(tǒng)中,則會在進程控制塊(PCB)中增加一個包含指向該進程所有線程的指針,然后再每個線程中再去包含自己獨占的資源。
這算是非常正統(tǒng)的實現(xiàn)方式了,比如 Windows 就是這樣干的。
但是相比之下 Linux 就顯得取巧很多,也很簡潔。
對于進程、線程這塊你還可以把 fork、vfork、clone 、pthread_create 這些模塊關(guān)系徹底搞清楚,對你理解 Linux 下的進程實現(xiàn)有非常大的幫助。
說了這么多,就是想強調(diào)一下理論聯(lián)系實際的重要性。
特別是操作系統(tǒng),最好的實踐就是看下 Linux 內(nèi)核是怎么實現(xiàn)的,當(dāng)然不是叫你直接去啃 Linux 源碼,那不是一般人能掌握的。
最好的方式是看書,書的脈絡(luò)給你理得很清晰。
書籍推薦:
《Linux內(nèi)核設(shè)計與實現(xiàn)》
這本書恰到好處,即講清楚了內(nèi)核實現(xiàn)的要點,又不會通篇源碼。
這本書重點關(guān)注「第 3 章進程管理」、「第 5 章系統(tǒng)調(diào)用」、「第12章內(nèi)存管理」、「第13章虛擬文件系統(tǒng)」、「第 15 章進程地址空間」
這些章節(jié)屬于操作系統(tǒng)核心部分,其它如中斷處理、塊 IO、設(shè)備管理根據(jù)你自己興趣選擇看下就可以了。
基本上做到這里,操作系統(tǒng)就沒什么大問題了。
自制OS
另外,如果你還想自己寫一個(模仿) mini os,那么你需要一些前置依賴知識,否則估計會被很多硬件、匯編知識勸退:
筑基內(nèi)功-- 需要學(xué)習(xí)計算機原理、C語言(需要熟練運用)、數(shù)據(jù)結(jié)構(gòu)課程 工欲善其事,必先利其器,掌握以下Linux 下常用命令行:
pwd、cd、find等,1-2 款趁手的編輯器,推薦掌握 vim 的基本操作
gcc、gdb、ld、make等編譯構(gòu)建鏈、objdump、nm、readif、dd 等 ELF 文件分析、燒錄工具。
這里只推薦一本我看過的書《操作系統(tǒng)真象還原》,作者實在太好了,所有需要前置依賴的部分他都會簡單的寫個教程,照著這本書就能擼一個屬于自己的 os。

這部分大家感興趣就自己去看好了,在公眾號發(fā)自制 OS 文章,我覺得不太合適,因為實在太多細(xì)節(jié)了,公眾號不適合做這樣的教程。
截取其中一部分讀者也會看得云里霧里,純碎作者自嗨。
關(guān)于自制 OS 后面可以單獨寫一篇文章~
好了,自學(xué) OS 部分就到這里了。
大家周末愉快~
記得幫我點個贊和在看喲~
