如何把「知乎」的文章優(yōu)雅的收割下來,形成自己的知識庫!


知乎文章 和 手動收藏
「知乎」是一個大型的在線知識庫,涉獵之廣,出乎想象。
雖然近幾年來,知乎的「重心」一直下移,有不少話題下的帖子質(zhì)量幾乎和「貼吧」接近,但盡管如此,知乎上面仍舊沉淀了大量 有用的經(jīng)驗 或 專業(yè)的知識。
無論我要腦外科這種的專業(yè)冷門的知識,還是買手機電腦這種大眾的參考性意見,「知乎」都能給出至少可啟發(fā)的答案, 當然其中也含有不少「無厘頭」「抖機靈」「軟廣告」的文章需要我們分別。
因此,就像收集知乎文章一樣,如果要收集這些網(wǎng)上良莠不齊的知識,我們可以:
(1)簡單粗暴的用腳本爬取文章
(2)通過我們甄別篩選,有選擇的手動收藏。
火箭君傾向于方法(2),雖然會麻煩一點,但是收藏不在于數(shù)量,在于質(zhì)量。少而精的知識摘要,遠遠勝過幾萬篇從來不看一眼的囤積文章。
今天我們不講如何甄別篩選優(yōu)秀的文章,這種事情因人而異,不同的人有不同的價值觀和收集目的,難有定論。我們今天單單講講,如果我看中了一篇網(wǎng)上文章(以「知乎」為例),我們?nèi)绾胃咝У膶⑺詹氐阶约旱哪抑?/strong>。
先說一下,如果我們已經(jīng)安裝了第三方插件,例如:印象筆記·剪藏
那么可以方便的一鍵同步「知乎」網(wǎng)頁到云筆記或者云端收藏夾里。

如果,我們 不想把收藏的知識放在 第三方的云端,只想把文章保存到自己本地或者內(nèi)部網(wǎng)絡上。 可以參考下面的辦法:
網(wǎng)頁轉(zhuǎn)存
火箭君對轉(zhuǎn)存的要求很簡單,文章的存在是為了將來可以參考查看,不是囤積在那里自嗨。所以網(wǎng)頁轉(zhuǎn)存下來后要變成 單一文件 方便傳輸歸類管理。這個文件必須是:
格式透明
內(nèi)容是公開格式而且可檢索的,不要長截圖,不要專有格式(類似那種paper文獻的專有格式),純文本配圖片最好。
可本地保存
文件最好可本地保存,如果不能也要可以方便的導出到本地,不要動不動就鎖死在XX云盤上。(尤其是累積到一定量之后,會有很大的取出風險)
所以,最直接的方案就是:
1. 保存為 mhtml
mhtml就是網(wǎng)頁文件,不過將圖片和文字等信息打包在一起。
在瀏覽頁面時,使用 CTRL+S 保存網(wǎng)頁.
保存時,就可選擇 mhtml 格式。這樣,就能把網(wǎng)頁,包括里面的圖片,都變成單一文件存儲,方便我們歸檔。

2. 轉(zhuǎn)為 PDF 保存
無論是 Windows 還是 macOS 只要有較新版本的Chrome瀏覽器,都可以直接將網(wǎng)頁打印到PDF保存,不過網(wǎng)頁內(nèi)容繁雜的話,還要加裝去廣告插件。PDF是標準格式,閱讀友好,便于打印。 基于PDF,后面還會提到版式調(diào)節(jié)。
瀏覽器中,在網(wǎng)頁上直接 Ctrl+P(打印網(wǎng)頁) 即可

如果是微軟系的瀏覽器或Office,一般還會有微軟的 打印到PDF選項。
這種做法很簡單,只要打印網(wǎng)頁時,選擇一個 支持PDF輸出的 「虛擬打印機」即可。

Save as PDF
Microsoft Print to PDF
這兩個虛擬打印機 都可以
另外,這個PDF轉(zhuǎn)存的方法有額外的好處,例如:
可以只保存選中部分
可以只保存 1-3頁
可調(diào)節(jié) 保存時的 PDF 每頁的大?。ㄆ鋵嵕褪翘摂M打印的用紙規(guī)格)
總的來說,PDF轉(zhuǎn)存是個比較靈活的方案。
優(yōu)雅的轉(zhuǎn)存
直接保存和打印下來的文件當中,會夾雜不少 廣告,或者無關的導航內(nèi)容,這些內(nèi)容可能會增加以后閱讀的負擔。因此在收藏時就把它們?nèi)コ赡苁亲罾硐氲摹?/span>
簡單方法就是,安裝一些去廣告插件,或者采用類似「簡悅」之類的網(wǎng)頁閱讀插件。
火箭君自己的經(jīng)驗是,如果有 Windows10 自帶的 Edge 瀏覽器,就可以省心很多了。
我們看看怎么收集「知乎」網(wǎng)頁的。
第一步
打開Edge,連上「知乎」,找到答案。 例如:我們想收集一篇「前額葉」的文章(別問我什么是「前額葉」,我也不知道?。?/span>

特別注意的是,有些知乎回答下面會顯示「展開閱讀全文」,務必要點擊「展開」后,再進行后面的保存操作,否則存下來的就真的只有展開前的那個文章片段了。
另外,文章很長,圖片很多的話,務必完整看一遍,知乎里面圖片采用的是「懶加載」,只有我們頁面上瀏覽到了,這些圖片才會真的被加載進網(wǎng)頁里面來。對于我們來說,圖片只有加載進來才能保存下來,否則即使保存下來也是一個空洞的框框而已。
第二步
點擊「沉浸式閱讀模式」(如果沒有出現(xiàn)這個沉浸式閱讀模式的圖標,請看下一步)

可以看到無關內(nèi)容已經(jīng)被去除,只留下正文,而且排版非常適合閱讀。

第三步
如果沒有「閱讀模式」也可考慮轉(zhuǎn)到移動設備模式,一般移動設備版面下,許多額外的頁面導航欄目會被去除,便于手機小屏幕查看內(nèi)容。
在網(wǎng)頁上 CTRL+SHIFT+I, 出現(xiàn)瀏覽器調(diào)試窗口。
然后點擊下面的圖標按鈕

點擊上述按鈕后,會有一個設備尺寸列表可選。選擇后,網(wǎng)頁的頁面布局也會發(fā)生變化(有時需要F5刷新)。 一般會使得文章更加便于閱讀。

第四步
確認版式后,就可以按照上面所說的基本方法, 打印到 PDF 或者 轉(zhuǎn)存到 mhtml 。收工!

隨著從「知乎」或者其它地方收藏下來的資料文件越來越多,我們很快就需要能把它放到不同的文件夾里分門別類的進行保管或歸檔了。至于如何高效管理這些收藏,我們下次再做詳細介紹。
火箭君建議,大家或許可以試試我們的自研產(chǎn)品 「tagLyst Next」。
tagLyst Next 專注于給 PDF/Word/Excel 等各種文件加上 標簽,方便我們進行知識管理。

— 【 THE END 】— 本公眾號全部博文已整理成一個目錄,請在公眾號里回復「m」獲??! 3T技術資源大放送!包括但不限于:Java、C/C++,Linux,Python,大數(shù)據(jù),人工智能等等。在公眾號內(nèi)回復「1024」,即可免費獲?。?!
