3 個(gè)令人驚艷的 GitHub 開(kāi)源項(xiàng)目,誕生了!
“
閱讀本文大概需要 5 分鐘。

2023 上半年在科技圈中,隨著 ChatGPT 的面世,讓 AI 領(lǐng)域這個(gè)看似沉浸已久的科技行業(yè),重新回到了人們的視野中。各種 AI 工具層出不窮,無(wú)數(shù)網(wǎng)友驚嘆技術(shù)進(jìn)步之快。
作為目前擁有諸多開(kāi)發(fā)者受眾的技術(shù)社區(qū),GitHub 在過(guò)去這段時(shí)間,也陸陸續(xù)續(xù)誕生了不少實(shí)用的 AI 工具。
這些工具都有著相同的特點(diǎn),簡(jiǎn)單易用且高效,主打一個(gè)新奇亮眼,順便解放你的個(gè)人生產(chǎn)力。
今天就給大家推薦幾個(gè) GitHub 上比較熱門的 AI 工具,讓大家體驗(yàn)一下人工智能的神器與強(qiáng)大之處。
AI 生成專屬頭像
去年 Midjourney 和 Stable Diffusion 這兩款 AI 繪畫(huà)神器一經(jīng)發(fā)布,讓諸多專業(yè)攝影師、設(shè)計(jì)師、藝術(shù)創(chuàng)作者都倍感震撼。大家都沒(méi)想到,能夠搶自己飯碗的,不是同行,而是 AI。
那些經(jīng) AI 之手創(chuàng)作的圖像,藝術(shù)風(fēng)格極具創(chuàng)意且逼真形象。當(dāng)中有一些作品,甚至還拿到了藝術(shù)博覽會(huì)的冠軍,或賣到了 40 萬(wàn)美元的高價(jià)。
隨著今年這波 AI 風(fēng)口的興起,讓這兩款神器再次走進(jìn)人們的視野,但與上次不同的是,這次很多普通網(wǎng)友都開(kāi)始上手學(xué)習(xí),并參與創(chuàng)作,再利用工具能力進(jìn)行變現(xiàn)。
前陣子有不少朋友幫人做 AI 頭像專屬定制,也能時(shí)不時(shí)賺幾杯奶茶錢。
其實(shí)想做頭像定制,也沒(méi)那么難,今天給大家推薦一個(gè)在 GitHub 上開(kāi)源的 AI 工具:Photoshot。
用戶將自己的個(gè)人頭像上傳后,可借助 Stable Diffusion 模型進(jìn)行訓(xùn)練,并生成一款擁有不同風(fēng)格的個(gè)人頭像。
GitHub:https://github.com/shinework/photoshot
該項(xiàng)目在 GitHub 上開(kāi)源半年多,里面用到的一些技術(shù)棧,放到今天,依然不會(huì)過(guò)時(shí)。下面我整理一下,供大家參考學(xué)習(xí):
-
Next.js 開(kāi)發(fā) webapp;
-
Chakra UI 開(kāi)發(fā) UI 組件;
-
Prisma 作為數(shù)據(jù)庫(kù);
-
Replicate 機(jī)器學(xué)習(xí)模型云托管平臺(tái);
-
Stripe OpenAI 聯(lián)合創(chuàng)始人做的第三方支付;
-
Stable Diffusion 當(dāng)下最為流行的文生圖開(kāi)源模型;
AI 一鍵實(shí)現(xiàn)圖像處理
今年 Meta 在 GitHub 開(kāi)源 Segment Anything Model(SAM)以后,圖像領(lǐng)域真正做到了「萬(wàn)物皆可分割」,開(kāi)發(fā)者處理圖像分割任務(wù)的流程進(jìn)一步簡(jiǎn)化,成本大幅下降。
作為計(jì)算機(jī)視覺(jué)中尤為重要的一個(gè)研究方向,圖像分割在近幾年一直倍受業(yè)界關(guān)注。現(xiàn)在技術(shù)已經(jīng)足夠成熟,我們也能做出更多有趣的 AI 應(yīng)用。
比如結(jié)合圖像分割與圖像處理,讓 AI 實(shí)現(xiàn)照片水印去除,老照片一鍵修復(fù),圖像中的物品對(duì)象替換等等。
今天給大家推薦一款開(kāi)源的圖像修復(fù)工具:Lama Cleaner,基于 SOTA AI 模型構(gòu)建,功能頗為齊全。
該工具可用于快速去除圖像中各種物品、人物、字體、水印等對(duì)象,并支持老照片修復(fù)、文本替換圖像內(nèi)容等。
GitHub:https://github.com/Sanster/lama-cleaner
項(xiàng)目免費(fèi)開(kāi)源,支持自托管。如果擔(dān)心數(shù)據(jù)隱私安全的話,可以把項(xiàng)目托管到自己的服務(wù)器上,讓數(shù)據(jù) under control。
另外,該工具還內(nèi)置了插件系統(tǒng),如果機(jī)器配置跟得上,你可以往里面再集成一些類似 RealESRGAN(生成高分辨率圖像)、GFPGAN(人臉修復(fù))等開(kāi)源模型,為工具增添更多功能。這整得就跟開(kāi)菜館一樣,豐儉由人
。
AI 實(shí)現(xiàn)視頻自動(dòng)剪切
近幾年,短視頻的風(fēng)口一直在持續(xù),各大社交網(wǎng)站也都針對(duì)短視頻流量進(jìn)行大力扶持。身邊陸陸續(xù)續(xù)有朋友從大廠離職,加入自媒體行業(yè),大多首選的內(nèi)容創(chuàng)作類型,便是短視頻。
短視頻制作流程,一般主要分為制定主題、腳本構(gòu)思、素材拍攝、視頻剪輯。其中視頻剪輯對(duì)技術(shù)要求頗高,不過(guò)一旦熟練掌握,不少流程也能實(shí)現(xiàn)自動(dòng)化。
曾任亞馬遜首席科學(xué)家的李沐老師,從兩三年前便開(kāi)始在 B 站授課,向大眾科普 AI 技術(shù)知識(shí),拆解主流論文中的技術(shù)實(shí)現(xiàn)原理與應(yīng)用方向。
在此過(guò)程中,他根據(jù)自己的視頻剪輯需求,隨手做出了一款視頻剪輯工具:AutoCut,可通過(guò)字幕快速剪切視頻,現(xiàn)已開(kāi)源至 GitHub。
該工具支持自動(dòng)生成字幕,用戶無(wú)需使用視頻編輯軟件,僅需編輯文本文件,即可完成剪切。

GitHub:https://github.com/mli/autocut
項(xiàng)目采用的是 OpenAI 開(kāi)源的自動(dòng)化語(yǔ)音識(shí)別(ASR)系統(tǒng),使用從網(wǎng)絡(luò)收集的 68 萬(wàn)小時(shí)的多語(yǔ)言和多任務(wù)監(jiān)督數(shù)據(jù)進(jìn)行訓(xùn)練。
它能夠根據(jù)視頻語(yǔ)音,自動(dòng)批量化生成字幕文件,其中英文語(yǔ)音的生成質(zhì)量最高。
利用 Whisper 能夠自動(dòng)生成字幕的視頻,對(duì)一些空白字幕內(nèi)容配合腳本,進(jìn)行視頻自動(dòng)剪切,便能夠節(jié)省很多視頻剪輯的時(shí)間。
以上,就是本期為大家推薦的幾個(gè) GitHub 項(xiàng)目,希望對(duì)大家有所幫助。
End
歡迎大家加入【ChatGPT&AI 變現(xiàn)圈】,零門檻掌握 AI 神器!我們帶你從小白到高手,解鎖智能問(wèn)答、自動(dòng)化創(chuàng)作、技術(shù)變現(xiàn)的無(wú)限可能。與我們共同成長(zhǎng),開(kāi)啟 AI 新征程!立即行動(dòng),未來(lái)已來(lái)!(詳情請(qǐng)戳:知識(shí)星球:ChatGPT&AI 變現(xiàn)圈,正式上線!)
掃碼加入: 
