Datawhale蝴蝶書(shū)重磅出版!
文末贈(zèng)書(shū) 喜歡AI,對(duì)ChatGPT超級(jí)好奇,但被市面上爆增的大模型書(shū)籍和教學(xué)視頻弄得眼花繚亂?沒(méi)事!Datawhale團(tuán)隊(duì)最新推出的“蝴蝶書(shū)”——《ChatGPT原理與應(yīng)用開(kāi)發(fā)》來(lái)啦! 這本書(shū)源自Datawhale開(kāi)源項(xiàng)目HuggingLLM,GitHub 2K+星、B站播放量超30萬(wàn),是Datawhale在打造了“南瓜書(shū)”“蘑菇書(shū)”“熊貓書(shū)”后,推出的第4本王牌之作。
掃碼5折購(gòu)書(shū),限100人
翻開(kāi)《ChatGPT原理與應(yīng)用開(kāi)發(fā)》你會(huì)發(fā)現(xiàn),書(shū)中的內(nèi)容以實(shí)戰(zhàn)為主,不僅對(duì)相關(guān)任務(wù)有詳細(xì)的背景和系統(tǒng)設(shè)計(jì)介紹,還教你使用ChatGPT相關(guān)API創(chuàng)造新的功能和應(yīng)用,并且提供實(shí)例代碼和實(shí)現(xiàn)流程,讓每一位學(xué)習(xí)者都能做出自己的AI產(chǎn)品!
為什么創(chuàng)作這本書(shū)?
借助ChatGPT,人們可以做到現(xiàn)在大部分 NLP 工程師在做的事,比如文本分類(lèi)、實(shí)體抽取、文本推理等。甚至隨著大語(yǔ)言模型能力的不斷提升,它們可能做得比 NLP 工程師都要好。不過(guò),AI也有許多局限性,要想實(shí)現(xiàn)應(yīng)用就需要投入大量的資源和時(shí)間。其中涉及的理論多到爆炸不說(shuō),案例、代碼、實(shí)操、創(chuàng)新更是一個(gè)都不能少,搞不懂,易出錯(cuò),很多開(kāi)發(fā)者一碰就想放棄。 開(kāi)源項(xiàng)目 HuggingLLM力圖幫助人們降低門(mén)檻,縮小應(yīng)用程序和研究之間的差距,使得大模型應(yīng)用開(kāi)發(fā)變得觸手可及。HuggingLLM是一個(gè)面向非算法專(zhuān)家但具有一定編程基礎(chǔ),對(duì)人工智能和 ChatGPT(或類(lèi)似模型)感興趣的人群的開(kāi)源項(xiàng)目,旨在利用 ChatGPT API 開(kāi)發(fā)相關(guān)應(yīng)用。 所以,當(dāng)開(kāi)源項(xiàng)目HuggingLLM發(fā)布時(shí),立即獲得了來(lái)自不同領(lǐng)域的朋友們的關(guān)注與支持,目前star點(diǎn)贊2K+。 翻閱參與者在Github上提交的成功案例,我們看到:有人機(jī)協(xié)同,創(chuàng)造未來(lái)的虛擬女友;
有應(yīng)用非凡,前景無(wú)限的AI輔助自動(dòng)標(biāo)注;
有啟迪人生,提高問(wèn)商的助思者;
有模擬人生,腦洞不停的AI NPC;
......
正如項(xiàng)目名字所寓意的那樣,上萬(wàn)名參與者通過(guò)這個(gè)開(kāi)源項(xiàng)目擁抱了AI時(shí)代的變化,無(wú)障礙地使用LLM創(chuàng)造了新的價(jià)值。 這個(gè)開(kāi)源項(xiàng)目的組織者還在B站上同步更新視頻教程,播放量高達(dá)31.1W,獲得網(wǎng)友一片好評(píng)。紙書(shū)做了哪些更新?
《ChatGPT原理與應(yīng)用開(kāi)發(fā)》是基于大語(yǔ)言模型進(jìn)行商業(yè)應(yīng)用開(kāi)發(fā)的最佳實(shí)踐書(shū),更是值得你“好好上課”!初心不改
本書(shū)內(nèi)容也正如HuggingLLM最初的立項(xiàng)理由所述,主要是講基于 ChatGPT 的算法應(yīng)用和服務(wù),聚焦于自然語(yǔ)言處理的常見(jiàn)任務(wù)和應(yīng)用。它向我們介紹了如何使用類(lèi)似 ChatGPT 這樣的大語(yǔ)言模型來(lái)完成之前只有算法工程師才能處理的工作。內(nèi)容優(yōu)化
本書(shū)以實(shí)踐為主,重點(diǎn)是任務(wù)的講解和設(shè)計(jì) ,但也會(huì)科普一些自然語(yǔ)言處理算法的基本原理和基礎(chǔ)知識(shí),適合所有對(duì)大語(yǔ)言模型感興趣的開(kāi)發(fā)者閱讀。本書(shū)一共有 8 章內(nèi)容,分別如下。 第 1 章基礎(chǔ)知識(shí)—大語(yǔ)言模型背后,主要介紹了與 ChatGPT 相關(guān)的 NLP 領(lǐng)域的基礎(chǔ)知識(shí)和原理。 第 2 章相似匹配—萬(wàn)物皆可 Embedding,主要介紹了文本表示,以及與文本匹配相關(guān)的任務(wù)和應(yīng)用。 第 3 章句詞分類(lèi)—句子 Token 都是類(lèi)別,主要介紹了 NLP 領(lǐng)域最常見(jiàn)的任務(wù)——分類(lèi)。 第 4 章文本生成—超越理解更智能,主要介紹了與文本生成技術(shù)相關(guān)的任務(wù)。 第 5 章復(fù)雜推理—更加像人一樣思考,主要介紹了如何使用大語(yǔ)言模型做復(fù)雜的邏輯推理任務(wù)。 第 6 章工程實(shí)踐—真實(shí)場(chǎng)景大不同,主要介紹了如何在真實(shí)業(yè)務(wù)中使用大語(yǔ)言模型。 第 7 章局限與不足—工具不是萬(wàn)能的,主要介紹了 ChatGPT(或其他類(lèi)似的大語(yǔ)言模型)的缺陷或不擅長(zhǎng)的地方,包括事實(shí)性錯(cuò)誤、實(shí)時(shí)更新、性能瓶頸等方面。 第 8 章商業(yè)應(yīng)用—LLM 是星辰大海,可以把該章當(dāng)作一篇調(diào)研報(bào)告來(lái)閱讀,主要針對(duì)工具應(yīng)用和行業(yè)應(yīng)用兩大方面展開(kāi),期望能夠給讀者更多啟迪,幫助大家構(gòu)思更好的應(yīng)用或服務(wù)。 這本書(shū)由郝少春、黃玉琳、易華揮三位作者在HuggingLLM教程內(nèi)容之上優(yōu)化而成。郝少春
· 某AI大語(yǔ)言模型公司的算法工程師,Datawhale成員;
· 擁有7年算法和工程架構(gòu)經(jīng)驗(yàn)及豐富的項(xiàng)目和產(chǎn)品經(jīng)歷,涉及文本、音頻、視頻、圖像等多種模態(tài)。
黃玉琳
· 上海財(cái)經(jīng)大學(xué)碩士,京東算法工程師,Datawhale成員;
· 從事智能供應(yīng)鏈領(lǐng)域的算法研究及應(yīng)用工作;
· 主要研究方向?yàn)闄C(jī)器學(xué)習(xí)、自然語(yǔ)言處理、運(yùn)籌優(yōu)化。
易華揮
· 四川大學(xué)華西醫(yī)院生物大數(shù)據(jù)中心的科研助理,Datawhale成員;
· 主要研究方向?yàn)槎嗄B(tài)表征學(xué)習(xí)及其在醫(yī)學(xué)影像分析中的應(yīng)用;
· 發(fā)表頂會(huì)論文3篇。
大咖推薦,口碑保證!
這本書(shū)一經(jīng)推出,就受到了吳飛、周明、朱信忠、金耀輝、張俊林5位人工智能領(lǐng)域?qū)<业挠H筆推薦!“這本書(shū)是由Datawhale所推出的力作,秉承了Datawhale‘為了學(xué)習(xí)者’的一貫理念,基于志愿者團(tuán)隊(duì)精彩的開(kāi)源學(xué)習(xí)內(nèi)容精心編纂而成,深入淺出地介紹大語(yǔ)言模型的原理和工程實(shí)踐,對(duì)于初學(xué)者了解ChatGPT非常有幫助!”
——吳飛,浙江大學(xué)人工智能研究所所長(zhǎng)
“書(shū)中內(nèi)容圍繞自然語(yǔ)言處理任務(wù)展開(kāi),很多設(shè)計(jì)思路和細(xì)節(jié)其實(shí)可以應(yīng)用到多個(gè)領(lǐng)域。期望讀者多學(xué)多練,能夠在實(shí)踐中提升自我。”
——周明,瀾舟科技創(chuàng)始人兼CEO,創(chuàng)新工場(chǎng)首席科學(xué)家
“這本書(shū)雖然以ChatGPT作為示例,但絕大部分內(nèi)容都可以無(wú)縫切換為其他大語(yǔ)言模型。這得益于本書(shū)基于以‘自然語(yǔ)言處理算法任務(wù)’為核心的設(shè)計(jì)理念,因而這本書(shū)具有更長(zhǎng)的生命周期。”
——朱信忠,浙江師范大學(xué)人工智能研究院副院長(zhǎng),浙江省特級(jí)專(zhuān)家,Datawhale首席科學(xué)家
“這本書(shū)以明晰而簡(jiǎn)潔的文字,闡述了大語(yǔ)言模型的工作原理,堪稱(chēng)杰作。更為可貴的是,書(shū)中還詳細(xì)介紹了ChatGPT的工程實(shí)施策略。”
——金耀輝,上海交通大學(xué)人工智能研究院總工程師、教授
“這是一本有關(guān)大語(yǔ)言模型應(yīng)用和服務(wù)的實(shí)踐指導(dǎo)書(shū),詳細(xì)介紹了如何開(kāi)發(fā)基于大語(yǔ)言模型算法的應(yīng)用和服務(wù)。這本書(shū)注重實(shí)際任務(wù)的設(shè)計(jì)及實(shí)現(xiàn)的思路講解,并提供了對(duì)自然語(yǔ)言處理基礎(chǔ)知識(shí)和算法原理的科普性介紹。”
——張俊林,新浪微博新技術(shù)研發(fā)負(fù)責(zé)人
▲ 滑動(dòng)查看更多 通過(guò)上面的介紹以及各位專(zhuān)家的推薦,相信讀者應(yīng)該對(duì)這本書(shū)有了初步了解。下面小異再具體說(shuō)說(shuō)如何更好地使用本書(shū)。如何閱讀本書(shū)?
第一,讀者可以先行了解第1章進(jìn)行一個(gè)科普入門(mén)。
書(shū)籍后面的內(nèi)容根據(jù)內(nèi)容規(guī)模和難度,講解順序重新排列為:相似匹配、句詞分類(lèi)、文本生成、復(fù)雜推理......讀者可以按部就班地學(xué)習(xí),也可以根據(jù)自己的興趣選擇任意章節(jié)進(jìn)行學(xué)習(xí)。因?yàn)楦髡鹿?jié)相對(duì)獨(dú)立,彼此沒(méi)有直接明顯的前后依賴(lài)關(guān)系,在學(xué)習(xí)時(shí)可以靈活調(diào)整。
第二,以“任務(wù)”為核心。
本書(shū)注重“任務(wù)”多于“工具” ,雖然ChatGPT 是目前大語(yǔ)言模型領(lǐng)域總體效果最好的,但未來(lái)一定會(huì)有其他更好的大語(yǔ)言模型出現(xiàn)。書(shū)中詳細(xì)介紹了與NLP相關(guān)的任務(wù)(如相似匹配、句詞分類(lèi)、文本生成、復(fù)雜推理)的背景和系統(tǒng)設(shè)計(jì),這些方法也適用于其他大模型。只要讀者理解了要做的事情,理解了系統(tǒng)設(shè)計(jì),工具就能為我們所用。第三,利用好本書(shū)內(nèi)容、提供的思維導(dǎo)圖、GitHub開(kāi)源項(xiàng)目HuggingLLM、B站視頻課程等各種資源,來(lái)全方位地助力自己的學(xué)習(xí)與實(shí)踐。
· GitHub開(kāi)源項(xiàng)目HuggingLLM鏈接是datawhalechina/hugging-llm: HuggingLLM, Hugging Future. (github.com)
· B站視頻課程鏈接是學(xué)會(huì)如何使用大模型,讓創(chuàng)意有能力落地成應(yīng)用:HuggingLLM,Hugging未來(lái)_嗶哩嗶哩_bilibili
第四,一定要親自動(dòng)手完成一個(gè)應(yīng)用或服務(wù)的 Demo!
你可以在書(shū)中找到詳細(xì)的示例代碼,稍做修改后就可以在實(shí)際環(huán)境中使用。光看不做在編程領(lǐng)域是絕對(duì)行不通的,只是想想或者口頭上說(shuō)與親自動(dòng)手完全是兩回事。萬(wàn)事開(kāi)頭難,但一旦完成了第一個(gè)項(xiàng)目,后面再做類(lèi)似的就會(huì)相對(duì)容易一些。所以大膽地實(shí)操吧! 另外要說(shuō)明的是,這本書(shū)不是特別為算法或者自然語(yǔ)言處理工程師等行業(yè)人員設(shè)計(jì)的。當(dāng)然,如果你是NLP工程師,也可以通過(guò)這本書(shū)受益。這本書(shū)更適合以下人員:
· 對(duì)ChatGPT感興趣的人;
· 希望實(shí)際運(yùn)用這項(xiàng)技術(shù)來(lái)創(chuàng)造新的服務(wù)或者解決現(xiàn)有問(wèn)題的人;
· 有一定編程基礎(chǔ)的人。
結(jié)語(yǔ)
本書(shū)的封面上有一幅幅蝴蝶圖案,這是因?yàn)樽髡邆兿嘈?span style="color:rgb(14,172,157);">人工智能將會(huì)涌現(xiàn)出更多美麗的形態(tài),恰如蝴蝶從蛹中蛻變一樣,這也寓意希望讀者閱讀本書(shū)后將有嶄新的領(lǐng)悟。趕緊拿起這本“蝴蝶書(shū)”,開(kāi)啟你的全新認(rèn)知之旅吧!
▼▼▼
滑動(dòng)查看更多
DataWhale好書(shū)推薦
01
機(jī)器學(xué)習(xí)公式詳解 第2版
02
pandas數(shù)據(jù)處理與分析
本書(shū)基于pandas官方推薦的中文教程“Joyful Pandas”編寫(xiě),是以實(shí)戰(zhàn)為中心的pandas教程。
本書(shū)基于作者自身學(xué)習(xí)pandas的切身經(jīng)驗(yàn),在對(duì)pandas龐雜內(nèi)容的主線認(rèn)真梳理之后,他整理出一條由淺入深、適合初學(xué)者的學(xué)習(xí)路線。本書(shū)能讓初學(xué)者擺脫常規(guī)學(xué)習(xí)pandas的痛苦,從核心概念開(kāi)始學(xué)習(xí),理解函數(shù)之間的邏輯關(guān)系,建立起數(shù)據(jù)處理的宏觀體系,真正快樂(lè)地學(xué)會(huì)pandas。
03
Easy RL 強(qiáng)化學(xué)習(xí)教程
同樣出自Datawhale的“蘑菇書(shū)”《Easy RL 強(qiáng)化學(xué)習(xí)教程》是一本真真切切的學(xué)霸筆記,三位作者王琦、楊毅遠(yuǎn)、江季分別是中國(guó)科學(xué)院大學(xué)、清華大學(xué)、北京大學(xué)的相關(guān)專(zhuān)業(yè)碩士研究生。
作者把自己學(xué)習(xí)強(qiáng)化學(xué)習(xí)過(guò)程中的想法、思路、難點(diǎn)、技巧等整理成教程,分享給更多的人,通過(guò)數(shù)千人的使用學(xué)習(xí)獲取反饋再仔細(xì)作補(bǔ)充與修改,經(jīng)過(guò)一年多的持續(xù)優(yōu)化,最終形成了這本“蘑菇書(shū)”。
—END—
分享你對(duì)“蝴蝶書(shū)”的看法
在留言區(qū)參與互動(dòng),分享你學(xué)習(xí)使用ChatGPT的經(jīng)驗(yàn),我們將選3名讀者分別獲得蝴蝶書(shū)1本,截止時(shí)間3月5日中午12點(diǎn)。
