類似 ChatGPT 的人工智能即將出現(xiàn)在主要科學(xué)搜索引擎中數(shù)據(jù)派THU關(guān)注共 2969字,需瀏覽 6分鐘 ·2023-08-09 03:00 來源:ScienceAI 本文約1700字,建議閱讀5分鐘 用戶是否可以簡單地將機(jī)器人的段落復(fù)制并粘貼到自己的論文中,從而有效地抄襲該工具? 人工智能驅(qū)動的會話式聊天機(jī)器人已經(jīng)出現(xiàn)在互聯(lián)網(wǎng)搜索引擎中,例如谷歌的 Bard 和微軟的 Bing,看起來也將越來越多地改變科學(xué)文獻(xiàn)搜索方式。8 月 1 日,荷蘭出版巨頭 Elsevier 為其 Scopus 數(shù)據(jù)庫的部分用戶發(fā)布了由 ChatGPT 支持的 AI 界面,而英國公司 Digital Science 則宣布對其 Dimensions 數(shù)據(jù)庫進(jìn)行 AI 大語言模型 (LLM) 助手的封閉試驗(yàn)。與此同時,美國 Clarivate 公司表示,它也在努力將 LLM 納入其 Web of Science 數(shù)據(jù)庫。 用于科學(xué)搜索的 LLM 并不新鮮:Elicit、Scite 和 Consensus 等初創(chuàng)公司已經(jīng)擁有此類人工智能系統(tǒng),有助于總結(jié)某個領(lǐng)域的發(fā)現(xiàn)或識別頂尖研究,依靠免費(fèi)的科學(xué)數(shù)據(jù)庫或(在 Scite 的例子中)通過與出版商合作獲得付費(fèi)研究文章。但擁有大型科學(xué)摘要和參考文獻(xiàn)專有數(shù)據(jù)庫的公司現(xiàn)在也加入了人工智能熱潮。 負(fù)責(zé)該工具開發(fā)的 Elsevier 駐倫敦高管 Maxim Khan 表示,Elsevier 的聊天機(jī)器人名為 Scopus AI,作為試點(diǎn)推出,旨在作為一種輕便、有趣的工具,幫助研究人員快速獲得他們不熟悉的研究主題的摘要。為了回答自然語言問題,機(jī)器人使用 LLM GPT-3.5 版本返回有關(guān)研究主題的流暢摘要段落,以及引用的參考文獻(xiàn)和要探索的進(jìn)一步問題。 對于搜索(尤其是科學(xué)搜索)的 LLM 的一個擔(dān)憂是它們不可靠。LLM 無法理解他們所寫的文字;它們的工作方式很簡單,就是吐出風(fēng)格上合理的詞語。正如學(xué)者們很快發(fā)現(xiàn)的那樣,他們的輸出可能包含事實(shí)錯誤和偏見,并且可能會編造不存在的參考資料。 因此,Scopus AI 受到限制:它只能通過參考五到十份研究摘要來生成答案。人工智能本身不會找到這些摘要:相反,在用戶輸入查詢后,傳統(tǒng)搜索引擎會返回與問題相關(guān)的摘要,Khan 解釋道。 虛假事實(shí) 關(guān)注人工智能搜索工具的新加坡管理大學(xué)(Singapore Management University)圖書館員 Aaron Tay 指出,許多其他人工智能搜索引擎系統(tǒng)也采用了類似的策略。這有時被稱為檢索增強(qiáng)生成,因?yàn)?LLM 僅限于總結(jié)另一個搜索引擎檢索的相關(guān)信息?!窵LM 仍然偶爾會產(chǎn)生幻覺或編造故事?!筎ay 說道,他指的是對互聯(lián)網(wǎng)搜索人工智能聊天機(jī)器人的研究,例如 Bing 和 Perplexity,它們使用類似的技術(shù)。 Elsevier 將其人工智能產(chǎn)品限制為僅搜索 2018 年以來發(fā)表的文章,以獲取最近的論文,并指示其聊天機(jī)器人在回復(fù)中適當(dāng)引用返回的摘要,從而避免不安全或惡意查詢,并說明收到的摘要中是否沒有相關(guān)信息。這不能避免錯誤,但可以最大限度地減少錯誤。Elsevier 還通過為機(jī)器人的「溫度」選擇較低的設(shè)置來降低其人工智能的不可預(yù)測性——這是一種衡量機(jī)器人在響應(yīng)中選擇偏離最合理詞語的頻率的指標(biāo)。 用戶是否可以簡單地將機(jī)器人的段落復(fù)制并粘貼到自己的論文中,從而有效地抄襲該工具?Khan 說,這是有可能的。他說,到目前為止, Elsevier 已經(jīng)通過指導(dǎo)來解決這個問題,要求研究人員負(fù)責(zé)任地使用這些摘要。Khan 指出,資助者和出版商也發(fā)布了類似的指導(dǎo)意見,要求透明披露 LLM 是否用于撰寫論文或進(jìn)行同行評審,或者在某些情況下聲明根本不應(yīng)該使用 LLM。 目前,該工具僅向大約 15,000 名用戶(Scopus 訂閱者的一部分)推出。Elsevier 表示預(yù)計將于 2024 年初全面推出。 全文分析 同樣在 8 月 1 日,Digital Science 宣布為其大型 Dimensions 科學(xué)數(shù)據(jù)庫推出人工智能助手,目前僅適用于選定的 Beta 測試人員。與 Scopus AI 不同,用戶輸入問題后,搜索引擎首先檢索相關(guān)文章,然后 Open AI GPT 模型圍繞已檢索到的排名靠前的摘要生成摘要段落。 「非常相似,有趣的是。」該公司首席產(chǎn)品官 Christian Herzog 說。(Digital Science 隸屬于 Holtzbrinck 出版集團(tuán),該集團(tuán)是《Nature》雜志出版商 Springer Nature 的大股東。) Dimensions 還利用 LLM 提供有關(guān)相關(guān)論文的更多詳細(xì)信息,包括其研究結(jié)果的簡短改寫摘要。 Herzog 表示,該公司希望在今年年底之前更廣泛地發(fā)布其工具,但目前正在與科學(xué)家、資助者和其他使用 Dimensions 的人合作,從而測試 LLM 可能在哪些方面有效——這還有待觀察?!高@是為了逐漸適應(yīng)新技術(shù)并建立信任?!顾f。 Tay 表示,他期待能夠在論文全文(而不僅僅是摘要)上使用 LLM 的工具。他指出,Elicit 等網(wǎng)站已經(jīng)允許用戶使用 LLM 來回答有關(guān)論文全文的詳細(xì)問題——當(dāng)機(jī)器人可以訪問它時,就像一些開放獲取的文章一樣。 與此同時,Clarivate 的「academia and government segment」負(fù)責(zé)人 Bar Veinstein 表示,該公司「正在致力于在 Web of Science 中添加LLM支持的搜索」,指的是有兩家公司于 6 月份宣布與以色列特拉維夫 AI21 Labs 簽署的戰(zhàn)略合作伙伴關(guān)系。然而,Veinstein 沒有給出基于 LLM 的 Web of Science 工具的發(fā)布時間表。 相關(guān)報道: https://www.nature.com/articles/d41586-023-02470-3 編輯:文婧 瀏覽 118點(diǎn)贊 評論 收藏 分享 手機(jī)掃一掃分享分享 舉報 評論圖片表情視頻評價全部評論推薦 CSS :is() 和 :where() 即將出現(xiàn)在瀏覽器中前端下午茶0Txtai人工智能驅(qū)動的搜索引擎Txtai 是一個人工智能驅(qū)動的搜索引擎,可以在文本的各個部分上建立了一個 AI 驅(qū)動的索引。 txTxtai人工智能驅(qū)動的搜索引擎Txtai是一個人工智能驅(qū)動的搜索引擎,可以在文本的各個部分上建立了一個AI驅(qū)動的索引。txtai支持構(gòu)建文本索引以執(zhí)行相似性搜索并創(chuàng)建基于問-答的系統(tǒng)。此外,txtai還具有用于zero-shot分ChatGPT:微軟人工智能Office和電郵即將登場...Mix Lab味知實(shí)驗(yàn)室0liqe類似 Lucene 的解析器和搜索引擎liqe是一個輕量級和高性能的類似Lucene的解析器和搜索引擎。Usageimport{filter,highlight,parse,test,}from'liqe';constpersons=[{liqe類似 Lucene 的解析器和搜索引擎liqe 是一個輕量級和高性能的類似 Lucene 的解析器和搜索引擎。Usageimport { 科學(xué)的極致:漫談人工智能集智俱樂部是一個從事學(xué)術(shù)研究、享受科學(xué)樂趣的探索者組成的團(tuán)體,倡導(dǎo)以平等開放的態(tài)度、科學(xué)實(shí)證的精神進(jìn)科學(xué)的極致:漫談人工智能科學(xué)的極致:漫談人工智能0ChatGPT 會取代搜索引擎嗎杰哥的IT之旅0ChatGPT: 讀懂人工智能新紀(jì)元 ChatGPT: 讀懂人工智能新紀(jì)元 0點(diǎn)贊 評論 收藏 分享 手機(jī)掃一掃分享分享 舉報