<kbd id="afajh"><form id="afajh"></form></kbd>
<strong id="afajh"><dl id="afajh"></dl></strong>
    <del id="afajh"><form id="afajh"></form></del>
        1. <th id="afajh"><progress id="afajh"></progress></th>
          <b id="afajh"><abbr id="afajh"></abbr></b>
          <th id="afajh"><progress id="afajh"></progress></th>

          SIGIR 2020最佳論文公布,清華大學(xué)攬多個獎項,大三學(xué)生摘得最佳短論文獎

          共 8041字,需瀏覽 17分鐘

           ·

          2020-07-30 16:06



          ??新智元報道??

          來源:智源研究院

          編輯:白峰

          【新智元導(dǎo)讀】7月29日晚,第43屆國際 「信息檢索研究與發(fā)展」?年會(SIGIR - The International ACM SIGIR Conference on Research and Development in Information Retrieval)最佳論文正式公布。


          本屆會議最佳論文獎由康奈爾大學(xué)Thorsten Joachims團(tuán)隊獲得,共同一作是Marco Morik和Ashudeep Singh。

          清華大學(xué)本次獲得了多個獎項:最佳論文榮譽提名獎由清華大學(xué)張帆(一作)等獲得,智源學(xué)者劉奕群也是作者之一;兩個最佳短論文獎也都被清華大學(xué)摘取,第一作者分別是常健新和于是。值得一提的是,于是目前是大三學(xué)生,智源學(xué)者劉知遠(yuǎn)是指導(dǎo)老師之一。

          作為 CCF 推薦的 A 類國際學(xué)術(shù)會議,SIGIR 歷來都是互聯(lián)網(wǎng)業(yè)內(nèi)關(guān)注的焦點,會議覆蓋了信息檢索領(lǐng)域相關(guān)的各類前沿成果,包括基礎(chǔ)理論、算法應(yīng)用以及評估分析。本屆SIGIR 2020(會議官網(wǎng):https://sigir.org/sigir2020/)于7月25日-30日在線上召開,通過智源社區(qū)向全球同步直播(點擊「閱讀原文」觀看回放)。
          ?? ? ??? ? ? ?
          本次會議共收到論文投稿總數(shù) 1180?篇,總共錄取 340?篇。其中,長文投稿555 篇,最終錄用 147 篇,錄用率約 26%;短文投稿507 篇,最終錄用 152 篇,錄取率約 30%。這是SIGIR繼2011年于北京刷新該會議論文投稿記錄后,時隔9年回到中國,投稿量和錄取率再創(chuàng)新高。來自 32 個國家的 1221 名作者為錄用論文做出了貢獻(xiàn)。


          ?最佳論文獎
          ?? ? ? ?? ? ? ?
          論文:Controlling Fairness and Bias in Dynamic Learning-to-Rank

          論文地址:https://sigir-schedule.baai.ac.cn/poster/fp0069

          本文作者:Marco Morik, Ashudeep Singh, Jessica Hong, Thorsten Joachims。其中Thorsten Joachims教授是康奈爾大學(xué)計算機系的教授,ACM Fellow,多年致力于無偏排序(unbiased ranking)的研究,在數(shù)據(jù)挖掘相關(guān)的頂級會議如KDD、SIGIR、WWW、WSDM、CIKM發(fā)表多篇相關(guān)著作,其中很多工作都頗具影響力,比如發(fā)表在SIGIR 2005上的Accurately interpreting clickthrough data as implicit feedback可以稱得上是無偏排序的開山之作之一。
          ?
          論文介紹:
          ?

          排序算法在很多在線平臺將用戶和項目(比如新聞產(chǎn)品音樂等)進(jìn)行匹配,在用戶和項目雙邊考慮中,用戶不僅評估排序算法的效益,而且排序算法本身也影響了項目提供端(比如出版商)的效益(比如曝光度)。目前的排序算法中并沒有考慮到在項目提供端的效益?;谶@些考慮,本文提出了顯性的基于組(比如相同出版商出版的文章)的公平排序算法。在保證公平的同時,本文的算法可以有效的優(yōu)化排序算法的效果。

          ?
          具體來說,本文主要研究了動態(tài)學(xué)習(xí)排序算法,在算法設(shè)計中,有兩個點需要重點考慮:一是排序系統(tǒng)本身會造成偏差(bias),這是由于排序高的項目可以獲得更多的反饋,這樣會造成這次排序高的項目在下次排序中排序也會高(richer-get-richer)。

          ? ? ? ?
          偏差示意圖(排序越高反饋越多)

          二是排序系統(tǒng)本身是曝光度裁決者的身份,會直接影響曝光度和項目提供端相關(guān)收入,所以在排序過程中,需要考慮項目的公平性(fairness),比如項目曝光度(exposure)需要相關(guān)度(relevance)正比。
          ?? ? ??公平性示意圖(圖中左右排序項目的曝光度與相關(guān)度并不是正比的,所以是不公平的)

          出于這種考慮,為了解決偏差問題,本文建立一個基于IPS(Inverse propensity weighting)的非偏估計機制(unbiased estimator)來估計文檔的條件相關(guān)度,這種非偏估計機制可以根據(jù)有偏的點擊,估計無偏的條件相關(guān)度。為了解決動態(tài)排序中的公平問題,本文采用了P-controller(proportional controller)的形式,動態(tài)地調(diào)整排序策略,使得之前曝光程度不夠的文檔能夠得到更有效的曝光。該方法被證明可以在平均相關(guān)度估計收斂的情況下,使得不同組間曝光度-相關(guān)度比例的差距以一定的比例收斂到零。為了驗證提出算法的魯棒性和效果,作者分別在半生成的新聞數(shù)據(jù)集和真實的電影數(shù)據(jù)集上進(jìn)行了實驗驗證。該算法不僅可以取得良好的排序效果和公平性,并且非常高效,容易實現(xiàn)。下圖為本文提出算法和線性規(guī)劃算法的比較。
          ?? ?實驗結(jié)果圖(左圖排序算法表現(xiàn),右圖公平表現(xiàn))

          整理:上海交通大學(xué) 張偉楠副教授
          博士生晉嘉睿、戴心儀


          ?最佳論文榮譽提名獎

          ? ? ? ?? ?

          論文:Models Versus Satisfaction: Towards a Better Understanding of Evaluation Metrics

          論文地址:https://sigir-schedule.baai.ac.cn/poster/fp0128
          ?
          這篇文章作者來自清華大學(xué)計算機系,作者包括張帆,毛佳昕,劉奕群,謝曉暉,馬為之,張敏,馬少平等人。
          ?
          論文介紹:
          ?
          搜索評價一直都是信息檢索領(lǐng)域的一個核心問題,為了使評價的結(jié)果更符合用戶的真實體驗,現(xiàn)有的搜索離線評價指標(biāo)在設(shè)計時都會基于一定的用戶模型。因此,評價指標(biāo)的有效性同時包括兩個方面:

          • 評價指標(biāo)背后的用戶模型能否準(zhǔn)確地擬合用戶行為;
          • 評價指標(biāo)的評價分?jǐn)?shù)能否有效地衡量用戶滿意度。

          基于用戶模型的評價指標(biāo)的兩個方面 [Wicaksono and Moffat, 2020][1]

          然而,現(xiàn)有工作很少去探究評價指標(biāo)在這兩方面表現(xiàn)的一致性。為了對基于用戶模型的評價指標(biāo)有更深入的理解,我們在本文中對評價指標(biāo)進(jìn)行了更細(xì)致的探究。
          ?
          通過在一個公開數(shù)據(jù)集[2]和我們收集的數(shù)據(jù)集[3]上的實驗,我們驗證了基于用戶模型的評價指標(biāo)在擬合用戶行為和衡量用戶滿意度兩方面的一致性,基于用戶點擊行為校準(zhǔn)的評價指標(biāo)與基于用戶滿意度校準(zhǔn)的評價指標(biāo)的表現(xiàn)是非常接近的。此外,我們也驗證了評價指標(biāo)參數(shù)的可靠性,相比用戶滿意度,利用用戶行為擬合評價指標(biāo)得到的參數(shù)更加穩(wěn)定,受訓(xùn)練數(shù)據(jù)采樣的影響較小。最后,我們對訓(xùn)練數(shù)據(jù)規(guī)模進(jìn)行了探究,利用小規(guī)模的用戶行為數(shù)據(jù)對評價指標(biāo)進(jìn)行校準(zhǔn),已經(jīng)能夠使評價指標(biāo)在衡量用戶滿意度上取得較好的效果。

          我們的實驗結(jié)果為現(xiàn)有的“基于用戶行為日志擬合評價指標(biāo)參數(shù)”這一方法論提供了經(jīng)驗依據(jù)。用戶滿意度反饋在實際搜索中難以收集,而我們通過用戶行為日志對評價指標(biāo)的參數(shù)進(jìn)行擬合,得到的評價指標(biāo)能夠很好地對用戶使用搜索系統(tǒng)的滿意度進(jìn)行衡量。

          整理:清華大學(xué) 張帆


          最佳短論文獎 I

          ? ? ??? ? ? ?


          論文:Bundle Recommendation with Graph Convolutional Networks

          論文地址:https://sigir-schedule.baai.ac.cn/poster/sp0017
          ?
          本文來自于清華大學(xué)電子系金德鵬教授與李勇副教授的研究團(tuán)隊,第一作者和第二作者分別為團(tuán)隊中的碩士生常健新與博士生高宸。中國科學(xué)技術(shù)大學(xué)何向南教授參與了該論文的合作和指導(dǎo)。
          ?
          論文介紹:
          ?? ? ??? ? ? ?
          物品組合是在功能或?qū)傩陨舷嗨苹蚧パa的多個物品,用于同時滿足用戶在某個場景下的復(fù)雜需求。目前,物品組合在電子商務(wù)和各類內(nèi)容平臺上日益流行,使得物品組合推薦變成一項重要個性化推薦任務(wù)。
          ?
          該論文提出了一個基于圖卷積神經(jīng)網(wǎng)絡(luò)的物品組合推薦方法,解決了物品組合推薦面臨的挑戰(zhàn)以及現(xiàn)有工作的諸多局限性。具體而言,該方法將用戶、物品、物品組合三者統(tǒng)一為異構(gòu)圖,以此顯式地建模用戶與物品組合/單一物品的交互關(guān)系、以及物品組合與單一商品的從屬關(guān)系。在此異構(gòu)圖上,提出單物品級別與物品組合級別的圖卷積網(wǎng)絡(luò)層,分別捕獲單一物品交互數(shù)據(jù)和物品組合交互數(shù)據(jù)中的協(xié)同過濾信號,同時也刻畫了物品組合蘊含的替代性、互補性等語義信息以及物品組合之間的相似性。
          ?
          進(jìn)一步地,考慮到用戶在選擇物品組合時與選擇單一物品時的不同動機,該方法提出了一種基于難負(fù)樣本的采樣學(xué)習(xí)方法,通過在訓(xùn)練過程中構(gòu)建難負(fù)樣本,以學(xué)習(xí)用戶、單個物品、物品組合的細(xì)粒度特征。
          ?
          總而言之,該方法利用圖神經(jīng)網(wǎng)絡(luò)從復(fù)雜的圖結(jié)構(gòu)中學(xué)習(xí)了用戶、物品、物品組合的高階連通性,解決了已有方法僅能提取簡單協(xié)同過濾信號的關(guān)鍵缺陷。該論文在多個真實數(shù)據(jù)集進(jìn)行了廣泛的實驗,提出的方法在多項推薦精準(zhǔn)度指標(biāo)上達(dá)到了state-of-the-art,同時該方法在應(yīng)對數(shù)據(jù)稀疏性等問題上亦取得優(yōu)異表現(xiàn)。

          整理:清華大學(xué) 常健新


          最佳短論文獎 II

          ? ? ?? ? ? ?

          論文:Few-Shot Generative Conversational Query Rewriting

          論文地址:https://sigir-schedule.baai.ac.cn/poster/sp0142
          ?
          本文由來自清華大學(xué)師生與Microsoft Research AI學(xué)者合作完成。第一作者是清華大學(xué)計算機系大三本科生于是同學(xué)。本文由清華大學(xué)劉知遠(yuǎn)和Microsoft Research AI高級研究員熊辰炎共同指導(dǎo)。
          ?
          論文介紹:
          ?? ? ? ?? ? ? ?
          現(xiàn)代信息檢索需要精準(zhǔn)理解用戶查詢意圖,提升用戶查詢體驗。近年來,對話式檢索由于能夠更好地捕捉用戶意圖,得到研究者越來越多的關(guān)注。在對話場景中,用戶提出的查詢問題是人機交互的重要方式,然而由于用戶在對話中做出的原始查詢?nèi)鄙偕舷挛恼Z境,現(xiàn)有的信息檢索系統(tǒng)無法直接進(jìn)行有效搜索。
          ?
          解決該問題的思路是,構(gòu)建自動的查詢改寫系統(tǒng),根據(jù)人機對話歷史信息,將用戶查詢改寫成信息檢索系統(tǒng)能夠有效處理的標(biāo)準(zhǔn)化查詢。基于這種思路,本論文提出了一種小樣本學(xué)習(xí)方法,能夠有效提升對話式檢索中的查詢重寫效果。具體地,分別采取基于規(guī)則和自我監(jiān)督學(xué)習(xí)的方式生成弱監(jiān)督數(shù)據(jù),用于微調(diào)預(yù)訓(xùn)練模型GPT-2增強對于用戶問題的理解和改寫能力。
          ?
          該模型在對話式檢索任務(wù)TREC Conversational Assistance Track 2019中,與當(dāng)前最好的問題改寫模型相比準(zhǔn)確率提高了12%。在無標(biāo)注語料訓(xùn)練場景中,該模型準(zhǔn)確率仍與TREC CAsT 2019最好的模型效果相當(dāng)。這些實驗表明,所提出的方法能夠有效捕捉對話上下文信息,從而幫助提升對話式檢索的效果。
          ?
          整理:清華大學(xué) 于是


          Test of Time Award

          ? ? ? ?? ? ? ?

          論文:Learning to Recommend with Social Trust Ensemble

          論文地址:https://dl.acm.org/doi/10.1145/1571941.1571978
          ?
          本文作者:Hao Ma,Irwin King,Michael R. Lyu,來自香港中文大學(xué)。
          ?
          論文介紹:
          ?
          推薦系統(tǒng)作為信息過濾領(lǐng)域不可缺少的技術(shù),近年來在學(xué)術(shù)界和工業(yè)界得到了廣泛的研究和發(fā)展。然而,目前大多數(shù)的推薦系統(tǒng)都存在如下問題:(1)用戶項矩陣數(shù)據(jù)量大且稀疏,嚴(yán)重影響了推薦質(zhì)量。因此,大多數(shù)推薦系統(tǒng)都無法有效處理使用頻次較少的用戶。(2) 傳統(tǒng)的推薦系統(tǒng)假設(shè)所有的用戶都是獨立、分布一致的,而忽略了用戶之間的聯(lián)系,這與現(xiàn)實世界中的推薦是不一致的。
          ?
          為了更準(zhǔn)確、真實地對推薦系統(tǒng)進(jìn)行建模,作者提出了一種新的概率因子分析框架,將用戶的喜好和他們所信任朋友的偏好自然地融合在一起。在這個框架中,創(chuàng)造了社會信任集合(Social Trust Ensemble)這一術(shù)語,來表達(dá)社會信任對推薦系統(tǒng)的限制。
          ?
          復(fù)雜度分析表明,作者的方法可以適用于非常大的數(shù)據(jù)集,因為它與觀測值的數(shù)量成線性關(guān)系,而實驗結(jié)果表明改方法比現(xiàn)有其他方法有更好的性能。
          ?
          整理:智源社區(qū) 常政
          ?

          ?Test of Time Award Honorable Mention I

          ? ? ? ?? ? ? ?


          論文:A User Browsing Model to Predict Search Engine Click Data from Past Observations

          論文地址:https://dl.acm.org/doi/10.1145/1390334.1390392
          ?
          本文作者:Georges Dupret,Benjamin Piwowarski。兩位作者都來自雅虎研究院。
          ?
          論文介紹:
          ?
          搜索引擎點擊日志提供了寶貴的相關(guān)信息來源,但這些信息是有偏差的,因為忽略了用戶點擊前后在結(jié)果列表中實際看到的文檔;否則完全可以通過簡單的計數(shù)來估計文檔的相關(guān)性。
          ?
          本文提出了一組關(guān)于用戶瀏覽行為的假設(shè),這些假設(shè)使得能夠估計文檔被看到的概率,從而提供文檔相關(guān)性的無偏估計。為了訓(xùn)練、測試和比較模型與文獻(xiàn)中描述的其他最佳替代方案,作者收集了大量真實數(shù)據(jù),并進(jìn)行了廣泛的交叉驗證實驗。結(jié)果顯示,其解決方案性能遠(yuǎn)遠(yuǎn)優(yōu)于以前的模型。
          ?
          伴隨而來的其他好處是,可以深入了解用戶的瀏覽行為,并將其與Joachims等人[4]的眼動實驗的結(jié)論進(jìn)行比較。特別是,作者的發(fā)現(xiàn)證實了用戶幾乎總是在點擊文檔后立即瀏覽該文檔,而且還解釋了為什么位于非常相關(guān)的文檔之后的內(nèi)容會被更頻繁地點擊。
          ?
          整理:智源社區(qū) 賈偉


          Test of Time Award Honorable Mention II

          ???? ? ? ?
          論文:Selecting Good Expansion Terms for Pseudo-Relevance Feedback

          論文地址:https://dl.acm.org/doi/10.1145/1390334.1390377

          本文作者:Guihong Cao,Jian-Yun Nie,Jianfeng Gao(高劍峰),Stephen Robertson。作者分別來自加拿大蒙特利爾大學(xué)、美國雷德蒙德微軟研究院和英國劍橋微軟研究院。
          ?
          論文介紹:
          ?
          偽相關(guān)性反饋(Pseudo-relevance feedback)假設(shè),在偽反饋文檔(pseudo-feedback documents)中最頻繁的術(shù)語對檢索是有用的。
          ?
          在這項研究中,作者重新檢驗了這一假設(shè),結(jié)果證明這個假設(shè)并不成立,傳統(tǒng)方法中確定的許多擴展術(shù)語事實上與查詢是無關(guān)的,且對檢索有害。
          ?
          研究還表明,僅根據(jù)反饋文檔和整個集合中的分布,不能將良好的和不良的擴展術(shù)語區(qū)分開來。作者建議整合一個術(shù)語分類過程(term classification process),從而來預(yù)測擴展術(shù)語的有用性,可以在這個過程中集成多個其他功能。
          ?
          作者對三個TREC集合的實驗表明,使用術(shù)語分類可以大大提高檢索效率。此外還表明,好的術(shù)語,應(yīng)當(dāng)能夠根據(jù)它們可能會對檢索效率產(chǎn)生的影響直接識別出來,換句話說,使用監(jiān)督學(xué)習(xí)而不是無監(jiān)督學(xué)習(xí)。
          ?
          整理:智源社區(qū) 賈偉




          參考文獻(xiàn):

          [1] Wicaksono A F, Moffat A. Metrics, User Models, and Satisfaction[C]//Proceedings of the 13th International Conference on Web Search and Data Mining. 2020: 654-662.
          [2] Chen Y, Zhou K, Liu Y, et al. Meta-evaluation of online and offline web search evaluation metrics[C]// Proceedings of the 40th international ACM SIGIR conference on research and development in information retrieval. 2017: 15-24.
          [3] http://www.thuir.cn/tiangong-ss-fsd/
          [4] T. Joachims, L. Granka, B. Pan, H. Hembrooke, F. Radlinski, and G. Gay. Evaluating the accuracy of implicit feedback from clicks and query reformulations in web search. ACM Transactions on Information Systems (TOIS), 25(2), 2007.
          ?

          附:SIGIR近5年最佳論文

          ?
          2019 | Variance Reduction in Gradient Exploration for Online Learning to Rank
          作者:Huazheng Wang,Sonwoo Kim,Eric McCord-Snook,Qingyun Wu,Hongning Wang
          鏈接:https://dl.acm.org/citation.cfm?id=3331264
          ?
          2018 | Should I Follow the Crowd? A Probabilistic Analysis of the Effectiveness of Popularity in Recommender Systems
          作者:Rocío Ca?amares,Pablo Castells
          鏈接:https://dl.acm.org/citation.cfm?id=3210014
          ?
          2017 | BitFunnel: Revisiting Signatures for Search
          作者:Bob Goodwin,Michael Hopcroft,Dan Luu,Alex Clemmer,Mihaela Curmei,Sameh Elnikety,Yuxiong He
          鏈接:https://dl.acm.org/citation.cfm?doid=3077136.3080789
          ?
          2016 | Understanding Information Need: an fMRI Study
          作者:Yashar Moshfeghi,Peter Triantafillou,F(xiàn)rank E. Pollick
          鏈接:http://dx.doi.org/10.1145/2911451.2911534
          ?
          2015 | QuickScorer: A Fast Algorithm to Rank Documents with Additive Ensembles of Regression Trees
          作者:Claudio Lucchese,F(xiàn)ranco Maria Nardini,Salvatore Orlando,Raffaele Perego,Nicola Tonellotto,Rossano Venturini
          鏈接:http://dx.doi.org/10.1145/2766462.2767733

          編輯:智源社區(qū) 王煒強


          瀏覽 66
          點贊
          評論
          收藏
          分享

          手機掃一掃分享

          分享
          舉報
          評論
          圖片
          表情
          推薦
          點贊
          評論
          收藏
          分享

          手機掃一掃分享

          分享
          舉報
          <kbd id="afajh"><form id="afajh"></form></kbd>
          <strong id="afajh"><dl id="afajh"></dl></strong>
            <del id="afajh"><form id="afajh"></form></del>
                1. <th id="afajh"><progress id="afajh"></progress></th>
                  <b id="afajh"><abbr id="afajh"></abbr></b>
                  <th id="afajh"><progress id="afajh"></progress></th>
                  污的网站在线观看豆花视频 | 操逼片欧美 | 欧美午夜性爱视频 | 九九视频免费观看 | 男人的天堂成人网站 |