<kbd id="afajh"><form id="afajh"></form></kbd>
<strong id="afajh"><dl id="afajh"></dl></strong>
    <del id="afajh"><form id="afajh"></form></del>
        1. <th id="afajh"><progress id="afajh"></progress></th>
          <b id="afajh"><abbr id="afajh"></abbr></b>
          <th id="afajh"><progress id="afajh"></progress></th>

          【NLP】圖解詞嵌入和Word2vec

          共 9739字,需瀏覽 20分鐘

           ·

          2020-11-03 18:45

          0.導(dǎo)語

          詞嵌入是自然語言處理(NLP)中語言模型與表征學(xué)習(xí)技術(shù)的統(tǒng)稱。概念上而言,它是指把一個維數(shù)為所有詞的數(shù)量的高維空間嵌入到一個維數(shù)低得多的連續(xù)向量空間中,每個單詞或詞組被映射為實數(shù)域上的向量。

          本篇文章講解詞嵌入基礎(chǔ)和Word2vec。

          本文作者:

          jalammar(https://jalammar.github.io

          翻譯:

          黃海廣(https://github.com/fengdu78

          本文代碼可以在github下載:

          https://github.com/fengdu78/Data-Science-Notes/tree/master/8.deep-learning/word2vec

          圖解Word2vec

          正文開始

          我發(fā)現(xiàn)嵌入的概念是機器學(xué)習(xí)中最迷人的想法之一。如果您曾經(jīng)使用Siri,Google智能助理,Alexa,谷歌翻譯,甚至智能手機鍵盤進行下一詞預(yù)測,那么您很有可能從這個已經(jīng)成為自然語言處理模型核心的想法中受益。在過去的幾十年中,使用嵌入技術(shù)進行神經(jīng)模型已有相當(dāng)大的發(fā)展(最近的發(fā)展包括BERT和GPT2 等尖端模型的語境化嵌入)。

          自2013年以來,Word2vec一直是一種有效創(chuàng)建單詞嵌入的方法。除了詞嵌入字的方法之外,它的一些概念已經(jīng)被證明可以在非語言任務(wù)中有效地創(chuàng)建推薦引擎和理解順序數(shù)據(jù)。比如Airbnb,阿里巴巴,Spotify和Anghami這樣的公司都從NLP世界中創(chuàng)造出這一優(yōu)秀的工具并將其用于生產(chǎn)中,從而為新型推薦引擎提供支持。

          我們將討論嵌入的概念,以及使用word2vec生成嵌入的機制。

          讓我們從一個例子開始,了解使用向量來表示事物。

          您是否知道五個數(shù)字(向量)的列表可以代表您的個性?

          個性嵌入:你的個性怎么樣?

          使用0到100的范圍表示你的個性(其中0是最內(nèi)向的,100是最外向的)。

          五大人格特質(zhì)測試,這些測試會問你一個問題列表,然后在很多方面給你打分,內(nèi)向/外向就是其中之一。

          圖:測試結(jié)果示例。
          它可以真正告訴你很多關(guān)于你自己的事情,并且在學(xué)術(shù)、個人和職業(yè)成功方面都具有預(yù)測能力。
          假設(shè)我的測試得分為38/100。我們可以用這種方式繪制:

          讓我們將范圍切換到從-1到1:

          了解一個人,一個維度的信息不夠,所以讓我們添加另一個維度 - 測試中另一個特征的得分。

          你可能不知道每個維度代表什么,但仍然可以從一個人的個性的向量表示中獲得了很多有用的信息。

          我們現(xiàn)在可以說這個向量部分代表了我的個性。當(dāng)你想要將另外兩個人與我進行比較時,這種表示的有用性就出現(xiàn)了。在下圖中,兩個人中哪一個更像我?

          處理向量時,計算相似度得分的常用方法是余弦相似度:

          一號人物與我的余弦相似度得分高,所以我們的性格比較相似。

          然而,兩個方面還不足以捕獲有關(guān)不同人群的足夠信息。幾十年的心理學(xué)研究已經(jīng)研究了五個主要特征(以及大量的子特征)。所以我們在比較中使用所有五個維度:

          我們沒法在二維上繪制出來五個維度,這是機器學(xué)習(xí)中的常見挑戰(zhàn),我們經(jīng)常需要在更高維度的空間中思考。但好處是余弦相似度仍然有效。它適用于任意數(shù)量的維度:

          嵌入的兩個中心思想:

          • 我們可以將人(事物)表示為數(shù)字的向量。
          • 我們可以很容易地計算出相似的向量彼此之間的關(guān)系。

          詞嵌入

          我們導(dǎo)入在維基百科上訓(xùn)練的GloVe向量

          import gensim
          import gensim.downloader as api
          model = api.load('glove-wiki-gigaword-50')
          單詞“king”的詞嵌入表示:
          model["king"]
          array([ 0.50451 ,  0.68607 , -0.59517 , -0.022801,  0.60046 , -0.13498 ,
          -0.08813 , 0.47377 , -0.61798 , -0.31012 , -0.076666, 1.493 ,
          -0.034189, -0.98173 , 0.68229 , 0.81722 , -0.51874 , -0.31503 ,
          -0.55809 , 0.66421 , 0.1961 , -0.13495 , -0.11476 , -0.30344 ,
          0.41177 , -2.223 , -1.0756 , -1.0783 , -0.34354 , 0.33505 ,
          1.9927 , -0.04234 , -0.64319 , 0.71125 , 0.49159 , 0.16754 ,
          0.34344 , -0.25663 , -0.8523 , 0.1661 , 0.40102 , 1.1685 ,
          -1.0137 , -0.21585 , -0.15155 , 0.78321 , -0.91241 , -1.6106 ,
          -0.64426 , -0.51042 ], dtype=float32)

          查看“king”最相似的單詞

          model.most_similar("king")
          [('prince', 0.8236179351806641),
          ('queen', 0.7839042544364929),
          ('ii', 0.7746230363845825),
          ('emperor', 0.7736247181892395),
          ('son', 0.766719400882721),
          ('uncle', 0.7627150416374207),
          ('kingdom', 0.7542160749435425),
          ('throne', 0.7539913654327393),
          ('brother', 0.7492411136627197),
          ('ruler', 0.7434253096580505)]

          這是一個包含50個數(shù)字的列表,我們無法說清楚里面的值代表什么。我們把所有這些數(shù)字放在一行,以便我們可以比較其他單詞向量。讓我們根據(jù)它們的值對單元格進行顏色編碼(如果它們接近2則為紅色,如果它們接近0則為白色,如果它們接近-2則為藍色)

          import seaborn as sns
          import matplotlib.pyplot as plt
          import numpy as np

          plt.figure(figsize=(15, 1))
          sns.heatmap([model["king"]],
          xticklabels=False,
          yticklabels=False,
          cbar=False,
          vmin=-2,
          vmax=2,
          linewidths=0.7)
          plt.show()

          我們將忽略數(shù)字并僅查看顏色以指示單元格的值,我們將“King”與其他詞語進行對比:

          plt.figure(figsize=(15, 4))
          sns.heatmap([
          model["king"],
          model["man"],
          model["woman"],
          model["king"] - model["man"] + model["woman"],
          model["queen"],
          ],
          cbar=True,
          xticklabels=False,
          yticklabels=False,
          linewidths=1)
          plt.show()


          看看“man”和“woman”是如何彼此更相似的,他們中的任何一個都是“king”?這告訴你一些事情。這些向量表示捕獲了這些單詞的信息/含義/關(guān)聯(lián)。

          這是另一個示例列表(通過垂直掃描列來查找具有相似顏色的列):

          有幾點需要指出:

          • 所有這些不同的單詞都有一個直的紅色列。它們在這個維度上是相似的(我們不知道每個維度代碼是什么)
          • 你可以看到“woman”和“girl”在很多地方是如何相似的。與“man”和“boy”一樣
          • “boy”和“girl”也有彼此相似的地方,但與“woman”或“man”不同。這些是否可以編寫一個模糊的青年概念?可能。
          • 除了最后一個字之外的所有字都代表著人。我添加了一個對象“water”來顯示類別之間的差異。例如,您可以看到藍色列一直向下并在嵌入“water”之前停止。
          • 有一個明顯的地方,“king”和“queen”彼此相似,并與所有其他人不同。

          類比

          我們可以添加和減去單詞嵌入并獲得有趣的結(jié)果,最有名的例子是公式:“king” - “man” + “woman”:

          model.most_similar(positive=["king","woman"],negative=["man"])
          [('queen', 0.8523603677749634),
          ('throne', 0.7664334177970886),
          ('prince', 0.759214460849762),
          ('daughter', 0.7473883032798767),
          ('elizabeth', 0.7460220456123352),
          ('princess', 0.7424569725990295),
          ('kingdom', 0.7337411642074585),
          ('monarch', 0.7214490175247192),
          ('eldest', 0.7184861898422241),
          ('widow', 0.7099430561065674)]

          我們可以像以前一樣想象這個類比:

          語言建模

          如果想要給出NLP應(yīng)用程序的示例,最好的示例之一將是智能手機鍵盤的下一個字(詞)預(yù)測功能。這是數(shù)十億人每天使用數(shù)百次的功能。

          下一個字(詞)預(yù)測是一項可以通過語言模型解決的任務(wù)。語言模型可以采用單詞列表(比方說兩個單詞),并嘗試預(yù)測它們之后的單詞。

          在上面的屏幕截圖中,我們可以將模型視為接受這兩個綠色單詞(thou shalt)并返回建議列表(“not”是具有最高概率的那個字)的模型:

          我們可以把模型想象成這個黑盒子:

          但實際上,該模型不會只輸出一個單詞。它實際上輸出了它所知道的所有單詞的概率分數(shù)(模型的“詞匯表”,其范圍可以從幾千到一百多萬個字(詞))。然后應(yīng)用程序必須找到分數(shù)最高的單詞,并將其呈現(xiàn)給用戶。

          圖:神經(jīng)語言模型的輸出是模型知道的所有單詞的概率分數(shù)。我們在這里將概率稱為百分比,比如概率40%將在輸出向量中表示為0.4。

          經(jīng)過訓(xùn)練,早期的神經(jīng)語言模型(Bengio 2003)將分三步計算預(yù)測:

          在討論嵌入時,第一步對我們來說最相關(guān)。訓(xùn)練過程的結(jié)果之一是這個矩陣包含我們詞匯表中每個單詞的嵌入。在預(yù)測時間內(nèi),我們只查找輸入字的嵌入,并使用它們來計算預(yù)測:

          現(xiàn)在讓我們轉(zhuǎn)到訓(xùn)練過程,以了解嵌入矩陣是如何工作的。

          語言模型的訓(xùn)練

          與大多數(shù)其他機器學(xué)習(xí)模型相比,語言模型具有巨大優(yōu)勢。即:我們所有的書籍,文章,維基百科內(nèi)容和其他形式的大量文本數(shù)據(jù)可以作為訓(xùn)練數(shù)據(jù)。與此相比,許多其他機器學(xué)習(xí)模型需要手動設(shè)計特征和專門收集的數(shù)據(jù)。

          單詞通過我們查看它們往往會出現(xiàn)在旁邊的其他單詞來嵌入。其機制就是這樣

          1. 我們獲得了大量文本數(shù)據(jù)(例如,所有維基百科文章)。然后
          2. 我們有一個窗口(比如說三個單詞),我們會對所有文本進行滑動。
          3. 滑動窗口為我們的模型生成訓(xùn)練樣本

          當(dāng)這個窗口滑動文本時,我們(虛擬地)生成一個用于訓(xùn)練模型的數(shù)據(jù)集。為了準(zhǔn)確看看它是如何完成的,讓我們看看滑動窗口如何處理這個短語:

          當(dāng)我們開始時,窗口在句子的前三個單詞上:

          我們將前兩個單詞作為特征,將第三個單詞作為標(biāo)簽:

          我們現(xiàn)在已經(jīng)在數(shù)據(jù)集中生成了第一個樣本,我們稍后可以使用它來訓(xùn)練語言模型。

          然后我們將窗口滑動到下一個位置并創(chuàng)建第二個樣本:

          現(xiàn)在生成第二個示例。

          很快我們就會有一個更大的數(shù)據(jù)集,在不同的單詞對之后,這些數(shù)據(jù)集會出現(xiàn):

          在實踐中,模型往往在我們滑動窗口時進行訓(xùn)練。但我發(fā)現(xiàn)邏輯上將“數(shù)據(jù)集生成”階段與訓(xùn)練階段分開是更清楚的。除了基于神經(jīng)網(wǎng)絡(luò)的語言建模方法之外,一種稱為N-gram的技術(shù)通常用于訓(xùn)練語言模型。

          要了解這種從N-gram到神經(jīng)模型的轉(zhuǎn)換如何反映現(xiàn)實世界的產(chǎn)品,建議看這篇2015年博客文章,介紹他們的神經(jīng)語言模型并將其與之前的N-gram模型進行比較。

          兩邊看

          給了你句子前面的內(nèi)容,進行填空:

          我在這里給你的背景是空格之前的五個字(以及之前提到的“bus”)。我相信大多數(shù)人都會猜到空格里的這個詞會是“bus”。但是,如果我再給你一條信息:空格之后的一句話,那會改變你的答案嗎?

          這完全改變了應(yīng)該留在空格中的內(nèi)容?!皉ed”這個詞現(xiàn)在最可能填到空格中。我們從中學(xué)到的是特定詞語之前和之后的詞語都具有信息價值。事實證明,考慮兩個方向(我們猜測的單詞左側(cè)和右側(cè)的單詞)會讓詞嵌入做得更好。

          讓我們看看我們?nèi)绾握{(diào)整我們訓(xùn)練模型的方式來解決這個問題。

          Skipgram

          我們不僅可以查看在目標(biāo)詞之前的兩個單詞,還可以查看其后的兩個單詞。

          如果我們這樣做,我們實際構(gòu)建和訓(xùn)練模型的數(shù)據(jù)集將如下所示:


          這被稱為連續(xù)詞袋結(jié)構(gòu),并在word2vec論文 one of the word2vec papers 中進行過描述。

          另一種結(jié)構(gòu)與連續(xù)詞袋結(jié)構(gòu)略有不同,但也可以也顯示出良好結(jié)果。這個結(jié)構(gòu)試圖使用當(dāng)前詞來猜測相鄰詞,而不是根據(jù)其上下文(它之前和之后的詞)猜測一個詞。我們可以想到它在訓(xùn)練文本上滑動的窗口如下所示:

          圖:綠色框中的字將是輸入字,每個粉色框?qū)⑹强赡艿妮敵觥?/center>粉色框具有不同的陰影,因為此滑動窗口實際上在我們的訓(xùn)練數(shù)據(jù)集中創(chuàng)建了四個單獨的樣本:

          此方法稱為skipgram架構(gòu)。我們可以執(zhí)行以下操作將滑動窗口可視化:

          這會將這四個樣本添加到我們的訓(xùn)練數(shù)據(jù)集中:

          然后我們將窗口滑動到下一個位置:

          這將產(chǎn)生我們的下四個樣本:

          接著滑動幾個位置之后,我們有更多的樣本:

          重新審視訓(xùn)練過程

          現(xiàn)在我們已經(jīng)從現(xiàn)有的運行文本中提取了我們的skipgram訓(xùn)練數(shù)據(jù)集,讓我們看看我們?nèi)绾问褂盟鼇碛?xùn)練預(yù)測相鄰單詞的基本神經(jīng)語言模型。

          我們從數(shù)據(jù)集中的第一個樣本開始。我們把特征提供給未經(jīng)訓(xùn)練的模型,要求它預(yù)測一個合適的相鄰單詞。

          該模型進行三個步驟并輸出預(yù)測向量(概率分配給其詞匯表中的每個單詞)。由于該模型未經(jīng)過訓(xùn)練,因此在此階段的預(yù)測肯定是錯誤的。但那沒關(guān)系。我們知道應(yīng)該它將猜到哪個詞:我們目前用于訓(xùn)練模型的行中的標(biāo)簽/輸出單元格:

          圖:“目標(biāo)向量”的詞(字)概率為1,其他詞(字)的概率都是0。
          我們減去兩個向量,得到一個誤差向量:

          現(xiàn)在可以使用此誤差向量來更新模型,以便下次當(dāng)“not”作為輸入時,模型更有可能猜測“thou”。

          這就是訓(xùn)練的第一步。我們繼續(xù)使用數(shù)據(jù)集中的下一個樣本進行相同的處理,然后是下一個樣本,直到我們覆蓋了數(shù)據(jù)集中的所有樣本。這就結(jié)束了一個epcho的訓(xùn)練。我們繼續(xù)訓(xùn)練多個epcho,然后我們就有了訓(xùn)練好的模型,我們可以從中提取嵌入矩陣并將其用于任何其他應(yīng)用。

          雖然這加深了我們對該過程的理解,但仍然不是word2vec實際上的訓(xùn)練過程。

          負采樣

          回想一下這個神經(jīng)語言模型如何計算其預(yù)測的三個步驟:

          從計算的角度來看,第三步非常消耗資源:尤其是我們將在數(shù)據(jù)集中為每個訓(xùn)練樣本做一次(很可能數(shù)千萬次)。我們需要做一些事情來提高效率。

          一種方法是將目標(biāo)分成兩個步驟:

          1. 生成高質(zhì)量的單詞嵌入(不要擔(dān)心下一個單詞預(yù)測)。
          2. 使用這些高質(zhì)量的嵌入來訓(xùn)練語言模型(進行下一個單詞預(yù)測)。

          我們將專注于第1步,因為我們專注于嵌入。要使用高性能模型生成高質(zhì)量嵌入,我們可以從預(yù)測相鄰單詞切換模型的任務(wù):


          并將其切換到一個取輸入和輸出字的模型,并輸出一個分數(shù),表明它們是否是鄰居(0表示“不是鄰居”,1表示“鄰居”)。

          這個簡單的改變,將我們需要的模型從神經(jīng)網(wǎng)絡(luò)改為邏輯回歸模型:因此它變得更簡單,計算速度更快。

          這個改變要求我們切換數(shù)據(jù)集的結(jié)構(gòu) - 標(biāo)簽現(xiàn)在是一個值為0或1的新列。它們將全部為1,因為我們添加的所有單詞都是鄰居。

          現(xiàn)在可以以極快的速度計算 - 在幾分鐘內(nèi)處理數(shù)百萬個示例。但是我們需要關(guān)閉一個漏洞。如果我們所有的例子都是正面的(目標(biāo):1),我們打開自己的智能模型的可能性總是返回1 - 達到100%的準(zhǔn)確性,但什么都不學(xué)習(xí)并生成垃圾嵌入。

          為了解決這個問題,我們需要在數(shù)據(jù)集中引入負樣本 - 不是鄰居的單詞樣本。我們的模型需要為這些樣本返回0?,F(xiàn)在這是一個挑戰(zhàn),模型必須努力解決,而且速度還要快。

          圖:對于我們數(shù)據(jù)集中的每個樣本,我們添加了負樣本。它們具有相同的輸入詞和0標(biāo)簽。
          但是我們填寫什么作為輸出詞?我們從詞匯表中隨機抽取單詞

          這個想法的靈感來自Noise-contrastive estimation。我們將實際信號(相鄰單詞的正例)與噪聲(隨機選擇的不是鄰居的單詞)進行對比。這是計算量和統(tǒng)計效率的巨大折衷。

          帶負采樣的skipgram(SGNS)

          我們現(xiàn)在已經(jīng)介紹了word2vec中的兩個核心思想:

          skipgram負采樣。

          Word2vec訓(xùn)練流程

          現(xiàn)在我們已經(jīng)建立了skipgram和負采樣的兩個中心思想,我們可以繼續(xù)仔細研究實際的word2vec訓(xùn)練過程。

          在訓(xùn)練過程開始之前,我們預(yù)先處理我們正在訓(xùn)練模型的文本。在這一步中,我們確定詞匯量的大?。ㄎ覀兎Q之為vocab_size,比如說,將其視為10,000)以及哪些詞屬于它。在訓(xùn)練階段的開始,我們創(chuàng)建兩個矩陣 - Embedding矩陣和Context矩陣。這兩個矩陣在我們的詞匯表中嵌入了每個單詞(這vocab_size是他們的維度之一)。第二個維度是我們希望每次嵌入的時間長度(embedding_size- 300是一個常見值,但我們在本文前面的例子是50。)。

          在訓(xùn)練過程開始時,我們用隨機值初始化這些矩陣。然后我們開始訓(xùn)練過程。在每個訓(xùn)練步驟中,我們采取一個正樣本及其相關(guān)的負樣本。我們來看看我們的第一組:

          現(xiàn)在我們有四個單詞:輸入單詞not和輸出/上下文單詞:( thou實際鄰居),aaron,和taco(負樣本)。我們繼續(xù)查找它們的嵌入 - 對于輸入詞,我們查看Embedding矩陣。對于上下文單詞,我們查看Context矩陣(即使兩個矩陣都在我們的詞匯表中嵌入了每個單詞)。

          然后,我們計算輸入嵌入與每個上下文嵌入的點積。。在每種情況下,會產(chǎn)生一個數(shù)字,該數(shù)字表示輸入和上下文嵌入的相似性。

          現(xiàn)在我們需要一種方法將這些分數(shù)轉(zhuǎn)化為看起來像概率的東西 :使用sigmoid函數(shù)把概率轉(zhuǎn)換為0和1。

          現(xiàn)在我們可以將sigmoid操作的輸出視為這些樣本的模型輸出。您可以看到taco得分最高aaron,并且在sigmoid操作之前和之后仍然具有最低分。既然未經(jīng)訓(xùn)練的模型已做出預(yù)測,并且看到我們有一個實際的目標(biāo)標(biāo)簽要比較,那么讓我們計算模型預(yù)測中的誤差。為此,我們只從目標(biāo)標(biāo)簽中減去sigmoid分數(shù)。

          圖:
          這是“機器學(xué)習(xí)”的“學(xué)習(xí)”部分?,F(xiàn)在,我們可以利用這個錯誤分數(shù)調(diào)整`not`,`thou`,`aaron`和`taco`的嵌入,使下一次我們做出這一計算,結(jié)果會更接近目標(biāo)分數(shù)。

          ?訓(xùn)練步驟到此結(jié)束。我們從這一步驟中得到稍微好一點的嵌入(`not`,`thou`,`aaron`和`taco`)。我們現(xiàn)在進行下一步(下一個正樣本及其相關(guān)的負樣本),并再次執(zhí)行相同的過程。?

          當(dāng)我們循環(huán)遍歷整個數(shù)據(jù)集多次時,嵌入繼續(xù)得到改進。然后我們可以停止訓(xùn)練過程,丟棄`Context`矩陣,并使用`Embeddings`矩陣作為下一個任務(wù)的預(yù)訓(xùn)練嵌入。

          窗口大小和負樣本數(shù)量

          word2vec訓(xùn)練過程中的兩個關(guān)鍵超參數(shù)是窗口大小和負樣本的數(shù)量。

          不同的窗口大小可以更好地提供不同的任務(wù)。

          一種啟發(fā)式方法是較小的窗口嵌入(2-15),其中兩個嵌入之間的高相似性得分表明這些單詞是可互換的(注意,如果我們只查看周圍的單詞,反義詞通??梢曰Q - 例如,好的和壞的經(jīng)常出現(xiàn)在類似的情境中)。

          使用較大的窗口嵌入(15-50,甚至更多)會得到相似性更能指示單詞相關(guān)性的嵌入。實際上,您通常需要對嵌入過程提供注釋指導(dǎo),為您的任務(wù)帶來有用的相似感。

          Gensim默認窗口大小為5(輸入字本身加上輸入字之前的兩個字和輸入字之后的兩個字)。

          負樣本的數(shù)量是訓(xùn)練過程的另一個因素。原始論文里負樣本數(shù)量為5-20。它還指出,當(dāng)你擁有足夠大的數(shù)據(jù)集時,2-5似乎已經(jīng)足夠了。Gensim默認為5個負樣本。

          結(jié)論

          我希望你現(xiàn)在對詞嵌入和word2vec算法有所了解。我也希望現(xiàn)在當(dāng)你讀到一篇提到“skip gram with negative sampling”(SGNS)的論文時,你會對這些概念有了更好的認識。

          本文作者:jalammar(https://twitter.com/jalammar)。

          參考文獻和進一步閱讀材料

          • Distributed Representations of Words and Phrases and their Compositionality?[pdf]

          • Efficient Estimation of Word Representations in Vector Space?[pdf]

          • A Neural Probabilistic Language Model?[pdf]

          • Speech and Language Processing?by Dan Jurafsky and James H. Martin is a leading resource for NLP. Word2vec is tackled in Chapter 6.

          • Neural Network Methods in Natural Language Processing?by?Yoav Goldberg?is a great read for neural NLP topics.

          • Chris McCormick?has written some great blog posts about Word2vec. He also just released?The Inner Workings of word2vec, an E-book focused on the internals of word2vec.

          • Want to read the code? Here are two options:

            • Gensim’s?python implementation?of word2vec

            • Mikolov’s original?implementation in C?– better yet, this?version with detailed comments?from Chris McCormick.

          • Evaluating distributional models of compositional semantics

          • On word embeddings,?part 2

          • Dune

          往期精彩回顧





          獲取一折本站知識星球優(yōu)惠券,復(fù)制鏈接直接打開:

          https://t.zsxq.com/y7uvZF6

          本站qq群704220115。

          加入微信群請掃碼:

          瀏覽 51
          點贊
          評論
          收藏
          分享

          手機掃一掃分享

          分享
          舉報
          評論
          圖片
          表情
          推薦
          點贊
          評論
          收藏
          分享

          手機掃一掃分享

          分享
          舉報
          <kbd id="afajh"><form id="afajh"></form></kbd>
          <strong id="afajh"><dl id="afajh"></dl></strong>
            <del id="afajh"><form id="afajh"></form></del>
                1. <th id="afajh"><progress id="afajh"></progress></th>
                  <b id="afajh"><abbr id="afajh"></abbr></b>
                  <th id="afajh"><progress id="afajh"></progress></th>
                  成人网站在线视频三级 | 亚洲AV成人无码精电影在线 | 无码在线免费视频 | 北条麻妃在线一区二区三区免费 | 日韩欧美中文字幕在线观看 |