国产一区二区精品,91沈三级电影,又紧又嫩又爽无遮挡免费,黄片视频在线观看,无码一区二区三区四区五区六区七区八区 ,123操逼图片,特级日本欧美日韩亚洲精品综合免费在线 ,亚洲.欧美.丝袜.中文.综合

來源：機(jī)器之心

作者：力元

深度學(xué)習(xí)的靈活性恰好適合于復(fù)雜的 CAD 設(shè)計(jì)，DeepMind 的研究者基于 CAD 草圖與自然語言建模的相似性，提出了自動(dòng)生成 CAD 草圖的機(jī)器學(xué)習(xí)模型。

在制造業(yè)中，CAD 的應(yīng)用十分廣泛。憑借著精準(zhǔn)、靈活、快速的特性，CAD 已經(jīng)取代了紙筆畫圖，并且不再只是應(yīng)用于汽車制造、航空航天等領(lǐng)域，哪怕小到一個(gè)咖啡杯，生活中幾乎每個(gè)物件都由 CAD 畫圖建模。

CAD 模型中最難制作的部件之一就是高度結(jié)構(gòu)化的 2D 草圖，即每一個(gè) 3D 構(gòu)造的核心。盡管時(shí)代不同了，但 CAD 工程師仍然需要多年的培訓(xùn)和經(jīng)驗(yàn)，并且像紙筆畫圖設(shè)計(jì)的前輩們一樣關(guān)注所有的設(shè)計(jì)細(xì)節(jié)。下一步，CAD 技術(shù)將融合機(jī)器學(xué)習(xí)技術(shù)來自動(dòng)化可預(yù)測(cè)的設(shè)計(jì)任務(wù)，使工程師可以專注于更大層面的任務(wù)，以更少的精力來打造更好的設(shè)計(jì)。

在最近的一項(xiàng)研究中，DeepMind 提出了一種機(jī)器學(xué)習(xí)模型，能夠自動(dòng)生成此類草圖，且結(jié)合了通用語言建模技術(shù)以及現(xiàn)成的數(shù)據(jù)序列化協(xié)議，具有足夠的靈活性來適應(yīng)各領(lǐng)域的復(fù)雜性，并且對(duì)于無條件合成和圖像到草圖的轉(zhuǎn)換都表現(xiàn)良好。

論文鏈接：https://arxiv.org/pdf/2105.02769.pdf

具體而言，研究者開展了以下工作：

使用 PB（Protocol Buffer）設(shè)計(jì)了一種描述結(jié)構(gòu)化對(duì)象的方法，并展示了其在自然 CAD 草圖領(lǐng)域的靈活性；
從最近的語言建模消除冗余數(shù)據(jù)中吸取靈感，提出了幾種捕捉序列化 PB 對(duì)象分布的技術(shù)；
使用超過 470 萬精心預(yù)處理的參數(shù)化 CAD 草圖作為數(shù)據(jù)集，并使用此數(shù)據(jù)集來驗(yàn)證提出的生成模型。事實(shí)上，無論是在訓(xùn)練數(shù)據(jù)量還是模型能力方面，實(shí)際的實(shí)驗(yàn)規(guī)模都比這更多。

CAD 草圖展示效果圖如下：

特寫鏡頭展示：

對(duì)于 DeepMind 的這項(xiàng)研究，網(wǎng)友的評(píng)價(jià)非常高。用戶 @Theodore Galanos 表示：「非常棒的解決方案。我曾使用 SketchGraphs 作為多模態(tài)模型的候選方案，但序列的格式和長(zhǎng)度太不容易處理了。等不及在建筑設(shè)計(jì)中也使用這種方法了。」

草圖之于 CAD

2D 草圖是機(jī)械 CAD 的核心，是構(gòu)成三維形式的骨架。草圖由通過特定的約束（例如正切、垂直和對(duì)稱）相關(guān)聯(lián)的各種線、弧、樣條線和圓組成。這些約束旨在傳達(dá)設(shè)計(jì)意圖，并定義在實(shí)體的各種變換下，形狀應(yīng)該如何發(fā)生變化。下圖說明了約束是如何將不同的線、弧等幾何圖形組合創(chuàng)建成特定的形狀的。虛線顯示了丟失約束時(shí)的另一個(gè)有效的解決方案。所有的幾何實(shí)體都位于一個(gè)草圖平面上，共同形成封閉的區(qū)域，供后續(xù)操作（例如放樣和拉伸）使用，以生成復(fù)雜的 3D 幾何。

約束：草圖逃不開的問題

約束（ constraint ）使草圖比看起來要復(fù)雜得多。它們展現(xiàn)了可以間接影響草圖中每個(gè)實(shí)體的關(guān)系。例如，在上圖中，如果在底角保持固定的狀態(tài)下向上拖動(dòng)兩個(gè)圓弧相交的點(diǎn)，則心形的大小會(huì)增大。這種轉(zhuǎn)變看似簡(jiǎn)單，但實(shí)際上是所有約束共同作用的結(jié)果。

這些約束確保了當(dāng)每個(gè)實(shí)體的尺寸和位置發(fā)生變化時(shí)，形狀仍保持著設(shè)計(jì)者想傳達(dá)的狀態(tài)。由于實(shí)體之間復(fù)雜的相互作用，很容易意外地指定一組約束，從而導(dǎo)致草圖無效。例如，同時(shí)滿足平行和垂直約束的兩條線是無法繪制的。在復(fù)雜的草圖中，約束依賴關(guān)系鏈會(huì)導(dǎo)致設(shè)計(jì)人員確定要添加的約束變得極為困難。此外，對(duì)于給定的一組實(shí)體，有許多等效的約束系統(tǒng)能產(chǎn)生類似的草圖。

一個(gè)高質(zhì)量的草圖通常會(huì)使用一組保留設(shè)計(jì)意圖的約束，這意味著即使更改了實(shí)體參數(shù)（例如尺寸），草圖的語義也得以保留。簡(jiǎn)而言之，無論實(shí)體尺寸如何變化，上圖中的心形永遠(yuǎn)是心形。捕捉設(shè)計(jì)意圖與選擇一致的約束系統(tǒng)的復(fù)雜性使草圖生成變成極其困難的問題。

草圖與自然語言建模的相似性

草圖構(gòu)造的復(fù)雜性有些類似于自然語言建模。在草圖中選擇下一個(gè)約束或?qū)嶓w就像生成句子中的下一個(gè)單詞，而兩者中的的選擇又必須在語法上起作用（在草圖中形成一個(gè)一致約束系統(tǒng)），并保留設(shè)計(jì)意圖。

在生成自然語言方面，已經(jīng)有了許多成功的工具，其中表現(xiàn)最佳的無疑是在大量現(xiàn)實(shí)世界數(shù)據(jù)上進(jìn)行訓(xùn)練的機(jī)器學(xué)習(xí)模型。比如 2017 年的 Transformer 架構(gòu)，展示了強(qiáng)大的連貫造句的能力。這些自然語言模型中的規(guī)律，是否可以用來繪制草圖呢？

數(shù)據(jù)

Onshape 是維度驅(qū)動(dòng)設(shè)計(jì)的一個(gè)參數(shù)化實(shí)體建模軟件。但為了存儲(chǔ)和處理草圖，研究者使用 PB，而不是 Onshape API 提供的原始 JSON 格式。使用 PB 具有雙重的優(yōu)勢(shì)：由于移除了不必要的信息，結(jié)果數(shù)據(jù)占用的空間更少；使用 PB 語言可以輕松地為結(jié)構(gòu)各異的復(fù)雜物體定義精準(zhǔn)的規(guī)格。

一旦設(shè)定好所有必要的對(duì)象類型，就需要將數(shù)據(jù)轉(zhuǎn)換為可以通過機(jī)器學(xué)習(xí)模型來處理的表格。研究者選擇將草圖表示為 tokens 序列，以便使用語言建模生成草圖。文本格式包含了結(jié)構(gòu)和數(shù)據(jù)的內(nèi)容，這樣使用的優(yōu)勢(shì)是可以應(yīng)用任何現(xiàn)成的文本數(shù)據(jù)建模方法。不過，即使對(duì)于現(xiàn)代語言建模技術(shù)，這樣做也是有代價(jià)的：模型為了生成有效的語法，將額外占用模型容量的一部分。

解決的手段就是避免使用字節(jié)格式 PB 定義的通用解析器，利用草圖格式的結(jié)構(gòu)來自定義構(gòu)建設(shè)計(jì)解釋器，即輸入一系列代表草圖創(chuàng)建過程中各個(gè)決策步驟有效選擇的 tokens。在這種 tokens 序列的格式下設(shè)計(jì)解釋器會(huì)導(dǎo)致 PB 消息有效。

在這種格式下，研究者將消息表示為 triplets 序列（????，????，????），其中??是 token 的索引。給定一系列這樣的 triplets，推斷每個(gè) token 對(duì)應(yīng)的確切字段是可能的。實(shí)際上，第一個(gè) token（????，????，????）始終與 objects.kind 相關(guān)聯(lián)，因?yàn)樗莿?chuàng)建一個(gè)草圖消息的首選。第二個(gè)字段取決于??1 的具體值。如果??1= 0，那么第一個(gè)對(duì)象是一個(gè)實(shí)體，這意味著第二個(gè) token 對(duì)應(yīng)于 entity.kind。該序列的其余部分以類似的方式關(guān)聯(lián)。字段標(biāo)識(shí)符及其在對(duì)象中的位置構(gòu)成了 token 的上下文。因?yàn)樗菇忉?triplets 值的含義以及了解整體數(shù)據(jù)結(jié)構(gòu)更容易，研究者將此信息用作機(jī)器學(xué)習(xí)模型的其他輸入。

如上圖所示，草圖包含了一條線實(shí)體和一個(gè)點(diǎn)實(shí)體。在左列的每個(gè) triplet 中，實(shí)際使用的值以粗體顯示。右列顯示了 triplet 與對(duì)象的哪個(gè)字段有關(guān)聯(lián)。

從模型中取樣

建立模型的主要目標(biāo)是估計(jì)數(shù)據(jù)集 D 中的 2D 草圖 ??data 的分布。就像上文提到的，研究者將像 token 序列一樣處理草圖。在這項(xiàng)工作中，由于相關(guān)原始文本格式的序列長(zhǎng)度挑戰(zhàn)，只會(huì)考慮使用用字節(jié)和 triplet 來表示。

從字節(jié)模型取樣很簡(jiǎn)單，該過程與任何典型的基于 Transformer 的語言建模過程相同，而 Triplet 模型需要更多的定制處理。

上圖展示了 Triplet 的處理過程：首先將特殊的 BOS token 嵌入并提供給 Transformer。然后，Transformer 輸出一組 triplets，每個(gè)可能的 token 組一個(gè)。為了確定具體需要發(fā)出哪個(gè) token，應(yīng)用從數(shù)據(jù)規(guī)格中自動(dòng)生成的解釋器（狀態(tài)機(jī)），再選擇合適的 token 組并關(guān)聯(lián)在合成對(duì)象中具有字段的 triplet 的活動(dòng)組件。填入適當(dāng)?shù)淖侄魏螅忉屍鬓D(zhuǎn)換到下一個(gè)狀態(tài)并生成一個(gè)輸出 token，然后將其反饋到該模型。當(dāng)狀態(tài)機(jī)收到最外層重復(fù)字段（即 object.kind）的 “end” triplet 時(shí)，停止該過程。

實(shí)驗(yàn)

研究者使用了從 Onshape 平臺(tái)上公開可用的文檔庫中獲得的數(shù)據(jù)對(duì)方法進(jìn)行驗(yàn)證。遵循自回歸生成模型的標(biāo)準(zhǔn)評(píng)估方法，研究者使用對(duì)數(shù)可能性作為主要的定量指標(biāo)。此外，研究者還提供了各種隨機(jī)和選定的模型樣本以進(jìn)行定性分析評(píng)估。

訓(xùn)練細(xì)節(jié)

研究者使用 128 個(gè)通道的批次訓(xùn)練模型以進(jìn)行 10^6 個(gè)權(quán)重更新。每個(gè)通道都可以在 triplet 設(shè)置中容納 1024 個(gè) tokens 的序列，在字節(jié)設(shè)置中容納 1990 個(gè) tokens。為了提高占用率并減少計(jì)算浪費(fèi)，研究者動(dòng)態(tài)地填滿了通道，在繼續(xù)前進(jìn)到下一條道之前將盡可能多的例子打包。每個(gè)批次由 32 個(gè) TPU 內(nèi)核并行處理。

此外，研究者還使用了 Adam 優(yōu)化器，學(xué)習(xí)率為 10^?4，梯度范數(shù)為 1.0，所有實(shí)驗(yàn)均采用 0.1 的失活率。

實(shí)驗(yàn)結(jié)果

如上圖所示，各種模型的可能性都被測(cè)試到了。第三列是草圖測(cè)試樣本中每個(gè)對(duì)象的平均字節(jié)數(shù)，第四列是第三列乘以對(duì)象數(shù)。

下圖是從 triplet 模型中取樣的實(shí)體與約束。第一列節(jié)點(diǎn)代表了不同的實(shí)體，節(jié)點(diǎn)從上至下遵循生成的順序。第二列代表著不同的約束，按照序列索引排序。第三列是從頻率最高到最低的約束類型。

下圖是條件模型的實(shí)體和約束。左下角是輸入位圖，下例說明了模型在分布外輸入時(shí)的表現(xiàn)。

下圖顯示了從非條件模型取樣的各種草圖數(shù)據(jù)分布統(tǒng)計(jì)，而括號(hào)中的是 Nucleus 取樣的 top-p 參數(shù)。

這些只是最初的概念驗(yàn)證實(shí)驗(yàn)。DeepMind 表示，希望能夠看到更多利用已開發(fā)接口的靈活性優(yōu)勢(shì)開發(fā)的應(yīng)用程序，比如以各種草圖屬性為條件，給定實(shí)體來推斷約束，以自動(dòng)完成圖紙。

借助Transformer，DeepMind新模型自動(dòng)生成CAD草圖，網(wǎng)友：建筑設(shè)計(jì)要起飛了