MaGGIe 在自然影像的頭髮渲染和實例分離方面表現出色,在複雜的多實例場景中優於 MGM 和 InstMatt。MaGGIe 在自然影像的頭髮渲染和實例分離方面表現出色,在複雜的多實例場景中優於 MGM 和 InstMatt。

強健的遮罩引導去背:管理雜訊輸入與物件多樣性

2025/12/21 02:00
閱讀時長 4 分鐘
如需對本內容提供反饋或相關疑問,請通過郵箱 crypto.news@mexc.com 聯絡我們。

摘要與 1. 引言

  1. 相關研究

  2. MaGGIe

    3.1. 高效遮罩引導實例摳圖

    3.2. 特徵-遮罩時間一致性

  3. 實例摳圖資料集

    4.1. 影像實例摳圖與 4.2. 視訊實例摳圖

  4. 實驗

    5.1. 在影像資料上預訓練

    5.2. 在視訊資料上訓練

  5. 討論與參考文獻

\ 補充材料

  1. 架構細節

  2. 影像摳圖

    8.1. 資料集生成與準備

    8.2. 訓練細節

    8.3. 定量細節

    8.4. 更多自然影像的定性結果

  3. 視訊摳圖

    9.1. 資料集生成

    9.2. 訓練細節

    9.3. 定量細節

    9.4. 更多定性結果

8.4. 更多自然影像的定性結果

圖 13 展示了我們模型在具有挑戰性場景中的表現,特別是在準確渲染頭髮區域方面。我們的框架在細節保留方面持續優於 MGM⋆,尤其是在複雜的實例互動中。與 InstMatt 相比,我們的模型在模糊區域展現出更優越的實例分離和細節準確度。

\ 圖 14 和圖 15 展示了我們的模型和先前研究在涉及多個實例的極端情況下的表現。雖然 MGM⋆ 在密集實例場景中面臨雜訊和準確度的困擾,但我們的模型保持了高精確度。InstMatt 在沒有額外訓練資料的情況下,在這些複雜設置中顯示出局限性。

\ 我們遮罩引導方法的穩健性在圖 16 中得到進一步證明。在此,我們強調了 MGM 變體和 SparseMat 在預測遮罩輸入中缺失部分時所面臨的挑戰,而我們的模型解決了這些問題。然而,重要的是要注意,我們的模型並非設計為人體實例分割網路。如圖 17 所示,我們的框架遵循輸入引導,即使在同一遮罩中存在多個實例時,也能確保精確的 alpha 遮罩預測。

\ 最後,圖 12 和圖 11 強調了我們模型的泛化能力。該模型準確地從背景中提取人體主體和其他物體,展示了其在各種場景和物體類型中的多功能性。

\ 所有範例均為無真實標註的網路影像,並使用來自 r101fpn400e 的遮罩作為引導。

\ 圖 13. 我們的模型在自然影像上生成高度詳細的 alpha 遮罩。我們的結果顯示,它在沒有昂貴計算成本的情況下準確且可與先前的實例無關和實例感知方法相媲美。紅色方框放大了每個實例的細節區域。(最佳以彩色和數位縮放檢視)。

\ 圖 14. 我們的框架在具有許多實例的極端情況下精確分離實例。雖然 MGM 經常導致實例之間的重疊,而 MGM⋆ 包含雜訊,但我們的結果與在外部資料集上訓練的 InstMatt 相當。紅色箭頭指示錯誤。(最佳以彩色和數位縮放檢視)。

\ 圖 15. 我們的框架在一次傳遞中精確分離實例。所提出的解決方案顯示出與 InstMatt 和 MGM 相當的結果,而無需運行五次預測/精煉。紅色箭頭指示錯誤。(最佳以彩色和數位縮放檢視)。

\ 圖 16. 與 MGM 和 SparseMat 不同,我們的模型對輸入引導遮罩具有穩健性。透過注意力頭,我們的模型對遮罩輸入產生更穩定的結果,而無需像 InstMatt 那樣在實例之間進行複雜的精煉。紅色箭頭指示錯誤。(最佳以彩色和數位縮放檢視)。

\ 圖 17. 我們的解決方案在多實例遮罩引導下正確運作。當一個引導遮罩中存在多個實例時,我們仍然為這些實例生成正確的聯合 alpha 遮罩。紅色箭頭指示錯誤或紅色方框中的放大區域。(最佳以彩色和數位縮放檢視)。

\ 表 12. HIM2K+M-HIM2K 上定量結果的細節(表 5 的延伸)。灰色表示未重新訓練的公開權重。

\ 表 12. HIM2K+M-HIM2K 上定量結果的細節(表 5 的延伸)。灰色表示未重新訓練的公開權重。(續)

\ 表 12. HIM2K+M-HIM2K 上定量結果的細節(表 5 的延伸)。灰色表示未重新訓練的公開權重。(續)

\ 表 12. HIM2K+M-HIM2K 上定量結果的細節(表 5 的延伸)。灰色表示未重新訓練的公開權重。(續)

\ 表 13. 所提出的時間一致性模組在 V-HIM60 上的有效性(表 6 的延伸)。雙向 Conv-GRU 和前向-後向融合的組合在三個測試集上達到了最佳整體效能。粗體突出顯示每個級別的最佳結果。

\

:::info 作者:

(1) Chuong Huynh,馬里蘭大學帕克分校 (chuonghm@cs.umd.edu);

(2) Seoung Wug Oh,Adobe Research (seoh,jolee@adobe.com);

(3) Abhinav Shrivastava,馬里蘭大學帕克分校 (abhinav@cs.umd.edu);

(4) Joon-Young Lee,Adobe Research (jolee@adobe.com)。

:::


:::info 本論文可在 arxiv 上取得,採用 CC by 4.0 Deed(姓名標示 4.0 國際)授權。

:::

\

市場機遇
Mask Network 圖標
Mask Network實時價格 (MASK)
$0.4568
$0.4568$0.4568
+0.79%
USD
Mask Network (MASK) 實時價格圖表
免責聲明: 本網站轉載的文章均來源於公開平台,僅供參考。這些文章不代表 MEXC 的觀點或意見。所有版權歸原作者所有。如果您認為任何轉載文章侵犯了第三方權利,請聯絡 crypto.news@mexc.com 以便將其刪除。MEXC 不對轉載文章的及時性、準確性或完整性作出任何陳述或保證,並且不對基於此類內容所採取的任何行動或決定承擔責任。轉載材料僅供參考,不構成任何商業、金融、法律和/或稅務決策的建議、認可或依據。

您可能也會喜歡

2025年國債償債支出達2.1兆披索

2025年國債償債支出達2.1兆披索

國家政府(NG)債務服務支出在2025年躍升到2.1兆披索,超過政府自身的計劃,顯示財政壓力不斷增加
分享
Bworldonline2026/03/16 00:32
成長疑慮與治理問題拖累第四季市場

成長疑慮與治理問題拖累第四季市場

菲律賓金融市場在2025年結束時表現低迷,國內增長動能持續受到關注以及治理相關的不確定性抵消了順風因素
分享
Bworldonline2026/03/16 00:02
又一家納斯達克上市公司宣布大規模購買 Bitcoin (BTC)!成為第 14 大公司!- 他們還將投資與 Trump 相關的山寨幣!

又一家納斯達克上市公司宣布大規模購買 Bitcoin (BTC)!成為第 14 大公司!- 他們還將投資與 Trump 相關的山寨幣!

另一家納斯達克上市公司宣布大規模購買比特幣(BTC)!成為第14大公司!- 他們還將投資與川普相關的山寨幣! 這篇文章發表在BitcoinEthereumNews.com。隨著持有比特幣(BTC)國庫的公司數量日益增加,另一家納斯達克上市公司已宣布購買BTC。據此,直播和電子商務公司GD Culture Group宣布了一項價值7.875億美元的比特幣購買協議。 根據官方聲明,GD Culture Group宣布他們已與註冊在英屬維爾京群島的Pallas Capital Holding簽訂股權協議,收購價值8.75億美元的資產,包括7,500個比特幣。GD Culture將發行約3,920萬股普通股,以換取Pallas Capital的所有資產,包括價值8.754億美元的比特幣。 GD Culture首席執行官王曉健表示,這項收購協議將直接支持公司建立強大且多元化的加密資產儲備的計劃,同時利用比特幣作為儲備資產和價值儲存的機構接受度不斷提高的優勢。 通過這次收購,GD Culture預計將成為第14大公開交易的比特幣持有公司。採用比特幣國庫策略的公司數量已顯著增加,到2025年將超過190家。 在交易宣布後,GD Culture股價立即下跌了28.16%至6.99美元,創下一年來最大跌幅。 您可能還記得,GD Culture在五月宣布將創建一個加密貨幣儲備。此時,該公司宣布他們計劃通過發行高達3億美元的股票來投資比特幣和美國總統唐納德·川普的官方迷因幣TRUMP代幣。 *這不是投資建議。立即關注我們的Telegram和Twitter帳戶,獲取獨家新聞、分析和鏈上數據! 來源:https://en.bitcoinsistemi.com/another-nasdaq-listed-company-announces-massive-bitcoin-btc-purchase-becomes-14th-largest-company-theyll-also-invest-in-trump-linked-altcoin/
分享
BitcoinEthereumNews2025/09/18 04:06