MaGGIe প্রাকৃতিক ছবিতে চুল রেন্ডারিং এবং ইনস্ট্যান্স পৃথকীকরণে দক্ষতা প্রদর্শন করে, জটিল, বহু-ইনস্ট্যান্স পরিস্থিতিতে MGM এবং InstMatt-কে ছাড়িয়ে যায়।MaGGIe প্রাকৃতিক ছবিতে চুল রেন্ডারিং এবং ইনস্ট্যান্স পৃথকীকরণে দক্ষতা প্রদর্শন করে, জটিল, বহু-ইনস্ট্যান্স পরিস্থিতিতে MGM এবং InstMatt-কে ছাড়িয়ে যায়।

শক্তিশালী মাস্ক-গাইডেড ম্যাটিং: নয়েজি ইনপুট এবং অবজেক্ট বহুমুখিতা পরিচালনা

2025/12/21 02:00
2 মিনিটে পড়া যাবে
এই বিষয়বস্তু সম্পর্কে মতামত বা উদ্বেগ জানাতে, অনুগ্রহ করে আমাদের সাথে crypto.news@mexc.com ঠিকানায় যোগাযোগ করুন

সারসংক্ষেপ এবং ১. ভূমিকা

  1. সম্পর্কিত কাজসমূহ

  2. MaGGIe

    ৩.১. দক্ষ মাস্কড গাইডেড ইনস্ট্যান্স ম্যাটিং

    ৩.২. ফিচার-ম্যাট টেম্পোরাল কনসিস্টেন্সি

  3. ইনস্ট্যান্স ম্যাটিং ডেটাসেট

    ৪.১. ইমেজ ইনস্ট্যান্স ম্যাটিং এবং ৪.২. ভিডিও ইনস্ট্যান্স ম্যাটিং

  4. পরীক্ষা-নিরীক্ষা

    ৫.১. ইমেজ ডেটার উপর প্রি-ট্রেনিং

    ৫.২. ভিডিও ডেটার উপর ট্রেনিং

  5. আলোচনা এবং তথ্যসূত্র

\ সম্পূরক উপাদান

  1. আর্কিটেকচারের বিস্তারিত

  2. ইমেজ ম্যাটিং

    ৮.১. ডেটাসেট তৈরি এবং প্রস্তুতি

    ৮.২. ট্রেনিং বিস্তারিত

    ৮.৩. পরিমাণগত বিস্তারিত

    ৮.৪. প্রাকৃতিক ছবিতে আরো গুণগত ফলাফল

  3. ভিডিও ম্যাটিং

    ৯.১. ডেটাসেট তৈরি

    ৯.২. ট্রেনিং বিস্তারিত

    ৯.৩. পরিমাণগত বিস্তারিত

    ৯.৪. আরো গুণগত ফলাফল

৮.৪. প্রাকৃতিক ছবিতে আরো গুণগত ফলাফল

চিত্র ১৩ চ্যালেঞ্জিং পরিস্থিতিতে আমাদের মডেলের কর্মক্ষমতা প্রদর্শন করে, বিশেষত চুলের অঞ্চলগুলি সঠিকভাবে রেন্ডার করায়। আমাদের ফ্রেমওয়ার্ক ধারাবাহিকভাবে বিস্তারিত সংরক্ষণে MGM⋆ কে ছাড়িয়ে যায়, বিশেষত জটিল ইনস্ট্যান্স ইন্টারঅ্যাকশনে। InstMatt এর সাথে তুলনায়, আমাদের মডেল অস্পষ্ট অঞ্চলে উন্নত ইনস্ট্যান্স বিচ্ছেদ এবং বিস্তারিত নির্ভুলতা প্রদর্শন করে।

\ চিত্র ১৪ এবং চিত্র ১৫ একাধিক ইনস্ট্যান্স জড়িত চরম ক্ষেত্রে আমাদের মডেল এবং পূর্ববর্তী কাজের কর্মক্ষমতা চিত্রিত করে। যদিও MGM⋆ ঘন ইনস্ট্যান্স পরিস্থিতিতে শব্দ এবং নির্ভুলতার সাথে লড়াই করে, আমাদের মডেল উচ্চ নির্ভুলতা বজায় রাখে। InstMatt, অতিরিক্ত ট্রেনিং ডেটা ছাড়াই, এই জটিল সেটিংসে সীমাবদ্ধতা দেখায়।

\ আমাদের মাস্ক-গাইডেড পদ্ধতির দৃঢ়তা চিত্র ১৬ তে আরও প্রদর্শিত হয়েছে। এখানে, আমরা MGM ভ্যারিয়েন্ট এবং SparseMat মাস্ক ইনপুটে অনুপস্থিত অংশগুলি পূর্বাভাসে যে চ্যালেঞ্জগুলির সম্মুখীন হয় তা তুলে ধরি, যা আমাদের মডেল সমাধান করে। তবে, এটি লক্ষ করা গুরুত্বপূর্ণ যে আমাদের মডেল একটি হিউম্যান ইনস্ট্যান্স সেগমেন্টেশন নেটওয়ার্ক হিসাবে ডিজাইন করা হয়নি। চিত্র ১৭ তে দেখানো হয়েছে, আমাদের ফ্রেমওয়ার্ক ইনপুট গাইডেন্স মেনে চলে, একই মাস্কে একাধিক ইনস্ট্যান্স থাকলেও সুনির্দিষ্ট আলফা ম্যাট পূর্বাভাস নিশ্চিত করে।

\ পরিশেষে, চিত্র ১২ এবং চিত্র ১১ আমাদের মডেলের সাধারণীকরণ ক্ষমতার উপর জোর দেয়। মডেলটি পটভূমি থেকে মানব বিষয় এবং অন্যান্য বস্তু উভয়ই সঠিকভাবে নিষ্কাশন করে, বিভিন্ন পরিস্থিতি এবং অবজেক্ট টাইপ জুড়ে এর বহুমুখিতা প্রদর্শন করে।

\ সমস্ত উদাহরণ হল ইন্টারনেট ছবি গ্রাউন্ড-ট্রুথ ছাড়া এবং r101fpn400e থেকে মাস্ক গাইডেন্স হিসাবে ব্যবহার করা হয়েছে।

\ চিত্র ১৩. আমাদের মডেল প্রাকৃতিক ছবিতে অত্যন্ত বিস্তারিত আলফা ম্যাট তৈরি করে। আমাদের ফলাফল দেখায় যে এটি ব্যয়বহুল কম্পিউটেশনাল খরচ ছাড়াই পূর্ববর্তী ইনস্ট্যান্স-অজ্ঞেয়বাদী এবং ইনস্ট্যান্স-সচেতনতা পদ্ধতিগুলির সাথে সঠিক এবং তুলনীয়। লাল বর্গ প্রতিটি ইনস্ট্যান্সের জন্য বিস্তারিত অঞ্চলগুলি জুম করে। (রঙিন এবং ডিজিটাল জুমে সর্বোত্তম দেখা যায়)।

\ চিত্র ১৪. আমাদের ফ্রেমওয়ার্ক অনেক ইনস্ট্যান্স সহ চরম ক্ষেত্রে সুনির্দিষ্টভাবে ইনস্ট্যান্সগুলি আলাদা করে। যদিও MGM প্রায়ই ইনস্ট্যান্সগুলির মধ্যে ওভারল্যাপিং ঘটায় এবং MGM⋆ শব্দ ধারণ করে, আমাদের বাহ্যিক ডেটাসেটে প্রশিক্ষিত InstMatt এর সাথে সমান ফলাফল তৈরি করে। লাল তীর ত্রুটি নির্দেশ করে। (রঙিন এবং ডিজিটাল জুমে সর্বোত্তম দেখা যায়)।

\ চিত্র ১৫. আমাদের ফ্রেমওয়ার্ক একক পাসে সুনির্দিষ্টভাবে ইনস্ট্যান্সগুলি আলাদা করে। প্রস্তাবিত সমাধান পূর্বাভাস/পরিমার্জন পাঁচবার চালানো ছাড়াই InstMatt এবং MGM এর সাথে তুলনীয় ফলাফল দেখায়। লাল তীর ত্রুটি নির্দেশ করে। (রঙিন এবং ডিজিটাল জুমে সর্বোত্তম দেখা যায়)।

\ চিত্র ১৬. MGM এবং SparseMat থেকে ভিন্ন, আমাদের মডেল ইনপুট গাইডেন্স মাস্কে দৃঢ়। অ্যাটেনশন হেড সহ, আমাদের মডেল InstMatt এর মতো ইনস্ট্যান্সগুলির মধ্যে জটিল পরিমার্জন ছাড়াই মাস্ক ইনপুটগুলিতে আরও স্থিতিশীল ফলাফল তৈরি করে। লাল তীর ত্রুটি নির্দেশ করে। (রঙিন এবং ডিজিটাল জুমে সর্বোত্তম দেখা যায়)।

\ চিত্র ১৭. আমাদের সমাধান মাল্টি-ইনস্ট্যান্স মাস্ক গাইডেন্সের সাথে সঠিকভাবে কাজ করে। যখন একটি গাইডেন্স মাস্কে একাধিক ইনস্ট্যান্স বিদ্যমান থাকে, আমরা এখনও সেই ইনস্ট্যান্সগুলির জন্য সঠিক ইউনিয়ন আলফা ম্যাট তৈরি করি। লাল তীর ত্রুটি বা লাল বক্সে জুম-ইন অঞ্চল নির্দেশ করে। (রঙিন এবং ডিজিটাল জুমে সর্বোত্তম দেখা যায়)।

\ সারণি ১২. HIM2K+M-HIM2K এ পরিমাণগত ফলাফলের বিস্তারিত (সারণি ৫ এর সম্প্রসারণ)। ধূসর পুনরায় প্রশিক্ষণ ছাড়াই পাবলিক ওয়েট নির্দেশ করে।

\ সারণি ১২. HIM2K+M-HIM2K এ পরিমাণগত ফলাফলের বিস্তারিত (সারণি ৫ এর সম্প্রসারণ)। ধূসর পুনরায় প্রশিক্ষণ ছাড়াই পাবলিক ওয়েট নির্দেশ করে। (অব্যাহত)

\ সারণি ১২. HIM2K+M-HIM2K এ পরিমাণগত ফলাফলের বিস্তারিত (সারণি ৫ এর সম্প্রসারণ)। ধূসর পুনরায় প্রশিক্ষণ ছাড়াই পাবলিক ওয়েট নির্দেশ করে। (অব্যাহত)

\ সারণি ১২. HIM2K+M-HIM2K এ পরিমাণগত ফলাফলের বিস্তারিত (সারণি ৫ এর সম্প্রসারণ)। ধূসর পুনরায় প্রশিক্ষণ ছাড়াই পাবলিক ওয়েট নির্দেশ করে। (অব্যাহত)

\ সারণি ১৩. V-HIM60 এ প্রস্তাবিত টেম্পোরাল কনসিস্টেন্সি মডিউলের কার্যকারিতা (সারণি ৬ এর সম্প্রসারণ)। দ্বি-দিকীয় Conv-GRU এবং ফরওয়ার্ড-ব্যাকওয়ার্ড ফিউশনের সংমিশ্রণ তিনটি টেস্ট সেটে সর্বোত্তম সামগ্রিক কর্মক্ষমতা অর্জন করে। বোল্ড প্রতিটি স্তরের জন্য সেরা হাইলাইট করে।

\

:::info লেখকগণ:

(১) চুয়ং হুইন, ইউনিভার্সিটি অফ মেরিল্যান্ড, কলেজ পার্ক (chuonghm@cs.umd.edu);

(২) সেউং উগ ও, অ্যাডোব রিসার্চ (seoh,jolee@adobe.com);

(৩) অভিনব শ্রীবাস্তব, ইউনিভার্সিটি অফ মেরিল্যান্ড, কলেজ পার্ক (abhinav@cs.umd.edu);

(৪) জুন-ইয়াং লি, অ্যাডোব রিসার্চ (jolee@adobe.com)।

:::


:::info এই গবেষণাপত্রটি CC by 4.0 Deed (Attribution 4.0 International) লাইসেন্সের অধীনে arxiv এ উপলব্ধ

:::

\

মার্কেটের সুযোগ
Mask Network লোগো
Mask Network প্রাইস(MASK)
$0.521
$0.521$0.521
-2.17%
USD
Mask Network (MASK) লাইভ প্রাইস চার্ট
ডিসক্লেইমার: এই সাইটে পুনঃপ্রকাশিত নিবন্ধগুলো সর্বসাধারণের জন্য উন্মুক্ত প্ল্যাটফর্ম থেকে সংগ্রহ করা হয়েছে এবং শুধুমাত্র তথ্যের উদ্দেশ্যে প্রদান করা হয়েছে। এগুলো আবশ্যিকভাবে MEXC-এর মতামতকে প্রতিফলিত করে না। সমস্ত অধিকার মূল লেখকদের কাছে সংরক্ষিত রয়েছে। আপনি যদি মনে করেন কোনো কনটেন্ট তৃতীয় পক্ষের অধিকার লঙ্ঘন করেছে, তাহলে অনুগ্রহ করে অপসারণের জন্য crypto.news@mexc.com এ যোগাযোগ করুন। MEXC কনটেন্টের সঠিকতা, সম্পূর্ণতা বা সময়োপযোগিতা সম্পর্কে কোনো গ্যারান্টি দেয় না এবং প্রদত্ত তথ্যের ভিত্তিতে নেওয়া কোনো পদক্ষেপের জন্য দায়ী নয়। এই কনটেন্ট কোনো আর্থিক, আইনগত বা অন্যান্য পেশাদার পরামর্শ নয় এবং এটি MEXC-এর সুপারিশ বা সমর্থন হিসেবে গণ্য করা উচিত নয়।

আপনি আরও পছন্দ করতে পারেন

AI যুগে Web3-এ যাচাইকৃত মানব পরিচয় ব্যবস্থার চাহিদা বাড়ায় Pi Network মনোযোগ আকর্ষণ করছে

AI যুগে Web3-এ যাচাইকৃত মানব পরিচয় ব্যবস্থার চাহিদা বাড়ায় Pi Network মনোযোগ আকর্ষণ করছে

AI যুগে ওয়েব৩-এ যাচাইকৃত মানব পরিচয় ব্যবস্থার চাহিদায় Pi Network মনোযোগ আকর্ষণ করছে ক্রিপ্টো এবং ওয়েব৩ সম্প্রদায়ের মধ্যে সম্প্রতি প্রচারিত একটি আলোচনা h
শেয়ার করুন
Hokanews2026/04/29 12:29
Pi Network মাইগ্রেশন আপডেট KYC সম্পন্ন হওয়ার টোকেন বিতরণে প্রভাব দেখাচ্ছে

Pi Network মাইগ্রেশন আপডেট KYC সম্পন্ন হওয়ার টোকেন বিতরণে প্রভাব দেখাচ্ছে

পাই নেটওয়ার্ক মাইগ্রেশন আপডেট দেখাচ্ছে KYC সম্পন্ন করা টোকেন বিতরণে কী প্রভাব ফেলছে পাই নেটওয়ার্ক কমিউনিটির সাম্প্রতিক আপডেটগুলি চলমান অগ্রগতি তুলে ধরেছে
শেয়ার করুন
Hokanews2026/04/29 12:55
CLARITY Act নাটক বিস্ফোরিত হয়েছে, Tillis নতুন আশঙ্কা তুলেছেন, Coinbase পাল্টা আঘাত করেছে এবং বিশেষজ্ঞরা বলছেন এটি ইতিমধ্যে মৃত

CLARITY Act নাটক বিস্ফোরিত হয়েছে, Tillis নতুন আশঙ্কা তুলেছেন, Coinbase পাল্টা আঘাত করেছে এবং বিশেষজ্ঞরা বলছেন এটি ইতিমধ্যে মৃত

ক্লারিটি অ্যাক্ট ক্রমবর্ধমান চাপের মুখে পড়েছে কারণ আইনপ্রণেতা, শিল্প নেতা এবং বিশ্লেষকরা ক্রিপ্টো নিয়ন্ত্রণ নিয়ে দ্বন্দ্বে জড়িয়েছেন ক্রিপ্টোকারেন্সি সংক্রান্ত একটি প্রধান প্রস্তাবিত আইন
শেয়ার করুন
Hokanews2026/04/29 12:30

24/7 লাইভ নিউজ

আরও

Roll the Dice & Win Up to 1 BTC

Roll the Dice & Win Up to 1 BTCRoll the Dice & Win Up to 1 BTC

Invite friends & share 500,000 USDT!