Anyscale-এর Ray Serve LLM আপডেট vLLM WideEP ডিপ্লয়মেন্টের জন্য DP গ্রুপ ফল্ট টলারেন্স সক্ষম করে, যা বিতরণকৃত AI ইনফারেন্স সিস্টেমের ডাউনটাইম ঝুঁকি হ্রাস করে। (ReadAnyscale-এর Ray Serve LLM আপডেট vLLM WideEP ডিপ্লয়মেন্টের জন্য DP গ্রুপ ফল্ট টলারেন্স সক্ষম করে, যা বিতরণকৃত AI ইনফারেন্স সিস্টেমের ডাউনটাইম ঝুঁকি হ্রাস করে। (Read

Ray 2.55 বড় আকারের AI মডেল ডিপ্লয়মেন্টের জন্য ফল্ট টলারেন্স যোগ করেছে

2026/04/03 02:35
3 মিনিটে পড়া যাবে
এই বিষয়বস্তু সম্পর্কে মতামত বা উদ্বেগ জানাতে, অনুগ্রহ করে আমাদের সাথে crypto.news@mexc.com ঠিকানায় যোগাযোগ করুন

Ray 2.55 বড় মাপের AI মডেল স্থাপনার জন্য ফল্ট টলারেন্স যোগ করেছে

Joerg Hiller এপ্রিল ০২, ২০২৬ ১৮:৩৫

Anyscale-এর Ray Serve LLM আপডেট vLLM WideEP স্থাপনার জন্য DP গ্রুপ ফল্ট টলারেন্স সক্ষম করে, বিতরণকৃত AI ইনফারেন্স সিস্টেমের জন্য ডাউনটাইম ঝুঁকি হ্রাস করে।

Ray 2.55 বড় মাপের AI মডেল স্থাপনার জন্য ফল্ট টলারেন্স যোগ করেছে

Anyscale তার Ray Serve LLM ফ্রেমওয়ার্কে একটি গুরুত্বপূর্ণ আপডেট প্রকাশ করেছে যা বড় মাপের AI ইনফারেন্স ওয়ার্কলোড চালানো প্রতিষ্ঠানগুলির জন্য একটি গুরুত্বপূর্ণ অপারেশনাল চ্যালেঞ্জ সমাধান করে। Ray 2.55 vLLM ওয়াইড এক্সপার্ট প্যারালেলিজম স্থাপনার জন্য ডেটা প্যারালেল (DP) গ্রুপ ফল্ট টলারেন্স প্রবর্তন করে—একটি বৈশিষ্ট্য যা একক GPU ব্যর্থতাকে সম্পূর্ণ মডেল সার্ভিং ক্লাস্টার বন্ধ হওয়া থেকে প্রতিরোধ করে।

আপডেটটি মিক্সচার অফ এক্সপার্টস (MoE) মডেল সার্ভিংয়ের একটি নির্দিষ্ট সমস্যাকে লক্ষ্য করে। ট্র্যাডিশনাল মডেল স্থাপনার বিপরীতে যেখানে প্রতিটি রেপ্লিকা স্বাধীনভাবে কাজ করে, DeepSeek-V3-এর মতো MoE আর্কিটেকচার এক্সপার্ট লেয়ারগুলিকে GPU-এর গ্রুপ জুড়ে শার্ড করে যা সম্মিলিতভাবে কাজ করতে হয়। যখন এই কনফিগারেশনে একটি GPU ব্যর্থ হয়, তখন সম্পূর্ণ গ্রুপ—সম্ভাব্যভাবে 16 থেকে 128 GPU জুড়ে—অকার্যকর হয়ে পড়ে।

প্রযুক্তিগত সমস্যা

MoE মডেলগুলি একাধিক GPU জুড়ে বিশেষায়িত "এক্সপার্ট" নিউরাল নেটওয়ার্ক বিতরণ করে। উদাহরণস্বরূপ, DeepSeek-V3 প্রতি লেয়ারে 256টি এক্সপার্ট ধারণ করে কিন্তু প্রতি টোকেনে মাত্র 8টি সক্রিয় করে। টোকেনগুলি যেকোনো GPU-তে রাউট হয় যা প্রয়োজনীয় এক্সপার্টদের ডিসপ্যাচ এবং কম্বাইন অপারেশনের মাধ্যমে ধারণ করে যার জন্য সমস্ত অংশগ্রহণকারী র‍্যাঙ্কগুলিকে সুস্থ থাকতে হয়।

পূর্বে, একক র‍্যাঙ্ক ব্যর্থতা এই সম্মিলিত অপারেশনগুলি ভেঙে ফেলত। প্রভাবিত গ্রুপে বেঁচে থাকা রেপ্লিকাগুলিতে কোয়েরি রাউটিং অব্যাহত থাকত, কিন্তু প্রতিটি রিকোয়েস্ট ব্যর্থ হত। পুনরুদ্ধারের জন্য সম্পূর্ণ সিস্টেম পুনরায় চালু করা প্রয়োজন ছিল।

Ray কীভাবে এটি সমাধান করে

Ray Serve LLM এখন গ্যাং শিডিউলিংয়ের মাধ্যমে প্রতিটি DP গ্রুপকে একটি পারমাণবিক ইউনিট হিসাবে বিবেচনা করে। যখন একটি র‍্যাঙ্ক ব্যর্থ হয়, তখন সিস্টেমটি সম্পূর্ণ গ্রুপকে অসুস্থ হিসাবে চিহ্নিত করে, এতে ট্রাফিক রাউটিং বন্ধ করে, ব্যর্থ গ্রুপটি ভেঙে ফেলে এবং এটিকে একটি ইউনিট হিসাবে পুনর্নির্মাণ করে। অন্যান্য সুস্থ গ্রুপগুলি সর্বত্র রিকোয়েস্ট সার্ভিং চালিয়ে যায়।

বৈশিষ্ট্যটি Ray 2.55-এ ডিফল্টরূপে সক্ষম হয়ে শিপ করে। বিদ্যমান DP স্থাপনার জন্য কোনো কোড পরিবর্তনের প্রয়োজন নেই—ফ্রেমওয়ার্কটি স্বয়ংক্রিয়ভাবে গ্রুপ-স্তরের স্বাস্থ্য পরীক্ষা, শিডিউলিং এবং পুনরুদ্ধার পরিচালনা করে।

অটোস্কেলিং এই সীমানাগুলিকেও সম্মান করে। স্কেল-আপ এবং স্কেল-ডাউন অপারেশনগুলি পৃথক রেপ্লিকার পরিবর্তে গ্রুপ-আকারের বৃদ্ধিতে ঘটে, যা আংশিক গ্রুপের তৈরি প্রতিরোধ করে যা ট্রাফিক সার্ভ করতে পারে না।

অপারেশনাল প্রভাব

আপডেটটি একটি গুরুত্বপূর্ণ ডিজাইন বিবেচনা তৈরি করে: গ্রুপের প্রশস্ততা বনাম গ্রুপের সংখ্যা। Anyscale দ্বারা উদ্ধৃত vLLM বেঞ্চমার্ক অনুসারে, প্রতি GPU থ্রুপুট 32, 72, এবং 96 এর এক্সপার্ট প্যারালেল সাইজ জুড়ে তুলনামূলকভাবে স্থিতিশীল থাকে। এর অর্থ হল অপারেটররা দক্ষতা ত্যাগ না করে ছোট গ্রুপের দিকে টিউন করতে পারেন—এবং ছোট গ্রুপের অর্থ ব্যর্থতা ঘটলে ছোট ব্লাস্ট রেডিআই।

Anyscale উল্লেখ করে যে এই অর্কেস্ট্রেশন-স্তরের স্থিতিস্থাপকতা vLLM কমিউনিটিতে ঘটছে ইঞ্জিন-স্তরের ইলাস্টিসিটি কাজের পরিপূরক। vLLM ইলাস্টিক এক্সপার্ট প্যারালেলিজম RFC এ সম্বোধন করে যে কীভাবে রানটাইম একটি গ্রুপের মধ্যে গতিশীলভাবে টপোলজি সামঞ্জস্য করতে পারে, যখন Ray Serve LLM পরিচালনা করে কোন গ্রুপগুলি বিদ্যমান এবং ট্রাফিক গ্রহণ করে।

বড় মাপে DeepSeek-স্টাইল মডেল স্থাপন করা প্রতিষ্ঠানগুলির জন্য, ব্যবহারিক সুবিধা সরল: GPU ব্যর্থতাগুলি সিস্টেম-ব্যাপী বিভ্রাটের পরিবর্তে স্থানীয় ঘটনায় পরিণত হয়। কোড নমুনা এবং পুনরুত্পাদন পদক্ষেপগুলি Anyscale-এর GitHub রিপোজিটরিতে উপলব্ধ।

চিত্র সূত্র: Shutterstock
  • ray
  • vllm
  • এআই অবকাঠামো
  • মেশিন লার্নিং
  • বিতরণকৃত কম্পিউটিং
মার্কেটের সুযোগ
Raydium লোগো
Raydium প্রাইস(RAY)
$0.6314
$0.6314$0.6314
-1.09%
USD
Raydium (RAY) লাইভ প্রাইস চার্ট

CHZ +28%! Will History Repeat?

CHZ +28%! Will History Repeat?CHZ +28%! Will History Repeat?

0-fee opening long & short. Be ready for any move!

ডিসক্লেইমার: এই সাইটে পুনঃপ্রকাশিত নিবন্ধগুলো সর্বসাধারণের জন্য উন্মুক্ত প্ল্যাটফর্ম থেকে সংগ্রহ করা হয়েছে এবং শুধুমাত্র তথ্যের উদ্দেশ্যে প্রদান করা হয়েছে। এগুলো আবশ্যিকভাবে MEXC-এর মতামতকে প্রতিফলিত করে না। সমস্ত অধিকার মূল লেখকদের কাছে সংরক্ষিত রয়েছে। আপনি যদি মনে করেন কোনো কনটেন্ট তৃতীয় পক্ষের অধিকার লঙ্ঘন করেছে, তাহলে অনুগ্রহ করে অপসারণের জন্য crypto.news@mexc.com এ যোগাযোগ করুন। MEXC কনটেন্টের সঠিকতা, সম্পূর্ণতা বা সময়োপযোগিতা সম্পর্কে কোনো গ্যারান্টি দেয় না এবং প্রদত্ত তথ্যের ভিত্তিতে নেওয়া কোনো পদক্ষেপের জন্য দায়ী নয়। এই কনটেন্ট কোনো আর্থিক, আইনগত বা অন্যান্য পেশাদার পরামর্শ নয় এবং এটি MEXC-এর সুপারিশ বা সমর্থন হিসেবে গণ্য করা উচিত নয়।

আপনি আরও পছন্দ করতে পারেন

মার্কিন-ইরান আলোচনা সবে শুরু হয়েছে এবং ট্রাম্প ইতিমধ্যেই হামলার হুমকি দিচ্ছেন, যার ফলে আলোচনা স্থগিত হয়ে গেছে

মার্কিন-ইরান আলোচনা সবে শুরু হয়েছে এবং ট্রাম্প ইতিমধ্যেই হামলার হুমকি দিচ্ছেন, যার ফলে আলোচনা স্থগিত হয়ে গেছে

ভাইস প্রেসিডেন্ট জেডি ভ্যান্স মধ্যপ্রাচ্য সংঘাত অবসানের লক্ষ্যে একটি চুক্তি এগিয়ে নিতে উচ্চ পর্যায়ের আলোচনার সময় পাকিস্তানের প্রধানমন্ত্রী শেহবাজ শরিফের সঙ্গে বৈঠকের অপেক্ষায় রয়েছেন
শেয়ার করুন
Fortune2026/06/22 05:09
ফিলিপাইন বলছে RWA টোকেনাইজেশন ফ্রেমওয়ার্ক প্রস্তুত

ফিলিপাইন বলছে RWA টোকেনাইজেশন ফ্রেমওয়ার্ক প্রস্তুত

এসইসি কমিশনার রোগেলিও কুয়েভেদো বলেছেন যে ফিলিপাইন এখন টোকেনাইজড রিয়েল-ওয়ার্ল্ড অ্যাসেট, ব্লক সমর্থন করার জন্য প্রয়োজনীয় আইনি কাঠামো অর্জন করেছে
শেয়ার করুন
Hokanews2026/06/22 10:54
মাইকেল বারি স্পেসএক্সের সাথে ৩ ট্রিলিয়ন ডলারের সমস্যা দেখছেন

মাইকেল বারি স্পেসএক্সের সাথে ৩ ট্রিলিয়ন ডলারের সমস্যা দেখছেন

মাইকেল বারি SpaceX-এর ৩ ট্রিলিয়ন ডলার বৃদ্ধির পেছনের গণিত নিয়ে প্রশ্ন তুলেছেন।
শেয়ার করুন
Thestreet2026/06/22 06:03

World Cup Combo: Aim for 200x

World Cup Combo: Aim for 200xWorld Cup Combo: Aim for 200x

Combine up to 20 World Cup matches in one order