যখন মানুষ ই-কমার্স স্কেলিং নিয়ে কথা বলে, তারা বড় ইঞ্জিনিয়ারিং চ্যালেঞ্জগুলিতে ফোকাস করে: ডিস্ট্রিবিউটেড সার্চ, রিয়েল-টাইম ইনভেন্টরি, রেকমেন্ডেশন ইঞ্জিন এবং চেকআউট অপটিমাইজেশন। কিন্তু এসবের নিচে একটি নিরব, আরও স্থায়ী সমস্যা রয়েছে যা প্রায় প্রতিটি রিটেইলার মোকাবেলা করে: অ্যাট্রিবিউট ভ্যালু।
অ্যাট্রিবিউট হল প্রোডাক্ট ডিসকভারির মেরুদণ্ড। এগুলি ফিল্টার, তুলনা, সার্চ র্যাঙ্কিং এবং রেকমেন্ডেশন লজিক পাওয়ার করে। কিন্তু বাস্তব ক্যাটালগে, অ্যাট্রিবিউট ভ্যালু কদাচিৎ পরিষ্কার থাকে। এগুলি অসামঞ্জস্যপূর্ণ, ডুপ্লিকেট, ভুল ফরম্যাট বা শব্দার্থগতভাবে অস্পষ্ট।
সাইজ-এর মতো সহজ কিছু নিন। আপনি দেখতে পারেন:
Code
["XL", "Small", "12cm", "Large", "M", "S"]
অথবা রঙ:
Code
["RAL 3020", "Crimson", "Red", "Dark Red"]
পৃথকভাবে, এই অসামঞ্জস্যগুলি নিরীহ দেখায়। কিন্তু এগুলি ৩০ লক্ষেরও বেশি SKU জুড়ে গুণ করুন, প্রতিটিতে কয়েক ডজন অ্যাট্রিবিউট সহ, এবং সমস্যাটি সিস্টেমিক হয়ে ওঠে। ফিল্টারগুলি অপ্রত্যাশিতভাবে আচরণ করে, সার্চ ইঞ্জিন প্রাসঙ্গিকতা হারায়, মার্চেন্ডাইজাররা ম্যানুয়াল ক্লিনআপে ডুবে যায় এবং গ্রাহকদের জন্য প্রোডাক্ট ডিসকভারি ধীর এবং আরও হতাশাজনক হয়ে ওঠে।
এটি ছিল আমার সামনে চ্যালেঞ্জ যখন আমি Zoro-তে একজন ফুল-স্ট্যাক সফটওয়্যার ইঞ্জিনিয়ার হিসেবে কাজ করছিলাম, এমন একটি সমস্যা যা উপেক্ষা করা সহজ ছিল কিন্তু প্রতিটি প্রোডাক্ট পেজকে প্রভাবিত করেছিল।
আমি এমন একটি রহস্যময় ব্ল্যাক বক্স AI চাইনি যা শুধু জিনিসগুলি সাজায়। এই ধরনের সিস্টেমগুলি বিশ্বাস করা, ডিবাগ করা বা স্কেল করা কঠিন। পরিবর্তে, আমি এমন একটি পাইপলাইনের লক্ষ্য রেখেছিলাম যা:
ফলাফল ছিল একটি হাইব্রিড AI পাইপলাইন যা LLM থেকে প্রাসঙ্গিক যুক্তিকে স্পষ্ট নিয়ম এবং মার্চেন্ডাইজার নিয়ন্ত্রণের সাথে মিলিত করে। এটি প্রয়োজন হলে স্মার্টভাবে কাজ করে, কিন্তু সবসময় পূর্বাভাসযোগ্য থাকে। এটি গার্ডরেইল সহ AI, নিয়ন্ত্রণহীন AI নয়।
সমস্ত অ্যাট্রিবিউট প্রসেসিং অফলাইন ব্যাকগ্রাউন্ড জবে ঘটে, রিয়েল টাইমে নয়। এটি কোনো আপস ছিল না; এটি একটি কৌশলগত আর্কিটেকচারাল পছন্দ ছিল।
রিয়েল-টাইম পাইপলাইন আকর্ষণীয় শোনায়, কিন্তু ই-কমার্স স্কেলে, তারা পরিচয় করায়:
অন্যদিকে, অফলাইন জব আমাদের দিয়েছে:
লক্ষ লক্ষ SKU নিয়ে কাজ করার সময় গ্রাহক-মুখী সিস্টেমকে ডেটা-প্রসেসিং পাইপলাইন থেকে আলাদা রাখা অপরিহার্য।
ডেটাতে AI ব্যবহার করার আগে, আমি নয়েজ এবং বিভ্রান্তি অপসারণ করতে একটি স্পষ্ট প্রিপ্রসেসিং ধাপ চালিয়েছি। এই ধাপটি সহজ শোনাতে পারে, কিন্তু এটি LLM-এর যুক্তি ব্যাপকভাবে উন্নত করেছে।
ক্লিনিং পাইপলাইনে অন্তর্ভুক্ত ছিল:
এটি নিশ্চিত করেছে যে LLM পরিষ্কার, স্পষ্ট ইনপুট পেয়েছে, যা সামঞ্জস্যপূর্ণ ফলাফলের চাবিকাঠি। গারবেজ ইন, গারবেজ আউট। এই স্কেলে, এমনকি ছোট ত্রুটিগুলিও পরে বড় সমস্যা সৃষ্টি করতে পারে।
LLM শুধু ভ্যালুগুলি বর্ণানুক্রমিকভাবে সাজাচ্ছিল না। এটি তাদের সম্পর্কে যুক্তি দিচ্ছিল।
সেবা পেয়েছে:
এই প্রসঙ্গ দিয়ে, মডেলটি বুঝতে পারে:
মডেল ফেরত দিয়েছে:
এটি পাইপলাইনকে প্রতিটি ক্যাটাগরির জন্য হার্ডকোড নিয়ম ছাড়াই বিভিন্ন অ্যাট্রিবিউট টাইপ পরিচালনা করতে দেয়।
প্রতিটি অ্যাট্রিবিউটের AI প্রয়োজন নেই।
প্রকৃতপক্ষে, অনেক অ্যাট্রিবিউট ডিটারমিনিস্টিক লজিক দ্বারা ভালোভাবে পরিচালিত হয়।
সংখ্যাসূচক রেঞ্জ, ইউনিট-ভিত্তিক ভ্যালু এবং সাধারণ সেটগুলি প্রায়শই উপকৃত হয়:
পাইপলাইন স্বয়ংক্রিয়ভাবে এই ক্ষেত্রে সনাক্ত করেছে এবং তাদের জন্য ডিটারমিনিস্টিক লজিক ব্যবহার করেছে। এটি সিস্টেমকে দক্ষ রেখেছে এবং অপ্রয়োজনীয় LLM কলগুলি এড়িয়ে গেছে।
মার্চেন্ডাইজারদের এখনও নিয়ন্ত্রণ প্রয়োজন ছিল, বিশেষত ব্যবসা-সংবেদনশীল অ্যাট্রিবিউটগুলির জন্য।
তাই প্রতিটি ক্যাটাগরি ট্যাগ করা যেতে পারে:
এই ডুয়াল-ট্যাগ সিস্টেম মানুষকে চূড়ান্ত সিদ্ধান্ত নিতে দেয় যখন AI বেশিরভাগ কাজ করেছে। এটি বিশ্বাসও তৈরি করেছে, যেহেতু মার্চেন্ডাইজাররা পাইপলাইন ভাঙা ছাড়াই প্রয়োজন হলে মডেলকে ওভাররাইড করতে পারে।
সমস্ত ফলাফল সরাসরি একটি প্রোডাক্ট MongoDB ডেটাবেসে সংরক্ষণ করা হয়েছিল, আর্কিটেকচারকে সহজ এবং কেন্দ্রীভূত রেখে।
MongoDB হয়ে উঠেছে একক অপারেশনাল স্টোর:
এটি পরিবর্তনগুলি পর্যালোচনা করা, ভ্যালু ওভাররাইড করা, ক্যাটাগরি পুনঃপ্রক্রিয়া করা এবং অন্যান্য সিস্টেমের সাথে সিঙ্ক করা সহজ করে তুলেছে।
সাজানো হলে, ভ্যালুগুলি প্রবাহিত হয়েছে:
এটি নিশ্চিত করেছে যে:
সার্চ হল যেখানে অ্যাট্রিবিউট সাজানো সবচেয়ে দৃশ্যমান, এবং যেখানে সামঞ্জস্য সবচেয়ে গুরুত্বপূর্ণ।
লক্ষ লক্ষ SKU জুড়ে এটি কাজ করার জন্য, আমি ব্যাকগ্রাউন্ড জব, AI যুক্তি এবং সার্চ ইন্টিগ্রেশনের চারপাশে নির্মিত একটি মডুলার পাইপলাইন ডিজাইন করেছি। নিচের আর্কিটেকচার ডায়াগ্রামটি সম্পূর্ণ প্রবাহ ক্যাপচার করে:
এই প্রবাহ নিশ্চিত করে যে প্রতিটি অ্যাট্রিবিউট ভ্যালু, AI দ্বারা সাজানো হোক বা ম্যানুয়ালি সেট করা হোক, সার্চ, মার্চেন্ডাইজিং এবং গ্রাহক অভিজ্ঞতায় প্রতিফলিত হয়।
এভাবে অগোছালো ভ্যালুগুলি রূপান্তরিত হয়েছিল:
| অ্যাট্রিবিউট | কাঁচা ভ্যালু | অর্ডার করা আউটপুট | |----|----|----| | সাইজ | XL, Small, 12cm, Large, M, S | Small, M, Large, XL, 12cm | | রঙ | RAL 3020, Crimson, Red, Dark Red | Red, Dark Red, Crimson, Red (RAL 3020) | | উপাদান | Steel, Carbon Steel, Stainless, Stainless Steel | Steel, Stainless Steel, Carbon Steel | | সংখ্যাসূচক | 5cm, 12cm, 2cm, 20cm | 2cm, 5cm, 12cm, 20cm |
এই উদাহরণগুলি দেখায় কীভাবে পাইপলাইন পরিষ্কার, সহজে বোঝার ক্রম তৈরি করতে প্রাসঙ্গিক যুক্তিকে স্পষ্ট নিয়মের সাথে একত্রিত করে।
রিয়েল-টাইম প্রসেসিং পরিচয় করাত:
অফলাইন জব আমাদের দিয়েছে:
ট্রেড-অফ ছিল ডেটা ইনজেশন এবং ডিসপ্লে-এর মধ্যে একটি ছোট বিলম্ব, কিন্তু সুবিধা ছিল স্কেলে সামঞ্জস্য, যা গ্রাহকরা অনেক বেশি মূল্য দেয়।
ফলাফলগুলি উল্লেখযোগ্য ছিল:
এটি শুধু একটি প্রযুক্তিগত জয় ছিল না; এটি ব্যবহারকারীর অভিজ্ঞতা এবং রাজস্বের জন্যও একটি জয় ছিল।
অ্যাট্রিবিউট ভ্যালু সাজানো সহজ শোনায়, কিন্তু যখন আপনাকে লক্ষ লক্ষ প্রোডাক্টের জন্য এটি করতে হয় তখন এটি একটি প্রকৃত চ্যালেঞ্জ হয়ে ওঠে।
LLM বুদ্ধিমত্তাকে স্পষ্ট নিয়ম এবং মার্চেন্ডাইজার নিয়ন্ত্রণের সাথে একত্রিত করে, আমি একটি জটিল, লুকানো সমস্যাকে একটি পরিষ্কার, স্কেলযোগ্য সিস্টেমে রূপান্তরিত করেছি।
এটি একটি অনুস্মারক যে কিছু বৃহত্তম জয় আসে বিরক্তিকর সমস্যাগুলি সমাধান করে, যেগুলি মিস করা সহজ কিন্তু প্রতিটি প্রোডাক্ট পেজে দেখা যায়।
\n \n \n


