हाल ही में अलीबाबा ने एक नए कृत्रिम बुद्धिमत्ता (AI) मॉडल “QwQ-32B” को लॉन्च किया है, जिसे प्रमुख AI मॉडल्स के साथ प्रतिस्पर्धा करने के लिए डिज़ाइन किया गया है। यह नया मॉडल गणितीय और तार्किक सोच के मानकों पर उच्च-स्तरीय प्रदर्शन करता है। आगे पढ़ें और जानें कि यह मॉडल कैसे OpenAI के मॉडल्स को चुनौती दे रहा है।
अलीबाबा का QwQ-32B AI मॉडल
एक ब्लॉग पोस्ट में, अलीबाबा ने अपने नए तर्क-केंद्रित बड़े भाषा मॉडल (LLM) QwQ-32B की विशेषताओं और सीमाओं को रेखांकित किया। यह मॉडल फिलहाल पूर्वावलोकन (प्रिव्यू) के रूप में उपलब्ध है। इसका निर्माण 32 अरब पैरामीटर्स पर आधारित है और इसमें 32,000 टोकन्स का संदर्भ विंडो है। यह मॉडल पहले से पूर्व-प्रशिक्षण और पोस्ट-प्रशिक्षण के चरणों को पूरा कर चुका है।
इस मॉडल की आर्किटेक्चर में ट्रांसफॉर्मर तकनीक का उपयोग किया गया है। पोज़िश्नल एनकोडिंग के लिए इसमें रोटरी पोज़िशन एंबेडिंग्स (RoPE) का प्रयोग किया गया है। इसके साथ-साथ स्विच्ड गेटेड लीनियर यूनिट (SwiGLU), रूट मीन स्क्वायर नॉर्मलाइजेशन (RMSNorm), और अटेंशन क्वेरी-की-वैल्यू बायस (Attention QKV) जैसे घटकों का भी समावेश किया गया है।
यह मॉडल, OpenAI GTP-o1 की तरह, उपयोगकर्ता की क्वेरी का आकलन करते समय आंतरिक चिंतन प्रक्रिया दिखाता है। यह प्रक्रिया मॉडल को विभिन्न सिद्धांतों का परीक्षण करने और उत्तर प्रस्तुत करने से पहले तथ्यों को जांचने में सक्षम बनाती है। अलीबाबा का दावा है कि इस मॉडल ने MATH-500 बेंचमार्क में 90.6% और AIME बेंचमार्क में 50% स्कोर प्राप्त किया है। यह परिणाम OpenAI के तर्क-केंद्रित मॉडल्स से बेहतर कहे जा रहे हैं।
QwQ-32B मॉडल की सीमाएं
हालांकि तर्क-केंद्रित AI मॉडल्स अधिक सटीक उत्तर और जटिल प्रश्नों का समाधान प्रदान कर सकते हैं, विशेषज्ञों का कहना है कि यह प्रगति AI मॉडल्स के “अधिक बुद्धिमान या सक्षम” होने का संकेत नहीं है। यह केवल टेस्ट-टाइम कंप्यूट नामक एक नई प्रक्रिया का उपयोग कर रहा है जो अधिक प्रॉसेसिंग समय लेकर कार्य पूर्ण करता है।
मॉडल की सीमाओं की बात करें तो, अलीबाबा ने स्वीकार किया कि QwQ-32B भाषाओं को मिलाने और कोड-स्विचिंग जैसी समस्याएं उत्पन्न कर सकता है। यह तर्क लूप्स में भी प्रवेश करता है, जिससे कुछ बार उत्तर अप्रत्याशित और गलत हो सकते हैं। इसके अलावा, गणितीय और तार्किक दक्षताओं के अलावा, अन्य क्षेत्रों में अभी भी सुधार की आवश्यकता है।
QwQ-32B मॉडल की उपलब्धता
अलीबाबा ने QwQ-32B मॉडल को Hugging Face पर डाल दिया है, जहां से इसे शैक्षणिक, व्यक्तिगत, और व्यावसायिक उद्देश्यों के लिए Apache 2.0 लाइसेंस के तहत डाउनलोड किया जा सकता है। हालांकि, मॉडल के वेट्स और डेटा सार्वजनिक रूप से उपलब्ध नहीं कराए गए हैं, जिससे उपयोगकर्ता मॉडल की आर्किटेक्चर या इसके पुनर्निर्माण को समझने में सक्षम नहीं होंगे।