सामान्य एआई का परिदृश्य तेजी से विकसित हो रहा है, कंपनियों के साथ अधिक कुशल, सक्षम और सुलभ मॉडल बनाने के लिए दौड़। नवीनतम प्रवेशकों के बीच, मिस्ट्रल स्मॉल 3, अलीबाबा के Qwen2.5-Max, और DeepSeek R1 Openai के स्थापित CHATGPT के साथ प्रभुत्व के लिए मर रहे हैं। प्रत्येक मॉडल AI और उपयोग किए गए मामलों के लिए एक अनूठा दृष्टिकोण प्रस्तुत करता है।
मिस्ट्रल छोटा 3
मिस्ट्रल एआई का नवीनतम मॉडल, मिस्ट्रल छोटा 3, एक 24 बिलियन-पैरामीटर मॉडल है जो कम विलंबता अनुप्रयोगों के लिए अनुकूलित होने का दावा करता है। ओपन अपाचे 2.0 लाइसेंस के तहत जारी, इसे लामा 3.3 70 बी और क्यूवेन 32 बी जैसे बड़े मॉडलों के लिए एक प्रत्यक्ष प्रतियोगी के रूप में तैनात किया गया है, जिसने समान प्रदर्शन के स्तर को बनाए रखते हुए गति को तीन गुना घमंड करने का दावा किया था। कंपनी के अनुसार, मिस्ट्रल छोटे 3 एक्सेल:
QWEN2.5-MAX
अलीबाबा का QWEN2.5-MAX 20 ट्रिलियन टोकन पर एक बहुत बड़ा मिश्रण-ऑफ-आउट-आउट-आउट-आउट-आउट-आउट-आउट-आउट-आउट-आउट-आउट-आउट है। यह अपनी क्षमताओं को बढ़ाने के लिए मानव प्रतिक्रिया (RLHF) से पर्यवेक्षित फाइन-ट्यूनिंग (SFT) और सुदृढीकरण सीखने का लाभ उठाने का दावा किया जाता है। चीनी कंपनी का सुझाव है कि बेंचमार्क में, प्लेटफ़ॉर्म डीपसेक वी 3 को विभिन्न परीक्षणों में, एरिना-हार्ड और लाइवबेंच सहित विभिन्न परीक्षणों में, जबकि जीपीटी -4 ओ के साथ निकटता से प्रतिस्पर्धा करता है।
QWEN2.5-MAX के लिए बाहर खड़े होने का दावा किया जाता है:
- सामान्य तर्क और ज्ञान-आधारित कार्यों में मजबूत प्रदर्शन
- उन्नत कोडिंग क्षमताओं को LiveCodebench के माध्यम से परीक्षण किया गया
- अलीबाबा क्लाउड के माध्यम से उपलब्धता और Qwen चैट
दीपसेक आर 1
दीपसेक आर 1एक अन्य ओपन-सोर्स दावेदार, अर्जित तर्क और कार्य विशेषज्ञता पर जोर देता है। मिस्ट्रल स्मॉल 3 के विपरीत, जो आरएल या सिंथेटिक डेटा के साथ प्रशिक्षित नहीं है, डीपसेक आर 1 प्रतिक्रिया गुणवत्ता को बढ़ाने के लिए सुदृढीकरण सीखने की तकनीकों का लाभ उठाता है। जबकि डीपसेक आर 1 जीपीटी -4 ओ या क्लाउड -3.5 के खिलाफ व्यापक रूप से बेंचमार्क नहीं किया गया है, यह शोधकर्ताओं और डेवलपर्स के लिए एक मूल्यवान संसाधन के रूप में कार्य करता है, जो एक ओपन-वेट एआई मॉडल के साथ प्रयोग करने में रुचि रखते हैं।
चटपट
Openai की चैट, विशेष रूप से नवीनतम पुनरावृत्तियों की तरह GPT-4Oवाणिज्यिक एआई प्रदर्शन के लिए बेंचमार्क बना हुआ है। मालिकाना जबकि, यह व्यापक पोस्ट-ट्रेनिंग और सुदृढीकरण सीखने से लाभान्वित होता है, जिससे यह तर्क, संवादी सुसंगतता और रचनात्मक पीढ़ी के लिए सक्षम हो जाता है। CHATGPT का व्यापक रूप से उपयोग किया जाता है:
- सामान्य ज्ञान और तर्क कार्य
- ग्राहक सहायता और स्वचालन के लिए व्यावसायिक अनुप्रयोग
- रचनात्मक लेखन और समस्या-समाधान
जबकि प्रत्येक मॉडल की अपनी ताकत होती है, उनके बीच का विकल्प उपयोग के मामले पर निर्भर करता है। Mistral Small 3 गति और स्थानीय तैनाती को प्राथमिकता देने वाले उपयोगकर्ताओं के लिए आदर्श है, Qwen2.5-Max शक्तिशाली बड़े पैमाने पर खुफिया जानकारी प्रदान करता है, DeepSeek R1 एक ओपन-सोर्स विकल्प प्रदान करता है, और CHATGPT जनरेटिव AI में एक वाणिज्यिक सोने का मानक बना हुआ है।
Mistral Small 3 बनाम Qwen बनाम दीपसेक बनाम CHATGPT: क्षमताएं, गति, मामलों का उपयोग और अधिक तुलना