MBZUAI ने Nanda का विमोचन करके आधे बिलियन से अधिक हिंदी भाषियों को विश्व के सर्वश्रेष्ठ ओपन-सोर्स Hindi LLM में प्रवेश पाने की सुविधा प्रदान की
News provided by
Mohamed bin Zayed University of Artificial Intelligence (MBZUAI)31 Oct, 2024, 20:50 IST
इस वर्ष की शुरुआत में घोषणा के बाद उपयोग के लिए 10 बिलियन पैरामीटर वाला ओपन-सोर्स लार्ज लैंग्वेज मॉडल उपलब्ध है
अबू धाबी, UAE, 31 अक्टूबर 2024 /PRNewswire/ -- Mohamed bin Zayed University of Artificial Intelligence (MBZUAI) - अनुसंधान के लिए समर्पित विश्व का पहला स्नातक स्तर का आर्टिफिशियल इंटेलिजेंस (AI) विश्वविद्यालय - ने विश्व का सबसे उन्नत ओपन-सोर्स हिन्दी लार्ज लैंग्वेज मॉडल (LLM) Nanda का विमोचन किया है।
ओपन सोर्स के रूप में जारी किए गए इस मॉडल को University के Institute of Foundation Models (IFM) ने Inception (एक G42 कंपनी) और Cerebras Systems के साथ साझेदारी में विकसित किया था, और इस वर्ष की शुरुआत में इसकी घोषणा की गई थी। यह विमोचन भारत के AI इकोसिस्टम के चल रहे विकास और न्यायसंगत AI की यात्रा में एक महत्वपूर्ण उपलब्धि है जिसमें अब आधे बिलियन से अधिक हिंदी भाषी अपनी मातृभाषा में जनरेटिव AI की क्षमता का उपयोग करने में सक्षम हैं।
व्यापक मूल्यांकन के आधार पर, समान आकार के किसी भी मौजूदा खुले हिंदी और बहुभाषी मॉडल की तुलना में हिंदी में बेहतर ज्ञान और तर्क क्षमता प्रदर्शित करने वाला Llama-3-Nanda-10B-Chat, या संक्षेप में Nanda, एक 10-बिलियन पैरामीटर मॉडल है। अंग्रेजी में भी यह अत्यंत प्रतिस्पर्धी है। इस मॉडल को G42 और Cerebras Systems द्वारा निर्मित Condor Galaxy सुपरकंप्यूटर पर प्रशिक्षित किया गया था। भारत की सबसे ऊंची चोटियों में से एक के नाम पर रखा गया, Nanda https://huggingface.co/MBZUAI/Llama-3-Nanda-10B-Chat पर उपलब्ध है।
MBZUAI के अध्यक्ष और विश्वविद्यालय के प्रोफेसर Eric Xing ने कहा: "हिंदी भाषा के लिए सटीक और कुशल LLM भारत की समावेशी और सुलभ AI की महत्वाकांक्षाओं के लिए महत्वपूर्ण है। Nanda के विमोचन के साथ, हम ओपन-सोर्स LLM के प्रति अपनी प्रतिबद्धता को सुदृढ़ कर रहे हैं तथा नई टेक्नोलॉजी को किफायती, सुरक्षित, नैतिक और मानकीकृत बनाने के प्रति अपनी प्रतिबद्धता को सुदृढ़ कर रहे हैं। यह एक शैक्षणिक संस्थान के रूप में हमारे सार्वजनिक भलाई के लिए जनरेटिव AI विकास का नेतृत्व करने और UAE की ज्ञान-आधारित अर्थव्यवस्था में योगदान देने के मिशन के अनुरूप है।"
MBZUAI में प्राकृतिक भाषा प्रोसेसिंग विभाग के अध्यक्ष और प्रोफेसर, परियोजना के प्रमुख, Preslav Nakov ने कहा, "Nanda, विश्व में सबसे अधिक बोली जाने वाली भाषाओं में से एक हिंदी के लिए जनरेटिव AI की दिशा में एक महत्वपूर्ण प्रगति है।"
"हम Nanda का एक खुले मॉडल के रूप में विमोचन कर रहे हैं, ताकि लोग इसे HuggingFace से डाउनलोड कर सकें और स्थानीय स्तर पर चला सकें। इसका आकार पर्याप्त है, और इसलिए इसकी हार्डवेयर आवश्यकताएं भी मामूली हैं।"
परियोजना के सह-प्रमुख, MBZUAI में प्राकृतिक भाषा प्रोसेसिंग के प्रोफेसर, Monojit Choudhury, ने कहा, "हिंदी में LLM की वर्तमान स्थिति अच्छी नहीं है। यह अंग्रेजी या कई यूरोपीय भाषाओं के कहीं भी निकट नहीं है। विशेषकर सैकड़ों मिलियन लोगों द्वारा बोले जाने वाली हिंदी जैसी भाषा के लिए LLM का एक उचित स्तर तक सृजन करना महत्वपूर्ण है। भारत, विश्व की सबसे बड़ी अर्थव्यवस्थाओं में से एक है; हिंदी की सेवा कर सकने में सक्षम कोई भी LLM, समुदायों को लाभान्वित करेगा क्योंकि इससे नए व्यावसायिक अवसर खुलेंगे।"
Nanda का शुभारंभ, विश्व के अग्रणी अरबी LLM, Jais की सफलता पर आधारित है तथा यह MBZUAI के उन्नत फाउंडेशन मॉडलों के समूह में सम्मिलित हो गया है। Jais ने अरबी प्राकृतिक भाषा प्रोसेसिंग (NLP) को रूपांतरित किया है, जिससे वैश्विक स्तर पर 400 मिलियन से अधिक अरबी भाषियों के लिए मूल-भाषा जनरेटिव AI क्षमताओं तक पहुंच खुल गई।
फ़ोटो: https://mma.prnewswire.com/media/2544598/MBZUAI_Eric_Xing.jpg
Share this article