Advertisement

LLAMA 2 Kya hai? META AI LLAMA kya hai? हिन्दी में पूरी जानकारी

LLAMA 2 क्या है? 

Meta AI LLAMA 2 क्या है?

LLAMA 2 Kya hai? META AI LLAMA kya hai? हिन्दी में पूरी जानकारी 


फेसबुक पेरेंट मेटा ने अपने चैटजीपीटी प्रतिद्वंद्वी एलएलएएमए  (बड़े भाषा मॉडल मेटा एआई) को सार्वजनिक किया


फेसबुक पेरेंट मेटा ने अपने चैटजीपीटी प्रतिद्वंद्वी एलएलएएमए (बड़े भाषा मॉडल मेटा एआई) को सार्वजनिक किया
LLAMA क्या है? मेटा एआई 


LLAMA Kya hai? META AI LLAMA kya hai? हिन्दी में पूरी जानकारी 


फेसबुक की मूल कंपनी मेटा प्लेटफॉर्म्स ने एक कृत्रिम बुद्धिमत्ता  प्रणाली बनाई है जो चैटजीपीटी और गूगल के बार्ड को टक्कर देती है लेकिन यह एक अलग दृष्टिकोण अपना रही है: इसे मुफ्त में जारी करना।


मेटा के सीईओ मार्क जुकरबर्ग ने मंगलवार को कहा कि कंपनी अपने एआई बड़े भाषा मॉडल की अगली पीढ़ी को पेश करने और लामा 2 के नाम से जानी जाने वाली तकनीक को अनुसंधान और व्यावसायिक उपयोग के लिए मुफ्त बनाने के लिए माइक्रोसॉफ्ट के साथ साझेदारी कर रही है।

तकनीकी प्रतिस्पर्धियों Google और Microsoft की तरह, सोशल मीडिया कंपनी के पास लंबे समय से AI तकनीक को आगे बढ़ाने के लिए समर्पित कंप्यूटर वैज्ञानिकों की एक बड़ी शोध टीम है। लेकिन यह छाया हुआ है क्योंकि चैटजीपीटी की रिलीज ने "जनरेटिव एआई" टूल से लाभ कमाने की होड़ मचा दी है जो नए गद्य, चित्र और अन्य मीडिया बना सकते हैं।

मेटा ने एआई सिस्टम बनाने के लिए उपयोग किए जाने वाले डेटा और कोड पर एक नज़र डालने के मामले में अपने कुछ बिग टेक प्रतिद्वंद्वियों की तुलना में अधिक खुला होकर खुद को अलग करने की कोशिश की है। यह तर्क दिया गया है कि इस तरह के खुलेपन से बाहरी शोधकर्ताओं के लिए उस पूर्वाग्रह और विषाक्तता को पहचानने और कम करने में मदद करना आसान हो जाता है जो एआई सिस्टम वास्तविक लोगों के लिखने और संवाद करने के तरीके को आत्मसात करके उठाता है।

जुकरबर्ग ने मंगलवार को एक फेसबुक पोस्ट में कहा, "ओपन सोर्स नवाचार को बढ़ावा देता है क्योंकि यह कई डेवलपर्स को नई तकनीक के साथ निर्माण करने में सक्षम बनाता है।" "यह सुरक्षा और सुरक्षा में भी सुधार करता है क्योंकि जब सॉफ़्टवेयर खुला होता है, तो अधिक लोग संभावित मुद्दों की पहचान करने और उन्हें ठीक करने के लिए इसकी जांच कर सकते हैं। मेरा मानना ​​​​है कि यदि पारिस्थितिकी तंत्र अधिक खुला होता तो यह अधिक प्रगति को अनलॉक करता, यही कारण है कि हम लामा 2 की ओपन सोर्सिंग कर रहे हैं। "

जुकरबर्ग ने मेटा के एआई कार्य के ओपन-सोर्सिंग के इतिहास की ओर इशारा किया, जैसे कि व्यापक रूप से उपयोग किए जाने वाले मशीन-लर्निंग फ्रेमवर्क प्योरटॉर्च का विकास।

लेकिन   नए मॉडल को पेश करने वाला 

इसमें कहा गया है कि नवीनतम मॉडल को "सार्वजनिक रूप से उपलब्ध स्रोतों से डेटा के एक नए मिश्रण पर प्रशिक्षित किया गया था, जिसमें मेटा के उत्पादों या सेवाओं से डेटा शामिल नहीं है," लेकिन यह निर्दिष्ट नहीं करता है कि किस डेटा का उपयोग किया गया था। इसमें कहा गया है कि मेटा ने उन वेबसाइटों से डेटा हटा दिया है जिनमें "निजी व्यक्तियों के बारे में बड़ी मात्रा में व्यक्तिगत जानकारी होती है।"


मेटा ने फरवरी में घोषित अपने  के पहले संस्करण का वर्णन करने के लिए बड़े भाषा मॉडल मेटा एआई के लिए संक्षिप्त नाम LLaMA का उपयोग किया। अब इसके दूसरे संस्करण, लामा 2 के लिए बड़े अक्षरों को हटा दिया गया है।

जुकरबर्ग ने कहा कि लोग इसके नए एआई मॉडल को सीधे या साझेदारी के माध्यम से डाउनलोड कर सकते हैं जो उन्हें माइक्रोसॉफ्ट के क्लाउड प्लेटफॉर्म एज़्योर पर "माइक्रोसॉफ्ट के सुरक्षा और सामग्री टूल के साथ" उपलब्ध कराता है।

उस साझेदारी की वित्तीय शर्तों का खुलासा नहीं किया गया था।

जबकि मेटा द्वारा माइक्रोसॉफ्ट को "पसंदीदा" भागीदार के रूप में वर्णित किया गया है, मेटा ने कहा कि मॉडल अमेज़ॅन वेब सेवाओं के माध्यम से भी उपलब्ध होंगे, जो माइक्रोसॉफ्ट का मुख्य क्लाउड प्रतिद्वंद्वी है, साथ ही एआई स्टार्टअप हगिंग फेस और अन्य भी।

माइक्रोसॉफ्ट चैटजीपीटी के निर्माता ओपनएआई का एक प्रमुख फंडर और भागीदार भी है। न तो ChatGPT और न ही Microsoft या Google की समान पेशकशें   हैं ।

 माइक्रोसॉफ्ट और मेटा ने मंगलवार को  के लिए माइक्रोसॉफ्ट के वार्षिक कार्यक्रम में नई एआई साझेदारी का भी खुलासा किया  । माइक्रोसॉफ्ट ने एक अलग बयान में कहा कि दोनों कंपनियां "एआई और इसके लाभों को लोकतांत्रिक बनाने के प्रति प्रतिबद्धता साझा करती हैं और हम उत्साहित हैं कि मेटा एक खुला दृष्टिकोण अपना रहा है।" मेटा पहले से ही Microsoft के Azure क्लाउड कंप्यूटिंग प्लेटफ़ॉर्म का ग्राहक है।

माइक्रोसॉफ्ट ने इग्नाइट नामक वर्चुअल इवेंट का भी उपयोग किया, यह दिखाने के लिए कि वह व्यवसायों से अपने प्रमुख जेनरेटिव एआई टूल, माइक्रोसॉफ्ट 365 कोपायलट के प्रत्येक उपयोगकर्ता के लिए 30 डॉलर का मासिक शुल्क लेगा, जो कि उन संगठनों द्वारा माइक्रोसॉफ्ट सेवाओं के लिए पहले से ही भुगतान किया जा रहा है।



मेटा कंपनी के शब्दों में:- 


खुले विज्ञान के प्रति मेटा की प्रतिबद्धता के हिस्से के रूप में, आज हम सार्वजनिक रूप से एलएलएएमए (लार्ज लैंग्वेज मॉडल मेटा एआई) जारी कर रहे हैं , जो एक अत्याधुनिक मूलभूत  बड़ा भाषा मॉडल  है जो शोधकर्ताओं को एआई के इस उपक्षेत्र में अपने काम को आगे बढ़ाने में मदद करने के लिए डिज़ाइन किया गया है। एलएलएएमए जैसे छोटे, अधिक प्रदर्शन करने वाले मॉडल अनुसंधान समुदाय में अन्य लोगों को सक्षम बनाते हैं जिनके पास इन मॉडलों का अध्ययन करने के लिए बड़ी मात्रा में बुनियादी ढांचे तक पहुंच नहीं है, जो इस महत्वपूर्ण, तेजी से बदलते क्षेत्र में पहुंच को और अधिक लोकतांत्रिक बनाता है।   

एलएलएएमए जैसे छोटे फाउंडेशन मॉडल का प्रशिक्षण बड़े भाषा मॉडल क्षेत्र में वांछनीय है क्योंकि इसमें नए दृष्टिकोणों का परीक्षण करने, दूसरों के काम को मान्य करने और नए उपयोग के मामलों का पता लगाने के लिए बहुत कम कंप्यूटिंग शक्ति और संसाधनों की आवश्यकता होती है। फाउंडेशन मॉडल बिना लेबल वाले डेटा के एक बड़े सेट पर प्रशिक्षित होते हैं, जो उन्हें विभिन्न प्रकार के कार्यों के लिए फाइन-ट्यूनिंग के लिए आदर्श बनाता है। हम LLaMA को कई आकारों (7B, 13B, 33B, और 65B पैरामीटर) पर उपलब्ध करा रहे हैं और एक LLaMA मॉडल कार्ड भी साझा कर रहे हैं जो बताता है कि हमने जिम्मेदार AI प्रथाओं के प्रति अपने दृष्टिकोण को ध्यान में रखते हुए मॉडल कैसे बनाया    

पिछले वर्ष में, बड़े भाषा मॉडल - अरबों मापदंडों के साथ प्राकृतिक भाषा प्रसंस्करण (एनएलपी) सिस्टम - ने रचनात्मक पाठ उत्पन्न करने,  गणितीय प्रमेयों को हल करने ,  प्रोटीन संरचनाओं की भविष्यवाणी करने ,  पढ़ने की समझ के सवालों का जवाब देने और बहुत कुछ करने की नई क्षमताएं दिखाई हैं। वे उन पर्याप्त संभावित लाभों के स्पष्ट मामलों में से एक हैं जो एआई बड़े पैमाने पर अरबों लोगों को प्रदान कर सकता है।

बड़े भाषा मॉडलों में सभी हालिया प्रगति के बावजूद, ऐसे बड़े मॉडलों को प्रशिक्षित करने और चलाने के लिए आवश्यक संसाधनों के कारण उन तक पूर्ण अनुसंधान पहुंच सीमित बनी हुई है। इस प्रतिबंधित पहुंच के कारण शोधकर्ताओं की यह समझने की क्षमता सीमित हो गई है कि ये बड़े भाषा मॉडल कैसे और क्यों काम करते हैं, जिससे उनकी मजबूती में सुधार करने और पूर्वाग्रह, विषाक्तता और गलत सूचना उत्पन्न करने की क्षमता जैसे ज्ञात मुद्दों को कम करने के प्रयासों में प्रगति में बाधा आती है।

अधिक टोकन पर प्रशिक्षित छोटे मॉडल - जो शब्दों के टुकड़े हैं - विशिष्ट संभावित उत्पाद उपयोग मामलों के लिए फिर से प्रशिक्षित करना और ठीक करना आसान है। हमने 1.4 ट्रिलियन टोकन पर LLaMA 65B और LLaMA 33B को प्रशिक्षित किया। हमारा सबसे छोटा मॉडल, LLaMA 7B, एक ट्रिलियन टोकन पर प्रशिक्षित है।

अन्य बड़े भाषा मॉडलों की तरह, एलएलएएमए एक इनपुट के रूप में शब्दों के अनुक्रम को लेकर काम करता है और पाठ को पुनरावर्ती रूप से उत्पन्न करने के लिए अगले शब्द की भविष्यवाणी करता है। अपने मॉडल को प्रशिक्षित करने के लिए, हमने लैटिन और सिरिलिक वर्णमाला वाली भाषाओं पर ध्यान केंद्रित करते हुए सबसे अधिक बोलने वालों वाली 20 भाषाओं में से पाठ को चुना।

बड़े भाषा मॉडलों में पूर्वाग्रह, विषाक्त टिप्पणियों और मतिभ्रम के जोखिमों को दूर करने के लिए अभी भी अधिक शोध किए जाने की आवश्यकता है  । अन्य मॉडलों की तरह, एलएलएएमए इन चुनौतियों को साझा करता है। एक फाउंडेशन मॉडल के रूप में, LLaMA को बहुमुखी होने के लिए डिज़ाइन किया गया है और इसे कई अलग-अलग उपयोग के मामलों में लागू किया जा सकता है, बनाम एक बढ़िया-ट्यून मॉडल जो एक विशिष्ट कार्य के लिए डिज़ाइन किया गया है। LLaMA के लिए कोड साझा करके, अन्य शोधकर्ता बड़े भाषा मॉडल में इन समस्याओं को सीमित करने या समाप्त करने के लिए नए तरीकों का अधिक आसानी से परीक्षण कर सकते हैं। हम पेपर में मॉडल की सीमाओं को दिखाने और इस महत्वपूर्ण क्षेत्र में आगे के शोध का समर्थन करने के लिए मॉडल पूर्वाग्रहों और विषाक्तता का मूल्यांकन करने वाले बेंचमार्क पर मूल्यांकन का एक सेट भी प्रदान करते हैं।


अखंडता बनाए रखने और दुरुपयोग को रोकने के लिए, हम अपने मॉडल को अनुसंधान उपयोग के मामलों पर केंद्रित एक गैर-व्यावसायिक लाइसेंस के तहत जारी कर रहे हैं। अकादमिक शोधकर्ताओं को मामले-दर-मामले आधार पर मॉडल तक पहुंच प्रदान की जाएगी; सरकार, नागरिक समाज और शिक्षा जगत के संगठनों से जुड़े लोग; और दुनिया भर में उद्योग अनुसंधान प्रयोगशालाएँ। पहुंच के लिए आवेदन करने में रुचि रखने वाले लोग हमारे शोध पत्र में आवेदन का लिंक पा सकते हैं।

हमारा मानना ​​है कि पूरे एआई समुदाय - अकादमिक शोधकर्ताओं, नागरिक समाज, नीति निर्माताओं और उद्योग - को सामान्य रूप से जिम्मेदार एआई और विशेष रूप से जिम्मेदार बड़े भाषा मॉडल के बारे में स्पष्ट दिशानिर्देश विकसित करने के लिए मिलकर काम करना चाहिए। हम यह देखने के लिए उत्सुक हैं कि एलएलएएमए का उपयोग करके समुदाय क्या सीख सकता है - और अंततः निर्माण कर सकता है  


स्रोत: एफ ऐसबुक का ब्लॉग 







Post a Comment

0 Comments