sarvam ai kya hai : भारत में आर्टिफिशियल इंटेलिजेंस (एआई) को लेकर लंबे समय से यह सवाल उठता रहा है कि जब देश दुनिया को बड़ी संख्या में सॉफ्टवेयर इंजीनियर देता है और Google तथा Microsoft जैसी कंपनियों में भारतीय प्रोफेशनल शीर्ष पदों पर हैं, तब भी ChatGPT, Gemini या DeepSeek जैसे वैश्विक एआई प्रोडक्ट भारत में क्यों नहीं बन पाते. इसी बहस के बीच एक भारतीय स्टार्टअप सर्वम एआई (sarvam AI) चर्चा में है.
एआई इंपैक्ट समिट में चर्चा का केंद्र
दिल्ली के भारत मंडपम में आयोजित एआई इंपैक्ट समिट में सर्वम एआई को लेकर खास चर्चा हो रही है. कंपनी का दावा है कि उसका मॉडल भारतीय उपयोगकर्ताओं की जरूरतों को ध्यान में रखकर तैयार किया गया है और यह किफायती होने के साथ-साथ भारतीय भाषाओं में बेहतर प्रदर्शन करता है.
22 भारतीय भाषाओं में OCR क्षमता
सर्वम एआई का प्रमुख फीचर सर्वम विजन ऑप्टिकल कैरेक्टर रिकॉग्निशन (OCR) तकनीक पर आधारित है. कंपनी के अनुसार यह मॉडल तस्वीरों को समझने, दस्तावेज स्कैन करने और हाथ से लिखे टेक्स्ट को पढ़ने में सक्षम है. दावा किया गया है कि यह 22 भारतीय भाषाओं में जानकारी उपलब्ध करा सकता है. उदाहरण के लिए अगर आप किसी कागज पर लिखे गणित के सवाल को स्कैन करते हैं तो मॉडल उसका समाधान आपको उस भाषा में दे सकता है, जिस में आप चाहते हैं. इसके अलावा 10 भाषाओं में स्पीच रिकग्निशन और रियल टाइम ट्रांसलेशन की सुविधा भी उपलब्ध बताई गई है. हाल ही में एक सार्वजनिक कार्यक्रम में प्रधानमंत्री Narendra Modi के भाषण का एआई के जरिए कई भाषाओं में लाइव अनुवाद प्रसारित किया गया. हालांकि कंपनी ने यह स्पष्ट नहीं किया कि उस कार्यक्रम में उसकी तकनीक सीधे तौर पर इस्तेमाल हुई या नहीं.
84.3 प्रतिशत एक्यूरेसी का दावा
कंपनी के सह-संस्थापक प्रत्युष के अनुसार मॉडल 84.3 प्रतिशत एक्यूरेसी के साथ काम करता है. यानी 100 में से लगभग 84 मामलों में सही परिणाम देता है. उनका दावा है कि जटिल कार्यों में यह मॉडल Gemini और ChatGPT से बेहतर प्रदर्शन करता है. हालांकि विशेषज्ञों का कहना है कि यह तुलना मुख्य रूप से भारतीय भाषाओं और इंडिक स्क्रिप्ट्स के संदर्भ में है. चूंकि सर्वम एआई को भारतीय भाषाई डेटा पर प्रशिक्षित किया गया है, इसलिए इन भाषाओं में इसका प्रदर्शन स्वाभाविक रूप से बेहतर हो सकता है. दूसरी ओर वैश्विक मॉडल मुख्यत अंग्रेजी-आधारित प्रशिक्षण पर विकसित हुए हैं.
चैट फीचर पर चल रहा है काम
सर्वम एआई का एक अन्य फीचर बुलबुल V3 टेक्स्ट-टू-स्पीच तकनीक पर आधारित है. कंपनी का दावा है कि यह अंग्रेजी समेत कई भारतीय भाषाओं में टेक्स्ट को आवाज में बदल सकता है और इस क्षेत्र में यह वैश्विक लीडर ElevenLabs से बेहतर है. हालांकि यहां भी तुलना भारतीय भाषाओं के संदर्भ में की गई बताई जाती है. फिलहाल सर्वम एआई में पूर्ण विकसित चैट फीचर उपलब्ध नहीं है, लेकिन कंपनी इसके विकास पर काम कर रही है. अभी मॉडल परीक्षण चरण में है और सीमित उपयोगकर्ताओं के लिए उपलब्ध है.
वैश्विक प्रतिस्पर्धा से अभी दूरी
वैश्विक स्तर पर देखें तो Gemini उन्नत परीक्षा स्तर के प्रश्नपत्र तैयार करने में सक्षम है, जबकि ChatGPT एक्स-रे जैसी मेडिकल इमेज का विश्लेषण करने जैसे कार्य भी कर सकता है (हालांकि किसी भी मॉडल की सटीकता 100 प्रतिशत नहीं मानी जाती). विशेषज्ञों का मानना है कि सर्वम एआई भारतीय भाषाओं और स्थानीय उपयोग मामलों में निश्चित रूप से मजबूत दावेदारी पेश कर रहा है, लेकिन वैश्विक मंच पर शीर्ष स्तर की प्रतिस्पर्धा तक पहुंचने में अभी समय लग सकता है. फिलहाल यह कहा जा सकता है कि सर्वम एआई कुछ विशिष्ट क्षेत्रों में अंतरराष्ट्रीय मॉडलों को चुनौती देता नजर आ रहा है, खासकर भारतीय भाषाई संदर्भ में. हालांकि व्यापक क्षमताओं और वैश्विक मानकों पर खुद को स्थापित करने की दिशा में उसे अभी और विकास की जरूरत होगी.