GPT-4o (जीपीटी फोर ओ) हे नवं मॉडेल आता नैसर्गिक मानवी-संगणक परस्परसंवादाच्या दिशेने एक पाऊल आहे असं सांगितलं आहे. हे मॉडेल टेक्स्ट, ऑडिओ आणि व्हिडिओचा अभ्यास करू शकेल. विशेष म्हणजे यापैकी वेगळ्या प्रकारचे इनपुट एकत्र करून त्यानुसार अपेक्षित उत्तरे मिळवू शकेल. Vision अंतर्गत मिळणाऱ्या नव्या सोयी नक्कीच आश्चर्यचकित करणाऱ्या आहेत.
नवीन मॉडेल इमेजेस वाचू आणि चर्चा करू शकते, भाषांचे भाषांतर करू शकते आणि व्हिज्युअल एक्सप्रेशनमधून भावना ओळखू शकते. यामध्ये आता मेमरी देखील आहे त्यामुळे ती मागील प्रॉम्प्ट आठवू शकते आणि त्या नुसार उत्तर बदलून देऊ शकेल! आता याद्वारे तयार केल्या जाणाऱ्या इमेजेसमध्ये टेक्स्ट योग्य पद्धतीने दिसेल.
या ChatGPT च्या नव्या मॉडेलमध्ये Hey ChatGPT असे बोलून आपण आपल्या चेहऱ्यावरील हावभाव ओळखून आपण सध्या अनुभवत असलेल्या भावनांबद्दलसुद्धा अंदाज व्यक्त करू शकतो! सोबतच लाईव्ह भाषांतर करणे, लाईव्ह इमेजचा अभ्यास करून गणितं सोडवण्यास अगदी शिक्षकाप्रमाणे बोलून मदत करणे, कोडिंग प्रॉब्लेम मध्ये मदत करणे, अगदी लहान मुलांना झोपवण्यासाठी बेड टाइम गोष्टी त्या सुद्धा आपल्या हव्या त्या आवाजात आणि त्यामधील चढउतारसुद्धा नियंत्रित करता येतील. स्वतःच्या इनपुटनुसार नवे फॉन्टसुद्धा तयार करून देईल, लोगोचं 3D Rendering करून देईल, साऊंड इफेक्टस तयार करेल, इ.
OpenAI च्या वेबसाइटवर त्यांच्या नवीन मॉडेलमध्ये पूर्वीच्या तुलनेत किती प्रमाणात कमी Tokens लागतील हे दर्शवण्यासाठी मराठीचंही उदाहरण दिलेलं आहे! मराठी भाषेत बोलत असताना आता पूर्वीपेक्षा २.९ पट कमी टोकन्सचा वापर होईल!
आज जाहीर करण्यात आलेल्या ठळक गोष्टी :
- GPT-4o नावाचं नवं multimodal मॉडेल जे टेक्स्ट, ऑडिओ आणि व्हिडिओचा अभ्यास करून उत्तर देऊ शकतं
- हे मॉडेल वापरुन ChatGPT आता मानवी आवाजाच्या जवळ वाटेल असा संवाद साधेल
- GPT-4o फ्री आणि पेड अशा दोन्ही यूजर्ससाठी उपलब्ध होणार!
- प्रथमच ChatGPT च्या फ्री युजर्सना कस्टम चॅटबॉट वापरता येणार!
- ChatGPT चं डेस्कटॉप ॲप उपलब्ध होणार (आधी मॅकवर)!
- येत्या आठवड्यांत टप्प्याटप्प्याने या सोयी मिळणार!
काही दिवसांपूर्वीच त्यांनी आणखी एक बदल केला होता ज्यामुळे ChatGPT Sign In / Sign Up न करता कुठेही वापरता येईल! यामुळे आपला ChatGPT चा वापर पूर्णपणे गोपनीय असेल!
खालील व्हिडिओमध्ये GPT-4o चे बरेच डेमो पाहू शकता.