मोबाइल और वेब ऐप्लिकेशन के लिए, Firebase AI Logic SDK टूल की मदद से, सीधे अपने ऐप्लिकेशन से, काम करने वाले Gemini मॉडल और Imagen मॉडल के साथ इंटरैक्ट किया जा सकता है.
Gemini मॉडल को मल्टीमोडल माना जाता है, क्योंकि ये टेक्स्ट, कोड, PDF, इमेज, वीडियो, और ऑडियो जैसे कई तरह के इनपुट को प्रोसेस करने के साथ-साथ जनरेट भी कर सकते हैं. Imagen मॉडल को टेक्स्ट के ज़रिए इमेज जनरेट करने के लिए कहा जा सकता है.
यहां दी गई टेबल में, Firebase AI Logic के साथ काम करने वाले मॉडल और उनके सबसे नए मॉडल के नामों के बारे में खास जानकारी दी गई है. इस टेबल में, प्रोटोटाइप के इस्तेमाल के उदाहरणों के लिए उपलब्ध, झलक और प्रयोग के तौर पर उपलब्ध मॉडल की सूची भी दी गई है.
Gemini मॉडल
मॉडल | इनपुट | आउटपुट | ब्यौरा |
---|---|---|---|
Gemini स्टेबल वर्शन वाले मॉडल | |||
Gemini 2.0 Flashgemini-2.0-flash-001
|
टेक्स्ट, कोड, PDF, इमेज, वीडियो, ऑडियो | टेक्स्ट, कोड, JSON | अगली पीढ़ी की सुविधाओं और बेहतर क्षमताओं वाला हमारा मल्टीमोडल मॉडल. इसमें बेहतर स्पीड, बिल्ट-इन टूल का इस्तेमाल, और 10 लाख टोकन वाली कॉन्टेक्स्ट विंडो जैसी सुविधाएं शामिल हैं |
Gemini 2.0 Flash‑Litegemini-2.0-flash-lite-001
|
टेक्स्ट, कोड, PDF, इमेज, वीडियो, ऑडियो | टेक्स्ट, कोड, JSON | यह हमारा सबसे तेज़ और किफ़ायती फ़्लैश मॉडल है. यह 1.5 Flash का इस्तेमाल करने वाले उन लोगों के लिए अपग्रेड पाथ है जो पहले जैसी कीमत और स्पीड पर बेहतर क्वालिटी चाहते हैं. |
Gemini ऐसे मॉडल जिनके सिर्फ़ झलक और एक्सपेरिमेंटल वर्शन उपलब्ध हैं (सिर्फ़ प्रोटोटाइप बनाने के उदाहरणों के लिए सुझाया गया) | |||
Gemini 2.5 Progemini-2.5-pro-preview-05-06
|
टेक्स्ट, कोड, PDF, इमेज, वीडियो, ऑडियो | टेक्स्ट, कोड, JSON | हमारा सबसे ऐडवांस रीज़निंग मॉडल, जो मुश्किल समस्याओं को हल कर सकता है. |
Gemini 2.5 Flashgemini-2.5-flash-preview-05-20
|
टेक्स्ट, कोड, PDF, इमेज, वीडियो, ऑडियो | टेक्स्ट, कोड, JSON | हमारा थिंकिंग मॉडल, बेहतरीन और बेहतर सुविधाएं देता है. इसे कीमत और परफ़ॉर्मेंस के बीच संतुलन बनाने के लिए डिज़ाइन किया गया है. |
Gemini 2.0 Flash Image Generationgemini-2.0-flash-preview-image-generation
|
टेक्स्ट, कोड, PDF, इमेज, वीडियो, ऑडियो | इमेज, टेक्स्ट, और इमेज | हमारा मल्टीमोडल मॉडल, मल्टीमोडल इनपुट और इमेज आउटपुट के साथ काम करता है. |
Gemini 2.0 Flash‑Live 1gemini-2.0-flash-live-preview-04-09
|
टेक्स्ट (स्ट्रीमिंग), ऑडियो (स्ट्रीमिंग) |
टेक्स्ट (स्ट्रीमिंग), ऑडियो (स्ट्रीमिंग) |
हमारा मल्टीमोडल मॉडल, मल्टीमोडल इनपुट और आउटपुट की कम इंतज़ार वाली रीयल-टाइम स्ट्रीमिंग की सुविधा देता है. |
1 Firebase AI Logic एसडीके टूल के साथ Gemini Developer API का इस्तेमाल करने पर, यह सुविधा काम नहीं करती.
Imagen मॉडल
मॉडल | इनपुट | आउटपुट | ब्यौरा |
---|---|---|---|
Imagen स्टेबल वर्शन वाले मॉडल | |||
Imagen 3imagen-3.0-generate-002 |
टेक्स्ट | इमेज | सामान्य भाषा के टेक्स्ट के प्रॉम्प्ट से, असली जैसी और अच्छी क्वालिटी की इमेज जनरेट करता है |
Imagen 3 Fast 2imagen-3.0-fast-generate-001
|
टेक्स्ट | इमेज | प्रोटोटाइप बनाने या कम इंतज़ार वाले इस्तेमाल के उदाहरणों के लिए इमेज जनरेट करता है |
Imagen ऐसे मॉडल जिनके सिर्फ़ झलक और एक्सपेरिमेंटल वर्शन उपलब्ध हैं (सिर्फ़ प्रोटोटाइप बनाने के उदाहरणों के लिए सुझाया गया) | |||
Imagen 4 2imagen-4-0-generate-preview-05-20
|
टेक्स्ट | इमेज | सामान्य भाषा के टेक्स्ट के प्रॉम्प्ट से, असली जैसी और अच्छी क्वालिटी की इमेज जनरेट करता है |
Imagen 4 Ultra 2imagen-4-0-ultra-preview-05-20
|
टेक्स्ट | इमेज | सामान्य भाषा के टेक्स्ट के प्रॉम्प्ट से, असली जैसी और अच्छी क्वालिटी की इमेज जनरेट करता है |
2 Imagen मॉडल, Gemini Developer API के साथ काम नहीं करता. भले ही, आपने एपीआई को किसी भी तरीके से ऐक्सेस किया हो.
साथ ही, उन सभी मॉडल के बारे में अक्सर पूछे जाने वाले सवाल देखें जिन पर Firebase AI Logic काम करता है और जिन पर नहीं करता.
इस पेज पर, Firebase AI Logic के साथ काम करने वाले मॉडल के बारे में ज़्यादा जानकारी दी गई है.
-
- इस्तेमाल किए जा सकने वाले इनपुट और आउटपुट
- काम करने वाली सुविधाओं की खास जानकारी
- खास जानकारी और सीमाएं. उदाहरण के लिए, इनपुट टोकन की ज़्यादा से ज़्यादा संख्या या इनपुट वीडियो की ज़्यादा से ज़्यादा अवधि
मॉडल के वर्शन तय करने का तरीका, खास तौर पर उनके स्टैबल, अपने-आप अपडेट होने वाले, झलक, और प्रयोग के तौर पर उपलब्ध वर्शन
उपलब्ध मॉडल के नाम की सूचियां, जिन्हें शुरू करने के दौरान अपने कोड में शामिल करना है
मॉडल के लिए इस्तेमाल की जा सकने वाली भाषाओं की सूचियां
इस पेज पर सबसे नीचे, पुराने मॉडल के बारे में ज़्यादा जानकारी देखी जा सकती है.
मॉडल की तुलना करें
हर मॉडल में अलग-अलग सुविधाएं होती हैं, ताकि अलग-अलग तरह के कामों में इसका इस्तेमाल किया जा सके. ध्यान दें कि Firebase AI Logic के साथ इस्तेमाल करने पर, इस सेक्शन की हर टेबल में हर मॉडल के बारे में जानकारी दी जाती है. हर मॉडल में ऐसी अतिरिक्त सुविधाएं हो सकती हैं जो हमारे SDK टूल का इस्तेमाल करते समय उपलब्ध नहीं होती हैं.
अगर आपको यहां दिए गए सब-सेक्शन में अपनी पसंद की जानकारी नहीं मिलती है, तो एपीआई की सेवा देने वाली कंपनी के दस्तावेज़ में ज़्यादा जानकारी देखी जा सकती है:
Gemini Developer API: Gemini मॉडल और Imagen मॉडल
Vertex AI Gemini API: Gemini मॉडल और Imagen मॉडल
इस्तेमाल किए जा सकने वाले इनपुट और आउटपुट
Firebase AI Logic के साथ हर मॉडल का इस्तेमाल करते समय, इनपुट और आउटपुट के ये टाइप इस्तेमाल किए जा सकते हैं:
<span="notranslate">Gemini 2.5 Pro </span="notranslate"> |
<span="notranslate">Gemini 2.5 Flash </span="notranslate"> |
<span="notranslate">Gemini 2.0 Flash </span="notranslate"> |
<span="notranslate">Gemini 2.0 Flash- Lite </span="notranslate"> |
<span="notranslate">Gemini 2.0 Flash इमेज जनरेशन </span="notranslate"> |
<span="notranslate">Gemini 2.0 Flash- Live </span="notranslate"> |
Imagen | ||
---|---|---|---|---|---|---|---|---|
इनपुट टाइप | ||||||||
टेक्स्ट | ||||||||
टेक्स्ट (स्ट्रीमिंग) | ||||||||
कोड | ||||||||
दस्तावेज़ (PDF या सादा टेक्स्ट) |
||||||||
इमेज | ||||||||
वीडियो | ||||||||
ऑडियो | ||||||||
ऑडियो (स्ट्रीमिंग) | ||||||||
आउटपुट टाइप | ||||||||
टेक्स्ट | ||||||||
टेक्स्ट (स्ट्रीमिंग) | ||||||||
कोड | ||||||||
स्ट्रक्चर्ड आउटपुट (जैसे, JSON) |
||||||||
इमेज | ||||||||
ऑडियो | ||||||||
ऑडियो (स्ट्रीमिंग) |
इस्तेमाल किए जा सकने वाले फ़ाइल टाइप के बारे में जानने के लिए, इस्तेमाल की जा सकने वाली इनपुट फ़ाइलें और ज़रूरी शर्तें देखें.
इस्तेमाल की जा सकने वाली सुविधाएं और क्षमताएं
Firebase AI Logic के साथ हर मॉडल का इस्तेमाल करते समय, ये सुविधाएं और काम करने की क्षमताएं उपलब्ध होती हैं:
<span="notranslate">Gemini 2.5 Pro </span="notranslate"> |
<span="notranslate">Gemini 2.5 Flash </span="notranslate"> |
<span="notranslate">Gemini 2.0 Flash </span="notranslate"> |
<span="notranslate">Gemini 2.0 Flash- Lite </span="notranslate"> |
<span="notranslate">Gemini 2.0 Flash इमेज जनरेशन </span="notranslate"> |
<span="notranslate">Gemini 2.0 Flash- Live </span="notranslate"> |
Imagen | |
---|---|---|---|---|---|---|---|
सिर्फ़ टेक्स्ट या अलग-अलग तरह के इनपुट से टेक्स्ट जनरेट करना | इंटरलीव या इमेज के हिस्से के तौर पर | सिर्फ़ स्ट्रीमिंग | |||||
इमेज जनरेट करें (Gemini या Imagen) |
|||||||
ऑडियो जनरेट करना | सिर्फ़ स्ट्रीमिंग | ||||||
स्ट्रक्चर्ड आउटपुट जनरेट करें
(जैसे, JSON) |
|||||||
दस्तावेज़ों का विश्लेषण करना
(PDF या सादा टेक्स्ट) |
|||||||
इमेज का विश्लेषण करना (विज़न) | |||||||
वीडियो का विश्लेषण करना (विज़न) | |||||||
ऑडियो का विश्लेषण करना | सिर्फ़ स्ट्रीमिंग | ||||||
मल्टी-टर्न चैट | |||||||
फ़ंक्शन कॉलिंग (टूल) | |||||||
टोकन की गिनती करना | |||||||
सिस्टम से जुड़े निर्देश | |||||||
दोनों तरफ़ की जाने वाली मल्टीमोडल स्ट्रीमिंग |
खास जानकारी और सीमाएं
Firebase AI Logic के साथ हर मॉडल का इस्तेमाल करते समय, ये खास बातें और सीमाएं लागू होती हैं:
प्रॉपर्टी |
<span="notranslate">Gemini 2.5 Pro </span="notranslate"> |
<span="notranslate">Gemini 2.5 Flash </span="notranslate"> |
<span="notranslate">Gemini 2.0 Flash </span="notranslate"> |
<span="notranslate">Gemini 2.0 Flash- Lite </span="notranslate"> |
<span="notranslate">Gemini 2.0 Flash इमेज जनरेशन </span="notranslate"> |
<span="notranslate">Gemini 2.0 Flash- Live </span="notranslate"> |
Imagen |
---|---|---|---|---|---|---|---|
कॉन्टेक्स्ट विंडो * टोकन की कुल सीमा (इनपुट+आउटपुट को मिलाकर) |
1,048,576 टोकन | 1,048,576 टोकन | 1,048,576 टोकन | 1,048,576 टोकन | 32,768 टोकन | 32,768 टोकन | 480 टोकन |
आउटपुट टोकन की सीमा * | 65,536 टोकन | 65,536 टोकन | 8,192 टोकन | 8,192 टोकन | 8,192 टोकन | 8,192 टोकन | --- |
नॉलेज कट्सऑफ़ की तारीख | जनवरी 2025 | जनवरी 2025 | जून 2024 | जून 2024 | अगस्त 2024 | अगस्त 2024 | --- |
PDF (हर अनुरोध के हिसाब से) | |||||||
इनपुट PDF फ़ाइलों की ज़्यादा से ज़्यादा संख्या ** |
3,000 फ़ाइलें | 3,000 फ़ाइलें | 3,000 फ़ाइलें | 3,000 फ़ाइलें | 3,000 फ़ाइलें | --- | --- |
हर इनपुट PDF फ़ाइल में पेजों की ज़्यादा से ज़्यादा संख्या ** |
1,000 पेज | 1,000 पेज | 1,000 पेज | 1,000 पेज | 1,000 पेज | --- | --- |
हर इनपुट PDF फ़ाइल का ज़्यादा से ज़्यादा साइज़ |
50 एमबी | 50 एमबी | 50 एमबी | 50 एमबी | 50 एमबी | --- | --- |
इमेज (हर अनुरोध के लिए) | |||||||
इनपुट इमेज की ज़्यादा से ज़्यादा संख्या |
3,000 इमेज | 3,000 इमेज | 3,000 इमेज | 3,000 इमेज | 3,000 इमेज | --- | --- |
आउटपुट इमेज की ज़्यादा से ज़्यादा संख्या |
--- | --- | --- | --- | 10 इमेज | --- | चार इमेज |
हर इनपुट के लिए, Base64 कोड में बदली गई इमेज का ज़्यादा से ज़्यादा साइज़ |
7 एमबी | 7 एमबी | 7 एमबी | 7 एमबी | 7 एमबी | --- | --- |
वीडियो (हर अनुरोध के हिसाब से) | |||||||
इनपुट वीडियो फ़ाइलों की ज़्यादा से ज़्यादा संख्या |
10 फ़ाइलें | 10 फ़ाइलें | 10 फ़ाइलें | 10 फ़ाइलें | 10 फ़ाइलें | --- | --- |
सभी इनपुट वीडियो की ज़्यादा से ज़्यादा लंबाई(सिर्फ़ फ़्रेम) |
~60 मिनट | ~60 मिनट | ~60 मिनट | ~60 मिनट | ~60 मिनट | --- | --- |
सभी इनपुट वीडियो (फ़्रेम+ऑडियो) की ज़्यादा से ज़्यादा लंबाई |
~45 मिनट | ~45 मिनट | ~45 मिनट | ~45 मिनट | ~45 मिनट | --- | --- |
ऑडियो (हर अनुरोध के हिसाब से) | |||||||
इनपुट ऑडियो फ़ाइलों की ज़्यादा से ज़्यादा संख्या |
1 फ़ाइल | 1 फ़ाइल | 1 फ़ाइल | 1 फ़ाइल | 1 फ़ाइल | --- | --- |
आउटपुट के तौर पर जनरेट की जाने वाली ऑडियो फ़ाइलों की ज़्यादा से ज़्यादा संख्या |
--- | --- | --- | --- | --- | --- | --- |
इनपुट ऑडियो की ज़्यादा से ज़्यादा लंबाई |
~8.4 घंटे | ~8.4 घंटे | ~8.4 घंटे | ~8.4 घंटे | ~8.4 घंटे | --- | --- |
आउटपुट ऑडियो की ज़्यादा से ज़्यादा लंबाई |
--- | --- | --- | --- | --- | --- | --- |
*
सभी Gemini मॉडल के लिए, एक टोकन करीब चार वर्णों के बराबर होता है. इसलिए, 100 टोकन करीब 60 से 80 अंग्रेज़ी शब्दों के बराबर होते हैं. Gemini मॉडल के लिए, countTokens
का इस्तेमाल करके, अपने अनुरोधों में टोकन की कुल संख्या तय की जा सकती है.
** PDF फ़ाइलों को इमेज के तौर पर माना जाता है. इसलिए, PDF के एक पेज को एक इमेज के तौर पर माना जाता है. किसी अनुरोध में पेजों की संख्या, उन इमेज की संख्या तक सीमित होती है जिनके लिए मॉडल काम करता है.
ज़्यादा जानकारी पाना
हर मॉडल के लिए कोटा और कीमत अलग-अलग होती है. कीमत, इनपुट और आउटपुट पर भी निर्भर करती है.
इनपुट फ़ाइल के काम करने वाले टाइप, एमआईएम टाइप तय करने के तरीके, और इनपुट फ़ाइल के काम करने वाले टाइप और ज़रूरी शर्तों में बताए गए सबसे सही तरीकों का पालन करने के बारे में जानें. इससे, यह पक्का करने में मदद मिलेगी कि आपकी इनपुट फ़ाइलें और कई मोड वाले अनुरोध, ज़रूरी शर्तों के मुताबिक हों.
मॉडल के वर्शन और नाम देने के पैटर्न
मॉडल, स्टैबल, झलक, और प्रयोग के तौर पर उपलब्ध होते हैं. सुविधा के लिए, वर्शन की वैल्यू के बिना उपनाम इस्तेमाल किए जा सकते हैं.
अपने कोड में इस्तेमाल करने के लिए, मॉडल के खास नाम ढूंढने के लिए, इस पेज पर नीचे दिए गए "मॉडल के उपलब्ध नाम" सेक्शन को देखें.
वर्शन टाइप / रिलीज़ का स्टेज |
ब्यौरा | मॉडल के नाम का पैटर्न | |
---|---|---|---|
स्थिर |
रिलीज़ की तारीख से, स्टैबल वर्शन उपलब्ध होते हैं और इन्हें प्रोडक्शन में इस्तेमाल किया जा सकता है.
आम तौर पर, मॉडल के स्टेबल वर्शन को रिलीज़ करने के साथ ही, उसे बंद करने की तारीख भी तय की जाती है. इससे यह पता चलता है कि मॉडल का इस्तेमाल आखिरी बार कब किया जा सकता है. इस तारीख के बाद, मॉडल को ऐक्सेस नहीं किया जा सकेगा या Google पर इसका इस्तेमाल नहीं किया जा सकेगा. |
स्टेबल वर्शन के मॉडल के नाम के साथ, वर्शन का तीन वर्णों वाला खास नंबर जोड़ा जाता है
उदाहरण: |
|
अपने-आप अपडेट होने वाला स्टेबल आलियास | अपने-आप अपडेट होने वाले स्टेबल आइडेंटिफ़ायर हमेशा उस मॉडल के सबसे नए स्टेबल वर्शन पर ले जाते हैं. अगर कोई नया स्टेबल वर्शन रिलीज़ किया जाता है, तो अपने-आप अपडेट होने वाला दूसरा नाम, अपने-आप उस नए स्टेबल वर्शन पर ले जाता है. |
अन्य नामों वाले मॉडल के नाम में कोई ऐपेंडिज नहीं है
उदाहरण: |
|
झलक देखें |
झलक वाले वर्शन में नई सुविधाएं होती हैं और इन्हें स्टेबल नहीं माना जाता.
झलक वाले वर्शन, हमेशा उस मॉडल के सबसे नए झलक वर्शन पर ले जाते हैं. अगर झलक का कोई नया वर्शन रिलीज़ किया जाता है, तो झलक का कोई भी मौजूदा वर्शन, अपने-आप उस नए वर्शन पर ले जाता है. इन मॉडल का सुझाव, प्रोडक्शन में इस्तेमाल के लिए नहीं दिया जाता. इनमें, बिलिंग की ज़रूरी शर्तें हो सकती हैं और दरों की सीमाएं ज़्यादा पाबंदी वाली होती हैं. |
प्रीव्यू वर्शन के मॉडल के नाम के साथ,
उदाहरण: |
|
एक्सपेरिमेंटल |
प्रयोग के तौर पर उपलब्ध वर्शन में नई सुविधाएं होती हैं और इन्हें स्टेबल नहीं माना जाता.
इन मॉडल का इस्तेमाल प्रोडक्शन के लिए नहीं किया जाता. साथ ही, इनमें किराये की सीमाएं ज़्यादा होती हैं. एक्सपेरिमेंट के तौर पर उपलब्ध मॉडल का मकसद, सुझाव, शिकायत या राय पाना और हमारी नई सुविधाओं को आज़माना है. |
एक्सपेरिमेंट के तौर पर उपलब्ध वर्शन के मॉडल के नामों के साथ,
उदाहरण: |
|
रिटायर्ड |
बंद किए गए वर्शन, बंद किए जाने की तारीख के बाद इस्तेमाल नहीं किए जा सकते. साथ ही, इन्हें हमेशा के लिए बंद कर दिया गया है.
बंद किए गए मॉडल को अब ऐक्सेस नहीं किया जा सकता. साथ ही, Google पर इनका इस्तेमाल भी नहीं किया जा सकता. बंद किए गए मॉडल आईडी का रेफ़रंस देने वाले अनुरोधों पर, आम तौर पर 404 कोड वाली गड़बड़ी का मैसेज दिखता है. |
--- |
मॉडल के उपलब्ध नाम
मॉडल के नाम, साफ़ तौर पर बताई गई वैल्यू होती हैं. इन्हें मॉडल को शुरू करने के दौरान, अपने कोड में शामिल किया जाता है.
प्रोग्राम के ज़रिए सभी उपलब्ध मॉडल की सूची बनाना
REST API का इस्तेमाल करके, उपलब्ध सभी मॉडल के नामों की सूची देखी जा सकती है:
Gemini Developer API:
models.list
एंडपॉइंट को कॉल करेंVertex AI Gemini API:
publishers.models.list
एंडपॉइंट को कॉल करें
ध्यान दें कि इस सूची में, एपीआई की सेवा देने वाली कंपनियों के साथ काम करने वाले सभी मॉडल शामिल होंगे. हालांकि, Firebase AI Logic सिर्फ़ इस पेज पर बताए गए Gemini और Imagen मॉडल के साथ काम करता है.
यह भी ध्यान दें कि अपने-आप अपडेट होने वाले उपनाम (उदाहरण के लिए, gemini-2.0-flash
) सूची में शामिल नहीं किए जाते, क्योंकि ये बुनियादी मॉडल के लिए सुविधाजनक उपनाम होते हैं.
Gemini मॉडल के नाम
अपने प्लैटफ़ॉर्म के लिए, शुरू करने के उदाहरणों के लिए, शुरू करने के लिए गाइड देखें.
रिलीज़ के चरणों के बारे में ज़्यादा जानने के लिए, मॉडल के वर्शन और नाम देने के पैटर्न देखें.
Gemini 2.5 Pro मॉडल के नाम
मॉडल का नाम | ब्यौरा | रिलीज़ का स्टेज | रिलीज़ की तारीख | रिटायरमेंट की तारीख |
---|---|---|---|---|
gemini-2.5-pro-preview-05-06 |
Gemini 2.5 Pro का सबसे नया झलक वर्शन | झलक देखें | 2025-05-06 | निर्धारण शेष |
gemini-2.5-pro-preview-03-25 |
gemini-2.5-pro-preview-05-06 (जो झलक का नया वर्शन है) |
झलक देखें | 2025-03-25 | निर्धारण शेष |
Gemini 2.5 Flash मॉडल के नाम
मॉडल का नाम | ब्यौरा | रिलीज़ का स्टेज | रिलीज़ की तारीख | रिटायरमेंट की तारीख |
---|---|---|---|---|
gemini-2.5-flash-preview-05-20 |
Gemini 2.5 Flash का सबसे नया झलक वर्शन | झलक देखें | 2025-05-20 | निर्धारण शेष |
gemini-2.5-flash-preview-04-17 |
Gemini 2.5 Flash का शुरुआती झलक वाला वर्शन | झलक देखें | 2025-04-17 | निर्धारण शेष |
Gemini 2.0 Flash मॉडल के नाम
मॉडल का नाम | ब्यौरा | रिलीज़ का स्टेज | रिलीज़ की तारीख | रिटायरमेंट की तारीख |
---|---|---|---|---|
gemini-2.0-flash-001 |
Gemini 2.0 Flash का सबसे नया स्टेबल वर्शन | स्टेबल | 2025-02-05 | 2026-02-05 से पहले नहीं |
gemini-2.0-flash |
अपने-आप अपडेट होने वाला दूसरा नाम, जो Flash 2.0 के सबसे नए स्टेबल वर्शन (फ़िलहाल gemini-2.0-flash-001 |
स्टेबल | 2025-02-10 | --- |
Gemini 2.0 Flash‑Lite मॉडल के नाम
मॉडल का नाम | ब्यौरा | रिलीज़ का स्टेज | रिलीज़ की तारीख | रिटायरमेंट की तारीख |
---|---|---|---|---|
gemini-2.0-flash-lite-001 |
Gemini 2.0 Flash‑Lite का सबसे नया स्टेबल वर्शन | स्टेबल | 2025-02-25 | 2026-02-25 से पहले नहीं |
gemini-2.0-flash-lite |
2.0 Flash-Lite के नए स्टेबल वर्शन पर अपने-आप अपडेट होने वाला दूसरा नाम (फ़िलहाल gemini-2.0-flash-lite-001 |
स्टेबल | 2025-02-25 | --- |
Gemini 2.0 Flash Image Generation मॉडल के नाम
मॉडल का नाम | ब्यौरा | रिलीज़ का स्टेज | रिलीज़ की तारीख | रिटायरमेंट की तारीख |
---|---|---|---|---|
gemini-2.0-flash-preview-image-generation 1 |
Gemini 2.0 Flash Image Generation के लिए प्रीव्यू वर्शन | झलक देखें | 2025-05-06 | निर्धारण शेष |
Gemini 2.0 Flash‑Live मॉडल के नाम
यह सिर्फ़ तब उपलब्ध होता है, जब एपीआई प्रोवाइडर के तौर पर Vertex AI Gemini API का इस्तेमाल किया जा रहा हो. |
मॉडल का नाम | ब्यौरा | रिलीज़ का स्टेज | रिलीज़ की तारीख | रिटायरमेंट की तारीख |
---|---|---|---|---|
gemini-2.0-flash-live-preview-04-09 1 |
Gemini 2.0 Flash‑Live के लिए प्रीव्यू वर्शन | झलक देखें | 2025-04-09 | निर्धारण शेष |
1 Firebase AI Logic एसडीके टूल के साथ Gemini Developer API का इस्तेमाल करने पर, यह सुविधा काम नहीं करती.
Imagen मॉडल के नाम
अपने प्लैटफ़ॉर्म के लिए, शुरू करने के उदाहरणों के लिए, Imagen की मदद से इमेज जनरेट करने की गाइड देखें.
रिलीज़ के चरणों के बारे में ज़्यादा जानने के लिए, मॉडल के वर्शन और नाम देने के पैटर्न देखें.
Imagen 4 मॉडल के नाम
मॉडल का नाम | ब्यौरा | रिलीज़ का स्टेज | रिलीज़ की तारीख | रिटायरमेंट की तारीख |
---|---|---|---|---|
imagen-4-0-generate-preview-05-20 2 |
Imagen 4 का झलक वाला वर्शन | झलक देखें | 2025-05-20 | निर्धारण शेष |
Imagen 4 Ultra मॉडल के नाम
मॉडल का नाम | ब्यौरा | रिलीज़ का स्टेज | रिलीज़ की तारीख | रिटायरमेंट की तारीख |
---|---|---|---|---|
imagen-4.0-ultra-generate-exp-05-20 2 |
Imagen 4 Ultra का एक्सपेरिमेंटल वर्शन | झलक देखें | 2025-05-20 | निर्धारण शेष |
Imagen 3 मॉडल के नाम
मॉडल का नाम | ब्यौरा | रिलीज़ का स्टेज | रिलीज़ की तारीख | रिटायरमेंट की तारीख |
---|---|---|---|---|
imagen-3.0-generate-002 |
Imagen 3 का सबसे नया स्टेबल वर्शन | स्टेबल | 2025-01-23 | 23-01-2026 से पहले नहीं |
imagen-3.0-generate-001 2 |
Imagen 3 का शुरुआती स्टेबल वर्शन | स्टेबल | 2024-07-31 | 31-07-2025 से पहले |
Imagen 3 Fast मॉडल के नाम
मॉडल का नाम | ब्यौरा | रिलीज़ का स्टेज | रिलीज़ की तारीख | रिटायरमेंट की तारीख |
---|---|---|---|---|
imagen-3.0-fast-generate-001 2 |
Imagen 3 Fast का शुरुआती स्टेबल वर्शन | स्टेबल | 2024-07-31 | 31-07-2025 से पहले |
2 Gemini Developer API में यह सुविधा काम नहीं करती. भले ही, एपीआई को ऐक्सेस करने का तरीका कुछ भी हो.
यह सुविधा इन भाषाओं में काम करती है
Gemini
सभी Gemini मॉडल, इन भाषाओं को समझ सकते हैं और इनमें जवाब दे सकते हैं:
ऐरेबिक (ar), बांग्ला (bn), बुल्गारियन (bg), चाइनीज़ सिम्प्लिफ़ाइड और ट्रेडिशनल (zh), क्रोएशियन (hr), चेक (cs), डेनिश (da), डच (nl), अंग्रेज़ी (en), एस्टोनियन (et), फ़िनिश (fi), फ़्रेंच (fr), जर्मन (de), ग्रीक (el), हिब्रू (iw), हिन्दी (hi), हंगेरियन (hu), इंडोनेशियन (id), इटैलियन (it), जैपनीज़ (ja), कोरियन (ko), लातवियन (lv), लिथुआनियन (lt), नॉर्वेजियन (no), पोलिश (pl), पॉर्चगीज़ (pt), रोमेनियन (ro), रशियन (ru), सर्बियन (sr), स्लोवाक (sk), स्लोवेनियन (sl), स्पैनिश (es), स्वाहिली (sw), स्वीडिश (sv), थाई (th), टर्किश (tr), यूक्रेनियन (uk), वियतनामीज़ (vi)
Gemini 2.0 Flash, Gemini 1.5 Pro, और Gemini 1.5 Flash मॉडल, इन अन्य भाषाओं को समझ सकते हैं और इनमें जवाब दे सकते हैं:
अफ़्रीकान्स (af), अम्हारिक (am), असमिया (as), अज़ेरी (az), बेलारूसी (be), बोस्नियाई (bs), कैटलन (ca), सिबुआनो (ceb), कोर्सिकन (co), वेल्श (cy), दीवेही (dv), एस्पेरांटो (eo), बास्क (eu), फ़ारसी (fa), फ़िलिपिनो (Tagalog) (fil), फ़्रिसियन (fy), आयरिश (ga), स्कॉटिश गेलिक (gd), गैलिशियन (gl), गुजराती (gu), हौसा (ha), हवाईयन (haw), हमोंग (hmn), हैतीयन क्रेओल (ht), अर्मेनियाई (hy), इग्बो (ig), आइसलैंडिक (is), ज्वानेस (jv), जॉर्जियन (ka), कज़ाख (kk), खमेर (km), कन्नड़ (kn), क्रियो (kri), कुर्दीश (ku), किर्गिज़ (ky), लैटिन (la), लक्ज़मबर्गिश (lb), लाओ (lo), मलागासी (mg), माओरी (mi), मैसेडोनियन (mk), मलयालम (ml), मंगोलियन (mn), मेइतेइलोन (मणिपुरी) (mni-Mtei), मराठी (mr), मलय (ms), माल्टीज़ (mt), म्यांमार (बर्मीज़) (my), नेपाली (ne), न्यान्या (चिचेवा) (ny), ओडिया (ओडिया) (or), पंजाबी (pa), पश्तो (ps), सिंधी (sd), सिंघल (सिंघल) (si), समोआन (sm), शोना (sn), सोमाली (so), अल्बानियाई (sq), सेसोथो (st), सुंडानी (su), तमिल (ta), तेलुगु (te), ताजिक (tg), उइघुर (ug), उर्दू (ur), उज़्बेक (uz), ज़ोसा (xh), येहुदी (yi), योरुबा (yo), ज़ुलु (zu)
Imagen
सामान्य तौर पर उपलब्धता: अंग्रेज़ी
झलक: चाइनीज़ (सिंप्लिफ़ाइड), चाइनीज़ (ट्रेडिशनल), हिन्दी, जैपनीज़, कोरियन, पॉर्चगीज़, स्पेनिश
पुराने मॉडल के बारे में जानकारी
Firebase AI Logic, Gemini के पुराने और चालू मॉडल (जैसे, Gemini 1.5 मॉडल) के साथ काम करता है.
Firebase AI Logic, Imagen के पुराने मॉडल (जैसे, Imagen 2) के साथ काम नहीं करता.
मॉडल | इनपुट | आउटपुट | इनके लिए ऑप्टिमाइज़ किया गया |
---|---|---|---|
Gemini 1.5 Progemini-1.5-pro-002 |
टेक्स्ट, कोड, PDF, इमेज, वीडियो, ऑडियो | टेक्स्ट, कोड, JSON | ज़्यादा जानकारी की ज़रूरत वाले जटिल कामों के लिए काम करता है; 20 लाख वर्णों का कॉन्टेक्स्ट |
Gemini 1.5 Flashgemini-1.5-flash-002 |
टेक्स्ट, कोड, PDF, इमेज, वीडियो, ऑडियो | टेक्स्ट, कोड, JSON | अलग-अलग तरह के टास्क के लिए तेज़ और बेहतर परफ़ॉर्मेंस देता है |
gemini-1.0-pro-vision-001 |
|
||
gemini-1.0-pro-002 |
|
अगले चरण
Gemini API की सुविधाओं को आज़माएं
- कई बार की जाने वाली बातचीत (चैट) बनाएं.
- सिर्फ़ टेक्स्ट वाले प्रॉम्प्ट से टेक्स्ट जनरेट करें.
- इमेज, PDF, वीडियो, और ऑडियो जैसी अलग-अलग फ़ाइल टाइप के लिए प्रॉम्प्ट करके टेक्स्ट जनरेट करें.
- टेक्स्ट और मल्टीमोडल प्रॉम्प्ट, दोनों से स्ट्रक्चर्ड आउटपुट (जैसे कि JSON) जनरेट करें.
- टेक्स्ट प्रॉम्प्ट (Gemini या Imagen) से इमेज जनरेट करें.
- Gemini Live API का इस्तेमाल करके, इनपुट और आउटपुट को स्ट्रीम करें. इसमें ऑडियो भी शामिल है.
- जनरेटिव मॉडल को बाहरी सिस्टम और जानकारी से कनेक्ट करने के लिए, फ़ंक्शन कॉल का इस्तेमाल करें.