इस्तेमाल किए जा सकने वाले मॉडल के बारे में जानें

मोबाइल और वेब ऐप्लिकेशन के लिए, Firebase AI Logic SDK टूल की मदद से, सीधे अपने ऐप्लिकेशन से, काम करने वाले Gemini मॉडल और Imagen मॉडल के साथ इंटरैक्ट किया जा सकता है.

Gemini मॉडल को मल्टीमोडल माना जाता है, क्योंकि ये टेक्स्ट, कोड, PDF, इमेज, वीडियो, और ऑडियो जैसे कई तरह के इनपुट को प्रोसेस करने के साथ-साथ जनरेट भी कर सकते हैं. Imagen मॉडल को टेक्स्ट के ज़रिए इमेज जनरेट करने के लिए कहा जा सकता है.

यहां दी गई टेबल में, Firebase AI Logic के साथ काम करने वाले मॉडल और उनके सबसे नए मॉडल के नामों के बारे में खास जानकारी दी गई है. इस टेबल में, प्रोटोटाइप के इस्तेमाल के उदाहरणों के लिए उपलब्ध, झलक और प्रयोग के तौर पर उपलब्ध मॉडल की सूची भी दी गई है.

Gemini मॉडल

मॉडल इनपुट आउटपुट ब्यौरा
Gemini स्टेबल वर्शन वाले मॉडल
Gemini 2.0 Flash
gemini-2.0-flash-001
टेक्स्ट, कोड, PDF, इमेज, वीडियो, ऑडियो टेक्स्ट, कोड, JSON अगली पीढ़ी की सुविधाओं और बेहतर क्षमताओं वाला हमारा मल्टीमोडल मॉडल. इसमें बेहतर स्पीड, बिल्ट-इन टूल का इस्तेमाल, और 10 लाख टोकन वाली कॉन्टेक्स्ट विंडो जैसी सुविधाएं शामिल हैं
Gemini 2.0 Flash‑Lite
gemini-2.0-flash-lite-001
टेक्स्ट, कोड, PDF, इमेज, वीडियो, ऑडियो टेक्स्ट, कोड, JSON यह हमारा सबसे तेज़ और किफ़ायती फ़्लैश मॉडल है. यह 1.5 Flash का इस्तेमाल करने वाले उन लोगों के लिए अपग्रेड पाथ है जो पहले जैसी कीमत और स्पीड पर बेहतर क्वालिटी चाहते हैं.
Gemini ऐसे मॉडल जिनके सिर्फ़ झलक और एक्सपेरिमेंटल वर्शन उपलब्ध हैं (सिर्फ़ प्रोटोटाइप बनाने के उदाहरणों के लिए सुझाया गया)
Gemini 2.5 Pro
gemini-2.5-pro-preview-05-06
टेक्स्ट, कोड, PDF, इमेज, वीडियो, ऑडियो टेक्स्ट, कोड, JSON हमारा सबसे ऐडवांस रीज़निंग मॉडल, जो मुश्किल समस्याओं को हल कर सकता है.
Gemini 2.5 Flash
gemini-2.5-flash-preview-05-20
टेक्स्ट, कोड, PDF, इमेज, वीडियो, ऑडियो टेक्स्ट, कोड, JSON हमारा थिंकिंग मॉडल, बेहतरीन और बेहतर सुविधाएं देता है. इसे कीमत और परफ़ॉर्मेंस के बीच संतुलन बनाने के लिए डिज़ाइन किया गया है.
Gemini 2.0 Flash Image Generation
gemini-2.0-flash-preview-image-generation
टेक्स्ट, कोड, PDF, इमेज, वीडियो, ऑडियो इमेज, टेक्स्ट, और इमेज हमारा मल्टीमोडल मॉडल, मल्टीमोडल इनपुट और इमेज आउटपुट के साथ काम करता है.
Gemini 2.0 Flash‑Live 1
gemini-2.0-flash-live-preview-04-09
टेक्स्ट (स्ट्रीमिंग),
ऑडियो (स्ट्रीमिंग)
टेक्स्ट (स्ट्रीमिंग),
ऑडियो (स्ट्रीमिंग)
हमारा मल्टीमोडल मॉडल, मल्टीमोडल इनपुट और आउटपुट की कम इंतज़ार वाली रीयल-टाइम स्ट्रीमिंग की सुविधा देता है.

1 Firebase AI Logic एसडीके टूल के साथ Gemini Developer API का इस्तेमाल करने पर, यह सुविधा काम नहीं करती.

Imagen मॉडल

मॉडल इनपुट आउटपुट ब्यौरा
Imagen स्टेबल वर्शन वाले मॉडल
Imagen 3
imagen-3.0-generate-002
टेक्स्ट इमेज सामान्य भाषा के टेक्स्ट के प्रॉम्प्ट से, असली जैसी और अच्छी क्वालिटी की इमेज जनरेट करता है
Imagen 3 Fast 2
imagen-3.0-fast-generate-001
टेक्स्ट इमेज प्रोटोटाइप बनाने या कम इंतज़ार वाले इस्तेमाल के उदाहरणों के लिए इमेज जनरेट करता है
Imagen ऐसे मॉडल जिनके सिर्फ़ झलक और एक्सपेरिमेंटल वर्शन उपलब्ध हैं (सिर्फ़ प्रोटोटाइप बनाने के उदाहरणों के लिए सुझाया गया)
Imagen 4 2
imagen-4-0-generate-preview-05-20
टेक्स्ट इमेज सामान्य भाषा के टेक्स्ट के प्रॉम्प्ट से, असली जैसी और अच्छी क्वालिटी की इमेज जनरेट करता है
Imagen 4 Ultra 2
imagen-4-0-ultra-preview-05-20
टेक्स्ट इमेज सामान्य भाषा के टेक्स्ट के प्रॉम्प्ट से, असली जैसी और अच्छी क्वालिटी की इमेज जनरेट करता है

2 Imagen मॉडल, Gemini Developer API के साथ काम नहीं करता. भले ही, आपने एपीआई को किसी भी तरीके से ऐक्सेस किया हो.

साथ ही, उन सभी मॉडल के बारे में अक्सर पूछे जाने वाले सवाल देखें जिन पर Firebase AI Logic काम करता है और जिन पर नहीं करता.


इस पेज पर, Firebase AI Logic के साथ काम करने वाले मॉडल के बारे में ज़्यादा जानकारी दी गई है.

इस पेज पर सबसे नीचे, पुराने मॉडल के बारे में ज़्यादा जानकारी देखी जा सकती है.



मॉडल की तुलना करें

हर मॉडल में अलग-अलग सुविधाएं होती हैं, ताकि अलग-अलग तरह के कामों में इसका इस्तेमाल किया जा सके. ध्यान दें कि Firebase AI Logic के साथ इस्तेमाल करने पर, इस सेक्शन की हर टेबल में हर मॉडल के बारे में जानकारी दी जाती है. हर मॉडल में ऐसी अतिरिक्त सुविधाएं हो सकती हैं जो हमारे SDK टूल का इस्तेमाल करते समय उपलब्ध नहीं होती हैं.

अगर आपको यहां दिए गए सब-सेक्शन में अपनी पसंद की जानकारी नहीं मिलती है, तो एपीआई की सेवा देने वाली कंपनी के दस्तावेज़ में ज़्यादा जानकारी देखी जा सकती है:

इस्तेमाल किए जा सकने वाले इनपुट और आउटपुट

Firebase AI Logic के साथ हर मॉडल का इस्तेमाल करते समय, इनपुट और आउटपुट के ये टाइप इस्तेमाल किए जा सकते हैं:

<span="notranslate">Gemini
2.5 Pro </span="notranslate">
<span="notranslate">Gemini
2.5 Flash </span="notranslate">
<span="notranslate">Gemini
2.0 Flash </span="notranslate">
<span="notranslate">Gemini
2.0 Flash-
Lite </span="notranslate">
<span="notranslate">Gemini
2.0 Flash
इमेज जनरेशन </span="notranslate">
<span="notranslate">Gemini
2.0 Flash-
Live </span="notranslate">
Imagen
इनपुट टाइप
टेक्स्ट
टेक्स्ट (स्ट्रीमिंग)
कोड
दस्तावेज़
(PDF या सादा टेक्स्ट)
इमेज
वीडियो
ऑडियो
ऑडियो (स्ट्रीमिंग)
आउटपुट टाइप
टेक्स्ट
टेक्स्ट (स्ट्रीमिंग)
कोड
स्ट्रक्चर्ड आउटपुट
(जैसे, JSON)
इमेज
ऑडियो
ऑडियो (स्ट्रीमिंग)

इस्तेमाल किए जा सकने वाले फ़ाइल टाइप के बारे में जानने के लिए, इस्तेमाल की जा सकने वाली इनपुट फ़ाइलें और ज़रूरी शर्तें देखें.

इस्तेमाल की जा सकने वाली सुविधाएं और क्षमताएं

Firebase AI Logic के साथ हर मॉडल का इस्तेमाल करते समय, ये सुविधाएं और काम करने की क्षमताएं उपलब्ध होती हैं:

<span="notranslate">Gemini
2.5 Pro </span="notranslate">
<span="notranslate">Gemini
2.5 Flash </span="notranslate">
<span="notranslate">Gemini
2.0 Flash </span="notranslate">
<span="notranslate">Gemini
2.0 Flash-
Lite </span="notranslate">
<span="notranslate">Gemini
2.0 Flash
इमेज जनरेशन </span="notranslate">
<span="notranslate">Gemini
2.0 Flash-
Live </span="notranslate">
Imagen
सिर्फ़ टेक्स्ट या अलग-अलग तरह के इनपुट से टेक्स्ट जनरेट करना इंटरलीव या इमेज के हिस्से के तौर पर सिर्फ़ स्ट्रीमिंग
इमेज जनरेट करें
(Gemini या Imagen)
ऑडियो जनरेट करना सिर्फ़ स्ट्रीमिंग
स्ट्रक्चर्ड आउटपुट जनरेट करें
(जैसे, JSON)
दस्तावेज़ों का विश्लेषण करना
(PDF या सादा टेक्स्ट)
इमेज का विश्लेषण करना (विज़न)
वीडियो का विश्लेषण करना (विज़न)
ऑडियो का विश्लेषण करना सिर्फ़ स्ट्रीमिंग
मल्टी-टर्न चैट
फ़ंक्शन कॉलिंग (टूल)
टोकन की गिनती करना
सिस्टम से जुड़े निर्देश
दोनों तरफ़ की जाने वाली मल्टीमोडल स्ट्रीमिंग

खास जानकारी और सीमाएं

Firebase AI Logic के साथ हर मॉडल का इस्तेमाल करते समय, ये खास बातें और सीमाएं लागू होती हैं:

प्रॉपर्टी <span="notranslate">Gemini
2.5 Pro </span="notranslate">
<span="notranslate">Gemini
2.5 Flash </span="notranslate">
<span="notranslate">Gemini
2.0 Flash </span="notranslate">
<span="notranslate">Gemini
2.0 Flash-
Lite </span="notranslate">
<span="notranslate">Gemini
2.0 Flash
इमेज जनरेशन </span="notranslate">
<span="notranslate">Gemini
2.0 Flash-
Live </span="notranslate">
Imagen
कॉन्टेक्स्ट विंडो *
टोकन की कुल सीमा
(इनपुट+आउटपुट को मिलाकर)
1,048,576 टोकन 1,048,576 टोकन 1,048,576 टोकन 1,048,576 टोकन 32,768 टोकन 32,768 टोकन 480 टोकन
आउटपुट टोकन की सीमा * 65,536 टोकन 65,536 टोकन 8,192 टोकन 8,192 टोकन 8,192 टोकन 8,192 टोकन ---
नॉलेज कट्सऑफ़ की तारीख जनवरी 2025 जनवरी 2025 जून 2024 जून 2024 अगस्त 2024 अगस्त 2024 ---
PDF (हर अनुरोध के हिसाब से)

इनपुट PDF फ़ाइलों की ज़्यादा से ज़्यादा संख्या **
3,000 फ़ाइलें 3,000 फ़ाइलें 3,000 फ़ाइलें 3,000 फ़ाइलें 3,000 फ़ाइलें --- ---
हर इनपुट PDF फ़ाइल में
पेजों
की ज़्यादा से ज़्यादा संख्या **
1,000 पेज 1,000 पेज 1,000 पेज 1,000 पेज 1,000 पेज --- ---
हर इनपुट PDF फ़ाइल का ज़्यादा से ज़्यादा साइज़
50 एमबी 50 एमबी 50 एमबी 50 एमबी 50 एमबी --- ---
इमेज (हर अनुरोध के लिए)
इनपुट इमेज की ज़्यादा से ज़्यादा संख्या
3,000 इमेज 3,000 इमेज 3,000 इमेज 3,000 इमेज 3,000 इमेज --- ---
आउटपुट इमेज की ज़्यादा से ज़्यादा संख्या
--- --- --- --- 10 इमेज --- चार इमेज

हर इनपुट के लिए, Base64 कोड में बदली गई इमेज का ज़्यादा से ज़्यादा साइज़
7 एमबी 7 एमबी 7 एमबी 7 एमबी 7 एमबी --- ---
वीडियो (हर अनुरोध के हिसाब से)

इनपुट वीडियो फ़ाइलों की ज़्यादा से ज़्यादा संख्या
10 फ़ाइलें 10 फ़ाइलें 10 फ़ाइलें 10 फ़ाइलें 10 फ़ाइलें --- ---

सभी इनपुट वीडियो
की ज़्यादा से ज़्यादा लंबाई(सिर्फ़ फ़्रेम)
~60 मिनट ~60 मिनट ~60 मिनट ~60 मिनट ~60 मिनट --- ---

सभी इनपुट वीडियो
(फ़्रेम+ऑडियो) की ज़्यादा से ज़्यादा लंबाई
~45 मिनट ~45 मिनट ~45 मिनट ~45 मिनट ~45 मिनट --- ---
ऑडियो (हर अनुरोध के हिसाब से)

इनपुट ऑडियो फ़ाइलों की ज़्यादा से ज़्यादा संख्या
1 फ़ाइल 1 फ़ाइल 1 फ़ाइल 1 फ़ाइल 1 फ़ाइल --- ---
आउटपुट के तौर पर जनरेट की जाने वाली ऑडियो फ़ाइलों की ज़्यादा से ज़्यादा संख्या
--- --- --- --- --- --- ---
इनपुट ऑडियो की ज़्यादा से ज़्यादा लंबाई
~8.4 घंटे ~8.4 घंटे ~8.4 घंटे ~8.4 घंटे ~8.4 घंटे --- ---
आउटपुट ऑडियो की ज़्यादा से ज़्यादा लंबाई
--- --- --- --- --- --- ---

* सभी Gemini मॉडल के लिए, एक टोकन करीब चार वर्णों के बराबर होता है. इसलिए, 100 टोकन करीब 60 से 80 अंग्रेज़ी शब्दों के बराबर होते हैं. Gemini मॉडल के लिए, countTokens का इस्तेमाल करके, अपने अनुरोधों में टोकन की कुल संख्या तय की जा सकती है.

** PDF फ़ाइलों को इमेज के तौर पर माना जाता है. इसलिए, PDF के एक पेज को एक इमेज के तौर पर माना जाता है. किसी अनुरोध में पेजों की संख्या, उन इमेज की संख्या तक सीमित होती है जिनके लिए मॉडल काम करता है.

ज़्यादा जानकारी पाना



मॉडल के वर्शन और नाम देने के पैटर्न

मॉडल, स्टैबल, झलक, और प्रयोग के तौर पर उपलब्ध होते हैं. सुविधा के लिए, वर्शन की वैल्यू के बिना उपनाम इस्तेमाल किए जा सकते हैं.

अपने कोड में इस्तेमाल करने के लिए, मॉडल के खास नाम ढूंढने के लिए, इस पेज पर नीचे दिए गए "मॉडल के उपलब्ध नाम" सेक्शन को देखें.

वर्शन टाइप /
रिलीज़ का स्टेज
ब्यौरा मॉडल के नाम का पैटर्न
स्थिर रिलीज़ की तारीख से, स्टैबल वर्शन उपलब्ध होते हैं और इन्हें प्रोडक्शन में इस्तेमाल किया जा सकता है.

आम तौर पर, मॉडल के स्टेबल वर्शन को रिलीज़ करने के साथ ही, उसे बंद करने की तारीख भी तय की जाती है. इससे यह पता चलता है कि मॉडल का इस्तेमाल आखिरी बार कब किया जा सकता है. इस तारीख के बाद, मॉडल को ऐक्सेस नहीं किया जा सकेगा या Google पर इसका इस्तेमाल नहीं किया जा सकेगा.

स्टेबल वर्शन के मॉडल के नाम के साथ, वर्शन का तीन वर्णों वाला खास नंबर जोड़ा जाता है

उदाहरण: gemini-2.0-flash-001
उदाहरण: imagen-3.0-generate-002

अपने-आप अपडेट होने वाला स्टेबल आलियास अपने-आप अपडेट होने वाले स्टेबल आइडेंटिफ़ायर हमेशा उस मॉडल के सबसे नए स्टेबल वर्शन पर ले जाते हैं. अगर कोई नया स्टेबल वर्शन रिलीज़ किया जाता है, तो अपने-आप अपडेट होने वाला दूसरा नाम, अपने-आप उस नए स्टेबल वर्शन पर ले जाता है.

अन्य नामों वाले मॉडल के नाम में कोई ऐपेंडिज नहीं है

उदाहरण: gemini-2.0-flash

झलक देखें झलक वाले वर्शन में नई सुविधाएं होती हैं और इन्हें स्टेबल नहीं माना जाता.

झलक वाले वर्शन, हमेशा उस मॉडल के सबसे नए झलक वर्शन पर ले जाते हैं. अगर झलक का कोई नया वर्शन रिलीज़ किया जाता है, तो झलक का कोई भी मौजूदा वर्शन, अपने-आप उस नए वर्शन पर ले जाता है.

इन मॉडल का सुझाव, प्रोडक्शन में इस्तेमाल के लिए नहीं दिया जाता. इनमें, बिलिंग की ज़रूरी शर्तें हो सकती हैं और दरों की सीमाएं ज़्यादा पाबंदी वाली होती हैं.

प्रीव्यू वर्शन के मॉडल के नाम के साथ, -preview और मॉडल के रिलीज़ होने की तारीख (-MM-DD) जोड़ी जाती है

उदाहरण: gemini-2.5-flash-preview-04-17
(17 अप्रैल, 2025 को रिलीज़ किया गया)

एक्सपेरिमेंटल प्रयोग के तौर पर उपलब्ध वर्शन में नई सुविधाएं होती हैं और इन्हें स्टेबल नहीं माना जाता.

इन मॉडल का इस्तेमाल प्रोडक्शन के लिए नहीं किया जाता. साथ ही, इनमें किराये की सीमाएं ज़्यादा होती हैं. एक्सपेरिमेंट के तौर पर उपलब्ध मॉडल का मकसद, सुझाव, शिकायत या राय पाना और हमारी नई सुविधाओं को आज़माना है.

एक्सपेरिमेंट के तौर पर उपलब्ध वर्शन के मॉडल के नामों के साथ, -exp और मॉडल के रिलीज़ होने की तारीख (-MM-DD) जोड़ी जाती है

उदाहरण: gemini-2.5-pro-exp-03-25
(25 मार्च, 2025 को रिलीज़ किया गया)

रिटायर्ड बंद किए गए वर्शन, बंद किए जाने की तारीख के बाद इस्तेमाल नहीं किए जा सकते. साथ ही, इन्हें हमेशा के लिए बंद कर दिया गया है.

बंद किए गए मॉडल को अब ऐक्सेस नहीं किया जा सकता. साथ ही, Google पर इनका इस्तेमाल भी नहीं किया जा सकता. बंद किए गए मॉडल आईडी का रेफ़रंस देने वाले अनुरोधों पर, आम तौर पर 404 कोड वाली गड़बड़ी का मैसेज दिखता है.

---



मॉडल के उपलब्ध नाम

मॉडल के नाम, साफ़ तौर पर बताई गई वैल्यू होती हैं. इन्हें मॉडल को शुरू करने के दौरान, अपने कोड में शामिल किया जाता है.

प्रोग्राम के ज़रिए सभी उपलब्ध मॉडल की सूची बनाना

REST API का इस्तेमाल करके, उपलब्ध सभी मॉडल के नामों की सूची देखी जा सकती है:

ध्यान दें कि इस सूची में, एपीआई की सेवा देने वाली कंपनियों के साथ काम करने वाले सभी मॉडल शामिल होंगे. हालांकि, Firebase AI Logic सिर्फ़ इस पेज पर बताए गए Gemini और Imagen मॉडल के साथ काम करता है. यह भी ध्यान दें कि अपने-आप अपडेट होने वाले उपनाम (उदाहरण के लिए, gemini-2.0-flash) सूची में शामिल नहीं किए जाते, क्योंकि ये बुनियादी मॉडल के लिए सुविधाजनक उपनाम होते हैं.

Gemini मॉडल के नाम

अपने प्लैटफ़ॉर्म के लिए, शुरू करने के उदाहरणों के लिए, शुरू करने के लिए गाइड देखें.

रिलीज़ के चरणों के बारे में ज़्यादा जानने के लिए, मॉडल के वर्शन और नाम देने के पैटर्न देखें.

Gemini 2.5 Pro मॉडल के नाम

मॉडल का नाम ब्यौरा रिलीज़ का स्टेज रिलीज़ की तारीख रिटायरमेंट की तारीख
gemini-2.5-pro-preview-05-06 Gemini 2.5 Pro का सबसे नया झलक वर्शन झलक देखें 2025-05-06 निर्धारण शेष
gemini-2.5-pro-preview-03-25 gemini-2.5-pro-preview-05-06 पर ले जाने वाला झलक वाला वर्शन
(जो झलक का नया वर्शन है)
झलक देखें 2025-03-25 निर्धारण शेष

Gemini 2.5 Flash मॉडल के नाम

मॉडल का नाम ब्यौरा रिलीज़ का स्टेज रिलीज़ की तारीख रिटायरमेंट की तारीख
gemini-2.5-flash-preview-05-20 Gemini 2.5 Flash का सबसे नया झलक वर्शन झलक देखें 2025-05-20 निर्धारण शेष
gemini-2.5-flash-preview-04-17 Gemini 2.5 Flash का शुरुआती झलक वाला वर्शन झलक देखें 2025-04-17 निर्धारण शेष

Gemini 2.0 Flash मॉडल के नाम

मॉडल का नाम ब्यौरा रिलीज़ का स्टेज रिलीज़ की तारीख रिटायरमेंट की तारीख
gemini-2.0-flash-001 Gemini 2.0 Flash का सबसे नया स्टेबल वर्शन स्टेबल 2025-02-05
2026-02-05 से पहले नहीं
gemini-2.0-flash अपने-आप अपडेट होने वाला दूसरा नाम, जो Flash 2.0 के सबसे नए स्टेबल वर्शन
(फ़िलहाल gemini-2.0-flash-001) पर ले जाता है
स्टेबल 2025-02-10 ---

Gemini 2.0 Flash‑Lite मॉडल के नाम

मॉडल का नाम ब्यौरा रिलीज़ का स्टेज रिलीज़ की तारीख रिटायरमेंट की तारीख
gemini-2.0-flash-lite-001 Gemini 2.0 Flash‑Lite का सबसे नया स्टेबल वर्शन स्टेबल 2025-02-25
2026-02-25 से पहले नहीं
gemini-2.0-flash-lite 2.0 Flash-Lite
के नए स्टेबल वर्शन पर अपने-आप अपडेट होने वाला दूसरा नाम (फ़िलहाल gemini-2.0-flash-lite-001)
स्टेबल 2025-02-25 ---

Gemini 2.0 Flash Image Generation मॉडल के नाम

मॉडल का नाम ब्यौरा रिलीज़ का स्टेज रिलीज़ की तारीख रिटायरमेंट की तारीख
gemini-2.0-flash-preview-image-generation 1 Gemini 2.0 Flash Image Generation के लिए प्रीव्यू वर्शन झलक देखें 2025-05-06 निर्धारण शेष

Gemini 2.0 Flash‑Live मॉडल के नाम

यह सिर्फ़ तब उपलब्ध होता है, जब एपीआई प्रोवाइडर के तौर पर Vertex AI Gemini API का इस्तेमाल किया जा रहा हो.

मॉडल का नाम ब्यौरा रिलीज़ का स्टेज रिलीज़ की तारीख रिटायरमेंट की तारीख
gemini-2.0-flash-live-preview-04-09 1 Gemini 2.0 Flash‑Live के लिए प्रीव्यू वर्शन झलक देखें 2025-04-09 निर्धारण शेष

1 Firebase AI Logic एसडीके टूल के साथ Gemini Developer API का इस्तेमाल करने पर, यह सुविधा काम नहीं करती.

Imagen मॉडल के नाम

अपने प्लैटफ़ॉर्म के लिए, शुरू करने के उदाहरणों के लिए, Imagen की मदद से इमेज जनरेट करने की गाइड देखें.

रिलीज़ के चरणों के बारे में ज़्यादा जानने के लिए, मॉडल के वर्शन और नाम देने के पैटर्न देखें.

Imagen 4 मॉडल के नाम

मॉडल का नाम ब्यौरा रिलीज़ का स्टेज रिलीज़ की तारीख रिटायरमेंट की तारीख
imagen-4-0-generate-preview-05-20 2 Imagen 4 का झलक वाला वर्शन झलक देखें 2025-05-20 निर्धारण शेष

Imagen 4 Ultra मॉडल के नाम

मॉडल का नाम ब्यौरा रिलीज़ का स्टेज रिलीज़ की तारीख रिटायरमेंट की तारीख
imagen-4.0-ultra-generate-exp-05-20 2 Imagen 4 Ultra का एक्सपेरिमेंटल वर्शन झलक देखें 2025-05-20 निर्धारण शेष

Imagen 3 मॉडल के नाम

मॉडल का नाम ब्यौरा रिलीज़ का स्टेज रिलीज़ की तारीख रिटायरमेंट की तारीख
imagen-3.0-generate-002 Imagen 3 का सबसे नया स्टेबल वर्शन स्टेबल 2025-01-23 23-01-2026 से पहले नहीं
imagen-3.0-generate-001 2 Imagen 3 का शुरुआती स्टेबल वर्शन स्टेबल 2024-07-31 31-07-2025 से पहले

Imagen 3 Fast मॉडल के नाम

मॉडल का नाम ब्यौरा रिलीज़ का स्टेज रिलीज़ की तारीख रिटायरमेंट की तारीख
imagen-3.0-fast-generate-001 2 Imagen 3 Fast का शुरुआती स्टेबल वर्शन स्टेबल 2024-07-31 31-07-2025 से पहले

2 Gemini Developer API में यह सुविधा काम नहीं करती. भले ही, एपीआई को ऐक्सेस करने का तरीका कुछ भी हो.



यह सुविधा इन भाषाओं में काम करती है

Gemini

  • सभी Gemini मॉडल, इन भाषाओं को समझ सकते हैं और इनमें जवाब दे सकते हैं:

    ऐरेबिक (ar), बांग्ला (bn), बुल्गारियन (bg), चाइनीज़ सिम्प्लिफ़ाइड और ट्रेडिशनल (zh), क्रोएशियन (hr), चेक (cs), डेनिश (da), डच (nl), अंग्रेज़ी (en), एस्टोनियन (et), फ़िनिश (fi), फ़्रेंच (fr), जर्मन (de), ग्रीक (el), हिब्रू (iw), हिन्दी (hi), हंगेरियन (hu), इंडोनेशियन (id), इटैलियन (it), जैपनीज़ (ja), कोरियन (ko), लातवियन (lv), लिथुआनियन (lt), नॉर्वेजियन (no), पोलिश (pl), पॉर्चगीज़ (pt), रोमेनियन (ro), रशियन (ru), सर्बियन (sr), स्लोवाक (sk), स्लोवेनियन (sl), स्पैनिश (es), स्वाहिली (sw), स्वीडिश (sv), थाई (th), टर्किश (tr), यूक्रेनियन (uk), वियतनामीज़ (vi)

  • Gemini 2.0 Flash, Gemini 1.5 Pro, और Gemini 1.5 Flash मॉडल, इन अन्य भाषाओं को समझ सकते हैं और इनमें जवाब दे सकते हैं:

    अफ़्रीकान्स (af), अम्हारिक (am), असमिया (as), अज़ेरी (az), बेलारूसी (be), बोस्नियाई (bs), कैटलन (ca), सिबुआनो (ceb), कोर्सिकन (co), वेल्श (cy), दीवेही (dv), एस्पेरांटो (eo), बास्क (eu), फ़ारसी (fa), फ़िलिपिनो (Tagalog) (fil), फ़्रिसियन (fy), आयरिश (ga), स्कॉटिश गेलिक (gd), गैलिशियन (gl), गुजराती (gu), हौसा (ha), हवाईयन (haw), हमोंग (hmn), हैतीयन क्रेओल (ht), अर्मेनियाई (hy), इग्बो (ig), आइसलैंडिक (is), ज्वानेस (jv), जॉर्जियन (ka), कज़ाख (kk), खमेर (km), कन्नड़ (kn), क्रियो (kri), कुर्दीश (ku), किर्गिज़ (ky), लैटिन (la), लक्ज़मबर्गिश (lb), लाओ (lo), मलागासी (mg), माओरी (mi), मैसेडोनियन (mk), मलयालम (ml), मंगोलियन (mn), मेइतेइलोन (मणिपुरी) (mni-Mtei), मराठी (mr), मलय (ms), माल्टीज़ (mt), म्यांमार (बर्मीज़) (my), नेपाली (ne), न्यान्या (चिचेवा) (ny), ओडिया (ओडिया) (or), पंजाबी (pa), पश्तो (ps), सिंधी (sd), सिंघल (सिंघल) (si), समोआन (sm), शोना (sn), सोमाली (so), अल्बानियाई (sq), सेसोथो (st), सुंडानी (su), तमिल (ta), तेलुगु (te), ताजिक (tg), उइघुर (ug), उर्दू (ur), उज़्बेक (uz), ज़ोसा (xh), येहुदी (yi), योरुबा (yo), ज़ुलु (zu)

Imagen

  • सामान्य तौर पर उपलब्धता: अंग्रेज़ी

  • झलक: चाइनीज़ (सिंप्लिफ़ाइड), चाइनीज़ (ट्रेडिशनल), हिन्दी, जैपनीज़, कोरियन, पॉर्चगीज़, स्पेनिश



पुराने मॉडल के बारे में जानकारी

Firebase AI Logic, Gemini के पुराने और चालू मॉडल (जैसे, Gemini 1.5 मॉडल) के साथ काम करता है.

Firebase AI Logic, Imagen के पुराने मॉडल (जैसे, Imagen 2) के साथ काम नहीं करता.

मॉडल इनपुट आउटपुट इनके लिए ऑप्टिमाइज़ किया गया
Gemini 1.5 Pro
gemini-1.5-pro-002
टेक्स्ट, कोड, PDF, इमेज, वीडियो, ऑडियो टेक्स्ट, कोड, JSON ज़्यादा जानकारी की ज़रूरत वाले जटिल कामों के लिए काम करता है; 20 लाख वर्णों का कॉन्टेक्स्ट
Gemini 1.5 Flash
gemini-1.5-flash-002
टेक्स्ट, कोड, PDF, इमेज, वीडियो, ऑडियो टेक्स्ट, कोड, JSON अलग-अलग तरह के टास्क के लिए तेज़ और बेहतर परफ़ॉर्मेंस देता है
Gemini 1.0 Pro Vision
gemini-1.0-pro-vision-001
टेक्स्ट, कोड, PDF, इमेज, वीडियो (सिर्फ़ फ़्रेम) टेक्स्ट, कोड टेक्स्ट या कोड के जवाबों के लिए टेक्स्ट, इमेज, और वीडियो को हैंडल करता है. चैट के लिए इस्तेमाल नहीं किया जा सकता.
Gemini 1.0 Pro
gemini-1.0-pro-002
टेक्स्ट, कोड टेक्स्ट, कोड नैचुरल लैंग्वेज टास्क, एक से ज़्यादा बार के टेक्स्ट और कोड चैट, और कोड जनरेशन



अगले चरण

Gemini API की सुविधाओं को आज़माएं