选择适合您的 Gemini 模型

Gemini 3.0 系列提供了三种不同规格的模型，以满足不同的性能与成本需求。

Gemini 3.0 Flash

极致速度，高性价比

专为高频、低延迟任务设计。它是目前世界上响应速度最快的多模态模型之一，适合日常对话、快速翻译和简单任务。

免费试用

性能与成本的最佳平衡

目前最主流的通用大模型。在推理能力、数学计算和代码生成方面表现出色，超越了 GPT-4 Turbo。

开发者体验

最强性能，巅峰之作

专为高度复杂的任务打造。在科学研究、复杂代码架构、多语言创意写作等领域具有专家级水平。

升级 Advanced

特性	Flash	Pro	Ultra
上下文窗口	100万 Tokens	200万 Tokens	200万 Tokens
多模态支持	文本/图像/音频/视频	全能力增强	专家级理解
代码能力	基础	强	卓越
价格	免费	API付费/部分免费	$19.99/月

日常对话与轻任务，优先选择 Flash。需要更强推理或代码能力，选择 Pro。科研级任务再考虑 Ultra。

API 使用优先走 Pro，在超过延迟预算时降级到 Flash，实现性能与成本的平衡。

三款模型均支持中文，高并发下 Flash 的中文响应更稳定。

Flash 会影响准确性吗？

在复杂推理场景下，Pro 更稳健；一般任务两者差异不明显。

上下文 200万 tokens 如何使用？

通过分块与引用索引的方式传入长文档，避免一次性大对象导致费用激增。