Gemini 3.0 系列提供了三种不同规格的模型,以满足不同的性能与成本需求。
极致速度,高性价比
性能与成本的最佳平衡
最强性能,巅峰之作
专为高度复杂的任务打造。在科学研究、复杂代码架构、多语言创意写作等领域具有专家级水平。
| 特性 | Flash | Pro | Ultra |
|---|---|---|---|
| 上下文窗口 | 100万 Tokens | 200万 Tokens | 200万 Tokens |
| 多模态支持 | 文本/图像/音频/视频 | 全能力增强 | 专家级理解 |
| 代码能力 | 基础 | 强 | 卓越 |
| 价格 | 免费 | API付费/部分免费 | $19.99/月 |
日常对话与轻任务,优先选择 Flash。需要更强推理或代码能力,选择 Pro。科研级任务再考虑 Ultra。
API 使用优先走 Pro,在超过延迟预算时降级到 Flash,实现性能与成本的平衡。
三款模型均支持中文,高并发下 Flash 的中文响应更稳定。
Flash 会影响准确性吗?
在复杂推理场景下,Pro 更稳健;一般任务两者差异不明显。
上下文 200万 tokens 如何使用?
通过分块与引用索引的方式传入长文档,避免一次性大对象导致费用激增。