|
|
|
其实苹果跟 google 合作然后使用 gemini 确实比较稳,
一是 gemini 目前是多模态能力最强的模型,特别是能原生读视频,和苹果的场景配合更好,
二是 gemini 还有个优势就是他的推理速度够快,flash 这个等级的模型能去到 > 200t/s 的速度,0.3s 的 ttft ,lite 这个等级的就更快了,能去到 > 500t/s 的速度,也是 0.3 ttft, 苹果这个相机键长按启动,快问快答的多摸态场景明显是更加合适的,我觉得苹果应该会主力使用 lite 这个级别的模型以取得最佳的 cost efficiency |
|