FunctionGemma 是 Google 最小的函数调用专用模型——2.7 亿个参数,288 MB,解码速度约为 126 tok/s。没错,它需要微调(准确率从 58% 提升到 85%),没错,它使用了一种奇怪的自定义格式,而不是 JSON。但它适用于任何手机,响应速度极快,而且确实有效。现在就可以构建带有离线 AI 代理的应用——体积小、速度快、可靠性高,足以满足生产环境的需求。无需等待模型体积更小、设备速度更快的“神奇未来”,未来已来!
Москвичи пожаловались на зловонную квартиру-свалку с телами животных и тараканами18:04
。业内人士推荐Line官方版本下载作为进阶阅读
换言之,真正强大的模型,需要的从来不只是正确答案,而往往要靠模型自己摸索出来的解题路径,这是依靠蒸馏别人 API 的输出,得不到的东西。,更多细节参见搜狗输入法2026
Жители Санкт-Петербурга устроили «крысогон»17:52