谷歌 Gemini 3 模型大幅提升屏幕理解能力,助力 AI 手机爆发

摘要:: 谷歌新发布的 Gemini 3 模型在多模态能力上实现飞跃,其“屏幕理解(Screen Understanding)”准确度从 11% 提升至 72%。这一突破被视为 AI 手机普及的前置条件,使手机助理能像人类一样直接阅读并操作应用界面。
来源:: 国金证券 / 华尔街见闻

摘要:: 谷歌新发布的 Gemini 3 模型在多模态能力上实现飞跃,其“屏幕理解(Screen Understanding)”准确度从 11% 提升至 72%。这一突破被视为 AI 手机普及的前置条件,使手机助理能像人类一样直接阅读并操作应用界面。
来源:: 国金证券 / 华尔街见闻