谷歌在2024年I/O大会上公布了Gemini和AI在Gmail照片等平台集成的大胆愿景

• 2024-06-17 11:35:10

摘要今年的谷歌I/O 开发者大会正式拉开帷幕，谷歌宣布将全力进生成式人工智能的未来。在大会上，谷歌首席执行官 Sundar Pichai 公布了一系...

今年的谷歌I/O 开发者大会正式拉开帷幕，谷歌宣布将全力进生成式人工智能的未来。在大会上，谷歌首席执行官 Sundar Pichai 公布了一系列由谷歌人工智能技术 Gemini 驱动的进展。

此次活动的核心主题是生成式人工智能，谷歌展示了其 Gemini 系列模型的重大更新，并为创作者推出了新工具。以下是升级的亮点：

● 速度更快、性能更强大的 Gemini 型号： Google 推出了全新的 1.5 Flash 型号，这是迄今为止速度最快的 Gemini，在摘要、聊天应用程序和数据提取等任务中表现出色。此外，改进后的 1.5 Pro 型号拥有更强的遵循复杂指令和控制响应方式的能力。

● Gemini Nano 扩展，Gemma 升级：专为设备上的任务而设计的 Gemini Nano 现在从 Pixel 手机开始支持图像输入。谷歌还宣布了 Gemma 2.0，这是用于负责任的 AI 开发的下一代开源模型，以及受 PaLI-3 启发的视觉语言模型 PaliGemma。

● 高保真视频和图像生成：谷歌推出了 Veo，这是一种突破性的视频生成模型，能够生成长度超过一分钟的高质量电影风格视频。此外，该公司还推出了 Imagen 3，这是迄今为止最先进的文本转图像模型。

● 音乐 AI 沙盒：谷歌与 YouTube 合作推出了一套旨在赋能创作者的音乐 AI 工具，包括生成原创乐器部分的能力。

谷歌产品间 Gemini 的进一步整合

随着 Gemini 模型在发布数月后逐渐确立地位，谷歌宣布了将其进一步深度融入其核心产品的计划，其中包括：

● 增强的 Android UX：新功能利用设备上的 AI 来增强用户体验。例如，Circle to Search 允许学生使用手机或平板电脑获得数学和物理问题的分步辅导。此外，Gemini 集成支持将生成的图像拖放到消息中以及“询问此视频”以从 YouTube 视频中检索信息等功能。

● 更好的搜索功能：搜索功能很快将利用定制的 Gemini 模型来回答全新类型的问题。用户将能够与 AI 概览进行交互，调整显示的详细程度，并探索 AI 组织的结果页面，其中包含分类内容。

● 改进的 Google Photos 组织方式： Gemini 推出的新功能 Ask Photos 允许用户以更自然的方式搜索照片库，例如请求特定地点的照片或根据主题细节搜索照片。Ask Photos 还可以整理照片亮点并推荐用于社交媒体分享的标题。

● 更具协同性的 Google Workspace： Gemini for Workspace 功能正在升级，包括在 Gmail、Docs、Drive、Slides 和 Sheets 侧面板中访问 1.5 Pro 版本。这使用户能够直接在这些应用程序中提出更广泛的问题并获得更有见地的答复。

这些公告标志着谷歌人工智能战略向前迈出重要一步，将生成式人工智能置于其所有产品用户体验的最前沿。

标签：