今年,像往常一样,人们大量讨论人工智能:在两个小时内,演讲者至少提到了 121 次“AI”这个词。
双子座 1.5 PRO
100 万个上下文标记:Gemini 1.5 PRO 提供了 100 万个标记的上下文窗口,在测试访问中已经实现了 200 万个标记的结果
新版本的 Gemini 1.5 Pro 已经向全球部分国家的 Gemini Advanced 账户付费用户开放。不幸的是,俄罗斯不是其中之一。
Gemini 1.5 Flash 是 Gemini 的轻量级版本,更方便用户使用,但同时功能有限(类似的故事还有 GPT 3.5 和 GPT-4,或者 Claude Sonnet 和 Cloude 3.0 Opus)。
Project Astra 和 Gemini Live
计划中,代理将与 Gmail(包括根据您的任务在必要时回复您的信件)和其他 Google 服务以及 Google Meet 合作。目前,一切都还处于公告模式,助理甚至还没有登台亮相。
实时视频处理,Gemini Agent 将实时帮助您处理屏幕上所显示的内容。
有趣的是,助手可以记住你的眼镜在哪里,它(即神经网络)不久前看到过。
这有点像前一天 OpenAI 展示的基于 GPT-4o 的助手,不同之处在于谷歌的开发尚未实现,而只是公布。
Android 版 Gemini 和 Gemini Nano
在不久的将来,新版 Android 移动设备上的 Google Assistant 将会被 Gemini 所取代。用户可以将 AI 生成的图像直接拖放到他们的 Gmail、Google Messages 和其他应用程序中。同时,谷歌表示 YouTube 用户将能够点击“询问此视频”来查找该 YouTube 视频中的特定信息。
Gemini Nano是一个轻量级的神经网络模型,将会内置到下一版Chrome之中。
音乐 AI 沙盒 (音乐 FX)
该项目从事音乐生成,并与音乐家合作开发,以避免侵犯版权的指控。谷歌的入门音乐神经网络工具可以在这里获得,但核心音乐工具仅供特定用户使用。
图片 3
Imagen 3 是一种新的图像生成模型。与 Imagen 的先前版本一样,它不向公众开放。有兴趣的人可以通过页面上的Google 表单链接加入等候名单。
Veo 用于视频生成
Veo 是一款视频生成工具,旨在成为 OpenAI 的 Sora 的有力竞争对手。 Veo 的测试工具不向公众开放,但您可以加入等候名单 。
演示视频看起来相当不错,但尚不清楚需要尝试多 手机号码数据 少次才能拍出正确的照片。俄罗斯用户不应指望获得早期访问权或任何访问权。
TPU 6 Trillium 和 Firebase Genkit
谷歌发布了用于训练 AI 模型的新一代芯片 TPU 6 Trillium,将于 2024 年底在谷歌云上推出。
Firebase新增了一个名为 Firebase Genkit 的 引人入胜的行动呼吁 功能,旨在让使用 JavaScript/TypeScript 开发 AI 应用程序变得更加容易。很快将计划支持 Go。
使用 AI 和 Gems 进行搜索
谷歌承诺未来将修改搜索。 Gemini 神经网络 whatsapp 号码 计划使用多个步骤来分析从您的请求中收到的信息,并形成最佳答案或对您的问题的完整解决方案。
宝石– goka 以公告形式提供,目前尚未向用户开放。它就像是 ChatGPT 的一种 GPT 类似物。