人工智能统治地位的另一场光荣之战……GPT-4o vs Google I/O

Admin 2024-5-17 300 5/17
人工智能统治地位的另一场光荣之战……GPT-4o vs Google I/O

在2024年的Google I/O大会上,谷歌宣布了一系列突破性的消息,在AI、数据库管理和开发工具方面取得了显著进展。然而,此次活动被OpenAI的一项战略行动所掩盖,他们在谷歌会议前几个小时发布了GPT-4 Omni,加剧了这两家科技巨头之间的竞争。

OpenAI的GPT-4 Omni:新的里程碑

OpenAI的惊喜春季更新推出了GPT-4 Omni,一个将文本、视觉和音频集成在一起的模型,提供了更接近人类的对话体验。该模型比GPT-4 Turbo更快、更便宜,展示了AI能力的显著进步。它能够变化语音语调,从戏剧性到讽刺,再到超级轻松,为AI互动增添了新的维度,尽管其对话功能尚未向公众开放。

Google I/O亮点

尽管OpenAI采取了先发制人的行动,Google I/O仍然发布了令人印象深刻的公告:

Gemini 1.5 Pro

谷歌的旗舰AI模型Gemini 1.5 Pro现在支持200万个令牌上下文窗口,能够处理长达两小时的视频内容或60000行代码。为了降低处理如此大数据集的成本,谷歌引入了上下文缓存功能,以较低的成本重用令牌。

Firebase增强功能

对开发者而言,最令人兴奋的更新之一是Firebase Data Connect,终于将PostgreSQL支持引入Firebase。此集成解决了开发者社区长期以来的需求,并使Firebase成为Supabase的有力替代方案。

Project Astro和AI竞赛

谷歌的Project Astro是GPT-4 Omni的对手,展示了定位物体和回答查询等AI能力。虽然令人印象深刻,但在语音自然度和延迟方面仍然落后于OpenAI。此外,谷歌启动了一场开发者竞赛,鼓励开发最佳Gemini驱动的应用,获胜者将获得一辆电动DeLorean。

新的开发工具

谷歌推出了Firebase Gen Kit,一个与Oama集成的工具,简化了构建AI驱动的API端点的过程。Project IDX,一个基于浏览器的VS Code替代品,现在向公众开放,提供了移动模拟器等功能,以增强开发体验。

硬件创新

在硬件方面,谷歌推出了Trillium TPUs和Axion,这是其新的基于ARM的数据中心CPU,表明其向更高效、更强大的计算基础设施推进。

生成视频模型

为了与OpenAI的Sora竞争,谷歌宣布了Vio,一个生成视频模型,进一步展示了他们推动AI驱动内容创作的承诺。

前路

虽然OpenAI和谷歌的进展令人印象深刻,但仍然有一种达到瓶颈的感觉。奇点,即AI超越人类智能的时刻,仍然显得遥远。尽管模型更快、更便宜,但向真正智能、自我学习的AI飞跃仍然难以实现。科技界迫切期待能够突破AI能力界限的重大突破。

敬请关注这些技术的深入教程和见解。AI领域正在迅速发展,OpenAI和谷歌都站在这段令人兴奋的旅程的前沿。

- THE END -
最后修改:2024年5月17日

非特殊说明,本博所有文章均为博主原创。