Gemini 是 Google 今天发布的一个多模态的 AI 模型,它能够归纳并流畅地理解、操作处理包括文本、代码、音频、图像和视频在内的信息。另外,Gemini 的最小版本。Nano 可以直接部署在手机上。@Appinn

Google 发布了「他们规模最大、能力最强的 AI 模型」 Gemini 1

先不要去研究它是怎么实现的,也不需要去搞清楚如何训练的,看了下面这段视频之后,我有一种预感,著名电影《钢铁侠》里的贾维斯,真的可以在没多久后的未来,进入千家万户。

先来看视频吧:

视频来自 @宝玉

我不知道该怎么样描述这样一个我们正在经历的时代,从 ChatGPT 出现到现在,也才过了仅仅 1 年的时间。我们与机器的交流已经可以流畅到如此地步了么?这台机器,可能还掌握了人类有史以来的全部知识。

目前的英文版 Bard 已经可以使用 Gemini Pro 了,而未来几个月 Gemini Nano 就将直接内置在手机(Pixel 8 Pro)中,就有一种未来已经来到的感觉。最强的 Gemini Ultra 将在明年部署到 Bard 中。

在向公众推出之前,我们对 Gemini Pro 进行了多项行业标准基准测试。在八项基准测试中的六项中,Gemini Pro 的表现优于 GPT-3.5,包括在 MMLU(大规模多任务语言理解)(衡量大型 AI 模型的主要领先标准之一)和 GSM8K(衡量小学数学推理)方面。

Gemini 也在官网放出了和 GPT-4 的性能对比,从数据上对比,Gemini 要比 GPT-4 厉害。这可能会让2024年更有趣,比如 OpenAI 是不是真的要推出 GPT-5。

不知道在2025年,AI 能否拥有属于自己的记忆,会不会产生情感?我不知道,魔幻的世界已经不再魔幻了。

参考链接:

  • Gemini 简介:我们最大、能力最强的人工智能模型(英文)
  • 支持下一代人工智能工作负载: 发布 TPU v5p 和人工智能超级计算机(英文)
  • Gemini 官网(DeepMind)
  • 巴德 (Bard) 通过 Gemini 获得迄今为止最大的升级(英文)