谷歌打响OpenAI反击战,最新大语言模型PaLM 2直指GPT-4痛点
日期:2023-05-15 16:45:29 / 人气:198
谷歌开始了OpenAI的反击。最新的大语言模型PaLM2从PaLM 2到Gemini直指GPT-4的痛点。这一次,Google找到了GPT-4的痛点,以多模态能力直击靶心,以特殊领域模型拉开差距。可以说打了一个漂亮的反击。“本报记者|李静雅北京时间5月11日凌晨1点,Google I/O 2023开发者大会如期而至。在其位于美国加州山景城的总部,谷歌推出了多项产品和服务的重磅更新,涉及谷歌地图、人工智能、搜索、安卓、谷歌云和Pixel。其中,谷歌在萌芽和生成式AI方面的最新进展备受外界关注。棕榈2号发起了GPT 4号的反击。谷歌CEO皮查伊在发布会上表示,谷歌此次发布的PaLM 2是最先进的语言模型,也是其PaLM语言模型的第二个版本。与PaLM 1相比,新版本升级了多语言、推理和编码能力,并将支持25种谷歌产品。
来源:谷歌
在多语种能力方面,PaLM 2进行了更多的训练,文本跨越100多种语言,大大提高了对细致入微的文本的理解、生成和翻译能力,解决了对成语、诗词、谜语的理解能力,处理门槛较高。此外,PaLM 2可以在非常高的水平上通过语言能力测试。在推理能力方面,PaLM 2在包含科学论文和数学表达式的网页上进行了训练,因此在逻辑、常识推理和数学方面有能力提升。在编码能力上,PaLM 2支持20多种编程语言。由于它是在大量公开可用的源数据集上进行预训练的,因此擅长Python、JavaScript等流行编程语言,也可以编程Prolog、Fortran、Verilog等小众语言。
来源:谷歌
根据皮查伊的说法,PaLM 2将会有四种大小,分别是壁虎、水獭、野牛和独角兽。
来源:Google Gecko:体积最小,可以在移动设备上运行,速度足够快,即使离线也可以交互使用。
Otter:中型机型,适合各种任务,包括自然语言处理、机器翻译和代码生成。
Bison:更大的模型可以处理更复杂的任务,比如生成逼真的图像和视频。
独角兽:尺寸最大,可以处理最复杂的任务,比如写创意文字,比如诗歌、代码、剧本、音乐作品、邮件、信件等。
不同尺寸型号带来的功能意味着PaLM 2可以进行微调,以在许多方面支持整个类别的产品,并帮助更多的用户。
来源:谷歌
PaLM 2的多模态能力体现在其理解和生成音视频内容的能力上,皮查伊在现场演示了这些能力。他以谷歌基于PaLM 2针对医疗领域进行微调的MED-PaLM 2为例。后者是第一个在医师执照考试中显示专家水平的专业语言模型。它已经能够帮助放射科医生在医院的观察室解读图像,根据x光片分析患者的病情,此后将被用于更多领域。
来源:谷歌CEO皮查伊表示,Med-PaLM已经达到了人类专家医生的水平。
皮查伊指出,尽管PaLM 2已经非常强大,但只有对特定领域的知识进行微调,它才能发挥真正的作用。与基本模型相比,微调帮助Med-PaLM 2实现了近十倍的准确性,从而可以接近临床专家回答医学问题的性能。“我们仍在努力增加Med-PaLM 2的功能,使其能够整合来自医学图像的信息,如乳腺x光片。”皮柴强调。
据谷歌搜索高管称,Med PaLM 2的训练集使用了来自各国医疗诊所的数据样本。
同样,谷歌也基于PaLM 2为安全领域训练了一个垂直模型Sec-PaLM,它可以利用AI检测恶意脚本,帮助安全专家理解和解决各种攻击和威胁。谷歌称,PaLM 2的用户包括全世界的消费者,以及各种规模的开发者和企业。皮查伊还宣布,谷歌已经开始开发下一代多模态大型模型Gemini,该模型在整合工具和API方面非常高效,在内存和规划能力方面也有相当创新的突破,目前仍在培训中。“与其他型号相比,Gemini展示了前所未有的多模式能力。一旦经过微调和严格的安全测试,它还将具有各种尺寸和功能,并可以部署在不同的产品、应用和设备上,使每个人受益。”皮柴说。从PaLM2到Gemini,Google这次找到了GPT-4的痛点,以多模态能力击中靶心,以特殊域模型拉开差距,可以说打了一个漂亮的反击。谷歌研究部副总裁佐宾·格罗曼尼(Zobin Geromani)指出了一个值得关注的问题,即模型并不是“越大越好”那么简单,研究的创造力是构建伟大模型的关键。他说,谷歌最近在构建和训练模型方面的进展,使其能够理解如何真正释放多模态能力,以及如何比以前更有效地构建模型。在此之后,谷歌将致力于建立为人们的日常生活带来真正好处的模型。谷歌在本次I/O大会上并未给出更多PaLM 2的技术细节,这与OpenAI对ChatGPT和GPT-4的态度类似,但谷歌的上述表态符合其内部的技术路线。虽然从去年年底开始,Google因为ChatGPT的出现而处于非常被动的局面,但是Google其实在OpenAI之前就看到了超大规模语言模型的必要性,坚持在稀疏模型架构上做深入的探索。DeepMind在与Google分庭抗礼之前,其语言模型sparrow就走上了小模型参数战胜微调的道路,而与Google强强联手之后,势必会在思维上对PaLM 2做出相当大的贡献。皮查伊还强调,PaLM 2的成就是基于谷歌大脑和DeepMind这两个世界级研究团队取得的进展。巴德的复仇是在I/O大会上,另一个举世瞩目的进展来自巴德,他之前已经被打败了。谷歌公布了Bard的多项功能更新,可谓是对BingChat新更新的一次重量级回应。首先是带图片的多模态查询功能。用户可以用图片向吟游诗人提问,吟游诗人也可以用图片内容回复用户。如果用户想要查询某个旅游目的地,Bard的行为就像大众点评一样,可以向用户展示目的地附近的所有热门景点。
来源:谷歌来源:谷歌
除了文字,吟游诗人还能很好的理解图片,根据图片信息抽象文字。谷歌现场进行了演示。如果你给巴德发一张狗的图片,巴德可以根据图片分析出有趣的点。
来源:谷歌
在这个过程中,谷歌也表现出,通过最近几个月的训练,巴德对语言和文字的理解得到了进一步的提升,这也是上次巴德出来被群里嘲讽的核心点。在I/O大会现场,巴德有两个功能演示获得了最高分贝的欢呼。第一次更新了Bard的黑暗模式,第二次,Bard的新搜索功能与谷歌地图完美融合。
来源:谷歌来源:在现场演示中,谷歌高管问巴德18岁时哪个城市更适合读书,并给出了几个条件。巴德先用文字给出了几个选项,然后被要求用谷歌地图显示位置。来源:谷歌
Bard的另一个主要好处是在编程方面。谷歌正在增强下一代版本Bard的编程能力,希望Bard不仅能生成代码,还能解释一些代码片段,帮助用户调试代码,同时也希望Bard能有更强的代码引用能力。
在新版本中,巴德的编程能力非常强大,堪比副驾驶。现场演示引发阵阵掌声。
在之前的迭代中,Bard已经能够将Python代码导出到Google的Colab。Google正在扩展这一功能,希望将Python代码导出到Replit,方便开发者使用。这一次,谷歌取消了Bard的用户等候名单,使其可以在180多个国家和地区使用。除了英语,Bard目前还可以支持日语和中文,不久将支持40种语言。据悉,谷歌目前正在与第三方合作伙伴合作,向Bard介绍其技术支持。不过,谷歌强调其唯一的第三方合作伙伴是Adobe的图像生成器Firefly,并将与专注于数学计算的引擎WolframAlpha合作。有趣的是,最近微软Bing的升级也调用了Wolfram Alpha插件。有分析指出,谷歌自身的图像生成能力很强,但这次选择与Adobe Firefly联手令人意外,应该更多是出于安全考虑。
来源:谷歌
谷歌表示,将很快推出Bard的其他扩展,主要是将其集成到自己的应用程序中,尤其是谷歌地图、谷歌文档、谷歌工作表和Gmail。目前看来,这种更新会比微软Edge浏览器和GPT-4的组合更强。
来源:Google Bard结合Gmail "

来源:谷歌
在多语种能力方面,PaLM 2进行了更多的训练,文本跨越100多种语言,大大提高了对细致入微的文本的理解、生成和翻译能力,解决了对成语、诗词、谜语的理解能力,处理门槛较高。此外,PaLM 2可以在非常高的水平上通过语言能力测试。在推理能力方面,PaLM 2在包含科学论文和数学表达式的网页上进行了训练,因此在逻辑、常识推理和数学方面有能力提升。在编码能力上,PaLM 2支持20多种编程语言。由于它是在大量公开可用的源数据集上进行预训练的,因此擅长Python、JavaScript等流行编程语言,也可以编程Prolog、Fortran、Verilog等小众语言。
来源:谷歌
根据皮查伊的说法,PaLM 2将会有四种大小,分别是壁虎、水獭、野牛和独角兽。
来源:Google Gecko:体积最小,可以在移动设备上运行,速度足够快,即使离线也可以交互使用。
Otter:中型机型,适合各种任务,包括自然语言处理、机器翻译和代码生成。
Bison:更大的模型可以处理更复杂的任务,比如生成逼真的图像和视频。
独角兽:尺寸最大,可以处理最复杂的任务,比如写创意文字,比如诗歌、代码、剧本、音乐作品、邮件、信件等。
不同尺寸型号带来的功能意味着PaLM 2可以进行微调,以在许多方面支持整个类别的产品,并帮助更多的用户。
来源:谷歌
PaLM 2的多模态能力体现在其理解和生成音视频内容的能力上,皮查伊在现场演示了这些能力。他以谷歌基于PaLM 2针对医疗领域进行微调的MED-PaLM 2为例。后者是第一个在医师执照考试中显示专家水平的专业语言模型。它已经能够帮助放射科医生在医院的观察室解读图像,根据x光片分析患者的病情,此后将被用于更多领域。
来源:谷歌CEO皮查伊表示,Med-PaLM已经达到了人类专家医生的水平。
皮查伊指出,尽管PaLM 2已经非常强大,但只有对特定领域的知识进行微调,它才能发挥真正的作用。与基本模型相比,微调帮助Med-PaLM 2实现了近十倍的准确性,从而可以接近临床专家回答医学问题的性能。“我们仍在努力增加Med-PaLM 2的功能,使其能够整合来自医学图像的信息,如乳腺x光片。”皮柴强调。
据谷歌搜索高管称,Med PaLM 2的训练集使用了来自各国医疗诊所的数据样本。
同样,谷歌也基于PaLM 2为安全领域训练了一个垂直模型Sec-PaLM,它可以利用AI检测恶意脚本,帮助安全专家理解和解决各种攻击和威胁。谷歌称,PaLM 2的用户包括全世界的消费者,以及各种规模的开发者和企业。皮查伊还宣布,谷歌已经开始开发下一代多模态大型模型Gemini,该模型在整合工具和API方面非常高效,在内存和规划能力方面也有相当创新的突破,目前仍在培训中。“与其他型号相比,Gemini展示了前所未有的多模式能力。一旦经过微调和严格的安全测试,它还将具有各种尺寸和功能,并可以部署在不同的产品、应用和设备上,使每个人受益。”皮柴说。从PaLM2到Gemini,Google这次找到了GPT-4的痛点,以多模态能力击中靶心,以特殊域模型拉开差距,可以说打了一个漂亮的反击。谷歌研究部副总裁佐宾·格罗曼尼(Zobin Geromani)指出了一个值得关注的问题,即模型并不是“越大越好”那么简单,研究的创造力是构建伟大模型的关键。他说,谷歌最近在构建和训练模型方面的进展,使其能够理解如何真正释放多模态能力,以及如何比以前更有效地构建模型。在此之后,谷歌将致力于建立为人们的日常生活带来真正好处的模型。谷歌在本次I/O大会上并未给出更多PaLM 2的技术细节,这与OpenAI对ChatGPT和GPT-4的态度类似,但谷歌的上述表态符合其内部的技术路线。虽然从去年年底开始,Google因为ChatGPT的出现而处于非常被动的局面,但是Google其实在OpenAI之前就看到了超大规模语言模型的必要性,坚持在稀疏模型架构上做深入的探索。DeepMind在与Google分庭抗礼之前,其语言模型sparrow就走上了小模型参数战胜微调的道路,而与Google强强联手之后,势必会在思维上对PaLM 2做出相当大的贡献。皮查伊还强调,PaLM 2的成就是基于谷歌大脑和DeepMind这两个世界级研究团队取得的进展。巴德的复仇是在I/O大会上,另一个举世瞩目的进展来自巴德,他之前已经被打败了。谷歌公布了Bard的多项功能更新,可谓是对BingChat新更新的一次重量级回应。首先是带图片的多模态查询功能。用户可以用图片向吟游诗人提问,吟游诗人也可以用图片内容回复用户。如果用户想要查询某个旅游目的地,Bard的行为就像大众点评一样,可以向用户展示目的地附近的所有热门景点。
来源:谷歌来源:谷歌
除了文字,吟游诗人还能很好的理解图片,根据图片信息抽象文字。谷歌现场进行了演示。如果你给巴德发一张狗的图片,巴德可以根据图片分析出有趣的点。
来源:谷歌
在这个过程中,谷歌也表现出,通过最近几个月的训练,巴德对语言和文字的理解得到了进一步的提升,这也是上次巴德出来被群里嘲讽的核心点。在I/O大会现场,巴德有两个功能演示获得了最高分贝的欢呼。第一次更新了Bard的黑暗模式,第二次,Bard的新搜索功能与谷歌地图完美融合。
来源:谷歌来源:在现场演示中,谷歌高管问巴德18岁时哪个城市更适合读书,并给出了几个条件。巴德先用文字给出了几个选项,然后被要求用谷歌地图显示位置。来源:谷歌
Bard的另一个主要好处是在编程方面。谷歌正在增强下一代版本Bard的编程能力,希望Bard不仅能生成代码,还能解释一些代码片段,帮助用户调试代码,同时也希望Bard能有更强的代码引用能力。
在新版本中,巴德的编程能力非常强大,堪比副驾驶。现场演示引发阵阵掌声。
在之前的迭代中,Bard已经能够将Python代码导出到Google的Colab。Google正在扩展这一功能,希望将Python代码导出到Replit,方便开发者使用。这一次,谷歌取消了Bard的用户等候名单,使其可以在180多个国家和地区使用。除了英语,Bard目前还可以支持日语和中文,不久将支持40种语言。据悉,谷歌目前正在与第三方合作伙伴合作,向Bard介绍其技术支持。不过,谷歌强调其唯一的第三方合作伙伴是Adobe的图像生成器Firefly,并将与专注于数学计算的引擎WolframAlpha合作。有趣的是,最近微软Bing的升级也调用了Wolfram Alpha插件。有分析指出,谷歌自身的图像生成能力很强,但这次选择与Adobe Firefly联手令人意外,应该更多是出于安全考虑。
来源:谷歌
谷歌表示,将很快推出Bard的其他扩展,主要是将其集成到自己的应用程序中,尤其是谷歌地图、谷歌文档、谷歌工作表和Gmail。目前看来,这种更新会比微软Edge浏览器和GPT-4的组合更强。
来源:Google Bard结合Gmail "

作者:博猫娱乐
新闻资讯 News
- 先不说还得上班养人。00后会拍工...07-12
- Baby Paris为商界领袖唱歌,穿...07-12
- 林心如被她的肤色拖累了,她穿着...07-12
- 别吹牛了!潘粤明救不了戏《你见...07-12