谷歌发布全球最大视觉语言模型

2667 阅读 0 评论 0 点赞来源：网友投稿

近日，来自谷歌和德国柏林工业大学的一组人工智能研究人员公布了史上最大视觉语言模型 PaLM-E（全称 Pathways Language Model with Embodied）。

作为一种多模态具身视觉语言模型 (VLM)，PaLM-E 能将视觉和语言集成到机器人控制中。谷歌和柏林工业大学称，PaLM-E 是迄今为止人类开发的最大规模 VLM，其可以在不需要再训练的情况下执行各种任务。此外，通过 PaLM-540B 语言模型与 ViT-22B 视觉 Transformer 模型相结合，PaLM-E 最终的参数量高达 5620 亿（GPT-3 的参数量为 1750 亿），这是全球已知的最大视觉语言模型。

过去几个月时间里，由 ChatGPT 在全球科技巨头之间引发的人工智能热潮推动了大量语言模型的生产力前置。据《华尔街日报》，虽然谷歌早在两年前就做出了类似 ChatGPT 的人工智能聊天工具，但谷歌对 AI 的小心谨慎态度让其失去了对生成式 AI 的先机。

责编：聚观365

*此内容归聚观365整编发布，未经聚观365书面授权，不得以任何方式加以使用，包括转载、摘编、复制或建立镜像。

本文分类：国内早报
本文标签：谷歌视觉语言模型
浏览次数：2667 次浏览
发布日期：2023-03-10 09:49:47
本文链接：https://www.juguan365.com/guoneizaobao/6575.html
声明：本站所有资源均是网上搜集或网友上传提供，本站内容仅供观摩学习交流之用，将不对任何资源负法律责任，如有侵权请及时联系我们，本站将在核实后立即删除。

上一篇 > 诊断阿尔茨海默症将成AI下一突破口
下一篇 > 马斯克预计Twitter下季度现金流转正

评论列表共有 0 条评论

暂无评论

谷歌发布全球最大视觉语言模型

“AI+AR”能够让谷歌智能眼镜业务复苏吗？

屏幕下藏线圈，会是无线充电的最终解法吗？

Android转为内部开发，要从开源变成闭源了吗？

亚马逊应用商店关闭，谷歌却不一定能高兴起来

评论列表 共有 0 条评论

发表评论 取消回复

评论列表共有 0 条评论

发表评论取消回复