AI模型

亚马逊推出新系列AI模型

近日,有消息称亚马逊旗下云计算部门AWS推出了一个全新的生成式人工智能多模式模型系列,名为“Nova”。据了解,在这一系列AI模型中,有四个文本生成模型,分别是Micro、Lite、Pro和Premier,前三个目前已经对用户推出了,而Premier则要等到明年年初才会上线。根据亚马逊的说法,它们延迟很低,可以快速生成各种文本,并且能够适应各种复杂的使用场景。

英伟达展示AI模型Fugatto

据报道,英伟达展示了一种用于生成音乐和音频的新型人工智能模型Fugatto,它可以修改声音并生成新的声音。Fugatto的独特魅力在于其超越传统的人工智能界限,不仅能够接收并分析现有音频素材,还能对其进行灵活修改。举例来说,它能将钢琴伴奏的旋律无缝转化为动人的人声演唱,或是调整口语录音中的口音特征与情感色彩,展现出前所未有的音频转换能力。

昆仑万维发布SkyReels

昆仑万维发布首个集成视频大模型与3D大模型的AI短剧平台SkyReels。SkyReels平台集剧本生成、角色定制、分镜、剧情、对白/BGM及影片合成于一体,让创作者“一键成剧”,轻松制作高质量AI视频。据介绍,SkyReels平台集成了昆仑万维自研剧本大模型SkyScript、自研分镜大模型StoryboardGen、自研3D生成大模型Sky3DGen、以及业界首个将AI 3D引擎与视频大模型深度融合的创新平台WorldEngine。

Meta正构建巨型AI模型

据透露,Meta公司正在对人工智能进行重大投资,旨在打造一个先进的系统,能够支持Facebook等旗下各个平台视频的推荐引擎。Meta旗下负责Facebook平台的汤姆·艾里森(Tom Alison)透露,这个项目是公司“2026年技术发展蓝图”的关键一环。他详细解释称,这一全新AI推荐模型将不仅支持类似于TikTok的Reels短视频服务,还将覆盖更多的传统长视频内容。

Meta更新AI模型

Meta最新更新了其代码生成AI模型,Code Llama70B,这是“目前最大、最优秀的模型”。Code Llama工具于2023年8月推出,无论是研究还是商业用途,都是免费的。根据Meta的AI博客上的一篇文章,Code Llama70B能够处理比以前版本更多的查询,这意味着开发者可以在编程时输入更多的提示,而且它的准确性也更高。

谷歌发布AI模型Gemini

Google公司突然放出了自己“迄今为止最强大、最通用的模型”Gemini。Gemini是一款多模态模型,可以归纳并流畅地理解、操作以及组合不同类型的信息,包括文本、代码、音频、图像和视频。第一个版本 Gemini 1.0 推出3款不同尺寸模型:Ultra、Pro 和 Nano。

OpenAI正准备新的开源AI模型

5 月 16 日,据 The Information 援引一位知情人士的话说,OpenAI 正准备向公众发布一款新的开源语言模型。报告称,OpenAI 不太可能发布与 GPT 竞争的模型。该公司没有立即回应置评请求。微软公司 1 月宣布向 OpenAI 投资数十亿美元,加深了与这家初创公司的联系,并为与竞争对手展开更多竞争奠定了基础。