随着科技的疾驰,人工智能已逐渐成为当今世界最炙手可热的焦点。尽管人工智能、大模型的发展频频陷入“抄袭”的泥潭,但我们不能忽视的是,这些技术正在为各行各业的进步“添砖加瓦”。

近日,中国电信宣布将自主研发的星辰大模型全面开源,同时开放1T高质量清洗数据集,正式成为央企中首个完成LLM开源的“选手”。去年12月,阿里云正式发布并开源了“业界最强开源大模型”通义千问720亿参数模型Qwen-72B。今年1月17日,商汤科技与上海AI实验室联合香港中文大学和复旦大学发布的新一代大语言模型书生·浦语2.0也宣布开源。随着国内外越来越多的大模型宣布开源,大模型赛道正式迎来了“开源热”。

开源的重要性不容忽视,我国政府对开源的态度也十分明确,并将其作为新一代人工智能发展规划的基本原则。科技部副部长吴朝晖曾表示,中国将坚持开源协作,推动算力资源和数字资源的开放共享,加快形成大模型的产业生态。

在2023年4月,由复旦大学自然语言处理实验室开发的MOSS模型正式上线,成为国内首个插件增强的开源对话语言模型,这一突破标志着我国在人工智能领域取得了重大进展。大模型的开源不仅促进了研究和开发,还提高了模型的应用价值,推动了人工智能技术的普及,增强了模型的可靠性和安全性。

目前,我国国内开源大模型的种类丰富多样,包括大语言模型、多模态大模型、向量大模型、编程大模型和AI Agent框架/模型等5类。而开源的参数规模也分为五类,最大规模达到了千亿级。其中,浪潮信息的“源2.0”大模型是国产开源大模型的最高参数规模,达到了102B。

当然,不仅是在国内,众多国外知名的大模型也纷纷选择开源,如Meta的LLama、OPT,谷歌的T5、MT5、FLAN-T5以及UU2,BigScience的BLOOM、T0、BLOOMZ等。这些开源的大模型在人工智能领域中发挥着举足轻重的作用。值得一提的是,Meta首席AI科学家、图灵奖获得者Yann LeCun曾明确表示,开源的人工智能模型正在逐步超越专有模型,成为推动人工智能发展的重要力量。这些开源的大模型不仅促进了技术的交流和进步,也让更多人有机会参与到人工智能的研究和应用中来。



点赞(122)

评论列表 共有 0 条评论

暂无评论

微信小程序

微信扫一扫体验

立即
投稿

微信公众账号

微信扫一扫加关注

发表
评论
返回
顶部