发布时间:2023-08-23 11:00
出品 | AI科技大本营(ID:rgznai100)
3月20日,北京智源人工智能研究院发布我国首个超大规模智能模型系统“悟道1.0”。“悟道1.0”由智源研究院学术副院长、清华大学唐杰教授领衔,带领来自北京大学、清华大学、中国人民大学、中国科学院等单位的100余位AI科学家团队联合攻关,取得了多项国际领先的AI技术突破,形成超大规模智能模型训练技术体系,训练出包括中文、多模态、认知、蛋白质预测在内的系列模型,勇闯通用智能发展前沿,构建我国人工智能应用基础设施。同时,与龙头企业共同研发工业级示范性应用,加快大规模智能模型应用生态建设。
会上,智源研究院院长黄铁军教授介绍了“悟道”模型研发的初衷。据他介绍,本轮人工智能浪潮的基本特点是“数据+算力+算法=模型”,模型浓缩了训练数据的内部规律,是实现人工智能应用的载体。近年来人工智能的发展,已经从“大炼模型”逐步迈向“炼大模型”的阶段,通过设计先进的算法,整合尽可能多的数据,汇聚大量算力,集约化地训练大模型,供大量企业使用,这是必然趋势。
智能模型不仅要规模大(主要体现为参数量),还要智商高,才能满足各种应用需要,这需要突破大量技术挑战。例如:如何使得预训练模型具备像人类一样的符合逻辑、意识和推理的认知能力?如何实现对图、文和视频等多模态数据和信息的理解和建模的统一?如何将中文融入预训练模型,推动中文应用背景下的人工智能的发展?如何使得预训练模型深入融入自然科学研究,在目前基础上进一步实现对超长/复杂蛋白质序列的建模和预测?
会上,“悟道”模型技术委员会主任、智源研究院学术副院长唐杰教授介绍了“悟道”模型的战略布局及阶段性成果。据介绍,“悟道1.0”先期启动了4个大模型的研发:面向中文的预训练语言模型悟道·文源、首个公开的中文通用图文多模态预训练模型悟道·文澜、具有认知能力的超大规模预训练模型悟道·文汇、以及超大规模蛋白质序列预测预训练模型悟道·文溯。
在科研方面,“悟道1.0”模型正在逐步搭建并完善超大规模预训练模型技术体系,取得了多项国际领先的AI技术的突破:在基础性能方面,在自然语言理解和生成、跨视觉和文字的理解与检索等多项任务上取得更好表现;针对预训练模型有效使用,提出高效算法;进一步实现规模和性能的扩增中面临的挑战;以及建设并开放了全球最大中文语料数据库WuDaoCorpora。
在模型研发的同时,智源研究院也在同步探索“悟道”模型的应用生态建设模式。据唐杰教授介绍,后续“悟道”模型将以开放API(应用程序接口)的形式对外提供服务,用户通过申请并经授权后可以基于模型API开发各类智能化应用。另外,也会开源模型的社区版本,服务我国AI科研发展。
下一步,“悟道”模型应用生态建设分为三个主要阶段,分别关注示范应用、API生态及社区运营维护等。第一阶段为示范性应用搭建,将构建面向电子商务、智能文本服务、垂直领域以及数个独立的示范性应用,将开放几个高质量的应用Demo,支持用户在平台页面上使用及测试。第二阶段为API及平台生态构建,将设计多个API,支持对模型的不同请求方式,构建支持高并发、高速推理的API接口,分别支持企业级用户、个人独立开发者对模型或特定功能的请求。第三阶段为社区运营及迭代,将逐步增量扩大在线评测,构建开发者及使用者社区,建立完善的使用反馈机制,并作为模型迭代的参考标准,同时加强社区维护及管理,加快模型迭代。
目前,智源研究院已启动第一阶段的示范性应用搭建,正与快手、搜狗、360、阿里、智谱华章、一览群智、循环智能、新华社等机构就模型的应用进行洽谈,联合构建一批工业级示范性应用。
下一步,智源研究院将加强用户的开发,做好用户服务,与AI龙头企业共同研发更多工业级示范性应用,并将加快推动API生态构建及社区运营迭代工作,通过举办学术交流、技术挑战赛等活动提高“悟道”模型的影响力,吸引更多AI企业、研究机构、个人开发者等开展基于模型的应用开发工作,推动构建国际领先的超大规模智能模型应用生态。
此外,为了更好地推动“悟道”大模型的研发,保持研发过程中技术的领先性,此次发布上,还同时成立了由北京大学鄂维南院士等9位来自学术界和产业界的顶尖科学家组成的“悟道”大模型技术委员会。
更多精彩推荐
☞Python 玩出花儿,把罗小黑养在自己桌面☞315 曝光人脸识别摄像头,进店瞬间偷走你的“脸”,自动分析心情☞玩转3D全息图像!AI即刻生成☞在 5G 速度上,iPhone 12 只是个弟弟
阿里如何实现100%容器化镜像化?八年技术演进之路回顾(转)
麒麟操作系统 (kylinos) 从入门到精通 - 办公环境 - 第十四篇 打印机的设置
centos7安装打印机 cups页面管理 java程序驱动打印程序
复盘:霍夫曼编码平均长度计算方式,信源符号a1-a6概率为:0.1,0.4,0.06,0.1,0.04,0.3,霍夫曼编码平均长度是
Python 实现循环的最快方式(for、while 等速度对比)
el-upload http-request使用 多个文件上传携带其他参数方式
Nvidia jetson nano opencv 3.4.3 GPU版 编译 配置