在IT时代,传统开源就是开放源代码,到AI时代,要求增加开源的透明度,OSI顺应形势发展的需要,于2024年10月28日发布了《开源AI定义》(OSAID)1.0,要求提供训练AI系统详细的数据信息,提供用于训练和运行AI系统的完整的源代码,以及训练和运行AI系统的模型和参数(如设置和权重),即开放参数、权重。
DeepSeek强调实行全开源,他们还创造性地发展开源的新模式:把开源的免费开放和开源的商业模式收费铸成一体;在DeepSeek大模型的C端,主要接入中小企业和个体用户实行免费开放,而B端主要接入大客户,实行开源的商业模式,是要收费的。
开源的商业模式是在保证开源核心技术对外免费开放(即其源代码对外开放)的前提下灵活配置的,如开源与服务捆绑在一起(开源免费、服务收费),开源与其他适销产品或网络通信捆绑在一起(从产品销售或通信月租费中提成),也有开源与广告捆绑在一起的,或在开源实行产品化后可与其实施二进制转换、配置安全、质检、维稳及产品工程化处理模块或递增技术视作为开源的商业模式捆绑在一起。
COPU组织了多次开源的人工智能操作系统(AIOS)的讨论,基本上有两种类型:
一种是从应用入手,在开源操作系统中加入智能模块,另一种是从框架或内核入手,实现开源操作系统研发的全智能化。
谈到在人工智能时代优先采用开源的功效观点是:开源有助于人工智能的迭代创新、稳步升级(Fixbug,patch)、开拓生态,将开源与其商业模式铸成一体,实行开源的推广应用。采用开源的功效还与培育具有开源专业技术知识和开源许可证法律知识的两栖人才有关。
下面讨论人工智能(AI)发展的有关问题:
(1)当前AI处于什么发展阶段或发展水平?
(2)如何评价DeepSeek?
(3)如何看待AI的发展?
(4)COPU如何投入基于开源的AI研发?
以2022年11月30日发布ChatGPT为标志,AI从判别式发展到生成式实现了跨越,从那时起至今,AI处于生成式自回归语言大模型(LLM)的发展阶段,还处于弱AI(ANI)发展阶段。在AI所处的这个发展阶段,表现出很强的人机对话能力,发挥在聊天、策划文案、编制脚本、程序编码、翻译语言、语音识别、自动驾驶等诸多智能。由于语言不能取代世界,生成式自回归大模型缺乏世界知识,或者不能产生新知、无法真正理解物理世界,加上语言不等于思维,它在运行时也限制了思维深度,最终限制了其产生的智能水平。语言大模型训练架构是基于Tokens及其支持的信号处理和统计学,这是致使语言大模型产生幻觉的根源。
在未来为了克服目前生成式自回归语言大模型局限、根治缺陷、提升智能,面临转轨发展AI的任务。
DeepSeek最大的成功是梁文锋团队以创新姿态研发出一条“低投资、低成本、有限资源,高效率,高性价比(产出)”发展人工智能的新路径。
DeepSeek堪称为当前中国AI的代表作,正在改变世界人工智能的发展格局。
DeepSeek实行全开源,很大程度上助力其成功的创新发展。DeepSeek的问世引发了全球人工智能白热化的竞赛。目前DeepSeek的主要技术已没有多少秘密可言,国内外一些生成式语言大模型也将其主要技术学到了手,在开展下一阶段AI竞赛时,可以说大家站在同一起步线上。目前DeepSeek大模型也像其他大模型一样都是同一种生成式自回归语言大模型,也不可避免存在局限性和负面缺陷问题,需要研发转轨发展。
谈到未来AI的发展目标:
包括DeepSeek在内的生成式自回归语言大模型AI转轨的发展目标是:
萨姆·奥特曼、梁文锋、埃隆·马斯克均将未来AI转轨发展目标指向通用人工智能(AGI),辛顿(GeoffreyHinton)、姚期智、本吉奥(YoshuaBengio)、罗素(StuartRussell)、伊里亚(IlyaSutskever)、黄仁勋(JensenHuang)等大师也指向AGI。其中一些大师认为从生成式语言大模型走向通用人工智能还需经历几个过渡的AI模型,如多模态、具身(embodiment)、世界模型(AIAgent)等。
但杨立昆(YannLeCun)大师认为:通用智能指什么?指像人类智能那样普遍适用的智能吗?如果是这样,AGI这个词极具误导性,人类智能根本不是通用的,而是高度专业化的,我们更倾向于使用“先进机器智能(AMI)”这个词,这是指达到“人类水平智能”的概念。而杨立昆所谓“人类水平智能”指人类智能+智能体或智能工具(agents),表现出来的综合智能(杨立昆认为:“我坚信不疑在未来的某个时刻,我们将拥有与人类同等甚至更高智能水平的机器”,但他不认为机器智能即AI会超过人类+Agents的综合智能),而李飞飞、赛凡里斯(SilvioSavarese)、沈向洋等AI资深专家似乎赞同杨立昆的观点。
COPU从2015年开始便投身于人工智能的研究工作:
开始时以学习、点评早期AI为主,2017年COPU协同Linux基金会开展基于开源的深度信息技术(包括云原生、区块链、人工智能等)的研发、应用推广工作,从2019年开始,收集国内外人工智能发展的信息(包括接受AI专家发来的研发成果或评论),创办人工智能文集:评人工智能如何走向新阶段,兼谈国内外人工智能跟帖留言和评论,从2022年始,组织大规模基于开源的智能操作系统(AIOS)的开发、投产、应用工作,随后COPU的众多成员单位创建生成式语言大模型并投入运行服务(其中一些模型已与国际顶级模型一起位于排行榜前列)。
【陆首群】个人简介:
陆首群,男,1937年出生在无锡,教授,曾任国务院信息化联席会议办公室常务副主任、吉通公司董事长。主持首都电子商务工程的研究与实践, 发表了许多有影响的网络与信息化前沿技术、电子商务、电子政务方面的论文 。
陆首群参与组建了几大集团公司:1986年筹建了中国长城计算机集团公司,担任副董事长;1993年参与筹建以长途通信、话音通信为主营业务的中国联合通信公司(即“中国联通”)。在筹备中国联通的同时,他又创建了以新型通信,即数据通信、多媒体通信为主营业务的中国吉通公司,并担任总经理、董事长。1993年,国家相继提出了金桥工程、金卡工程、金关工程,吉通公司作为国务院“三金工程”的业主,陆首群为之付出了大量劳动。