元宇宙

刚刚-Meta发布免费开源大模型冲击已有竞争格局:当行业第三想要放手一搏

作者:CETCIT小编

2023-07-20 21:19:05

21世纪经济报道记者 王俊 实习生 罗洛 北京报道

大模型的竞争格局迎来重要节点。

近日,脸书母公司Meta宣布将推出开源大型语言模型Llama 2,可免费用于研究和商业用途。原本与OpenAI长期、深入合作的微软则成了此次Llama 2的“首选合作伙伴”。

去年底以来,OpenAI借助ChatGPT在全世界范围内点燃了大语言模型(LLM)的研发、应用之火,“百模大战”上演

OpenAI和谷歌成为这轮AI变革中最强劲的行业领先者。但是,Llama 2的开源商用,给既有商业格局投下了一颗足够震荡的“石子”。Meta这个在本轮AI变革中的后起商业巨头,似乎想用开源的方式放手一搏。

“我们相信,开源的方法是当今人工智能模型发展的正确途径,尤其是在技术进步日新月异的生成式领域。”Meta在其官网文章中表示。

从更长远的视角来看,近几个月开源竞速,开源方的野心不仅在于短期的商业价值,而是想要争做大模型时代的“新 Linux”,搭建一套生态系统。

开源为更多想入局者提供想象空间

此次Meta发布的Llama 2系列包含70亿、130亿和700亿三种参数版本,还提供了针对对话聊天场景微调的Llama-2-chat模型版本,其模型信息和起始代码全部开源。对比今年2月发布的LLaMA,Llama 2训练所用的token数量翻了一番,多达2万亿。Meta表示,在包括推理、编码、熟练程度和知识测试等多个外部基准测试中,Llama 2的表现均优于其他开源语言模型。

其实,在ChatGPT发布后,Meta就紧跟着推出了类GPT大语言模型LLaMA。模型公布后不久,其源代码文件便在4chan论坛上泄露,LLaMA却因祸得福,引来了大量开发者的关注,激起一波GPT平替风潮。基于LLaMA构建的模型,如Alpaca、Vicuna、Koala、ChatLLaMA、FreedomGPT和ColossalChat等陆续出现。

此次,Llama 2的免费开源,再次向采取闭源方式的OpenAI的GPT-4和谷歌PaLM发起了一次猛烈的进攻

目前OpenAI的主要收入来源包括订阅费、API许可费、与微软深度合作所产生的商业化收入等。在API许可费方面,OpenAI将GPT-3等模型开放给别的商业公司使用,根据用量收取费用(文字类模型按照文字生成量、图片类模型按照图片生成张数)。在调用过程中,其他公司不会接触到模型的细节和源代码,而仅是通过OpenAI提供的API接口进行调试以及使用。

OpenAI凭借领先优势,一定程度上跑通了商业化之路。近期,创业者服务平台GoDaddy对全美1003家小型企业的调查数据显示,ChatGPT以70%的应用率成为美国小型企业应用最多的生成式AI产品。据报道,今年6月,美国红杉资本发现在其投资的 33 家创业公司和上市公司中,65% 已经上线了大模型应用、94% 正用 OpenAI 的大模型接口(API)开发应用。

但是,开源在搅动着已有的竞争格局。

今年5月,谷歌内部泄漏的文件《我们没有护城河,OpenAI也没有》在SemiAnalysis网站上传播,文章的核心观点包括:开源AI用极低成本的高速迭代,已经赶上了ChatGPT的实力;数据质量远比数据数量重要;比起开源社区需要谷歌,谷歌更需要开源社区等等。文章作者指出,与开源AI竞争的结果必然是失败。

“门槛每天都在降低。”一位业内人士告诉记者,大模型的门槛正被开源踏破。

开源为更多想要入局者提供了想象空间。开源平台和开源生态将助推大模型的快速迭代与落地应用,尤其是对于缺少算力和资金的中小企业而言,开源打开了一个充满机会的世界。

“通过开放人工智能模型,可以让每个人受益。”Meta称,开源让初创公司、创业者和研究人员有机会使用开发难度高的工具,在这之前,他们难以获得足够的算力支持。

开源竞速 搭建生态的吸引力

“总体来说,OpenAI GPT系仍一骑绝尘,但训练成本高,难复现。而开源大模型借助更大标识符训练数据集、DeepSpeed、RLHF等方式,实现低训练成本和高性能,超大模型以下大模型的壁垒正在消失。”国盛证券的研报指出。

不过,也有业内专家向21世纪经济报道记者分析,开源后壁垒并没有那么容易破除,高质量、标注过的训练数据集尤其是专业模型的壁垒。

国金证券研报也指出,LLaMA等优质开源模型的推出极大地加速了下游行业AI应用开发效率。基于“通用基座+迁移学习+微调”的垂类AI模型开发范式或将成为主流,优质的行业数据资源成为影响模型性能的关键。

不过,近几个月来,开源仍在竞速,并持续影响着目前的人工智能发展。

除了LLaMA系列外,目前应用较广的开源大模型还包括非营利组织LAION推出的OpenFlamingo、Databricks的Dolly,以及MosaicML的MPT等。国内的例子则有百川智能的baichuan-7B中英文大模型、北京智源悟道3.0大模型系列和面壁智能的CPM-Bee 10B中文基座大模型等。

国盛证券指出,开源有利于防止大公司垄断,破除商业禁用限制。开源大模型的蓬勃发展,有望弥合开放模型和封闭模型之间的质量差距,促进破除商业化禁用限制的目标。从算力视角来看,开源还有利于降低算力成本,使大模型的使用“普惠化”。

目前开源的商业模式主要包括:1、靠服务变现;2、靠授权费变现;3、许可证、标准和能力评价体系的发展——这是开源大模型商用程度深化的催化剂。

不过,值得强调的是,对于Meta甚至众多开源者而言,开源的野心不仅是短期的商业变现,其更想引领规则设计以及搭建生态。

4月,在扎克伯格与分析师的一次电话会议中,他就谈到,如果行业能够在meta使用的基础工具上达成标准化,那么meta就能从其他人的改进中受益,这样会更好。

上述谷歌内部泄漏的文章同样提到,不同开源模型所组成的生态系统永远是OpenAI的潜在竞争对手。

中国也在积极建设人工智能生态。科技部副部长吴朝晖在2023中关村论坛上表示,中国坚持开源协作,加强大模型技术持续创新,协同解决透明性、稳定性等共性问题,进一步推动算力资源和数字资源开放共享,加快形成大模型的产业生态。

中国科学院院士、中国计算机学会开源发展委员会主任王怀民也表示,中国发展开源生态要打造ChatGPT这样的明星项目,可以吸纳更多的开发者和拥有定义用户的主导权。建立起人工智能开源创新的新平台后,可以有效支撑AI芯片、智算中心、超算中心等发展,体现出在该领域的影响力和竞争力。

web3.0教程