元宇宙

刚刚-Meta发布免费开源大模型冲击已有竞争格局：当行业第三想要放手一搏

作者:CETCIT小编 •

2023-07-20 21:19:05

21世纪经济报道记者王俊实习生罗洛北京报道

大模型的竞争格局迎来重要节点。

近日，脸书母公司Meta宣布将推出开源大型语言模型Llama 2，可免费用于研究和商业用途。原本与OpenAI长期、深入合作的微软则成了此次Llama 2的“首选合作伙伴”。

去年底以来，OpenAI借助ChatGPT在全世界范围内点燃了大语言模型（LLM）的研发、应用之火，“百模大战”上演

OpenAI和谷歌成为这轮AI变革中最强劲的行业领先者。但是，Llama 2的开源商用，给既有商业格局投下了一颗足够震荡的“石子”。Meta这个在本轮AI变革中的后起商业巨头，似乎想用开源的方式放手一搏。

“我们相信，开源的方法是当今人工智能模型发展的正确途径，尤其是在技术进步日新月异的生成式领域。”Meta在其官网文章中表示。

从更长远的视角来看，近几个月开源竞速，开源方的野心不仅在于短期的商业价值，而是想要争做大模型时代的“新 Linux”，搭建一套生态系统。

开源为更多想入局者提供想象空间

此次Meta发布的Llama 2系列包含70亿、130亿和700亿三种参数版本，还提供了针对对话聊天场景微调的Llama-2-chat模型版本，其模型信息和起始代码全部开源。对比今年2月发布的LLaMA，Llama 2训练所用的token数量翻了一番，多达2万亿。Meta表示，在包括推理、编码、熟练程度和知识测试等多个外部基准测试中，Llama 2的表现均优于其他开源语言模型。

其实，在ChatGPT发布后，Meta就紧跟着推出了类GPT大语言模型LLaMA。模型公布后不久，其源代码文件便在4chan论坛上泄露，LLaMA却因祸得福，引来了大量开发者的关注，激起一波GPT平替风潮。基于LLaMA构建的模型，如Alpaca、Vicuna、Koala、ChatLLaMA、FreedomGPT和ColossalChat等陆续出现。

此次，Llama 2的免费开源，再次向采取闭源方式的OpenAI的GPT-4和谷歌PaLM发起了一次猛烈的进攻。

目前OpenAI的主要收入来源包括订阅费、API许可费、与微软深度合作所产生的商业化收入等。在API许可费方面，OpenAI将GPT-3等模型开放给别的商业公司使用，根据用量收取费用（文字类模型按照文字生成量、图片类模型按照图片生成张数）。在调用过程中，其他公司不会接触到模型的细节和源代码，而仅是通过OpenAI提供的API接口进行调试以及使用。

OpenAI凭借领先优势，一定程度上跑通了商业化之路。近期，创业者服务平台GoDaddy对全美1003家小型企业的调查数据显示，ChatGPT以70%的应用率成为美国小型企业应用最多的生成式AI产品。据报道，今年6月，美国红杉资本发现在其投资的 33 家创业公司和上市公司中，65% 已经上线了大模型应用、94% 正用 OpenAI 的大模型接口（API）开发应用。

但是，开源在搅动着已有的竞争格局。

今年5月，谷歌内部泄漏的文件《我们没有护城河，OpenAI也没有》在SemiAnalysis网站上传播，文章的核心观点包括：开源AI用极低成本的高速迭代，已经赶上了ChatGPT的实力；数据质量远比数据数量重要；比起开源社区需要谷歌，谷歌更需要开源社区等等。文章作者指出，与开源AI竞争的结果必然是失败。

“门槛每天都在降低。”一位业内人士告诉记者，大模型的门槛正被开源踏破。

开源为更多想要入局者提供了想象空间。开源平台和开源生态将助推大模型的快速迭代与落地应用，尤其是对于缺少算力和资金的中小企业而言，开源打开了一个充满机会的世界。

“通过开放人工智能模型，可以让每个人受益。”Meta称，开源让初创公司、创业者和研究人员有机会使用开发难度高的工具，在这之前，他们难以获得足够的算力支持。

开源竞速搭建生态的吸引力

“总体来说，OpenAI GPT系仍一骑绝尘，但训练成本高，难复现。而开源大模型借助更大标识符训练数据集、DeepSpeed、RLHF等方式，实现低训练成本和高性能，超大模型以下大模型的壁垒正在消失。”国盛证券的研报指出。

不过，也有业内专家向21世纪经济报道记者分析，开源后壁垒并没有那么容易破除，高质量、标注过的训练数据集尤其是专业模型的壁垒。

国金证券研报也指出，LLaMA等优质开源模型的推出极大地加速了下游行业AI应用开发效率。基于“通用基座+迁移学习+微调”的垂类AI模型开发范式或将成为主流，优质的行业数据资源成为影响模型性能的关键。

不过，近几个月来，开源仍在竞速，并持续影响着目前的人工智能发展。

除了LLaMA系列外，目前应用较广的开源大模型还包括非营利组织LAION推出的OpenFlamingo、Databricks的Dolly，以及MosaicML的MPT等。国内的例子则有百川智能的baichuan-7B中英文大模型、北京智源悟道3.0大模型系列和面壁智能的CPM-Bee 10B中文基座大模型等。

国盛证券指出，开源有利于防止大公司垄断，破除商业禁用限制。开源大模型的蓬勃发展，有望弥合开放模型和封闭模型之间的质量差距，促进破除商业化禁用限制的目标。从算力视角来看，开源还有利于降低算力成本，使大模型的使用“普惠化”。

目前开源的商业模式主要包括：1、靠服务变现；2、靠授权费变现；3、许可证、标准和能力评价体系的发展——这是开源大模型商用程度深化的催化剂。

不过，值得强调的是，对于Meta甚至众多开源者而言，开源的野心不仅是短期的商业变现，其更想引领规则设计以及搭建生态。

4月，在扎克伯格与分析师的一次电话会议中，他就谈到，如果行业能够在meta使用的基础工具上达成标准化，那么meta就能从其他人的改进中受益，这样会更好。

上述谷歌内部泄漏的文章同样提到，不同开源模型所组成的生态系统永远是OpenAI的潜在竞争对手。

中国也在积极建设人工智能生态。科技部副部长吴朝晖在2023中关村论坛上表示，中国坚持开源协作，加强大模型技术持续创新，协同解决透明性、稳定性等共性问题，进一步推动算力资源和数字资源开放共享，加快形成大模型的产业生态。

中国科学院院士、中国计算机学会开源发展委员会主任王怀民也表示，中国发展开源生态要打造ChatGPT这样的明星项目，可以吸纳更多的开发者和拥有定义用户的主导权。建立起人工智能开源创新的新平台后，可以有效支撑AI芯片、智算中心、超算中心等发展，体现出在该领域的影响力和竞争力。

web3.0教程

获取web3.0观点与资讯

查找第三代互联网(web3.0)相关文章

刚刚-Meta发布免费开源大模型冲击已有竞争格局：当行业第三想要放手一搏

web3.0教程

什么是区块链？区块链初学者指南

web3.0初学者指南-全面了解web3

什么是元宇宙？如何准确定义元宇宙？