AI“源神”启动！影响多大？

开源还是闭源？这是(shì)属于大模型的(de)时代之问。

今年年初，埃隆·马斯克在对OpenAI及其CEO萨姆·奥特曼提起诉讼时，就对OpenAI逐渐不(bù)公(gōng)开(kāi)其模型研究相关细节的行为大(dà)加谴责。“时至今(jīn)日，OpenAI公司网站还(hái)宣称，它(tā)的宗(zōng)旨是确保(bǎo)通用人(rén)工智能造福全人类。然而，在现实(shí)中(zhōng)，OpenAI已经转变为(wèi)科技巨头微软事实上的闭源子公司。”这位曾经的OpenAI联合创始人如此表示。

OpenAI不够“Open”，Meta却“Open”了自己最新的开源人(rén)工智能模型。

4月18日，Meta 发布了其最新(xīn)版本的开源大模型 Llama 3，引起开源AI社区的一阵欢呼(hū)。巧合(hé)的是，Llama 3发布(bù)当天正(zhèng)好是AI领域(yù)顶(dǐng)尖学者、AI开源倡导者吴恩达的(de)生日。“（Llama 3是）至今为(wèi)止(zhǐ)最好的礼物，谢感谢Meta！”他说。

行至2024，开闭源之争(zhēng)日渐(jiàn)白热(rè)化。闭源阵营以目前最强的OpenAI为代表，开源阵营Meta的LLaMa、Mistral和Google等也在(zài)不(bù)断迭代(dài)。闭源阵营坚持(chí)对Scaling Law的信仰，押注在更(gèng)强通用模型(xíng)的打造上；开源阵营模型能力不断提升，并且(qiě)强调以更垂直的性能、更灵活的配置来推动大模型商业化落(luò)地。

关于应该选择模型开源还是闭源讨论经久不(bù)息。

对于局内人，这一选择这不仅决定(dìng)了他们将如何点亮AI“科技树”，更将影响他(tā)们的商业路线选择。换言之(zhī)，这很有可能是这个残酷竞争市场下的生存问题(tí)。

两个版本(běn)，多重惊喜

Meta此次发布的Llame 3包括8B和70B的预训练和(hé)指令微调版本。

据(jù)Meta官网信息，Llama 3 模型将数据和规模提升到新的高度。它在两个定制24K GPU集群上基于(yú)超过 15T 的数据进行了(le)训练——训练数据集是Llame 2使(shǐ)用量的7倍有(yǒu)余。它支持 8K 上(shàng)下文长度，是 Llama 2 容量(liàng)的两倍。

除了 Llama 3，Meta 还发(fā)布了新的信任(rèn)和安全(quán)工具，包括Llama Guard 2、Code Shield和 CyberSec Eval 2。

据悉，Llama 3 即将在AWS（Amazon web service）、Databricks、Google Cloud、Hugging Face、Kaggle、IBM WatsonX、 Microsoft Azure等主要云提供商、模型 API 提(tí)供商平台上线，Llama还得到AMD、AWS、戴尔、英特尔(ěr)、NVIDIA和高通(tōng)提供的硬件(jiàn)平台(tái)的(de)支持。

在官网上，Meta还放出了(le)Llama3两个版本与谷歌Gemma、谷歌Gemini、Mistral、Anthropic的Claude 3等竞争对手的参数对比(bǐ)。据Meta官网，Llame3在MMLU（学科知识理解）、GPQA（一般问题）、HumanEval（代码能力）、GSM—8K（数学(xué)能力）、MATH（比较难的数(shù)学问题）5个评测集上均表(biǎo)现良好。

值得注意的是，Llama3的代码(mǎ)能力非常优(yōu)秀。在AI领域公众(zhòng)号“数字(zì)生命(mìng)卡兹克”主理人(rén)卡兹克分享的用户实测中，Llama3—8B能够(gòu)给出国际象棋中经典皇后问题的解题代码(mǎ)。而其前代版本Llama2需(xū)要专门的代码模型才能(néng)实现。

市场的反应速度很快。18日当天，Meta股价逆势收涨1.54%。次日，百度(dù)智能云千帆大模型平台开放邀约测(cè)试，提(tí)供针对Llama 3的训练(liàn)推理(lǐ)方(fāng)案，帮助开发者训(xùn)练专属大模型(xíng)。

8B和70B 两(liǎng)个(gè)型号(hào)的模型(xíng)，仅仅标(biāo)志着 Llama 3 系列(liè)的开端，Meta AI首席科学家杨立昆在其社交媒体透露，在(zài)接下来的几个月，还会有更多(duō)版本陆续发布。

英伟达(dá)高级科学家Jim Fan认为之后可(kě)能会发布的Llama 3-400B以上(shàng)的版本将成(chéng)为某(mǒu)种“分水岭”，开源社区将能用(yòng)上GPT-4级别的模(mó)型。

不下牌(pái)桌，各显神通

上一轮元宇宙竞争(zhēng)中被认为可能(néng)跌进坑里的Meta，在人工智(zhì)能(néng)的牌桌上打出了(le)Llama系(xì)列这把好牌。要讨论Llama3带来的行业震荡，首先要明(míng)白，什么是大模型领域的开源？

大模型领域的开源通常意味着模型的架构、训练(liàn)代码和预训(xùn)练权重等都(dōu)被公开，允许研究人员(yuán)和开发者自(zì)由(yóu)地访问和使用。

不(bù)过，开源的程度因模型而异。“有些可能只提供有限的访问权限或部分代码。”郭涛指出，判(pàn)断大模型(xíng)是否真正开源的(de)基准可能包括：代码和数据的可访问性、使用许可的宽松程度、社区支持的活(huó)跃度以及对改进和新应(yīng)用的开放性。

放(fàng)眼(yǎn)AI界，两条路径上都各有“头号玩家”分布。闭源自不必(bì)说，海外有OpenAI旗(qí)下的ChatGPT，国内是百度的(de)文心(xīn)一言(yán)以及风头正劲的月之(zhī)暗面Kimi。

而(ér)开源方面，除了Llama系列，目前应用较广的开源大模型还包括非(fēi)营利组织LAION推出(chū)的OpenFlamingo、Databricks的Dolly，以及MosaicML的MPT等。国内则(zé)包括，阿里巴巴的通义千问，智(zhì)谱的(de)ChatGLM-4、百川智能(néng)的(de)baichuan-7B中英文大模型、北京(jīng)智源悟道3.0大模型系列和面壁智能的(de)CPM-Bee 10B中文基座大模型等。

形成这样的分化，很多时候是受技术进(jìn)步和商业模(mó)式迭代(dài)等的多重影响。

天使投资人、资深人工智能专家郭(guō)涛认为，从技术角度来看，开源可以(yǐ)促进学术界(jiè)的研究和创新，而闭(bì)源则有助于在一定时(shí)间内保持技术领先优势。

从商业角度来看，开源可以吸(xī)引开发者社区的(de)贡献，促进技术的快(kuài)速迭代(dài)和应用的广泛传播，但可能会(huì)影(yǐng)响到公司的盈(yíng)利模式。闭源则(zé)可以保护知(zhī)识产权，为公司创造直接的收入(rù)来源，但(dàn)可能会限制技术(shù)的(de)普及和生(shēng)态的建设。

事实上，在Llama3发(fā)布之前，中文互联网刚刚经历了一轮(lún)开闭(bì)源论战。

据媒体报道(dào)，百(bǎi)度CEO李彦宏近日表态(tài)，认为大模型开源意义不大，闭(bì)源(yuán)模型性能会不断提升。“有了文心大模型4.0，我们可以根据(jù)需要兼(jiān)顾效果、响应速度、推理成(chéng)本等(děng)各种考虑，裁剪出适合各种场景的更(gèng)小尺寸模型，且支持精调和post pretrain。通过降维裁剪出的模型，比直接拿开源调出来的模型，同等尺寸(cùn)下效果更好，同等效果(guǒ)下成本明显(xiǎn)更低(dī)。”

李(lǐ)彦宏一直是闭源(yuán)路线(xiàn)的忠实拥趸，理由包括但不限于(yú)认可闭源商业模式可以更(gèng)好地聚(jù)集人(rén)力和(hé)财力(lì)等。

而其反对(duì)者——360创始(shǐ)人周(zhōu)鸿祎言简意赅，“一句话(huà)，今天没有开源就没(méi)有 Linux，没有 Linux 就没有(yǒu)互联网。”

“源(yuán)神”启动，影响几何？

“Llama 3的发布会带来市场格(gé)局的改变。”郭涛(tāo)在接受21记者采访时指出，其优异表现可能吸引更(gèng)多的用户和投资者，从而增加其市场份额(é)。

官网显示，Llama 3将有条件地开(kāi)源给(gěi)商业使用（月活用(yòng)户超过7亿需要单独(dú)申请(qǐng)）。“不(bù)过这基本等于(yú)完全免费商用了。”卡兹克表示。

此前，投资人朱啸虎曾经就人工智能市场相关话题接受腾讯新闻采访(fǎng)。当被问及2023年大模型(xíng)发展的关键节点时，他给出的回答正是Llama上(shàng)线。这让中国在应用层面创新有了基础(chǔ)，降低了商业化门槛。

当然，朱啸虎提到的变现是指开源生态内的用(yòng)户。对(duì)于开源大模型发布者的能否盈利(lì)，或者(zhě)能等来盈利机会，很多时候(hòu)并没有确定的答案。

闭(bì)源大模型通常通过授权(quán)使用、订阅服务或者直接销售产品来盈利。其中的代表便(biàn)是AI领域的领跑(pǎo)者OpenAI，虽然其一直(zhí)有推进(jìn)开源项目的动作，但其处在(zài)核心地位的ChatGPT却一直采取收(shōu)取(qǔ)API许可费(fèi)的(de)方式向其他公司提供服务。在API服务过程，其他公司不会接(jiē)触到ChatGPT模型的细节(jié)和源代码，仅仅通过API接口进行调用。

创业者服(fú)务平台GoDaddy对全美1003家小型(xíng)企业的调(diào)查数据显示，ChatGPT以(yǐ)70%的应用率成为(wèi)美国小型企(qǐ)业应用最多的生成式AI产品，这说明OpenAI选择(zé)的(de)闭源模式的商业化之路(lù)在一定程(chéng)度已经跑通。

开源模型(xíng)如何(hé)寻求生存和发展的机(jī)会？

首(shǒu)先是以开放的生态吸引用户。国盛证券研报就指出，开源大模型借助更(gèng)大标识符训练数(shù)据集、DeepSpeed、RLHF等方式，实现低训(xùn)练成本和高(gāo)性能，超(chāo)大模型以下大模型的壁垒正在消失。

“在(zài)拥有用户后，开源大(dà)模(mó)型通常通过提供(gōng)增值服务、定制(zhì)开发、技术支持等方式来实现盈利(lì)”。郭涛指(zhǐ)出(chū)，公司可以(yǐ)在开(kāi)源模型的基础(chǔ)上提供(gōng)专业(yè)的(de)训练(liàn)服务或(huò)者定制化的应用解(jiě)决方案。

对于(yú)Meta甚至众多开源(yuán)者而言(yán)，开源的野(yě)心不仅是(shì)短(duǎn)期的(de)商业变(biàn)现，其更想引领规则设(shè)计以及搭建生态(tài)。有业内专家分析，开源后壁(bì)垒(lěi)并没有那么容易破除，高质量、标注过的(de)训练(liàn)数据集(jí)尤其是专业模型的壁(bì)垒。

星纪魅族集团数据合规(guī)执行总监朱玲凤表示，目前(qián)有些开(kāi)源AI由头部公司主导，“越多(duō)人使用，就越能强化网格效应，而且不是真正的开放(fàng)，后续需要使用它们(men)的配套工具、配套服务(wù)。头部公(gōng)司还可能利用监管豁免的(de)方式，获得寻租空间。”换言之，以(yǐ)开源为噱头的巨头游戏，可能会进一步强化大公司的垄(lǒng)断地(dì)位，反而不利于(yú)产(chǎn)业竞争。

据报道，去年4月，在扎克伯格(gé)与分析师的一次电(diàn)话会(huì)议中，他就谈到，如果行业能够在Meta使用的基础工具上达成(chéng)标准化，那(nà)么meta就(jiù)能(néng)从其他人的改进中受益。同年5月，谷歌内部泄露的文件《我们(men)没有护城河，OpenAI也没(méi)有》在SemiAnalysis网站上传播，其中的观点包括，比起开源社区需要谷歌，谷歌更需(xū)要开源社区等等。文(wén)章作者指出，不同开源模型(xíng)所组成的生(shēng)态系(xì)统永(yǒng)远是(shì)OpenAI的(de)潜在竞争对手，与开源(yuán)AI竞争的结果必然是失败。

Meta落子，战局生变。普邦股份第一季度成绩单出炉订单金额同比大幅度增长116.78%大模型的路线之争会不会迎来真正的胜利(lì)者？

“开源与闭源大模型之间不普邦股份第一季度成绩单出炉订单金额同比大幅度增长116.78%太可能分出绝对(duì)的输(shū)赢，因为它们各自适(shì)合不同的应用和场景。”郭涛认为，开源大(dà)模型更(gèng)适合那些需要快速创新和大规模协作(zuò)的项目，而闭源大模型可能更适(shì)合那些对性(xìng)能和安全性有极高(gāo)要(yào)求(qiú)的商业应用。

未经允许不得转载：泉州电动车网福建骑行网普邦股份第一季度成绩单出炉订单金额同比大幅度增长116.78%