泉州电动车网 福建骑行网泉州电动车网 福建骑行网

AI“源神”启动!影响多大?

AI“源神”启动!影响多大?

开源还是闭源?这是(shì)属于大模型的(de)时代之问。

今年年初,埃隆·马斯克在对OpenAI及其CEO萨姆·奥特曼提起诉讼时,就对OpenAI逐渐不(bù)公(gōng)开(kāi)其模型研究相关细节的行为大(dà)加谴责。“时至今(jīn)日,OpenAI公司网站还(hái)宣称 ,它(tā)的宗(zōng)旨是确保(bǎo)通用人(rén)工智能造福全人类。然而,在现实(shí)中(zhōng),OpenAI已经转变为(wèi)科技巨 头微软事实上的闭源子公司。”这位曾经的OpenAI联合创始人如此表示。

OpenAI不够“Open”,Meta却“Open”了自己最新的开源人(rén)工智能模型。

4月18日,Meta 发布了其最新(xīn)版本的开源大模型 Llama 3,引起开源AI社区的一阵欢呼(hū)。巧合(hé)的是,Llama 3发布(bù)当天正(zhèng)好是AI领域(yù)顶(dǐng)尖学者、AI开源倡导者吴恩达的(de)生日。“(Llama 3是)至今为(wèi)止(zhǐ)最好的礼物,谢感谢Meta!”他说。

行至2024,开闭源之争(zhēng)日渐(jiàn)白热(rè)化。闭源阵营以目前最强的OpenAI为代表,开源阵营Meta的LLaMa、Mistral和Google等也在(zài)不(bù)断迭代(dài)。闭源阵营坚持(chí)对Scaling Law的信仰,押注在更(gèng)强通用模型(xíng)的打造上;开源阵营模型能力不断提升,并且(qiě)强调以更垂直的性能、更灵活的配置来推动大模型商业化落(luò)地。

关于应该选择模型开源还是闭源讨论经久不(bù)息。

对于局内人,这一选择这不仅决定(dìng)了他们将如何点亮AI“科技树”,更将影响他(tā)们的商业路线选择。换言之(zhī),这很有可能是这 个残酷竞争市场下的生存问题(tí)。

两个版本(běn),多重惊喜

Meta此次发布的Llame 3包括8B和70B的预训练和(hé)指令微调版本。

据(jù)Meta官网信息,Llama 3 模型将数据和规模提升到新的高度。它 在两个定制24K GPU集群上基于(yú)超过 15T 的数据进 行了(le)训练——训练数据集是Llame 2使(shǐ)用量的7倍有(yǒu)余。它支持 8K 上(shàng)下文长度,是 Llama 2 容 量(liàng)的两倍。

除了 Llama 3,Meta 还发(fā)布了新的信任(rèn)和安全(quán)工具,包括Llama Guard 2、Code Shield和 CyberSec Eval 2。

据悉,Llama 3 即将在AWS(Amazon web service)、Databricks、Google Cloud、Hugging Face、Kaggle、IBM WatsonX、 Microsoft Azure等主要云提供商、模型 API 提(tí)供商平台上线,Llama还得到AMD、AWS、戴尔、英特尔(ěr)、NVIDIA和高通(tōng)提供的硬件(jiàn)平台(tái)的(de)支持。

在官网上,Meta还放出了(le)Llama3两个版本与谷歌Gemma、谷歌Gemini、Mistral、Anthropic的Claude 3等竞争对手的参数对比(bǐ)。据Meta官网,Llame3在MMLU(学科知识理解)、GPQA(一般问题)、HumanEval(代码能力)、GSM—8K(数学(xué)能力)、MATH(比较难的数(shù)学问题)5个评测集上均表(biǎo)现良好。

值得注意的是,Llama3的代码(mǎ)能力非常优(yōu)秀。在AI领 域公众(zhòng)号“数字(zì)生命(mìng)卡兹克”主理人(rén)卡兹克分享的用户实测中,Llama3—8B能够(gòu)给出国际象棋中经典皇后问题的解题代码(mǎ)。而其前代版本Llama2需(xū)要专门的代码模型才能(néng)实现。

市场的反应速度很快。18日当天,Meta股价逆势收涨1.54%。次日,百度(dù)智能云千帆大模型平台开放邀约测(cè)试,提(tí)供针对Llama 3的训练(liàn)推理(lǐ)方(fāng)案,帮助 开发者训(xùn)练专属大模型(xíng)。

8B和70B 两(liǎng)个(gè)型号(hào)的模型(xíng),仅仅标(biāo)志着 Llama 3 系列(liè)的开端,Meta AI首席科学家杨立昆在其社交媒体透露,在(zài)接下来的几个月,还会有更多(duō)版本陆续发布。

英 伟达(dá)高级 科学家Jim Fan认为之后可(kě)能会发布的Llama 3-400B以上(shàng)的版本将成(chéng)为某(mǒu)种“分水岭”,开源社区将能用(yòng)上GPT-4级别的模(mó)型。

不下牌(pái)桌,各显神通

上一轮元宇宙竞争(zhēng)中被认 为可能(néng)跌进坑里的Meta,在人工智(zhì)能(néng)的牌桌上打 出了(le)Llama系(xì)列这把好牌。要讨论Llama3带来的行业震荡,首先要明(míng)白,什么是大模型领域的开源?

大模型领域的开源通常意 味着模型的架构、训练(liàn)代码和预训(xùn)练权重等都(dōu)被公开,允许研究人员(yuán)和开发者自(zì)由(yóu)地访问和使用。

不(bù)过,开源的程度因模型而异。“有些可能只提供有限的访问权限或部分代码。”郭涛指出,判(pàn)断大模型(xíng)是否真正开源的(de)基准可能包括:代码和数据的可访问性、使用许可的宽松程度、社区支持的活(huó)跃度以及对改进和新应(yīng)用的开放性。

放(fàng)眼(yǎn)AI界,两条路径上都各有“头号玩家”分布。闭源自不必(bì)说 ,海外有OpenAI旗(qí)下的ChatGPT,国内是百度的(de)文 心(xīn)一言(yán)以及风头正劲的月之(zhī)暗面Kimi。

而(ér)开源方面,除了Llama系列 ,目前应用较广的开源大模型还包括非(fēi)营利组织LAION推出(chū)的OpenFlamingo、Databricks的Dolly,以及MosaicML的MPT等。国内则(zé)包括,阿里巴巴的通义千问,智(zhì)谱的(de)ChatGLM-4、百川智能(néng)的(de)baichuan-7B中英文大模型、北京(jīng)智源悟道3.0大模型系列和面壁智能的(de)CPM-Bee 10B中文基座大模型等。

形成这样的分化,很多时候是受技术进(jìn)步和商业模(mó)式迭代(dài)等的多重影响。

天使投 资人、资深人工智能专家郭(guō)涛认为,从技术角度来看,开源可以(yǐ)促进学术界(jiè)的研究和创新,而闭(bì)源则有助于在一定时(shí)间内保持技术领先优势。

从商业角度来看,开源可以吸(xī)引开发者社区的(de)贡献,促进技术的快(kuài)速迭代(dài)和应用的广泛传播,但可能会(huì)影(yǐng)响到公司的盈(yíng)利模式。闭源则(zé)可以保护知(zhī)识产权,为公司创造直接的收入(rù)来源,但(dàn)可能会限制技术(shù)的(de)普及和生(shēng)态的建设。

事实上,在Llama3发(fā)布 之前,中文互联网刚刚经历了一轮(lún)开闭(bì)源论战。

据媒体报道(dào),百(bǎi)度CEO李彦宏近日表态(tài),认为大模型开源意义不大,闭(bì)源(yuán)模型性能会不断提升。“有了文心大模型4.0,我们可以根据(jù)需要兼(jiān)顾效果、响应速度、推理成(chéng)本等(děng)各种考虑,裁剪出适合各种场景的更(gèng)小尺寸模型,且支持精调和post pretrain。通过降维裁剪出的模型,比直 接拿开源调出来的模型,同等尺寸(cùn)下效果更好,同等效果(guǒ)下成本明显(xiǎn)更低(dī)。”

李(lǐ)彦宏一直是闭源(yuán)路线(xiàn)的忠实拥趸,理由包括但不限于(yú)认可闭源商业模式可以更(gèng)好地聚(jù)集人(rén)力和(hé)财力(lì)等。

而其反对(duì)者——360创始(shǐ)人周(zhōu)鸿祎言简意赅,“一句话(huà),今天没有开源就没(méi)有 Linux,没有 Linux 就没有(yǒu)互联网。”

“源(yuán)神”启动,影响几何?

“Llama 3的发布会带来市场格(gé)局的改变。”郭 涛(tāo)在接受21记者采访时指出,其优异表现可能吸引更(gèng)多的用户和投资者,从而增加其市场份额(é)。

官网显示,Llama 3将有条件地开(kāi)源给(gěi)商业使用(月活用(yòng)户超过7亿需要单独(dú)申请(qǐng))。“不(bù)过这基本等于(yú)完全免费商用了。”卡兹 克表示。

此前,投资人朱啸虎曾经就人工智能市场相关话题接受腾讯新闻采访(fǎng)。当被问及 2023年大模型(xíng)发展的关键节点时,他给出的回答正是Llama上(shàng)线。这让中国在应用层面创新有了基础(chǔ),降低了商业化门槛。

当然,朱啸虎提到的变现是指开源生态内的用(yòng)户。对(duì)于开源 大模型发布者的能否盈利(lì),或者(zhě)能等来盈利机会,很多时候(hòu)并没有确定的答案。

闭(bì)源大模型通常通过授权(quán)使用 、订阅服务或者直接销售产品来盈利。其中的代表便(biàn)是AI领域的领跑(pǎo)者OpenAI,虽然其一直(zhí)有推进(jìn)开源项目的动作,但其处在(zài)核心地位的ChatGPT却一直采取收(shōu)取(qǔ)API许可费(fèi)的(de)方式向其他公司提供服务。在API服务 过程,其 他公司不会接(jiē)触到ChatGPT模型的细节(jié)和源代码,仅仅通过API接口进行调用。

创业者服(fú)务平 台GoDaddy对全美1003家小型(xíng)企业的调(diào)查数据显示,ChatGPT以(yǐ)70%的应 用率成为(wèi)美国小型企(qǐ)业应用最多的生成式AI产品,这说明OpenAI选择(zé)的(de)闭源模式的商业化之路(lù)在一定程(chéng)度已经跑通。

开源模型(xíng)如何(hé)寻求生存和发展的机(jī)会?

首(shǒu)先是以开放的生态吸引用户。国盛证券研报就指出,开源大模型借助更(gèng)大标识符训练数(shù)据集、DeepSpeed、RLHF等方式,实现低训(xùn)练成本和高(gāo)性能,超(chāo)大模型以下大模型的壁垒正在消失。

“在(zài)拥有用户后,开源大(dà)模(mó)型通常通过提供(gōng)增值服务、定制(zhì)开发、技术支持等方式来实现盈利(lì)”。郭涛指(zhǐ)出(chū),公司可以(yǐ)在开(kāi)源模型的基础(chǔ)上提供(gōng)专业(yè)的(de)训练(liàn)服 务或(huò)者定制化的应用解(jiě)决方案。

对于(yú)Meta甚至众多开源(yuán)者而言(yán),开源的野(yě)心不仅是(shì)短(duǎn)期的(de)商业变(biàn)现,其更想引领规则设(shè)计以及搭建生态(tài)。有业内专家分析,开源后壁(bì)垒(lěi)并没有那么容易破除,高质量、标注过的(de)训练(liàn)数据集(jí)尤其是专业模型的壁(bì)垒。

星纪魅族集团数据合规(guī)执行总监朱玲凤表示,目前(qián)有些开(kāi)源AI由头部公司主导,“越多(duō)人使用,就越能强化网格效应,而且不是真正的开放(fàng),后续需要 使用它们(men)的配套工具、配套服务(wù)。头部公(gōng)司还可能利用监管豁免的(de)方式,获得寻租空间。”换言之,以(yǐ)开源为噱头的巨头游戏,可能会进一步强化大公司的垄(lǒng)断地(dì)位,反而不利于(yú)产(chǎn)业竞争。

据报道,去年4月,在扎克伯格(gé)与分析师的一次电(diàn)话会(huì)议中,他就谈到,如果行业能够在Meta使用的基础工具上达成(chéng)标准化,那(nà)么meta就(jiù)能(néng)从其他人的改进中受益。同年5月,谷歌内部泄露的文件《我们(men)没有护城河,OpenAI也没(méi)有》在SemiAnalysis网站上传播,其中的观点包括,比起开源社区需要谷歌,谷歌更需(xū)要开源社区等等。文(wén)章作者指出,不同开源模型(xíng)所组成的生(shēng)态系(xì)统永(yǒng)远是(shì)OpenAI的(de)潜在竞争对手,与开源(yuán)AI竞争的结果必然是失败。

Meta落子,战局生变 。普邦股份第一季度成绩单出炉 订单金额同比大幅度增长116.78%大模型的路线之争会不会迎来真正的胜利(lì)者?

“开源与闭源大模型之间不普邦股份第一季度成绩单出炉 订单金额同比大幅度增长116.78%太可能分出绝对(duì)的输(shū)赢,因为它们各自适(shì)合不同的应用和场景。”郭涛认为,开源大(dà)模型更(gèng)适合那些需要快速创新和大规模协作(zuò)的项目,而闭源大模型可能更适(shì)合那些对性(xìng)能和安全性有极高(gāo)要(yào)求(qiú)的商业应用。

未经允许不得转载:泉州电动车网 福建骑行网 普邦股份第一季度成绩单出炉 订单金额同比大幅度增长116.78%

评论

5+2=