AI“源神”启动！影响多大？

开源还是(shì)闭源？这(zhè)是属于大模(mó)型的时代之问(wèn)。

今年年初，埃隆·马斯克在(zài)对OpenAI及其CEO萨(sà)姆·奥特曼(màn)提起(qǐ)诉讼时，就对OpenAI逐(zhú)渐不公开其模型研究相关细节的行为大加谴责。“时至今日(rì)，OpenAI公(gōng)司网站还宣(xuān)称，它的宗旨(zhǐ)是确保通用(yòng)人工(gōng)智能造福(fú)全人类。然而，在现(xiàn)实中，OpenAI已经转变为科技巨头微软事实上的闭源子公司(sī)。”这位曾经的OpenAI联合创始人如此表(biǎo)示。

OpenAI不够“Open”，Meta却“Open”了自己最新的开源人工智能模型。

4月18日，Meta 发布了其最新版本的开源(yuán)大模(mó)型 Llama 3，引起(qǐ)开源AI社区的一阵欢呼。巧合的是(shì)，Llama 3发布(bù)当天(tiān)正好是AI领域顶尖学者、AI开源倡导者吴恩达的(de)生(shēng)日。“（Llama 3是）至今为止最好的礼物，谢感谢Meta！”他说。

行至2024，开闭源之争(zhēng)日渐白(bái)热化。闭源阵(zhèn)营以(yǐ)目前最强的OpenAI为代表，开(kāi)源阵营Meta的LLaMa、Mistral和Google等也(yě)在不断迭代。闭源阵营坚持对Scaling Law的信仰，押注在更强通用模型的打造上；开源阵营模(mó)型能力不断提升，并且强调以更垂直的性能、更灵活的配置来推动大模型商业化落地。

关(guān)于应(yīng)该选择(zé)模型开源还是(shì)闭源讨论经久不(bù)息。

对于局内人，这一选择这不仅决定(dìng)了他们将如何点亮AI“科技树”，更将影响他们的商业路线选择。换言之，这很有可能是这个残酷竞争市场(chǎng)下的生存问题(tí)。

两(liǎng)个版本，多重惊喜

Meta此(cǐ)次发布的Llame 3包括8B和70B的预训练(liàn)和指令微调版本。

据(jù)Meta官网信息，Llama 3 模型将数据(jù)和规模提(tí)升到新的高度(dù)。它在两个定制24K GPU集群上基于超过 15T 的数据进行了训练——训练数据集是Llame 2使用(yòng)量的7倍有余。它支持(chí) 8K 上下文长度，是 Llama 2 容量的两倍。

除了 Llama 3，Meta 还发布了新的信任和安全工具，包括Llama Guard 2、Code Shield和 CyberSec Eval 2。

据悉，Llama 3 即将在AWS（Amazon web service）、Databricks、Google Cloud、Hugging Face、Kaggle、IBM WatsonX、 Microsoft Azure等主要云(yún)提供商、模型 API 提供商平台上线，Llama还得到AMD、AWS、戴尔、英特尔、NVIDIA和高通提供的硬件平台的支持。

在官网上，Meta还放出(chū)了(le)Llama3两个版本与谷歌(gē)Gemma、谷歌Gemini、Mistral、Anthropic的Claude 3等竞(jìng)争对手的参数对比。据Meta官网，Llame3在(zài)MMLU（学科知识理解）、GPQA（一般问题）、HumanEval（代(dài)码能力）、GSM—8K（数学能力）、MATH（比(bǐ)较难的(de)数学(xué)问题）5个(gè)评(píng)测集上(shàng)均表现良好。

值(zhí)得(dé)注意的是，Llama3的代码能力非常优(yōu)秀。在AI领域公众(zhòng)号“数(shù)字生命卡兹克”主理人卡兹克分享的用户实测中，Llama3—8B能够给出国际象棋中经典皇后问题的解题代码。而其前(qián)代版本Llama2需要专门的代码模型(xíng)才能实现(xiàn)。

市场的反应(yīng)速度(dù)很快。18日当天，Meta股价逆(nì)势收涨(zhǎng)1.54%。次日，百度智能云(yún)千(qiān)帆(fān)大模型平台开放邀约(yuē)测试，提供针对Llama 3的训(xùn)练推理方案，帮助开发者训练专属大模型。

8B和70B 两个型号的模型，仅仅标志着 Llama 3 系列的开端，Meta AI首(shǒu)席科学家杨立昆在其社交媒(méi)体透露，在(zài)接下来的几个月，还会有更多版本陆续发布。

英伟达高级科(kē)学家Jim Fan认为之后可能会发布的Llama 3-400B以上的版本将(jiāng)成为某种“分水岭”，开源社区将能用(yòng)上GPT-4级(jí)别的模型。

不下牌桌，各(gè)显神(shén)通

上一轮元(yuán)宇宙(zhòu)竞争中被认为可能跌进坑里的Meta，在人工(gōng)智能的牌(pái)桌上打(dǎ)出了Llama系列这把好牌。要讨(tǎo)论Llama3带来(lái)的行业(yè)震荡，首先要明白，什么是大模型领域的开源(yuán)？

大模型领(lǐng)域的开源通常意味着模型的架构、训(xùn)练代(dài)码和(hé)预训练(liàn)权重等(děng)都被公开，允许研究人(rén)员(yuán)和开发者自由地访问和使用。

不过，开源的程度因模型而(ér)异(yì)。“有些(xiē)可(kě)能只提供有限的访问权限或部分代码。”郭涛指出，判断大模型是否真正开源的基准可能包括：代码和数据的可访问性、使用许(xǔ)可的宽松程度、社区支持的活跃(yuè)度以及对改(gǎi)进和新应用(yòng)的开放性。

放眼AI界，两条路径上都各有“头号玩家”分布。闭源自不必说，海外有OpenAI旗下的ChatGPT，国内(nèi)是百度(dù)的文心(xīn)一言以及风头正劲的月之暗面Kimi。

而开源(yuán)方面，除(chú)了Llama系列，目前(qián)应用较广的开源大模型还包括非营(yíng)利组织LAION推出的OpenFlamingo、Databricks的Dolly，以及MosaicML的MPT等。国内则包括，阿(ā)里巴巴的通义千问，智(zhì)谱的ChatGLM-4、百川智能的baichuan-7B中英文大模型、北(běi)京(jīng)智源悟道3.0大模型系列和面壁智能的CPM-Bee 10B中文基座大模型等。

形(xíng)成这样的分化(huà)，很(hěn)多时候是受技术进步和商业模式迭(dié)代等的(de)多重(zhòng)影响。

天(tiān)使投(tóu)资(zī)人、资深人工智能专家郭涛认为，从技术角度来看(百通能源龙虎榜数据（4月23日）kàn)，开源可以促进学术界(jiè)的研究和创新(xīn)，而闭源则有助于在一(yī)定时(shí)间内保持(chí)技术领先优势。

从商业角度来看，开(kāi)源可以吸引开发者社百通能源龙虎榜数据（4月23日）区的(de)贡献，促进技术的快(kuài)速迭代和应用(yòng)的广(guǎng)泛传播(bō)，但可能会影响到(dào)公司的盈利模式。闭源则可以保护知识产权，为(wèi)公司创造直接的收入来源，但可能会限制技术的普及和生态的(de)建设。

事实上，在Llama3发(fā)布之前，中文(wén)互联网刚(gāng)刚经历了一轮开闭源论战。

据媒体报道，百度CEO李彦宏近日表态，认为大(dà)模(mó)型开源意义不大，闭源模型性能会不断提升。“有(yǒu)了文心大模型4.0，我们可以根据需要兼顾效果、响(xiǎng)应速度、推理(lǐ)成本(běn)等各种考虑，裁剪出适合各种场景的更小尺寸模型，且(qiě)支持精调和post pretrain。通过降维裁剪出的模型，比直(zhí)接(jiē)拿开源调出来的模型(xíng)，同等尺寸(cùn)下效果更好，同等效果下成本明显更低。”

李彦宏一直是闭源路线的忠实拥趸，理由包(bāo)括但不限于认(rèn)可闭源商业模式可以更好地聚集(jí)人力和财力等(děng)。

而其反对者——360创始人周鸿祎言简(jiǎn)意赅(gāi)，“一句话，今天没有(yǒu)开(kāi)源就没有 Linux，没有 Linux 就没有互(hù)联网。”

“源神”启动，影响几何(hé)？

“Llama 3的发(fā)布会(huì)带来(lái)市(shì)场格局(jú)的改变。”郭涛在接受21记者采访时指出，其优异表现可能吸引更多的(de)用户(hù)和投资者，从而增加(jiā)其(qí)市场份额。

官(guān)网显示，Llama 3将有条件地开源给商业使用（月活用户超过7亿需要单独申请）。“不过这基本等于完全免费商用(yòng)了。”卡兹克表示(shì)。

此前，投(tóu)资人朱啸虎曾经就人工智能(néng)市场相关话题接受腾讯新闻采访。当被问及(jí)2023年大模型发展的(de)关键节点时，他给出的回答正是Llama上线。这让中国在应用层面(miàn)创新有了基础，降低了商业(yè)化门槛。

当然，朱啸虎提到的变现是指开源生态内的用户。对于(yú)开(kāi)源大模型发布者的能否(fǒu)盈利，或者(zhě)能等来盈利(lì)机会，很多时候并(bìng)没有确(què)定的答案。

闭源(yuán)大模型通常(cháng)通过授权使用、订阅(yuè)服务或者直接销售产品来盈利。其中的代表(biǎo)便(biàn)是AI领域的领跑者OpenAI，虽然其(qí)一直有推进开(kāi)源项目的动作，但其(qí)处(chù)在核心地位的ChatGPT却一直采取收取API许可费的方式向其他公司提供(gōng)服务(wù)。在API服务(wù)过程，其他公司不会接触(chù)到ChatGPT模型的细节和(hé)源代码，仅仅通过API接口进行调用。

创业者服务平台GoDaddy对(duì)全美1003家小(xiǎo)型(xíng)企业的调查数(shù)据显示，ChatGPT以70%的应用率成为美国小型(xíng)企业应(yīng)用最多的生成式AI产品，这说明(míng)OpenAI选(xuǎn)择的闭源模式的商业化(huà)之路在一定程度(dù)已经(jīng)跑通。

开源模型如何寻求生存和发展的机(jī)会？

首先(xiān)是以开放的生态吸引用(yòng)户。国(guó)盛(shèng)证券(quàn)研报就指出，开源大模型借助更大标识符训(xùn)练数据集、DeepSpeed、RLHF等方式，实现低训练成本和高性能，超大模型以下大模(mó)型的壁(bì)垒正在消失。

“在(zài)拥有用户后，开(kāi)源大模型(xíng)通常通过提供增值服(fú)务、定制开发、技术支(zhī)持等方式来实现盈利”。郭涛指出，公司可(kě)以在(zài)开源模型的(de)基础上提供专业的训练服务或者定制化的(de)应用解决方(fāng)案。

对于Meta甚至众多开源者而言，开源的野心不仅是短期的商业(yè)变现，其更想引领规则设计以(yǐ)及搭建生(shēng)态(tài)。有业内专家分析，开源后壁垒并没有那么(me)容易破除，高质量、标注(zhù)过的训练数(shù)据集尤其是专(zhuān)业模型的壁垒。

星纪魅族集团数据合规执行总监朱玲(líng)凤表示，目(mù)前有些开源AI由头部公司主导，“越多人(rén)使用，就越能强化网格效应，而且不是真正的开放(fàng)，后续需要使用它(tā)们的配套工具、配套服务。头部公司还可能利用监管(guǎn)豁免的(de)方式，获得寻租空(kōng)间。”换言之，百通能源龙虎榜数据（4月23日）以开源为噱头的巨头游戏，可能会进一步强化大公司(sī)的垄断地位，反而不利于产业竞争(zhēng)。

据报道，去(qù)年4月，在扎克伯格(gé)与分析师的(de)一次电(diàn)话会议(yì)中，他就谈到(dào)，如果行(xíng)业能够在Meta使用的基础工具上达成标准化，那么meta就能从其他人(rén)的改进中受益(yì)。同年(nián)5月，谷歌(gē)内部泄露的文(wén)件《我们没有护城河，OpenAI也没有》在SemiAnalysis网站上传播(bō)，其中的观点包括，比(bǐ)起开源社区(qū)需要谷歌，谷歌(gē)更(gèng)需(xū)要开源社区等等。文章作者指出，不同开源模型所组成的生态(tài)系统永远是(shì)OpenAI的潜在竞争对手，与开源AI竞争的结果必(bì)然(rán)是失败。

Meta落子，战局生变。大模型的路线之争会不会迎来真正的胜(shèng)利者？

“开(kāi)源与闭源大模型之间(jiān)不太可能分出绝对的输赢，因为它们各自适合不同的应用和场景。”郭涛认为，开源大模型更(gèng)适合那些需(xū)要快速创新(xīn)和大规模协作的项目，而闭源大模型可能更适合那些(xiē)对性能和安全性有极高要求的商业应用。

未经允许不得转载：太仓网站建设,太仓网络公司,太仓网站制作,太仓网页设计,网站推广-昆山云度信息科技有限公司百通能源龙虎榜数据（4月23日）