太仓网站建设,太仓网络公司,太仓网站制作,太仓网页设计,网站推广-昆山云度信息科技有限公司太仓网站建设,太仓网络公司,太仓网站制作,太仓网页设计,网站推广-昆山云度信息科技有限公司

AI“源神”启动!影响多大?

AI“源神”启动!影响多大?

开源还是(shì)闭源?这(zhè)是属于大模(mó)型的时代之问(wèn)。

今年年初,埃隆·马斯克在(zài)对OpenAI及其CEO萨(sà)姆·奥特曼(màn)提起(qǐ)诉讼时,就对OpenAI逐(zhú)渐不公开其模型研究相关细节的行为大加谴责。“时至今日(rì),OpenAI公(gōng)司网站还宣(xuān)称,它的宗旨(zhǐ)是确保通用(yòng)人工(gōng)智能造福(fú)全人类。然而,在现(xiàn)实中,OpenAI已经转 变为科技巨头微软 事实上的闭源子公司(sī)。”这位曾经的OpenAI联合创始人如此表(biǎo)示。

OpenAI不够“Open”,Meta却“Open”了自己最新的开源人工智能模型。

4月18日,Meta 发布了其最新版本的开源(yuán)大模(mó)型 Llama 3,引起(qǐ)开源AI社区的一阵欢呼。巧合的是(shì),Llama 3发布(bù)当天(tiān)正好是AI领域顶尖学者、AI开源倡导者吴恩达的(de)生(shēng)日。“(Llama 3是)至今为止最好的礼物,谢感谢Meta!”他说。

行至2024,开闭源之争(zhēng)日渐白(bái)热化。闭源阵(zhèn)营以(yǐ)目前最强的OpenAI为代表,开(kāi)源阵营Meta的LLaMa、Mistral和Google等也(yě)在不断迭代。闭源阵营坚持对Scaling Law的信仰,押注在更强通用模型的打造上;开源阵营模(mó)型能力不断提升,并且强调以更垂直的性能、更灵活的配置来推动大模型商业化落 地。

关(guān)于应(yīng)该选择(zé)模型开源还是(shì)闭源讨论经久不(bù)息。

对于局内人,这一选择这不仅决定(dìng)了他们将如何点亮AI“科技树”,更将影响他们的商业路线选择。换言之,这很有可能是这个残酷竞争市场(chǎng)下的生存问题(tí)。

两(liǎng)个版本,多重惊喜

Meta此(cǐ)次发布 的Llame 3包括8B和70B的预训练(liàn)和指令微调版本。

据(jù)Meta官网信息,Llama 3 模型将数据(jù)和规模提(tí)升到新的高度(dù)。它在两个定制24K GPU集群上基 于超过 15T 的数据进行了训练——训练数据集是Llame 2使用(yòng)量的7倍有余。它支持(chí) 8K 上下文长度,是 Llama 2 容量的两倍。

除了 Llama 3,Meta 还发布了新的信任和安全工具,包括Llama Guard 2、Code Shield和 CyberSec Eval 2。

据悉,Llama 3 即将在AWS(Amazon web service)、Databricks、Google Cloud、Hugging Face、Kaggle、IBM WatsonX、 Microsoft Azure等主要云(yún)提供商、模型 API 提供商平台上线,Llama还得到AMD、AWS、戴尔、英特尔、NVIDIA和高通提供的硬件平台的支持。

在官网上,Meta还放出(chū)了(le)Llama3两个版本与谷歌(gē)Gemma、谷歌Gemini、Mistral、Anthropic的Claude 3等竞(jìng)争对手的参数对比。据Meta官网,Llame3在(zài)MMLU(学科知识理解)、GPQA(一 般问题)、HumanEval(代(dài)码能力)、GSM—8K(数学能力)、MATH(比(bǐ)较难的(de)数学(xué)问题)5个(gè)评(píng)测集上(shàng)均表现良好。

值(zhí)得(dé)注意的是,Llama3的代码能力非常优(yōu)秀。在AI领域公众(zhòng)号“数(shù)字生命卡兹克”主理人卡兹克分享的用户实测中,Llama3—8B能够给出国际象棋中经典皇后问题的解题代码。而其前(qián)代版本Llama2需要专门的代码模型(xíng)才能实现(xiàn)。

市场的反应(yīng)速度(dù)很快。18日当天,Meta股价逆(nì)势收涨(zhǎng)1.54%。次日,百度智能云(yún)千(qiān)帆(fān)大模型平台开放邀约(yuē)测试,提供针对Llama 3的训(xùn)练推理方案,帮助开发者训练专属大模 型。

8B和70B 两个型号的模型,仅仅标志着 Llama 3 系列的开端,Meta AI首(shǒu)席科学家杨立昆在其社交媒(méi)体透露,在(zài)接下来的几个月,还会有更多版本陆续发布。

英伟达高级 科(kē)学家Jim Fan认为之后可能会发布的Llama 3-400B以上的版本将(jiāng)成为某种“分水岭”,开源社区将能用(yòng)上GPT-4级(jí)别的模型。

不下牌桌,各(gè)显神(shén)通

上一轮元(yuán)宇宙(zhòu)竞争中被认为可能跌进坑里的Meta,在人工(gōng)智能的牌(pái)桌上打(dǎ)出了Llama系列这把好牌。要讨(tǎo)论Llama3带来(lái)的行业(yè)震荡,首先要明白,什么是大模型领域的开源(yuán)?

大模型领(lǐng)域的开源通常意味着模型的架构、训(xùn)练代(dài)码和(hé)预训练(liàn)权重 等(děng)都被公开,允许研究人(rén)员(yuán)和开发者自由地 访问 和使用。

不过,开源的程度因模型而(ér)异(yì)。“有些(xiē)可(kě)能只 提供有限的访问权限或部分代码。”郭涛指出,判断大模型是否真正开源的基准可能包括:代码和数据的可访问性、使用许(xǔ)可的宽松程度、社区支持的活跃(yuè)度以及对改(gǎi)进和新应用(yòng)的开放性。

放眼AI界,两条路径上都各有“头号玩家”分布。闭源自不必说,海外有OpenAI旗下的ChatGPT,国内(nèi)是百度(dù)的文心(xīn)一 言以及风头正劲的月之暗面Kimi。

而开源(yuán)方面,除(chú)了Llama系列,目前(qián)应用较广 的开源大模型还包括非营(yíng)利组织LAION推出的OpenFlamingo、Databricks的Dolly,以及MosaicML的MPT等。国内则包括,阿(ā)里巴巴的通义千问,智(zhì)谱的ChatGLM-4、百川智能的baichuan-7B中英文大模型、北(běi)京(jīng)智源悟道3.0大模型系列和面壁智能的CPM-Bee 10B中文基 座大模型等。

形(xíng)成这样的分化(huà),很(hěn)多时候是受技术进步和商业模式迭(dié)代等的(de)多重(zhòng)影响。

天(tiān)使投(tóu)资(zī)人、资深人工智能专家郭涛认为,从技术 角度来看(百通能源龙虎榜数据(4月23日)kàn),开源可以促进学术界(jiè)的研究和创新(xīn),而闭源则有助于在一(yī)定时(shí)间内保持(chí)技术领先优势。

从商业角度来看,开(kāi)源可以吸引开发者社百通能源龙虎榜数据(4月23日)区的(de)贡献,促进技术的快(kuài)速迭代和应用(yòng)的广(guǎng)泛传播(bō),但可能会影响到(dào)公司的盈利模式。闭源则可以保护知识产权,为(wèi)公司创造直接的收入来源,但可能会限制技术的普及和生态的(de)建设。

事实上,在Llama3发(fā)布之前,中文(wén)互联网刚(gāng)刚经历了一轮开闭源论战。

据 媒体报道,百度CEO李彦宏近日表态,认为大(dà)模(mó)型开源意义不大,闭源模型性能会不断提升。“有(yǒu)了文心大模型4.0,我们可以根据需要兼顾效果、响(xiǎng)应速度、推理(lǐ)成本(běn)等各种考虑,裁剪出适合各种场景的更小尺寸模型,且(qiě)支持精调和post pretrain。通过降维裁剪出的模型,比直(zhí)接(jiē)拿开源调出来的模型(xíng),同等尺寸(cùn)下效果更好,同等效果下成本明显更低。”

李彦宏一直是闭源路线的忠实拥趸,理由包(bāo)括但不限于认(rèn)可闭源商业模式可以更好地聚集(jí)人力和财力等(děng)。

而其反对者——360创始人周鸿祎言简(jiǎn)意 赅(gāi),“一句话,今天没有(yǒu)开(kāi)源就没有 Linux,没有 Linux 就没有互(hù)联网。”

“源神”启动,影响几何(hé)?

“Llama 3的发(fā)布会(huì)带来(lái)市(shì)场格局(jú)的改变。”郭涛在接受21记者采访时指出,其优异表现可能吸引更多的(de)用户(hù)和投资者,从而增加(jiā)其(qí)市场份额。

官(guān)网显示,Llama 3将有条件地开源给商业使用(月活用户超过7亿需要单独申请)。“不过这基本等于完全免费商用(yòng)了。”卡兹克表示(shì)。

此前,投(tóu)资人朱啸虎曾经就人工智能(néng)市场相关话题接受腾讯新闻采访。当被问及(jí)2023年大模型发展的(de)关键节点时,他给出的回答正是Llama上线。这让中国在应用层面(miàn)创新有了基础,降低了商业(yè)化门槛。

当然,朱啸虎提到的变现是指开源生态内的用户。对于(yú)开(kāi)源大模型发布者的能否(fǒu)盈利,或者(zhě)能等来盈利(lì)机会,很多时候并(bìng)没有确(què)定的答案。

闭源(yuán)大模型通常(cháng)通过授权使用、订阅(yuè)服务或者直接销售产品来盈利。其中的代表(biǎo)便(biàn)是AI领域的领跑者OpenAI,虽然其(qí)一直有推进开(kāi)源项目的动作,但其(qí)处(chù)在核心地位 的ChatGPT却一直采取收取API许可费的方式向其他公司提供(gōng)服务(wù)。在API服务(wù)过程,其他公司不会接触(chù)到ChatGPT模型的细节和(hé)源代码,仅仅通过API接口进行调用。

创业者服务平台GoDaddy对(duì)全美1003家小(xiǎo)型(xíng)企业的调查数(shù)据显示,ChatGPT以70%的应用率成为美国小型(xíng)企业应(yīng)用最多的生成式AI产品,这说明(míng)OpenAI选(xuǎn)择的闭源模式的商业化(huà)之路在一定程度(dù)已经(jīng)跑通。

开源模型如何寻求生存和发展的机(jī)会?

首先(xiān)是以开放的生态吸引用(yòng)户。国(guó)盛(shèng)证券(quàn)研报就指出,开源大模型借助更大标识符训(xùn)练数据集、DeepSpeed、RLHF等方式,实现低训练成本和高性能,超大模型以下大模(mó)型的壁(bì)垒正在消失。

“在(zài)拥有用户后,开(kāi)源大模型(xíng)通常通过提供增值服(fú)务、定制开发、技术支(zhī)持等 方式来实现盈利”。郭涛指出,公司可(kě)以在(zài)开源 模型的(de)基础上提供专业的训练服务或者定制化的(de)应用解决方(fāng)案。

对于Meta甚至众多开源者而言,开源的野心 不仅是短期的商业(yè)变现,其更想引领规则设计以(yǐ)及搭建生(shēng)态(tài)。有 业内专家分析,开源后壁垒并没有那么(me)容易破除,高质量、标注(zhù)过的训练数(shù)据集尤其是专(zhuān)业模型的壁垒。

星纪魅族集团数据合规 执行总监朱玲(líng)凤 表示,目(mù)前有些开源AI由头部公司主导,“越 多人(rén)使用,就越能强化网格效应,而且不是真正的开放(fàng),后续需要使用它(tā)们的配套工具、配套服务。头部公司还可能利用监管(guǎn)豁免的(de)方式,获得寻租空(kōng)间。”换言之,百通能源龙虎榜数据(4月23日)以开源为噱头的巨头游戏,可能会进一步强化大公司(sī)的垄断地位,反而不利于产业竞争(zhēng)。

据报 道,去(qù)年4月,在扎克伯格(gé)与分析师的(de)一次电(diàn)话会议(yì)中,他就谈到(dào),如果行(xíng)业能够在Meta使用的基础工具上达成标准化,那么meta就能从其他人(rén)的改进中受益(yì)。同年(nián)5月,谷歌(gē)内部泄露的文(wén)件《我们没有护城河,OpenAI也没有》在SemiAnalysis网站上传播(bō),其中的观点包括,比(bǐ)起开源社区(qū)需要谷歌,谷歌(gē)更(gèng)需(xū)要开源社区等等。文章作者指出,不同开源 模型所组成的生态(tài)系统永 远是(shì)OpenAI的潜在竞争对手,与开源AI竞争的结果必(bì)然(rán)是失败。

Meta落子,战局生变。大模型的路线之争会不会迎来真正的胜(shèng)利者?

“开(kāi)源与闭源大模型之间(jiān)不太可能分出绝对的输赢,因为它们各自适合不同的应用和场景。”郭涛认为,开源大模型更(gèng)适合那些需(xū)要快速创新(xīn)和大规模协作的项目,而闭源大模型可能更适合那些(xiē)对性能和安全性有极高要求的商业应用。

未经允许不得转载:太仓网站建设,太仓网络公司,太仓网站制作,太仓网页设计,网站推广-昆山云度信息科技有限公司 百通能源龙虎榜数据(4月23日)

评论

5+2=