自聊天机器人ChatGPT火(huǒ)爆(bào)以来,微软公司(sī)创始(shǐ)人(rén)比尔(ěr)·盖茨(cí)已多次公开谈(tán)论人工(gōng)智(zhì)能话题(tí)。在最近的一次(cì)采(cǎi)访中(zhōng),他再次表示:“AI可能会让科技行业迎来一次剧烈的洗牌”。
这(zhè)个结论是他在当地时间2月20日接受《In Good Company》节目专访时(shí)提出(chū)的。
他预(yù)期,AI的发展可能会威胁(xié)到谷(gǔ)歌的市(shì)占率(lǜ),因为(wèi)微(wēi)软(ruǎn)在AI方(fāng)面的(de)行动相(xiāng)当迅速。而最终(zhōng)科技巨头将把AI整合成用户(hù)的(de)“全能助手”,包揽一切应用,与(yǔ)人们进行(xíng)沟通并(bìng)提供建议,可(kě)以取代亚马(mǎ)逊、Siri或Outlook等应用。
大(dà)佬口中(zhōng)全能(néng)助(zhù)手的(de)到(dào)来可能尚需时日,但由ControlNet引发(fā)的(de)又(yòu)一(yī)次(cì)AI绘画(huà)浪潮(cháo),让AIGC在ChatGPT的话题(tí)热点(diǎn)包围(wéi)中(zhōng)杀出重围。
01
ControlNet颠覆AI绘画新(xīn)玩法
AIGC向(xiàng)可控靠近
以AI绘画为(wèi)代表的AIGC上一次爆火的时候,还是(shì)2022年8月,在美国科罗拉(lā)多(duō)州举办的新兴(xīng)数字艺术家竞赛(sài)中,一幅名(míng)为《太(tài)空歌剧(jù)院(yuàn)》的作(zuò)品获奖。
随后各大厂(chǎng)商(shāng)的AI绘(huì)画软(ruǎn)件被(bèi)广大网友熟知(zhī)并体验,Stable Diffusion便是其中代表。
用户们可以在应用中输入一(yī)组(zǔ)关键(jiàn)词或者一张照(zhào)片,就能获(huò)得(dé)一幅(fú)AI创作的(de)画作。
作(zuò)画的关(guān)键就是(shì)所(suǒ)输(shū)入(rù)的文本(běn)。同一组关键词也可以创作出很多(duō)张风格不一样(yàng)的画作,这让创作(zuò)的(de)过程就(jiù)像(xiàng)开盲盒。
很(hěn)多用户很喜(xǐ)欢这种不(bù)确(què)定的惊喜,他们会将生成(chéng)的美(měi)图当做头像。而另一部分(fēn)喜欢翻看AI绘画的“翻车(chē)”作(zuò)品(pǐn)。在(zài)社交媒体上,许多用户分享AI“翻车现场”,例如(rú),一位网友的小狗照片被AI画成了“肌肉男”,还有网友(yǒu)的个人照片被AI识别成了建筑。
而如(rú)今随着ControlNet的出现与加持(chí),以(yǐ)往AI绘画的填写(xiě)关键词游戏可能要被颠覆了(le)。
ControlNet是一位正(zhèng)在斯(sī)坦福读博的中国人张吕敏(mǐn)创作的(de)一(yī)种(zhǒng)基于控(kòng)制(zhì)点的图像(xiàng)变(biàn)形算(suàn)法,主要用于数(shù)字图像(xiàng)处理(lǐ)、计(jì)算机视觉和计算机(jī)图(tú)形学等领域。
其SD插件一经发布,在短短的两(liǎng)天内便成为了AI绘(huì)画领域最新的(de)热点。
在此之前,大家用(yòng)了很多方法想(xiǎng)让AI生成(chéng)的结果尽可能的符合要求(qiú),但是(shì)都不尽如人意,它的出(chū)现代表着AI生成(chéng)开始进入真正(zhèng)的可控时期。
因为ControlNet可以直接提取(qǔ)画(huà)面的构图,人(rén)物的姿势和画面的深度信息等。有(yǒu)了它的帮助,就(jiù)不用频(pín)繁的用提示词(cí)来碰运气(qì),抽盲盒式的创作了。
通俗(sú)的说ControlNet相当于(yú)给AI绘画(huà)加了“魔法”,不(bù)少博(bó)主的作品已经(jīng)获得了(le)大量的浏览量,“viggo”就是其中(zhōng)之一,他用朋(péng)友(yǒu)的照片(piàn)直接带(dài)她们走进动漫(màn)世界。
viggo先用(yòng)StableDiffusion图片转文字。
再用Text2Prompt插件拓(tuò)展找到对应的关(guān)键(jiàn)词;最后用(yòng)ControlNet插件(jiàn)绑(bǎng)定骨骼开始(shǐ)换(huàn)关键词试(shì)效果。
通过图片(piàn)就可(kě)以看出来(lái),效(xiào)果十分(fēn)惊(jīng)艳(yàn)。
更厉害的是,除了真实的照片,草图也可以加上“魔法(fǎ)”,知乎大牛“DevPoint”和“逗砂(shā)”介绍到(dào)ControlNet还(hái)能实现线稿转全彩图。大神(shén)张(zhāng)吕(lǚ)敏其本(běn)尊也(yě)亲自(zì)回应。
不得不说当下AIGC已经变得(dé)越来(lái)越强大,甚至输出的作品(pǐn)都已经能(néng)以假(jiǎ)乱真了。
02
难辨(biàn)虚(xū)实,AIGC技术力爆发(fā)
警惕(tì)安全问题(tí)
近日,“苏州金(jīn)鸡(jī)湖有游艇party”的消(xiāo)息(xī)火遍网络,而经(jīng)过警方(fāng)辟(pì)谣这所谓(wèi)的“party”可能是(shì)全(quán)国第(dì)一(yī)起AI绘(huì)图诈骗。
由于这个活动里面给出的美女照片(piàn)都是AI制作的真人照片绘图,因为太逼真,被大家(jiā)当成(chéng)真(zhēn)事传播了。
不过仔细观察可以发现,活(huó)动发起者提供的照片中有个(gè)很大的漏洞可以发(fā)现并非真人(rén),而是AI绘(huì)图,那(nà)便是(shì)图片中女性的手指部分有的存在(zài)异常。
有行业人事表示:“现在(zài)因为手指部分的绘画算(suàn)法比较复杂,AI还不太会(huì)画(huà)人(rén)的手(shǒu),但(dàn)最(zuì)新(xīn)看到的图片已经有越(yuè)来越完(wán)美的AI模(mó)型出现,以后(hòu)可(kě)能就(jiù)完全没(méi)有漏洞了(le)。”
类似(shì)的AI作图诈(zhà)骗(piàn)在(zài)国外也已(yǐ)有发(fā)生。据(jù)英国(guó)广播(bō)公司(sī)报道,土耳(ěr)其地(dì)震期间(jiān),有Tiktok用(yòng)户使用AI合成了儿童受灾的(de)假照(zhào)片(piàn)发布到网(wǎng)络,以此诱(yòu)骗善良的人打赏“捐(juān)助”从(cóng)而实施诈骗。
目前随着技术(shù)发展,AIGC已经能做(zuò)出真人照片般的绘图效果,如(rú)果这样的图(tú)片被用来诈骗,将(jiāng)非常可怕。
此外AIGC还引发了很(hěn)多担忧,一(yī)方面,批判者(zhě)认为(wèi)AI在“学习”了大量(liàng)前人的作(zuò)品之(zhī)后,其创作没有任何(hé)情绪(xù)和(hé)灵魂,难以和人类(lèi)的(de)艺术创作(zuò)相(xiāng)提并论。
另一(yī)方面,AIGC背后(hòu)的(de)版权、目前都(dōu)并没有得到有效的解(jiě)决,还有AIGC会(huì)不会代替人类“至高无上”的创意(yì)。
马斯克也强(qiáng)调,人工智能的(de)安全问题需要得(dé)到重视,太晚就来不及了。
03
AIGC下一站除了视频,还(hái)有远方
技术(shù)都是有两面性的(de),潜在(zài)的危害并不能掩盖其光(guāng)辉的贡献。现在看(kàn)来(lái),人工智(zhì)能(néng)技(jì)术将是第四次工业(yè)革(gé)命的核(hé)心驱动力量,将创(chuàng)造新的增长(zhǎng)奇迹。
过去一年,人工智能在技术和商业层面都有(yǒu)了(le)巨大进(jìn)展,AI绘画就是(shì)人(rén)工智(zhì)能技术(shù)发生方向性(xìng)改(gǎi)变(biàn)的一(yī)个(gè)代表。其下一站(zhàn)或许(xǔ)就是视频。
此前,Meta和(hé)谷歌先(xiān)后发布了(le)几条引爆科(kē)技圈(quān)的(de)短视频。这些视频引发关(guān)注并非内容做得(dé)多(duō)优秀,反而都非常简单,比如一(yī)匹正在喝(hē)水的马(mǎ),一只画(huà)画的玩具熊,或者一段骑摩(mó)托车的第(dì)一视(shì)角录像,随便一个有手(shǒu)机(jī)的人都可以随手录下一(yī)段。
但这些短视频的创作方式非常简单,创作者(zhě)仅仅需要向AI输入一段话,甚至只(zhǐ)是说一(yī)下要求,AI就可以(yǐ)根据需要生成(chéng)一(yī)段视(shì)频。
谷(gǔ)歌发(fā)布(bù)的两(liǎng)个AI生成视频分别来自于(yú)Imagen Video和Phenaki,前者(zhě)主要(yào)突(tū)出(chū)的(de)是高(gāo)清,与Meta的Make-A-Video没有太(tài)多的差别。
在Make-A-Video公布了AI生成(chéng)的视频(pín)后,AI圈就已(yǐ)经玩(wán)了一(yī)波梗,一个(gè)能够做(zuò)出更高清视频(pín)的AI还不足以在短时(shí)间(jiān)内戳中兴(xīng)奋点。
Phenaki更加(jiā)令(lìng)人震惊的地(dì)方(fāng)在于,它可以制作出超过(guò)2分(fēn)钟(zhōng)的连贯的也有确(què)切内容的视频,这才是(shì)真正(zhèng)让人们感(gǎn)到(dào)惊(jīng)喜的(de)地方。因为无论(lùn)AI生成的视频多(duō)么高清(qīng),也(yě)只能(néng)是为内容(róng)生产者提供一个灵(líng)感,一个(gè)素材,一(yī)个过场动(dòng)画。
不过能(néng)够制作出有具体剧(jù)情内容的视频就意味着,一(yī)些视(shì)频创(chuàng)作由AI代(dài)替人工(gōng)完成(chéng)已经(jīng)初步有(yǒu)了可能。
当下AI的发(fā)展速度已经超过(guò)大部分人的想象。内容产业的本质是供给创造需求(qiú),AIGC作为全新的内容生产方(fāng)式,可以(yǐ)为内容(róng)产业带来更新的(de)内容风格(gé)、更快的生(shēng)产速度,更低的生(shēng)产(chǎn)成本,这无疑会驱(qū)动内容产业的(de)大爆发。
除了AI绘图、视频,AIGC技术还能应用于音乐(lè)、代码、机器人(rén)动作等多种内容(róng)形(xíng)式的生成。不难发现(xiàn)该项技术不仅在游(yóu)戏(xì)等行业(yè)能得(dé)到有(yǒu)效应(yīng)用,对(duì)于下一(yī)代互联网各种元(yuán)素的构建亦有关键(jiàn)意义。
从商业化的角度来看,文化娱乐、教育、传(chuán)媒等诸(zhū)多领域,本身就对基(jī)于(yú)AI的可(kě)视化(huà)内容有强烈需求。
因(yīn)此(cǐ),AI绘画及(jí)视(shì)频或不是(shì)结果,而只是AI进(jìn)程中的一块重(zhòng)要拼图,有望在技(jì)术更新的(de)加持(chí)下实现更大的应用价值(zhí)。
AI从理解内(nèi)容,走向了(le)可以生成内(nèi)容(róng),甚至能够创造出独(dú)立价值和(hé)独立视角的内容。AIGC的再次出圈,更(gèng)代表着(zhe)未来的先(xiān)进(jìn)生(shēng)产力(lì)即将到来(lái)。
04
紧抓大(dà)模型与算力,牢固AIGC底座
从(cóng)技(jì)术的发展也可以(yǐ)看出,在(zài)语言大模(mó)型、图(tú)像大模型之后,多模态大模型已经成为了新的趋势。
大模型被誉为当(dāng)前人工智能(néng)发展(zhǎn)的(de)智能底(dǐ)座,是(shì)全球竞(jìng)争最激烈的(de)研(yán)究(jiū)方向(xiàng)之一(yī),包括谷(gǔ)歌(gē)、亚(yà)马逊、百度、阿(ā)里、腾讯等众多头部(bù)企业都在竞相(xiāng)发力(lì)。
不过训练大模型的确价格(gé)不菲,以国盛证券发布(bù)的(de)《ChatGPT需要多少算力》报告估算,GPT-3训练(liàn)一(yī)次(cì)的成本约为140万美元。而对(duì)于一(yī)些(xiē)更大的(de)LLM(大型(xíng)语言模型),训练成本则介于200万美元至1200万美元高价之(zhī)间。
以ChatGPT在(zài)2023年1月的独立(lì)访客(kè)平均数1300万计算,其对(duì)应芯片需求(qiú)为3万(wàn)多(duō)片英伟达A100 GPU,初(chū)始投入成本约(yuē)为8亿美元(yuán),每(měi)日仅电费(fèi)就在5万美元(yuán)左右。
此外不(bù)论是ChatGPT还是AIGC,都离(lí)不开庞大(dà)算(suàn)力支持。在关注各类(lèi)大模型的发展(zhǎn)同(tóng)时(shí),更应(yīng)该关注算力网络的建设。
算力网(wǎng)络(luò)正驱动(dòng)AI产业发(fā)展进入(rù)史诗级加速进程,让AIGC及通(tōng)用(yòng)AI这一(yī)人(rén)工智能发展的终极目(mù)标(biāo)离(lí)得更近(jìn)。
因为算力可以(yǐ)对突破性技术创新提供大(dà)力(lì)的(de)支持。这(zhè)方面,多模态(tài)大模型是典型(xíng)。作(zuò)为面向未来(lái)强(qiáng)人工(gōng)智能(néng)、通(tōng)用人工(gōng)智能的重要技术创新,多模态大模(mó)型已(yǐ)经在人工智能领域提出了(le)很多年,业界(jiè)也有不少技(jì)术(shù)突(tū)破,但是,多模态大模型进一步往(wǎng)下走,算力需求呈几何式(shì)上(shàng)升,一般(bān)的(de)算力基础设施很快将难(nán)以胜任。
从图像、文字(zì)、语音(yīn)单(dān)独一项的训练,到双模态、三模态(tài)的跃迁,让(ràng)人(rén)工智(zhì)能可(kě)以(yǐ)灵活应对不同模态(tài)的转化、像(xiàng)人与世界交互(hù)一样自(zì)然,这方面,由算力网(wǎng)络来驱动(dòng)将(jiāng)有明显优势。
此外,还有很多需(xū)要爆(bào)发(fā)式增长(zhǎng)的算力来支撑的技术(shù)创(chuàng)新,将在人工智能算力网(wǎng)络(luò)支撑(chēng)下快速推进。
AIGC已经(jīng)露出曙光,期待在大(dà)模型和大算力的支持(chí)下AIGC能持续颠(diān)覆内容生产(chǎn)的方(fāng)式,将创(chuàng)造的边(biān)际成(chéng)本降低,让万(wàn)众受益。
未经允许不得转载:太仓网站建设,太仓网络公司,太仓网站制作,太仓网页设计,网站推广-昆山云度信息科技有限公司 日落胭脂红完整的诗句带拼音,日落胭脂红完整的诗句的意思
最新评论
非常不错
测试评论
是吗
真的吗
哇,还是漂亮呢,如果这留言板做的再文艺一些就好了
感觉真的不错啊
妹子好漂亮。。。。。。
呵呵,可以好好意淫了