泉州电动车网 福建骑行网泉州电动车网 福建骑行网

科兴是美国的还是中国的

科兴是美国的还是中国的 ChatGPT之后又一应用杀疯了,AIGC或进入可控期,将洗牌科技行业?

自聊天机器人ChatGPT火爆(bào)以来,微软公司创始人比尔·盖茨已多次公开谈论人工(gōng)智能话(huà)题。在最近的一次采访中,他再次(cì)表示:“AI可能会让(ràng)科技行业迎来一次剧烈(liè)的(de)洗牌(pái)”。

这个结论是他在当地时间2月20日(rì)接受《In Good Company》节目专访(fǎng)时提出的。

他预期,AI的(de)发展可能会威胁到谷(gǔ)歌的市占率,因(yīn)为(wèi)微软(ruǎn)在AI方面的行动相(xiāng)当迅速。而最(zuì)终科技(jì)巨头(tóu)将把AI整合成用户的“全能助手”,包揽一切应用,与人们(men)进行沟通并提供建议,可以取代亚(yà)马(mǎ)逊、Siri或Outlook等应用。

大佬口中全(quán)能助手的到(dào)来可能尚(shàng)需时日,但由ControlNet引发的(de)又一次AI绘(huì)画浪潮,让AIGC在ChatGPT的话题热点包围中杀出重围。

ChatGPT之(zhī)后(hòu)又一应用(yòng)杀疯了(le),AIGC或进(jìn)入可控期,将洗牌科技行(xíng)业?_黑料正能量

01

ControlNet颠覆AI绘画新玩(wán)法

AIGC向可控靠(kào)近

以AI绘画为代表的AIGC上一次(cì)爆火的时候,还是2022年8月,在美国科罗拉多(duō)州举办的新兴(xīng)数字艺术家竞赛中,一幅名为(wèi)《太空(kōng)歌剧院》的(de)作(zuò)品获(huò)奖。

随后各大厂商的AI绘画软件被广大网友熟知并体验,Stable Diffusion便(biàn)是其中代表。

ChatGPT之后又一应(yīng)用杀疯了(le),AIGC或进入可控(kòng)期(qī),将洗(xǐ)牌科技行业(yè)?_黑料正能量

用户们(men)可以在应(yīng)用中(zhōng)输入一(yī)组关键(jiàn)词(cí)或者一张照片,就能获得一(yī)幅AI创作的画作(zuò)。

作画的(de)关键就是所(suǒ)输入的文本。同一组关键词也可以创作(zuò)出(chū)很多(duō)张风(fēng)格(gé)不一样(yàng)的画(huà)作,这让创作的过程就(jiù)像开(kāi)盲盒。

很(hěn)多(duō)用(yòng)户(hù)很喜欢(huān)这种不确定的惊喜,他们会将生成的(de)美(měi)图(tú)当做头像。而另(lìng)一部分喜(xǐ)欢翻看(kàn)AI绘(huì)画的“翻(fān)车”作(zuò)品。在社交媒体上,许多用户分享AI“翻车(chē)现场”,例(lì)如,一位网友的小(xiǎo)狗照片被AI画(huà)成了“肌(jī)肉男”,还有网友的个(gè)人照片被AI识别成了(le)建(jiàn)筑。

而如今(jīn)随着(zhe)ControlNet的出现与加持,以往AI绘(huì)画的填写(xiě)关(guān)键词游戏可能要被颠覆了。

ChatGPT之后(hòu)又一应用杀疯了,AIGC或(huò)进入(rù)可控期,将(jiāng)洗牌科(kē)技行业?_黑(hēi)料正(zhèng)能量

ControlNet是一位正在斯坦福读博的中国(guó)人(rén)张吕(lǚ)敏创作的一种基(jī)于(yú)控制点的图(tú)像变形算法,主要用于数字图像(xiàng)处理、计算机视觉和计算机(jī)图形学等领域(yù)。

其(qí)SD插(chā)件一经发布,在(zài)短短的两天(tiān)内(nèi)便成(chéng)为(wèi)了(le)AI绘画领域最新的热点。

在此之前,大家用了很多方法(fǎ)想让AI生成的结果尽(jǐn)可能的符合要求,但是(shì)都不尽如(rú)人(rén)意(yì),它的(de)出现代表着(zhe)AI生(shēng)成开始进入真(zhēn)正的(de)可控时期。

因为ControlNet可以直接提取画面的构图(tú),人物的姿势和画面的深度信息(xī)等。有了(le)它的帮(bāng)助(zhù),就(jiù)不用(yòng)频繁(fán)的用提示词来(lái)碰(pèng)运气(qì),抽盲盒式(shì)的创(chuàng)作了。

通俗的说ControlNet相当于给AI绘画加了(le)“魔法”,不少博(bó)主的作(zuò)品已经(jīng)获(huò)得了(le)大量(liàng)的浏(liú)览量,“viggo”就是(shì)其中之一,他用(yòng)朋友的(de)照(zhào)片直接带她们走进动漫世界。

ChatGPT之后又(yòu)一应用杀疯了,AIGC或进入可控(kòng)期,将洗牌科技行业?_黑料正能(néng)量

viggo先用StableDiffusion图片转文字。

再用Text2Prompt插件拓展找到(dào)对应的关(guān)键词;最后用ControlNet插件绑定骨骼开始换关键词试(shì)效果。

ChatGPT之(zhī)后(hòu)又一应(yīng)用杀疯(fēng)了(le),AIGC或进入可控期,将(jiāng)洗牌科技行业?_黑料(liào)正能量

通过图片就可(kě)以看(kàn)出(chū)来,效果十分惊(jīng)艳。

ChatGPT之(zhī)后又一(yī)应(yīng)用杀疯(fēng)了(le),AIGC或进(jìn)入可控期,将洗牌科(kē)技行业?_黑料(liào)正能量

ChatGPT之后又(yòu)一应用杀(shā)疯了,AIGC或进(jìn)入可控期,将洗牌科技行业?_黑料(liào)正(zhèng)能量

更厉害的是,除了(le)真实的照片,草图也可以加上“魔法”,知乎大牛(niú)“DevPoint”和“逗砂”介绍到(dào)ControlNet还能实现线稿(gǎo)转全(quán)彩(cǎi)图。大神张吕敏(mǐn)其本尊也亲自回应。

ChatGPT之后又一应(yīng)用(yòng)杀疯了,AIGC或进入(rù)可(kě)控期,将洗牌(pái)科技行业(yè)?_黑料(liào)正能量

不(bù)得不(bù)说(shuō)当下(xià)AIGC已经变得越(yuè)来越强大,甚至输(shū)出的作品都已经能以(yǐ)假乱真了。

02

难辨(biàn)虚实,AIGC技术力爆发

警惕安全问题(tí)

近日(rì),“苏州金鸡(jī)湖有游艇party”的消息火遍网络,而经过警方辟谣这所谓的“party”可能是全(quán)国第(dì)一起(qǐ)AI绘图诈骗。

由于这个活动(dòng)里面给出(chū)的美女照(zhào)片都(dōu)是(shì)AI制作(zuò)的真人照片绘图,因为太(tài)逼真,被大(dà)家当(dāng)成真(zhēn)事传(chuán)播了(le)

ChatGPT之后(hòu)又一(yī)应(yīng)用杀疯了,AIGC或进入(rù)可控期,将洗牌科(kē)技行业?_黑料正(zhèng)能量

不过仔(zǎi)细观察可(kě)以(yǐ)发现(xiàn),活动(dòng)发起者提供的照片中有个很大的漏洞可以发现并(bìng)非真人(rén),而是AI绘图,那便(biàn)是图片中女性的手指部分有的(de)存(cún)在异常。

ChatGPT之后(hòu)又一应(yīng)用杀疯了,AIGC或进入可(kě)控期,将洗牌科技行(xíng)业?_黑料(liào)正(zhèng)能(néng)量

有行(xíng)业人事表示:“现在因为手指(zhǐ)部分的绘画算法比较复杂(zá),AI还不(bù)太会画人的手,但最新看(kàn)到的图片已经有越(yuè)来(lái)越完美的AI模(mó)型出现,以后可能(néng)就完全没有漏(lòu)洞(dòng)了。

类似的AI作(zuò)图诈骗在国(guó)外也已有发生(shēng)。据英国广播公司报(bào)道,土(tǔ)耳(ěr)其(qí)地震期间(jiān),有Tiktok用户使用(yòng)AI合成(chéng)了儿(ér)童(tóng)受灾的假照片发布到(dào)网络,以此诱骗善良(liáng)的人打赏(shǎng)“捐助”从而实施诈骗。

目前随着技术发展,AIGC已经能做出真人照片般的绘图效(xiào)果,如果这样的(de)图片(piàn)被用来(lái)诈(zhà)骗,将非(fēi)常可怕。

此外AIGC还引发了很多担(dān)忧,一方面,批判者认(rèn)为AI在“学习”了大量前人的作(zuò)品之后(hòu),其创(chuàng)作(zuò)没有任何情绪和灵魂,难以和人类(lèi)的(de)艺术创作相(xiāng)提并(bìng)论。

另一方面,AIGC背(bèi)后(hòu)的版(bǎn)权、目(mù)前都并没有得到(dào)有效的解决,还有(yǒu)AIGC会不会代替人类(lèi)“至(zhì)高(gāo)无上(shàng)”的创意。

马斯克也强调,人工智能的安全问题(tí)需要得(dé)到重视,太晚(wǎn)就来不及了。

03

AIGC下一站除了视频,还有(yǒu)远方

技术都是有(yǒu)两(liǎng)面性的(de),潜在的危害并不能掩盖其光辉的(de)贡献。现在看来,人(rén)工智(zhì)能技术将是第四次工(gōng)业革(gé)命的(de)核心(xīn)驱动力量(liàng),将创(chuàng)造新的增长奇迹。

过去(qù)一年,人工智能在技术和商业层面都有了(le)巨(jù)大进展,AI绘画(huà)就是人工智能(néng)技术发(fā)生方向性改变(biàn)的一(yī)个代表。其(qí)下(xià)一站或(huò)许就(jiù)是(shì)视频。

此前,Meta和(hé)谷歌(gē)先后(hòu)发布了几(jǐ)条引爆科技圈的短(duǎn)视(shì)频。这些视频引发关注并非内容做得(dé)多(duō)优秀,反而都非(fēi)常简(jiǎn)单,比如(rú)一匹正(zhèng)在(zài)喝水的马(mǎ),一只画画的玩(wán)具熊,或者一(yī)段骑摩托(tuō)车的第一(yī)视角录(lù)像,随便(biàn)一个(gè)有(yǒu)手机的人都可以随(suí)手录(lù)下(xià)一段(duàn)。

ChatGPT之后又(yòu)一(yī)应用杀疯了,AIGC或进入可控期,将洗牌科技行(xíng)业?_黑料正能量

但这(zhè)些短视频的创作方式非常简单,创(chuàng)作(zuò)者仅(jǐn)仅(jǐn)需(xū)要向AI输入一段话,甚至只是说一下(xià)要求,AI就可以根(gēn)据需(xū)要(yào)生成一段(duàn)视(shì)频。

谷歌发布的两(liǎng)个AI生成视频分别来自于(yú)Imagen Video和Phenaki,前者主要突出(chū)的是高清(qīng),与Meta的Make-A-Video没(méi)有太多的差别(bié)。

在(zài)Make-A-Video公(gōng)布了(le)AI生成的(de)视频科兴是美国的还是中国的(pín)后,AI圈就已经玩了一波梗,一个能够做(zuò)出更(gèng)高清视频的AI还不足以在短时间内戳(chuō)中兴奋点。

Phenaki更加令(lìng)人震惊的地方(fāng)在(zài)于(yú),它(tā)可以制作出超过(guò)2分钟的(de)连贯的也有确切内(nèi)容(科兴是美国的还是中国的róng)的视频(pín),这才是真正(zhèng)让(ràng)人们感到惊喜的地方。因(yīn)为无论AI生成的视频多么高清,也只能是(shì)为内容生产者(zhě)提供一(yī)个灵(líng)感,一(yī)个素材,一个过(guò)场动画。

不(bù)过能够制作(zuò)出有具体剧情(qíng)内容(róng)的(de)视频就意味着(zhe),一些视频创作由AI代替人工完成已(yǐ)经初步有(yǒu)了可能。

当(dāng)下AI的发(fā)展速度已经超过大(dà)部分人(rén)的想象。内容产业(yè)的(de)本质是供给创(chuàng)造需求,AIGC作为全新的内容生产方式,可以为内容产(chǎn)业带来更新的内容风格、更(gèng)快的生产速度,更低的生(shēng)产成(chéng)本,这(zhè)无(wú)疑会(huì)驱(qū)动内容产业(yè)的大(dà)爆(bào)发。

除了AI绘图、视频(pín),AIGC技(jì)术还能应用(yòng)于音(yīn)乐、代码、机(jī)器人动作等(děng)多种内容形(xíng)式的生成。不难发现该项技术(shù)不(bù)仅在游戏等行业(yè)能得到(dào)有(yǒu)效应用,对(duì)于下一代互联网(wǎng)各种元(yuán)素的构(gòu)建亦有关键(jiàn)意义。

从(cóng)商业化的角度来看,文(wén)化娱乐、教育(yù)、传媒(méi)等(děng)诸多领域,本身(shēn)就对基于AI的可(kě)视化内容有强烈需求。

因此,AI绘画及视(shì)频或不是(shì)结果,而只(zhǐ)是(shì)AI进(jìn)程(chéng)中(zhōng)的(de)一块重(zhòng)要拼图,有(yǒu)望在技(jì)术更(gèng)新的(de)加持下实(shí)现(xiàn)更大的(de)应用价值(zhí)。

AI从理(lǐ)解内容,走向(xiàng)了可以(yǐ)生(shēng)成内容,甚至能够创造出独立价值和独立视角的内容(róng)。AIGC的再次出圈,更代表着未来的先进生产力(lì)即将(jiāng)到(dào)来。

ChatGPT之后又一应用杀(shā)疯了,AIGC或进(jìn)入(rù)可控期,将洗牌(pái)科技行业?_黑(hēi)料正能(néng)量

04

紧抓大(dà)模型与(yǔ)算力,牢固(gù)AIGC底(dǐ)座(zuò)

从技术的发展也(yě)可以看出,在语言大(dà)模型、图像大模(mó)型(xíng)之后,多模态大模型已经成为了新的趋势。

大模型(xíng)被誉为当前人工智(zhì)能发展的智能底(dǐ)座,是全球竞争最激烈的研究(jiū)方向之一,包括谷歌、亚马逊(xùn)、百度、阿里、腾讯(xùn)等众(zhòng)多头部企业都在竞相发力。

不过训练大模型的(de)确价格不菲,以国(guó)盛(shèng)证券发布(bù)的(de)《ChatGPT需要(yào)多少算力》报告(gào)估(gū)算(suàn),GPT-3训练(liàn)一次的(de)成本约为140万美元。而(ér)对于一(yī)些更大的(de)LLM(大型语(yǔ)言模型(xíng)),训(xùn)练成本则介于(yú)200万(wàn)美元至1200万美元高价(jià)之间。

以ChatGPT在2023年1月的(de)独立访客平均(jūn)数1300万(wàn)计算(suàn),其对应芯片需求为3万(wàn)多片英伟达A100 GPU,初(chū)始投入成本(běn)约(yuē)为8亿美(měi)元(yuán),每日仅(jǐn)电费就(jiù)在(zài)5万美元左右。

ChatGPT之后又一(yī)应用杀(shā)疯(fēng)了,AIGC或进入可控期(qī),将洗牌科技(jì)行业?_黑料(liào)正能量(liàng)

此(cǐ)外(wài)不论是(shì)ChatGPT还是AIGC,都(dōu)离不开庞(páng)大算力(lì)支持。在关注各类大(dà)模型的发展同时,更(gèng)应该关注算(suàn)力(lì)网络的建(jiàn)设。

算力(lì)网络正驱动AI产业发(fā)展(zhǎn)进入史诗级加速进程(chéng),让AIGC及(jí)通用AI这(zhè)一人工(gōng)智(zhì)能发展的终极目标(biāo)离得更近。

因(yīn)为(wèi)算力可以对突(tū)破性技术创新提供(gōng)大力(lì)的支持(chí)。这方面,多模(mó)态大模型是(shì)典(diǎn)型。作为面(miàn)向未(wèi)来强(qiáng)人工智能、通(tōng)用人(rén)工智能的重要技术创新,多模(mó)态大模(mó)型已经在人工智能领域提(tí)出了很多年(nián),业界也有(yǒu)不少技术突(tū)破,但是,多模态大模型(xíng)进一步往下走,算力需求呈几何(hé)式上升(shēng),一般的算力基础设施很快将难以胜任。

从图像、文字、语音单(dān)独(dú)一项的训练,到双模态、三模态(tài)的跃(yuè)迁,让人工智(zhì)能可以灵活应对不同模态(tài)的转化、像人与世界交(jiāo)互一样自然,这方面,由算力网络来驱动将有明显优势(shì)。

ChatGPT之后又(yòu)一应(yīng)用杀(shā)疯(fēng)了,AIGC或进(jìn)入可控期(qī),将洗牌科技(jì)行业?_黑(hēi)料正能量

此(cǐ)外,还有很多(duō)需要爆发式增长的(de)算力(lì)来支撑(chēng)的技术创新,将在人(rén)工智能算力(lì)网络支撑(chēng)下快(kuài)速(sù)推进。

AIGC已经露出曙光,期待在大模(mó)型(xíng)和大(dà)算力的支(zhī)持(chí)下(xià)AIGC能持续(xù)颠覆内容生产的方式,将创造的边际成本降低(dī),让万众(zhòng)受(shòu)益。

未经允许不得转载:泉州电动车网 福建骑行网 科兴是美国的还是中国的

评论

5+2=