新浪科技讯 1月6日(rì)上午消息(xī),据(jù)报道,旧金山(shān)人(rén)工智能研究公司OpenAI已经开发了一种新系统,能根据短文本来生(shēng)成图像。
OpenAI在官方博客中表示,这个新系统名为DALL-E,名(míng)称来源于(yú)艺术(shù)家(jiā)萨尔瓦多·达(dá)利(Salvador Dali)和皮克斯的机器人英雄瓦(wǎ)力(WALL-E)的结合。新系统展示了“为一系列(liè)广泛的概念”创(chuàng)造图像的(de)能(néng)力(lì),创作的作品包括牛油(yóu)果形状的扶手椅(yǐ)等。
通(tōng)过神经网络去生成图像,这种技术并不新颖。此前,生成对抗(kàng)网络(GAN)已被(bèi)广泛用于创建(jiàn)真实的人、宠物(wù)、租赁房产和食物(wù)的照片。
不过(guò),DALL-E的独特之处在于可以(yǐ)根据输入的文本来创(chuàng)作图(tú)像(xiàng)。该(gāi)系统基于文(wén)字生成系统GPT-3的一(yī)个版本,该系统此(cǐ)前被用于撰写诗歌(gē)和新闻(wén)文章等。利用配对好的文本和图像数据集进行训练(liàn),DALL-E可以根据新的(de)文字提示生成图像,此(cǐ)外还展示(shì)了(le)创造多种风格图片的能力。
OpenAI还(hái)发布(bù)了图像识别系(xì)统Clip。Clip通用性比当前针对单(dān)个任务的系统更好(hǎo),可以用网上公开的文(wén)字图像(xiàng)配对(duì)数据集来训练。
DALL-E还需(xū)要继续(xù)优化。OpenAI指出,DALL-E目前的可靠性还存在问题(tí),对类似“glass”等有(yǒu)多个含义的(de)名(míng)词常常会混淆(xiáo),文(wén)字中不(bú)同(tóng)的(de)语法(fǎ)也可能会造成不(bú)同的(de)结果。
此外(wài)还有更深层次(cì)的问题需要解决。OpenAI表(biǎo)示:“我们注意到,涉及生成(chéng)模型的工(gōng)作(zuò)可能会(huì)产生重(chóng)大而广(guǎng)泛的(de)社会影响。”未来可能(néng)的(de)举(jǔ)措包括研(yán)究(jiū)对就业岗位的影响,生成结果的偏见,以及技术(shù)的长期道(dào)德挑战。
长(zhǎng)期以(yǐ)来(lái),公众一直担心人工智能生(shēng)成的媒体(tǐ)内容被滥用,例如神(shén)经网络(luò)被用来制造虚假(jiǎ)的音视频和图像,用于不道(dào)德的目的,例(lì)如(rú)政治上的假信息(xī)和欺诈(zhà)活动等(děng)。