OpenAI发布根据文字生成图像的人工智能系统-EDA365

人工智能 > 详情

发布时间：

据报道，旧金山人工智能研究公司OpenAI已经开发了一种新系统，能根据短文本来生成图像。

OpenAI在官方博客中表示，这个新系统名为DALL-E，名称来源于艺术家萨尔瓦多·达利（SalvadorDali）和皮克斯的机器人英雄瓦力（WALL-E）的结合。新系统展示了“为一系列广泛的概念”创造图像的能力，创作的作品包括牛油果形状的扶手椅等。

通过神经网络去生成图像，这种技术并不新颖。此前，生成对抗网络（GAN）已被广泛用于创建真实的人、宠物、租赁房产和食物的照片。

不过，DALL-E的独特之处在于可以根据输入的文本来创作图像。该系统基于文字生成系统GPT-3的一个版本，该系统此前被用于撰写诗歌和新闻文章等。利用配对好的文本和图像数据集进行训练，DALL-E可以根据新的文字提示生成图像，此外还展示了创造多种风格图片的能力。

OpenAI还发布了图像识别系统Clip。Clip通用性比当前针对单个任务的系统更好，可以用网上公开的文字图像配对数据集来训练。

DALL-E还需要继续优化。OpenAI指出，DALL-E目前的可靠性还存在问题，对类似“glass”等有多个含义的名词常常会混淆，文字中不同的语法也可能会造成不同的结果。

此外还有更深层次的问题需要解决。OpenAI表示：“我们注意到，涉及生成模型的工作可能会产生重大而广泛的社会影响。”未来可能的举措包括研究对就业岗位的影响，生成结果的偏见，以及技术的长期道德挑战。

长期以来，公众一直担心人工智能生成的媒体内容被滥用，例如神经网络被用来制造虚假的音视频和图像，用于不道德的目的，例如政治上的假信息和欺诈活动等。

『本文转载自网络,版权归原作者所有,如有侵权请联系删除』

上一篇:一文详谈机器学习的强化学习下一篇:6大人工智能应用的关键技术详解

浅谈人工智能在工业4.0上的关键指标