当前位置:网站首页 > 更多 > 涨姿势 > 正文

[涨姿势] 新的 AI 图像生成器比 OpenAI 最好的工具快 8 倍,并且可以在廉价计算机上运行

作者:精品下载站 日期:2024-12-13 18:11:48 浏览:12 分类:涨姿势

新的 AI 图像生成器比 OpenAI 最好的工具快 8 倍,并且可以在廉价计算机上运行


科学家们使用“知识蒸馏”将 Stable Diffusion XL 浓缩成一个更精简、更高效的 AI 图像生成模型,可以在低成本硬件上运行。

[涨姿势] 新的 AI 图像生成器比 OpenAI 最好的工具快 8 倍,并且可以在廉价计算机上运行

一种新的人工智能(AI)工具可以在两秒内生成图像 - 并且不需要昂贵的硬件来运行。

韩国科学家使用了一种名为“知识蒸馏”的特殊技术来压缩名为“Stable Diffusion XL”的开源(或公开可用)图像生成模型的大小,该模型拥有 25.6 亿个参数,即人工智能在训练期间用来学习的变量。

新模型的最小版本被称为“KOALA”,只有 7 亿个参数,这意味着它足够精简,可以快速运行,而不需要昂贵且能源密集型的硬件。

相关:人工智能聊天机器人需要更好地记住事情。科学家们刚刚解决了他们可怕的记忆问题吗?

他们使用的方法是知识蒸馏,将知识从大型模型转移到较小的模型,理想情况下不会影响性能。较小模型的好处是执行计算和生成答案所需的时间较少。

该工具可以在低成本图形处理单元 (GPU) 上运行,并且需要大约 8GB RAM 来处理请求,而较大的模型则需要高端工业 GPU。

该团队于 2023 年 12 月 7 日在预印本数据库 arXiv 上发表了一篇论文,发表了他们的研究结果。他们还通过开源 AI 存储库 Hugging Face 提供了他们的工作成果。

新模型背后的机构电子电信研究所 (ETRI) 创建了五个版本,其中包括三个版本的“KOALA”图像生成器(根据文本输入生成图像)和两个版本的“Ko-LLaVA”——它可以通过图像或视频回答基于文本的问题。

他们测试KOALA时,它根据提示“宇航员在火星月下读书的图片”在1.6秒内生成了一张图像。根据一份声明,OpenAI 的 DALL·E 2 根据相同的提示在 12.3 秒内生成了一张图像,而 DALL·E 3 在 13.7 秒内生成了该图像。

科学家们现在计划将他们开发的技术整合到现有的图像生成服务、教育服务、内容制作和其他业务中。

您需要 登录账户 后才能发表评论

取消回复欢迎 发表评论:

关灯