以DALL·E为例:
CLIP模型:将文本与图像关联成向量
扩散模型:从噪点图逐步“去噪”生成细节
对抗训练:生成器与判别器博弈优化逼真度
模型参数量超百亿,学习10亿+图文对抽象概念关联。
文章来源:
十万个为什么
版权声明:除非特别标注,否则均为本站原创文章,转载时请以链接形式注明文章出处。
以DALL·E为例:
CLIP模型:将文本与图像关联成向量
扩散模型:从噪点图逐步“去噪”生成细节
对抗训练:生成器与判别器博弈优化逼真度
模型参数量超百亿,学习10亿+图文对抽象概念关联。
上一篇为什么5G比4G快百倍?
下一篇电脑做监控支持多少路
还木有评论哦,快来抢沙发吧~