开源生成式AI模型公司
暂无相关动态更新
这是一个在CLIP空间中进行材料重组和混合的方法,通过在CLIP空间中找到材料嵌入来控制预训练的文本到图像模型,以编辑图像中的物体材料。
这是一个结构化评估框架,将电影制作控制形式化为四个解耦的、分层的分类法:设置、事件、照明和摄像机。
这是一个新的开源文本到音频模型,使用Creative Commons数据训练,性能在多个指标上与当前最先进的技术相当。
这是一个框架,用于从单目输入生成配对的RGB和运动部件视频。
这是一个多视图视频扩散模型,用于动态3D内容生成。SV4D 2.0在鲁棒性、泛化能力和输出质量方面都有显著提升。
这是Stability AI的最新图像生成模型,包括Large、Large Turbo 和Medium版本。该模型具有高效性能和可定制性,支持多样化输出和多种功能。