字节跳动大模型产品
Depth Anything系列的最新开源续作,将单目深度估计的能力扩展至任意视角。
面向多模态Agent场景进行定向优化,工具调用能力、复杂指令遵循能力及OS Agent能力显著增强,大幅提升了模型在多模态场景下的表现,日均tokens调用量已超过50万亿。
可以从未经处理的单张图像生成高精度3D模型,在纹理和材质生成性能方面超过此前的开源及闭源模型,几何生成性能也超过业界更大参数规模的模型。
字节跳动开源的模型,参数规模达360亿,命名呼应OpenAI的GPT - OSS系列,在数学推理方面表现出色,其4B模型的数学推理能力接近235B模型。
字节跳动的AI助手,与抖音、剪映等核心产品深度绑定。