金色财经报道,xAI 正式发布图像与文本生成视频模型 Grok Imagine Video 1.5,并在 API(grok-imagine-video-1.5)、网页端(grok.com/imagine)及移动客户端全量上线。
模型实现音视频一体化同步生成,在单次推理阶段同步产生音效、环境音与角色对话,提高语音清晰度并优化唇形同步。同时,模型改进了物理引擎与运动一致性,提升镜头长周期内物体运动与物理重量的可信度,减少画面扭曲等伪影。在生成速度上,轻量版 Video 1.5 Fast 生成 6 ...
金色财经报道,xAI 正式发布图像与文本生成视频模型 Grok Imagine Video 1.5,并在 API(grok-imagine-video-1.5)、网页端(grok.com/imagine)及移动客户端全量上线。
模型实现音视频一体化同步生成,在单次推理阶段同步产生音效、环境音与角色对话,提高语音清晰度并优化唇形同步。同时,模型改进了物理引擎与运动一致性,提升镜头长周期内物体运动与物理重量的可信度,减少画面扭曲等伪影。在生成速度上,轻量版 Video 1.5 Fast 生成 6 秒 720p 视频的耗时缩短至约 25 秒。
网页端配套工作流同步更新:新增项目管理(Projects)以分类整理素材,支持多智能体并行(Multiple Agents)运行多个提示词,并提供媒体库语义搜索(Search)。数字艺术家 David Thompson 团队使用 Grok Imagine 1.5 制作了完全由 AI 生成的电影预告片《Odyssey》。
**免责声明** 本站所提供的数字货币信息和建议仅供参考,并不构成投资建议。用户在进行数字货币交易时应充分了解市场风险,谨慎决策。平台不对用户的投资行为或损失承担责任。 **Copyright2025 数字货币资讯工具平台. All rights reserved.**
陇ICP备2024015685号-1