2 月 16 日凌晨,也就是中国大年初七,OpenAI 在 AI 生成视频领域扔出一枚“王炸”,宣布推出全新的生成式人工智能模型“Sora”。
这家旧金山公司周四推出的该工具使用生成人工智能,根据书面命令立即创建短视频。
Sora 并不是第一个展示这种技术的产品。但行业分析师指出,该工具迄今为止展示的视频质量很高,并指出它的推出标志着 OpenAI 和文本到视频生成的未来的整体重大飞跃。
尽管如此,与当今快速发展的人工智能领域的所有事物一样,此类技术也引发了人们对潜在道德和社会影响的担忧。
Sora 是一款文本到视频生成器 - 使用生成式 AI 根据书面提示创建长达 60 秒的视频。该模型还可以从现有的静态图像生成视频。
生成式人工智能是人工智能的一个分支,可以创造新的东西。示例包括聊天机器人(如 OpenAI 的 ChatGPT)以及图像生成器(如 DALL-E 和 Midjourney)。让人工智能系统生成视频是更新且更具挑战性的,但依赖于一些相同的技术。
OpenAI 在周四(2 月 15 日)的博客文章中表示, Sora可以根据用户的文本提示创建长达一分钟的视频。
OpenAI 在帖子中表示:“我们正在教人工智能理解和模拟运动中的物理世界,目的是训练模型来帮助人们解决需要现实世界交互的问题。”
OpenAI 在帖子中补充道:“Sora 能够生成具有多个角色、特定类型的运动以及主题和背景的准确细节的复杂场景。” “该模型不仅了解用户在提示中提出的要求,还了解这些东西在物理世界中的存在方式。”
此外,根据该帖子,生成式人工智能模型可以基于单个图像创建视频,以及扩展现有视频或填充缺失的帧。
Sora 尚未可供公众使用(OpenAI 表示,在正式发布该工具之前,它正在与政策制定者和艺术家进行接触),而且还有很多我们不知道的事情。但自周四宣布以来,该公司已经分享了一些 Sora 生成的视频示例,以展示其功能。
OpenAI 首席执行官 Sam Altman 还利用 X(以前称为Twitter 的平台)要求社交媒体用户及时发送想法。后来,他分享了逼真详细的视频,这些视频响应了“两只金毛猎犬在山顶上播客”和“在海洋上与不同动物进行自行车比赛,运动员在无人机摄像机视图下骑自行车”等提示。
虽然 Sora 生成的视频可以描绘复杂、极其详细的场景,但 OpenAI 指出仍然存在一些弱点,包括一些空间和因果元素。例如,OpenAI 在其网站上补充道,“一个人可能会咬一口饼干,但之后,饼干可能没有咬痕。”
OpenAI 的 Sora 并不是同类产品中的第一个。谷歌、Meta 和初创公司 Runway ML 等公司都展示了类似的技术。
企业介绍:
深圳市捷易科技有限公司成立于2013年,高新技术企业,专精专新科技企业,总部位于广东省深圳市。
捷易科技品牌专注于人工智能领域,主营英伟达数据中心+AI服务器、大模型训练与微调解决方案,致力于成为行业领先的人工智能智算解决方案商。
本公司旗下捷易物联品牌专注于人工智能视觉技术、门禁安防等业务,多年来得到客户的好评,获得多项荣誉。
捷易科技重视科研和人才,与清华大学深圳研究院等建立联合实验室或开展科研合作。公司员工90%以上的研发人员具有研究生以上学历,丰富的人才资源为捷易从研发到生产的全栈式人工智能创新体系奠定了坚实基础,使其能日益增强行业内领先的AI能力。
产品简介:
产品系列Ⅰ:捷易全球供应正品AI服务器及配件:英伟达H100等整机服务器,交换机,IB卡,光模块,线缆等配件
产品系列Ⅱ:大模型训练与微调解决方案
产品系列Ⅲ:GPU算力租赁
产品系列Ⅳ:全球数据集群中心、机房运维
产品系列Ⅴ:云产品及解决方案(LASS)
24小时热线:4008688669
网站:https://www.jaeaiot.com/
地址:深圳市南山区高新北六道清华信息港科研楼207
注:图片源于网络