【OpenAI发布首个视频生成模型Sora:输文字出视频,1分钟流畅高清】2月16日凌晨,OpenAI再次扔出一枚深水炸弹,发布了首个文生视频模型Sora。据介绍,Sora可以直接输出长达60秒的视频,并且包含高度细致的背景、复杂的多角度镜头,以及富有情感的多个角色。#OpenAI宣布首个视频生成模型#
目前官网上已经更新了48个视频demo,在这些demo中,Sora不仅能准确呈现细节,还能理解物体在物理世界中的存在,并生成具有丰富情感的角色。该模型还可以根据提示、静止图像甚至填补现有视频中的缺失帧来生成视频。
例如一个Prompt(大语言模型中的提示词)的描述是:在东京街头,一位时髦的女士穿梭在充满温暖霓虹灯光和动感城市标志的街道上。
在Sora生成的视频里,女士身着黑色皮衣、红色裙子在霓虹街头行走,不仅主体连贯稳定,还有多镜头,包括从大街景慢慢切入到对女士的脸部表情的特写,以及潮湿的街道地面反射霓虹灯的光影效果。
电影预告片讲述了30岁宇航员戴着红色羊毛针织摩托车头盔的冒险经历,蓝天、盐漠,电影风格,35毫米胶片拍摄,色彩鲜艳。
AI想象中的龙年春节,红旗招展人山人海。有紧跟舞龙队伍抬头好奇观望的儿童,还有不少人掏出手机边跟边拍,海量人物角色各有各的行为。
竖屏超近景视角下,这只蜥蜴细节拉满。
网友直呼game over,工作要丢了;
甚至有人已经开始“悼念”一整个行业;
还有网友表示,电影业要彻底颠覆了。
一位YouTube博主Paddy Galloway发表了对Sora的感想,他表示内容创作行业已经永远的改变了,并且毫不夸张。“我进入YouTube世界已经15年时间,但OpenAI刚刚的展示让我无言…动画师/3D艺术家们有麻烦了,素材网站将变得无关紧要,任何人都可以无壁垒获得难以置信的产品,内容背后的‘想法’和故事将变得更加重要。”
对于Sora当前存在的弱点,OpenAI也不避讳,指出它可能难以准确模拟复杂场景的物理原理,并且可能无法理解因果关系。
例如“五只灰狼幼崽在一条偏僻的碎石路上互相嬉戏、追逐”,狼的数量会变化,一些凭空出现或消失。
该模型还可能混淆提示的空间细节,例如混淆左右,并且可能难以精确描述随着时间推移发生的事件,例如遵循特定的相机轨迹。
如提示词“篮球穿过篮筐然后爆炸”中,篮球没有正确被篮筐阻挡。
OpenAI表示,他们正在教AI理解和模拟运动中的物理世界,目标是训练模型来帮助人们解决需要现实世界交互的问题。
随后OpenAI解释了Sora的工作原理,Sora是一个扩散模型,它从类似于静态噪声的视频开始,通过多个步骤逐渐去除噪声,视频也从最初的随机像素转化为清晰的图像场景。Sora使用了Transformer架构,有极强的扩展性。
视频和图像是被称为“补丁”的较小数据单位集合,每个“补丁”都类似于GPT中的一个标记(Token),通过统一的数据表达方式,可以在更广泛的视觉数据上训练和扩散变化,包括不同的时间、分辨率和纵横比。
Sora是基于过去对DALL·E和GPT的研究基础构建,利用DALL·E 3的重述提示词技术,为视觉模型训练数据生成高描述性的标注,因此模型能更好的遵循文本指令。
如今,Sora正面向部分成员开放,以评估关键领域的潜在危害或风险。同时,OpenAI也邀请了一批视觉艺术家、设计师和电影制作人加入,期望获得宝贵反馈,以推动模型进步,更好地助力创意工作者。OpenAI提前分享研究进展,旨在与OpenAI以外的人士合作并获取反馈,让公众了解即将到来的AI技术新篇章。
目前官网上已经更新了48个视频demo,在这些demo中,Sora不仅能准确呈现细节,还能理解物体在物理世界中的存在,并生成具有丰富情感的角色。该模型还可以根据提示、静止图像甚至填补现有视频中的缺失帧来生成视频。
例如一个Prompt(大语言模型中的提示词)的描述是:在东京街头,一位时髦的女士穿梭在充满温暖霓虹灯光和动感城市标志的街道上。
在Sora生成的视频里,女士身着黑色皮衣、红色裙子在霓虹街头行走,不仅主体连贯稳定,还有多镜头,包括从大街景慢慢切入到对女士的脸部表情的特写,以及潮湿的街道地面反射霓虹灯的光影效果。
电影预告片讲述了30岁宇航员戴着红色羊毛针织摩托车头盔的冒险经历,蓝天、盐漠,电影风格,35毫米胶片拍摄,色彩鲜艳。
AI想象中的龙年春节,红旗招展人山人海。有紧跟舞龙队伍抬头好奇观望的儿童,还有不少人掏出手机边跟边拍,海量人物角色各有各的行为。
竖屏超近景视角下,这只蜥蜴细节拉满。
网友直呼game over,工作要丢了;
甚至有人已经开始“悼念”一整个行业;
还有网友表示,电影业要彻底颠覆了。
一位YouTube博主Paddy Galloway发表了对Sora的感想,他表示内容创作行业已经永远的改变了,并且毫不夸张。“我进入YouTube世界已经15年时间,但OpenAI刚刚的展示让我无言…动画师/3D艺术家们有麻烦了,素材网站将变得无关紧要,任何人都可以无壁垒获得难以置信的产品,内容背后的‘想法’和故事将变得更加重要。”
对于Sora当前存在的弱点,OpenAI也不避讳,指出它可能难以准确模拟复杂场景的物理原理,并且可能无法理解因果关系。
例如“五只灰狼幼崽在一条偏僻的碎石路上互相嬉戏、追逐”,狼的数量会变化,一些凭空出现或消失。
该模型还可能混淆提示的空间细节,例如混淆左右,并且可能难以精确描述随着时间推移发生的事件,例如遵循特定的相机轨迹。
如提示词“篮球穿过篮筐然后爆炸”中,篮球没有正确被篮筐阻挡。
OpenAI表示,他们正在教AI理解和模拟运动中的物理世界,目标是训练模型来帮助人们解决需要现实世界交互的问题。
随后OpenAI解释了Sora的工作原理,Sora是一个扩散模型,它从类似于静态噪声的视频开始,通过多个步骤逐渐去除噪声,视频也从最初的随机像素转化为清晰的图像场景。Sora使用了Transformer架构,有极强的扩展性。
视频和图像是被称为“补丁”的较小数据单位集合,每个“补丁”都类似于GPT中的一个标记(Token),通过统一的数据表达方式,可以在更广泛的视觉数据上训练和扩散变化,包括不同的时间、分辨率和纵横比。
Sora是基于过去对DALL·E和GPT的研究基础构建,利用DALL·E 3的重述提示词技术,为视觉模型训练数据生成高描述性的标注,因此模型能更好的遵循文本指令。
如今,Sora正面向部分成员开放,以评估关键领域的潜在危害或风险。同时,OpenAI也邀请了一批视觉艺术家、设计师和电影制作人加入,期望获得宝贵反馈,以推动模型进步,更好地助力创意工作者。OpenAI提前分享研究进展,旨在与OpenAI以外的人士合作并获取反馈,让公众了解即将到来的AI技术新篇章。
发张图表达此刻的心情啊啊啊啊,后来我在这里偶然看到了哥哥WeChat background的五只可爱小生灵,2019年哥哥毕业的时候给我留了毕业典礼的珍贵亲友席位置,然而我没有去,因此愧疚得一个多月没和哥哥说话。但是2020年的时候哥哥带着鲜花飞过来参加我的毕业典礼啊啊啊啊啊啊啊啊啊晚上还被我看到抱着电脑加班。打工以后微博成了工作苦水博,脑海里闪现的过去时光是我心底永远的宝藏和力量,我拥有很多爱我要勇敢地往前走 https://t.cn/AigL3Cvj
那里的暮色像画的一样,天空像微风吹起的波光粼粼的湖面般,有兰色的背景,稀疏的云彩像白色的绵缎点缀在那兰色的背景里,夕阳的余辉却染红了那白色的绵缎,一切似乎一动也不动。不远处的一片枫林火红火红的,再远点三五颗高大的法桐高高低低的叠在那儿,心形的叶子多是呈黄色,只树的顶端还残存着片片的绿。一颗银杏独自儿被裁植在旁边,三支木棒斜跨支撑着,金黄色的叶子已落得稀稀疏疏,黄色的果果便很显眼的露着,你是树的领舞者?人说银杏是植物界的活着的古化石,古化石能有如此的美?亭亭玉立?人工湖的曲桥上一家三口爬在栏杆上,那小女娃儿偷偷地在喂鱼,偶尔笑几声。曲桥的另一边湖面上的五只水鸭在水中游来游去的,我就在想桥两边被隔开了?鸭子不吃鱼吗?呵呵,闲吃萝卜淡操心啊。大概还未到那个时间点,广场上的人稀稀落落,没有舞曲和乐的吵杂哄闹声,一切皆静悄悄的。风景这边独好。
手机里播放着陈彦的巜主角》的小说,听着熟悉的方言,偶尔还唱段秦腔。听着忆秦娥曲折迭荡的人生,感概于小说即是生活,人物生活于现实中,又高于现实的生活,又有艺术的魅力,生活与艺术交错,梦幻与现实相映,在肉欲与灵魂间,主角与配角间交替转换,乾坤挪移,时代潮流,生老病死。命运要眷顾一个苦命的人,这个人首先自己得有一颗不屈于命运的顽强拼搏进取的精气神。
有时候觉得人生不就是主角配角吗?主角也罢,龙套也好,人的一生大概永远也没有猪一般的快乐,思想与欲望永远存留,让人永远的千方百计。
如忆秦娥般的人生,我们似乎也有重叠之处。有些不必你担的责任你担了,必有人抱怨你,说你傻,但你的确没办法,就算是装B吧,你也必须装,从此装出无所谓的样子,而你真正在呼的不在于装,在呼于你不装也许真的要发生你永远不想看见的事,它会伤许多人的心,于是就装了,可有时候为什么还那么难过呢?我突然想起了王宝强出演的《人在囧途》中的一段台词,我愿意上当受骗,受骗了才好呢,受骗了说明人没病。
现实就是现实,现实太美是梦,现实太残酷也是梦,当你认为一切可能水到渠成时,认为已是煮熟的鸭子时,它却照样飞走了,你能真以为是梦,现实是这是残酷的梦,但你还必须去面对,因为有时候生活就是这样,逼你到无力反抗,这时候说什么励志的话都是惘然。
秋去冬来,花开花落,孔夫子曾在泗水河边感慨说,逝者如斯夫,不舍昼夜,有没有谁见过静止不动的河水吗?看见过静止不支动的白云吗?就因为它们会移动,所以那些美好的事物才会来到你身边,一切的一切都来的,又会走的,如果不走也会变的,与其看着那些曾经让你快乐的事情变质,不如带着微笑送他们离开⋯。爷爷的遗像永远的停留在那一刻,满脸的胡茬,参差不齐,奶奶的笑容永远的停留在那一刻。但有时候不敢去面对,怕去梦见,远远的凝视之⋯。
生命原本是一场漂泊的单行线,你去过的每个地方,见过的每个人,最终将成为驿站,成为过客。喜欢追忆,大概是老了迹象吧。一切都不会让你再特别的感动,也不会让你再激怒,或者让你泪水涟涟。你大概会知道了成长究竟付出了什么。
人生如戏,戏如人生?忆秦娥在一番泪流满面后又重新回归舞台,把放羊娃简单美好的记忆永远地留在了风中⋯。
蒋捷在一剪梅中写道:何日归家洗客袍?银字笙调,心字烧香,流光容易把人抛,红了樱桃,绿了芭蕉。
手机里播放着陈彦的巜主角》的小说,听着熟悉的方言,偶尔还唱段秦腔。听着忆秦娥曲折迭荡的人生,感概于小说即是生活,人物生活于现实中,又高于现实的生活,又有艺术的魅力,生活与艺术交错,梦幻与现实相映,在肉欲与灵魂间,主角与配角间交替转换,乾坤挪移,时代潮流,生老病死。命运要眷顾一个苦命的人,这个人首先自己得有一颗不屈于命运的顽强拼搏进取的精气神。
有时候觉得人生不就是主角配角吗?主角也罢,龙套也好,人的一生大概永远也没有猪一般的快乐,思想与欲望永远存留,让人永远的千方百计。
如忆秦娥般的人生,我们似乎也有重叠之处。有些不必你担的责任你担了,必有人抱怨你,说你傻,但你的确没办法,就算是装B吧,你也必须装,从此装出无所谓的样子,而你真正在呼的不在于装,在呼于你不装也许真的要发生你永远不想看见的事,它会伤许多人的心,于是就装了,可有时候为什么还那么难过呢?我突然想起了王宝强出演的《人在囧途》中的一段台词,我愿意上当受骗,受骗了才好呢,受骗了说明人没病。
现实就是现实,现实太美是梦,现实太残酷也是梦,当你认为一切可能水到渠成时,认为已是煮熟的鸭子时,它却照样飞走了,你能真以为是梦,现实是这是残酷的梦,但你还必须去面对,因为有时候生活就是这样,逼你到无力反抗,这时候说什么励志的话都是惘然。
秋去冬来,花开花落,孔夫子曾在泗水河边感慨说,逝者如斯夫,不舍昼夜,有没有谁见过静止不动的河水吗?看见过静止不支动的白云吗?就因为它们会移动,所以那些美好的事物才会来到你身边,一切的一切都来的,又会走的,如果不走也会变的,与其看着那些曾经让你快乐的事情变质,不如带着微笑送他们离开⋯。爷爷的遗像永远的停留在那一刻,满脸的胡茬,参差不齐,奶奶的笑容永远的停留在那一刻。但有时候不敢去面对,怕去梦见,远远的凝视之⋯。
生命原本是一场漂泊的单行线,你去过的每个地方,见过的每个人,最终将成为驿站,成为过客。喜欢追忆,大概是老了迹象吧。一切都不会让你再特别的感动,也不会让你再激怒,或者让你泪水涟涟。你大概会知道了成长究竟付出了什么。
人生如戏,戏如人生?忆秦娥在一番泪流满面后又重新回归舞台,把放羊娃简单美好的记忆永远地留在了风中⋯。
蒋捷在一剪梅中写道:何日归家洗客袍?银字笙调,心字烧香,流光容易把人抛,红了樱桃,绿了芭蕉。
✋热门推荐