革萌 发表于 2024-4-27 19:56

Sora的买家秀看起来不算是特别好评阿


这个生成效率比较逆天阿
估计当时CEO在线演示用了多路来并行生成

素盏鸣尊 发表于 2024-4-27 20:14

几天前有人说了,气球的颜色无法一致。输入无头人但会生出头,靠后期特效修掉的,花费了更多时间和钱。
就在刚刚国产sora模型 清华和生数开发的vidu除了时间短一点外。质量和sora不相上下,证明只要数据足够没有门槛。殖殖又要破防了。




utakata 发表于 2024-4-27 20:23

虽然我也认同sora现在肯定是中看不中用,但只说文中60s12天的效率这一个细节来说,正经商业影视/广告CG渲染要花的时间更久。

御坂MKII 发表于 2024-4-27 20:58

txt2img 现在都不能生成图层信息,难道还想着 txt2video 生成镜头位置信息吗

jojog 发表于 2024-4-27 21:05

这个成本有点难绷 说实话还不如stable diffusion那个东西了

不过听人说好像压根不是一个路线的技术……?

2的不轻 发表于 2024-4-27 21:12

这个生成视频的成本肯定很高,其实从限量测试就能看出来,成本不高就不用限量了
sora最大的问题应该还是成本,等sora成本降低到一定程度,对剪宣传片应该有一点用
营销号应该是看不上这个的,他们直接偷别人的视频剪辑是0成本,除非是那种“世界奇闻”之类的营销号可以用ai来造谣

诚司 发表于 2024-4-27 21:15

本帖最后由 诚司 于 2024-4-27 21:19 编辑

sora搞得这么神秘一看就是画饼的概率大

现在GPT4-20240409和大杯Claude差不多,不过Claude毕竟是openai润出来的人,齐头并进也还好。
但现在问题是llama3 70B就这么牛逼,llama3 400B虽然没练好,练好了我估计也不会开源,但meta可能已经是手里握着比openai更厉害的大模型的玩家了,而且开源声望极好
要是openai再拿不出来东西,可能真的要被meta干掉,meta可真的有的是资源和你耗,到时候拿边角料放出来一个llama 110B就能把openai干死

jojog 发表于 2024-4-27 21:26

诚司 发表于 2024-4-27 21:15
sora搞得这么神秘一看就是画饼的概率大

现在GPT4-20240409和大杯Claude差不多,不过Claude毕竟是openai润 ...

我觉得想多了

这东西现在的benchmark基本上就和产品没啥关系
哪怕400b性能比claude再上一个台阶没法变现也没什么卵用,还不如copilot写代码

meta最大的优势是算力,以及可以scratch掉一些纯靠scaling上去的模
但是在产品方面meta现在一坨到根本落不了地

LLM本地跑的门槛现在还是太高只能成为超能力者的玩具,
但是作为产品的话一旦人数上一个量级商业模式立刻就被负面意义上的拉爆
不作恶至少自己有个生态,Openai抱苹果大腿也有布局

这个泡沫被捅的时候估计第一个死的就是meta了

素盏鸣尊 发表于 2024-4-27 21:30

utakata 发表于 2024-4-27 20:23
虽然我也认同sora现在肯定是中看不中用,但只说文中60s12天的效率这一个细节来说,正经商业影视/广告CG渲染 ...

气球视频肯定传统实拍加特效更快。皮克斯一天渲染一帧花时间久,但质量上限和可控性sora比不了。

tyx776 发表于 2024-4-27 21:31

我看发布的时候的那女人走路的视频。走着走着脚都没了。这帮人怎么好意思大吹特吹的。

诚司 发表于 2024-4-27 21:43

jojog 发表于 2024-4-27 21:26
我觉得想多了

这东西现在的benchmark基本上就和产品没啥关系


往训练数据里塞刷榜的题的模型太多了才导致看起来benchmark和能力没关系,不刷榜的模型MMLU真的有用
我自己的task调了两三个月的prompt,llama3一发布,第二天早上bad case就解决了,相信有很多人和我一样的

meta和阿里之前的路子是打不过openai就往开源社区里发炸弹,炸openai,但llama 3和llama 2不一样,llama-3 70B是个核弹,他这82的MMLU不是刷的反而还低了,比DBRX、Qwen1.5和Command R+强到不知道哪里去了,而且比llama-3 8B几何倍地强,我不太怀疑llama-3 400B现在的86+ MMLU已经比GPT4明显地强了

至于什么产品,那是openai、anthropic、智谱和moonshot要考虑的,不是meta要考虑的,苹果无论是和openai合作还是和百度合作,meta发的核弹比买过来的都强他苹果何不自己用核弹呢,给别人送钱没必要

jojog 发表于 2024-4-27 22:10

诚司 发表于 2024-4-27 21:43
往训练数据里塞刷榜的题的模型太多了才导致看起来benchmark和能力没关系,不刷榜的模型MMLU真的有用
我自 ...

那不还是超能力者的玩具吗(非贬义)

这东西大家都在烧钱,筛数据也好scratch一次几十万刀也是用的最后是图啥

扎克伯格自己也说了性能更高的绝对不开源,但是他这个也没见做出个什么变现的东西呀
总不会是拿来做慈善的吧

革萌 发表于 2024-4-27 22:14

诚司 发表于 2024-4-27 21:43
往训练数据里塞刷榜的题的模型太多了才导致看起来benchmark和能力没关系,不刷榜的模型MMLU真的有用
我自 ...

70B得多大显存,报个数让我死心

倚酒依旧拔夷陵 发表于 2024-4-27 22:20

不懂就问,400B这么大的模型即使是使用,也不是小公司玩的起的吧?这得几百G的显存了,就算给小公司也布不起来玩吧

—— 来自 S1Fun

诚司 发表于 2024-4-27 22:20

本帖最后由 诚司 于 2024-4-27 22:28 编辑

jojog 发表于 2024-4-27 22:10
那不还是超能力者的玩具吗(非贬义)

这东西大家都在烧钱,筛数据也好scratch一次几十万刀也是用 ...
meta之前开源llama2就是因为打不过openai所以开源削弱领头羊,现在meta的能力已经能当领头羊了,扎伦伯格稍微放点力,发点核弹搞倾销,把openai、anthropic都干死,真的不是不可能的
他现在不但有llama-3这个水平,他还有400B的,不开源400B,他也可以放出来一个阉割版,反正对meta来说能干死别人不就得了,facebook不用llm也能活,openai不行

fat 发表于 2024-4-27 22:26

不懂就问,现在怎样体验llama-3 70B比较方便?

诚司 发表于 2024-4-27 22:27

革萌 发表于 2024-4-27 22:14
70B得多大显存,报个数让我死心

4bit量化的70B,四十多G显存就够了……两个3090或者魔改的2080ti而已
大模型推理根本不用多少显存,需要大量显存的是全量参数训练
一般参数是xB的模型,int8量化的显存是比xG多一些,不量化的情况的fp16显存大约是2xG,int4大约是x/2 G

全参数训练才是需要20xG的显存,QLORA的话能非常低,手机都能靠QLora训练8B模型的……

webashrat 发表于 2024-4-27 22:48

jojog 发表于 2024-4-27 21:05
这个成本有点难绷 说实话还不如stable diffusion那个东西了

不过听人说好像压根不是一个路线的技术……? ...

sora也是扩散模型

—— 来自 Xiaomi 2206123SC, Android 14上的 S1Next-鹅版 v3.0.0-alpha

此用户不存在 发表于 2024-4-27 23:10

我自己就是作类似研究的,看sora的demo就觉得有点科幻,纯cherry pick应该做不到这个级别

jojog 发表于 2024-4-27 23:11

诚司 发表于 2024-4-27 22:20
meta之前开源llama2就是因为打不过openai所以开源削弱领头羊,现在meta的能力已经能当领头羊了,扎伦伯格 ...

是这个理 但是干完了干啥……

jojog 发表于 2024-4-27 23:11

webashrat 发表于 2024-4-27 22:48
sora也是扩散模型

—— 来自 Xiaomi 2206123SC, Android 14上的 S1Next-鹅版 v3.0.0-alpha ...

啊?真和那个国内开源的一样吗………

webashrat 发表于 2024-4-28 22:31

jojog 发表于 2024-4-27 23:11
啊?真和那个国内开源的一样吗………

vidu也没开源啊

vidu架构是u-vit sora是dit
俩其实都差不多的

—— 来自 Xiaomi 2206123SC, Android 14上的 S1Next-鹅版 v3.0.0-alpha

lcn 发表于 2024-4-28 22:33

OpenAI的王炸也就这样了,利好出尽,坐等股崩

—— 来自 Xiaomi 23049RAD8C, Android 13上的 S1Next-鹅版 v3.0.0-alpha

哈扎马 发表于 2024-4-28 23:28

从大量素材中编制故事,而不是按照剧本严格拍摄

先射箭再画靶子是所有ai的通病,之前说一句一堆邪教徒扣我鹅,不过已经无所谓了——奥特曼在描绘人人有书念,治愈所有疾病,上宇宙,发现新物理学的未来,宗教最后一环许你天堂

Niceday 发表于 2024-4-29 00:27

诚司 发表于 2024-4-27 21:43
往训练数据里塞刷榜的题的模型太多了才导致看起来benchmark和能力没关系,不刷榜的模型MMLU真的有用
我自 ...

LLama 可精了,大公司可不让用的

nekomimimode 发表于 2024-4-29 01:09

“他们很意外的发现,创作者需要控制镜头来讲故事”
这还能是“意外的发现”,真就不做创作的脑袋就没这根弦是吧

泥潭小灰灰 发表于 2024-4-29 11:22


额。。。这段计算是怎么回事 怎么就十二天了

素盏鸣尊 发表于 2024-4-29 11:39

泥潭小灰灰 发表于 2024-4-29 11:22
额。。。这段计算是怎么回事 怎么就十二天了

渲染一秒一分钟。60秒60分钟。然后乘以300倍审核。18000分钟等于12.5天,影视工作室大部分不会三班倒,扣除下班时间实际工期需要一个月。

泥潭小灰灰 发表于 2024-4-29 11:41

素盏鸣尊 发表于 2024-4-29 11:39
渲染一秒一分钟。60秒60分钟。然后乘以300倍审核。18000分钟等于12.5天,影视工作室大部分不会三班倒,扣 ...

如此
页: [1]
查看完整版本: Sora的买家秀看起来不算是特别好评阿