Stage1st

 找回密码
 立即注册
搜索
12
返回列表 发新帖
楼主: 天穹观测者
打印 上一主题 下一主题

[欢乐] 李彦宏内部讲话:大模型开源意义不大,百度绝不抢开发...

[复制链接]
     
41#
发表于 2024-4-12 09:56 来自手机 | 只看该作者
王怡人 发表于 2024-4-11 22:20
我印象中看过海思架构师通过成本反推认为文心免费版使用的模型最多只有6B的参数, 因为百度明显不打算在大 ...

现在非常尴尬的是文心4和GLM4有来有回,但是GLM4可以免费用…

—— 来自 HUAWEI ALN-AL80, Android 12上的 S1Next-鹅版 v2.5.4
回复

使用道具 举报

     
42#
发表于 2024-4-12 09:58 来自手机 | 只看该作者
诚司 发表于 2024-4-11 23:05
文心一言最开始版本据说是用bert结构实现的,毕竟千帆上就叫ERNIE-Bot,那拉胯很正常,和T5坐一桌。现在 ...

到底谁先传的用BERT…能用BERT结构做生成任务那可比GPT还牛逼了

—— 来自 HUAWEI ALN-AL80, Android 12上的 S1Next-鹅版 v2.5.4
回复

使用道具 举报

     
43#
发表于 2024-4-12 10:10 | 只看该作者
百度、阿里、腾讯已经切入到我们这个细分行业里了,做垂直领域的行业大模型,确实是有人买单的
回复

使用道具 举报

     
44#
发表于 2024-4-12 10:11 | 只看该作者
ycjiang1337 发表于 2024-4-12 09:58
到底谁先传的用BERT…能用BERT结构做生成任务那可比GPT还牛逼了

—— 来自 HUAWEI ALN-AL80, Android 12 ...

我没深入用过最初版的文心一言,也没详细比过
不过T5的对话版,硬说的话也没那么烂,2023了也都还有codeT5+这样的工作,code summary方面也还可以的
回复

使用道具 举报

     
45#
发表于 2024-4-12 10:15 | 只看该作者
做第一个开源的人有意义,做第二个还有什么用吗
回复

使用道具 举报

     
46#
发表于 2024-4-12 10:27 | 只看该作者
llm开源的一大尴尬点是大部分科研势的资源finetune一个7B的模型就够呛了,企业那种规模的llm连做inference都够呛,开源了后基本就是企业间相互白嫖
回复

使用道具 举报

     
47#
发表于 2024-4-12 10:28 | 只看该作者
别的没用过不好说,但贴吧包打听是真的弱智AI,完全就是编一段内容瞎回复
回复

使用道具 举报

     
48#
发表于 2024-4-12 10:35 | 只看该作者
开源的抄就完事了,的确不用抢
回复

使用道具 举报

     
49#
发表于 2024-4-12 10:40 | 只看该作者
TiiTiiLL 发表于 2024-4-12 10:27
llm开源的一大尴尬点是大部分科研势的资源finetune一个7B的模型就够呛了,企业那种规模的llm连做inference ...

7B和33B以上真的天差地别的,特别是long context
lora finetune 33B其实没这么废资源,QLora那更是了,72B的用QLora其实才70G显存,消费级的卡几张就够了

不过全参明显学术界和开源届就没跟上,或者没想去跟,megatron的代码用来训练llm的开源资料少得可怜,开源的遍地deepspeed,明显都是lora训的
不过megatron方面开源的也是阿里比较多,Qwen72B也开源,Pai-megatron-Path也开源,阿里这是化身铁拳要打爆大模型初创公司是吧
回复

使用道具 举报

     
50#
发表于 2024-4-12 11:01 | 只看该作者
开源是为了培养用户抢生态,打破高性能ai模型的垄断。闭源你做不到前列,用户就差一大截了。你要是低价促销就覆盖不了研发费用,那还不如开源赚点吆喝呢
回复

使用道具 举报

     
51#
发表于 2024-4-12 11:41 来自手机 | 只看该作者
搭车问下,普通搬砖码农办公用,现在文心一言付费版值得吗?和gpt4比咋样?
回复

使用道具 举报

52#
发表于 2024-4-12 13:11 | 只看该作者
TiiTiiLL 发表于 2024-4-12 10:27
llm开源的一大尴尬点是大部分科研势的资源finetune一个7B的模型就够呛了,企业那种规模的llm连做inference ...

就那些组,一个组才8张a100,还要养几个博士生,llm还是算了吧

llm是真富哥的玩意儿,没卡那就是上那美克星之前的孙悟空,有卡就是弗利萨

没卡的我看都转向llm evaluation这个赛道了,说白了就是个上游模型商抓虫罢了,免费的beta tester
回复

使用道具 举报

     
53#
发表于 2024-4-12 15:56 | 只看该作者
mimighost 发表于 2024-4-12 13:11
就那些组,一个组才8张a100,还要养几个博士生,llm还是算了吧

llm是真富哥的玩意儿,没卡那就是上那美克 ...

大部分院校的情况是8张A100整个院排队用
回复

使用道具 举报

     
54#
发表于 2024-4-12 17:19 | 只看该作者
本帖最后由 Aerooxx 于 2024-4-12 17:20 编辑
焚舟 发表于 2024-4-12 11:41
搭车问下,普通搬砖码农办公用,现在文心一言付费版值得吗?和gpt4比咋样? ...

直接智谱清言GLM4啊,免费,CodeGeex也是免费的,看另一个码农代码辅助楼评价不错
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|Archiver|上海互联网违法和不良信息举报中心|网上有害信息举报专区|962110 反电信诈骗|举报电话 021-62035905|stage1st 沪ICP备13020230号-1 沪公网安备 31010702007642号

GMT+8, 2024-4-30 07:27 , Processed in 0.026478 second(s), 5 queries , Gzip On, Redis On.

Powered by Discuz! X3.4

© 2001-2017 Comsenz Inc.

快速回复 返回顶部 返回列表