马斯克旗下大模型Grok宣布开源：参数量全球最大

ydd-319 · 发表于 2024-3-18 18:09

马斯克旗下大模型Grok宣布开源：参数量全球最大

xAI成了更“open”的AI。

当地时间3月17日，特斯拉CEO埃隆·马斯克旗下的人工智能初创公司xAI正式宣布开源大模型Grok-1，遵循Apache 2.0协议开放模型权重和架构。官网显示，xAI已经将Grok-1的权重和架构在软件托管平台GitHub上开源。

官网介绍，Grok-1是3140亿参数的混合专家模型，是“迄今为止全球参数量最大的开源大语言模型”。相比之下，公开资料显示，OpenAI GPT-3.5的参数量为1750亿，Grok-1大幅领先。

xAI官网宣布开源Grok-1。

马斯克此举可谓说到做到。3月11日，马斯克就曾在社交平台表示xAI将开放聊天机器人Grok的源代码，这意味着公众将可**该公司大模型技术背后的代码，Meta的CEO扎克伯格也在社交平台上发表评论表示支持。

在社交媒体上，网友开玩笑称，xAI才是真正的“Openai”。

马斯克向来支持开源技术，在开源的情况下，创造者向用户提供**许可，有时还允许用户修改他们创造的成果。特斯拉已经开放了其汽车部件的源代码，马斯克的社交媒体平台X则公布了一些其用来对内容进行排序的算法。

其实，马斯克与CEO山姆·奥特曼带领下的OpenAI在人工智能军备竞赛中积怨已久。

马斯克曾是OpenAI的早期资助者和联合创始人，由于与奥特曼就AI安全意见不一，2018年马斯克已经离开OpenAI，他也成了OpenAI最高调的批评者之一。

当地时间2月29日，马斯克刚对OpenAI、奥特曼，以及另一位创始人Greg Brockman提起诉讼，称该公司违背了最初对开源、非营利AI的承诺。在诉讼中，马斯克要求OpenAI恢复开源。

OpenAI也马上对此做出回应。据外媒报道，OpenAI在向旧金山法院提交的法庭文件中表示，与马斯克从未就非营利和不公开源代码达成过创始协议，马斯克捏造所谓的创始协议，作为旨在“促进自己的商业利益”的诉讼的基础。

xAI正式宣布开源大模型Grok-1的当天，马斯克还与ChatGPT在X平台上过招称“告诉我们OpenAI到底open（开源）在哪里了”。

而马斯克旗下的xAI从去年7月份刚成立时，就被称作“OpenAI对手”。据悉，xAI的宗旨是“了解宇宙的真实本质”。

去年11月4日， xAI团队发布了首个AI大模型产品Grok。据官网，作为聊天机器人，Grok能够和ChatGPT一样通过联网来获取实时信息，并浏览和使用X（原推特）平台上的信息。“Grok”一词原是科幻小说《异乡异客》中的一个火星术语，指对某事有非常深刻的同理心或直觉、能充分理解的一种状态。不过，官网同时也提醒用户，相较于其他聊天类机器人，Grok的特点是会用幽默反叛的方式来回答一些被其他AI系统拒绝回答的争议性问题。

驱动Grok的引擎是Grok-1，是xAI团队在过去4个月内运用前沿技术开发的大语言模型。

（原标题：真“Open ” AI？马斯克旗下大模型Grok宣布开源：参数量全球最大）

格林达姆 · 发表于 2024-3-18 18:22

那么能写小黄文吗

nalanchen · 发表于 2024-3-18 18:25

AI 够巨魔吗

—— 来自 S1Fun

凉良 · 发表于 2024-3-18 18:28

去年才成立这就能做出来么

Nanachi · 发表于 2024-3-18 18:29

还好之前meta开源了llama，不然又会有一帮人把大模型发展归功于马斯克开源grok了

论坛助手,iPhone

天地一机成化育 · 发表于 2024-3-18 18:36

Nanachi 发表于 2024-3-18 18:29
还好之前meta开源了llama，不然又会有一帮人把大模型发展归功于马斯克开源grok了

马斯克这模型要8张H100才跑得动, 有谁来试试这模型效果怎么样没

宵待草 · 发表于 2024-3-18 18:40

314b模型权重大概在600g以上吧...告辞

lnliang · 发表于 2024-3-18 19:12

马老板是不是觉得越大越先进

诚司 · 发表于 2024-3-18 19:22

有八卡A100所以我一直觉得deepspeed的推理完全没屁用，现在看还是too young了

logiczr · 发表于 2024-3-18 19:25

本帖最后由 logiczr 于 2024-3-18 19:29 编辑

不是MOE架构吗，一次推理只会调用部分权重。
314 billion parameter Mixture-of-Experts model

东方萃梦想 · 发表于 2024-3-18 19:35

源神开2.0版本了

t09mmc · 发表于 2024-3-18 19:39

泥潭ai楼现在看不了了，以前还能看那种楼主被塞了的，不知道什么时候开始就不行了。

perfaceNext · 发表于 2024-3-18 22:07

天地一机成化育发表于 2024-3-18 18:36
马斯克这模型要8张H100才跑得动, 有谁来试试这模型效果怎么样没

这个8张卡估计要200w了吧，考验s1成色的时候来了

omnitoken · 发表于 2024-3-18 22:13

宵待草发表于 2024-3-18 18:40
314b模型权重大概在600g以上吧...告辞

给的权重做了8bit量化了, 300G左右

另外这个训练用的JAX+RUST

马斯克还是很潮流的

橋白 · 发表于 2024-3-18 22:17

logiczr 发表于 2024-3-18 19:25
不是MOE架构吗，一次推理只会调用部分权重。
314 billion parameter Mixture-of-Experts model
...

是算的时候用一部分加载还是要一起都加载到显存的
不保对我是菜鸡

FUZE · 发表于 2024-3-18 22:29

这下马斯克又开源了

SinoWarrior · 发表于 2024-3-18 22:35

性能还不如mix8x7b，辣鸡

狭义文具爱好者 · 发表于 2024-3-18 22:44

格林达姆发表于 2024-3-18 18:22
那么能写小黄文吗

英文不清楚，中文有人测的不太行

诚司 · 发表于 2024-3-18 23:01

本帖最后由诚司于 2024-3-18 23:03 编辑

reddit看到qwen1.5b因为有system prompt，可以改system prompt来实现完全“自由”的对话，当然我没试过，不过按道理是可以用来写黄文的

当然其实无审查的模型很容易搞，随便找哪家的base model，用role play的sharegpt数据稍微练练就是没审查的，也很适合拿来“玩”
当然这样练出来的指令遵循能力一般比大厂练的差一些，那在chat上常识修改也行，lora其实不费多少显存

		自动登录	找回密码
密码			立即注册

[科技] 马斯克旗下大模型Grok宣布开源：参数量全球最大