Stage1st

 找回密码
 立即注册
搜索
查看: 1382|回复: 3
打印 上一主题 下一主题

[科技] ChatGPT劲敌现身:长文理解准确率超99%

[复制链接]
     
跳转到指定楼层
楼主
发表于 2024-3-6 14:14 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
ChatGPT劲敌现身:长文理解准确率超99%

当地时间3月4日,美国人工智能初创公司Anthropic发布最新大模型Claude 3系列,该系列包含Claude 3 Opus(著作)、Claude 3 Sonnet (十四行诗)、Claude 3 Haiku(俳句)三个版本。其中,Claude 3 Opus是Anthropic最强大的新模型,在行业基准测试中的表现优于OpenAI的GPT-4和谷歌的Gemini Ultra大模型。这家初创企业过去一年融资五笔,总额约73亿美元,由OpenAI前高级成员创立,获得了谷歌和亚马逊的支持。
可总结15万个单词,长文语境理解准确率超99%
Anthropic表示,Claude3系列是目前市面上速度最快、性能最好的人工智能模型,在推理、数学、编程、多语言理解和视觉方面树立了新的行业基准。
其中,Claude 3 Opus是Anthropic最强大的新模型,在行业基准测试中的表现优于OpenAI的GPT-4和谷歌的Gemini Ultra大模型,尤其在大规模多任务语言理解数据集(MMLU)、研究生级别的谷歌验证问答基准(GPQA)、数学评测集(GSM8K)、编程多语言测试(HumanEval)等方面均超越了GPT-4和Gemini。
      

Claude 3 模型与同行大模型在行业基准测试中的表现
Anthropic在官网公布了Claude 3模型与其他模型在多项性能基准上的比较数据。数据显示,在MMLU上,Claude 3 Opus得到86.8%的得分,而GPT-4得到86.4%。一些差距则较大,例如在编程多语言测试上,Claude 3 Opus得到84.9%的得分,而GPT-4得到67%,这或意味着Claude 3 Opus对于新手学编程的更友好。
此外,Claude 3能够总结高达15万个单词,而ChatGPT只能总结大约3000个单词。用户可以输入大量数据集,并要求Claude 3以备忘录、信件或故事的形式进行总结,这一能力使得Claude 3在处理长文本方面超过ChatGPT。其中,Claude 3 Opus对于长文的语境理解准确率超99%,“在某些情况下甚至能识别出有哪些词句是人为插入到原始文本中的。”Anthropic在官网提到。

Claude 3 Opus对长文理解的准确度
Claude 3系列中的Haiku能在3秒内读取arXiv(arXiv是一个收集物理学、数学、计算机科学、生物学论文预印本网站)上一篇数据密集的研究论文,并附带图表和图形。

Claude 3强大的视觉能力  
值得一提的是,与前几代模型相比,这也是Anthropic首次提供多模态支持,允许用户上传图片、文档、图表和其他类型的非结构化数据进行分析和回答,但Claude 3不能生成图像。
不过,Anthropic也在官网最后表示,尽管与之前发布的大模型相比,Claude3在生物知识、网络知识和自主性等相关指标上有所进步,但它仍处于人工智能安全等级2 (ASL-2)。Claude红队评估得出的结论是,目前这些模型带来灾难性风险的可能性非常小,但公司会持续监测未来的模型。
Anthropic拒绝透露训练Claude 3花了多长时间,也不愿透露花了多少钱。目前,Claude 3 Opus和Claude 3 Sonnet 已在全球159个国家上线,用户可在 Claude.ai 中使用,Claude 3 Haiku也将很快与公众见面。
Anthropic总裁丹妮拉·阿莫代(Daniela Amodei)表示,如果客户需要处理最复杂的认知任务,比如准确处理复杂的财务分析,他们会选择Claude 3 Opus,尽管价格更高。据路透社报道,Claude 3 Opus对输入的每100万token收取15美元。相比之下,OpenAI对其GPT-4 Turbo模型中输入的每100万token收费10美元。而Sonnet和Haiku比Claude 3 Opus更便宜。
创始人系OpenAI前高级成员,过往一年融资73亿美元
Anthropic是美国的人工智能初创公司,由OpenAI前高级成员丹妮拉·阿莫代和达里奥·阿莫代(Dario Amodei )兄妹于 2021 年创立,后者曾担任OpenAI研究副总裁。

Anthropic公司
据外媒报道,Anthropic公司创始人之一达里奥·阿莫代领导的一群研究人员因对OpenAI发展方向产生分歧而离开OpenAI,他们担心微软对OpenAI的首次投资会使其走上更加商业化的道路,从而偏离其最初对高级人工智能安全性的关注。
达里奥·阿莫代在领英上的介绍包括他曾担任Open AI研究副总裁和谷歌高级研究科学家。在OpenAI,达里奥·阿莫代从2016年工作到2020年,负责监督公司GPT-2和GPT-3语言模型的创建。
丹妮拉·阿莫代在创办Anthropic公司之前曾在Stripe担任风险经理,负责监管运营、用户政策和承保。后来成为OpenAI安全与政策副总裁,在确保人工智能技术的安全和道德使用方面发挥了关键作用。
Anthropic这家初创该公司将自己的产品定位为比ChatGPT更安全的替代品。过去一年Anthropic完成五笔融资,总额约73亿美元。据《金融时报》报道,谷歌在2023年2月向Anthropic投资约3亿美元。亚马逊公司于2023年9月向Anthropic投资40亿美元,作为战略合作伙伴关系的一部分。
亚马逊公司在一份新闻稿中表示,亚马逊计划在其产品和服务中使用Anthropic的人工智能技术,而Anthropic将依赖亚马逊网络服务作为其主要的云服务,并协助亚马逊开发其定制的人工智能芯片。亚马逊表示,作为交易的一部分,它将获得这家人工智能初创公司的"少数股权",但没有提供更多细节。

回复

使用道具 举报

头像被屏蔽
     
2#
发表于 2024-3-6 14:17 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

     
3#
发表于 2024-3-6 14:24 | 只看该作者
这个玩意的中文名不翻译成“诗云”是说不过去的吧
回复

使用道具 举报

     
4#
发表于 2024-3-6 14:26 来自手机 | 只看该作者
这家的反应速度太慢了

—— 来自 samsung SM-G9910, Android 14上的 S1Next-鹅版 v2.5.4
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|Archiver|上海互联网违法和不良信息举报中心|网上有害信息举报专区|962110 反电信诈骗|举报电话 021-62035905|stage1st 沪ICP备13020230号-1 沪公网安备 31010702007642号

GMT+8, 2024-5-4 00:28 , Processed in 0.021827 second(s), 6 queries , Gzip On, Redis On.

Powered by Discuz! X3.4

© 2001-2017 Comsenz Inc.

快速回复 返回顶部 返回列表