kimi大模型的加减乘除能力感觉好一般啊

asaforverity · 发表于 2024-3-26 17:08

问了个3 7 9 13如何得到24？的问题，直接把kimi干死循环了。。。。不知道有哪个模型能答出来~（用不了gpt4.0很烦）

yuanxi1 · 发表于 2024-3-28 18:38

人类的智能本来就是多模块混合体，譬如听说读写这四个功能都是能独立损坏的，为什么要求一个人工智能靠一个模型就能全能

yudms1 · 发表于 2024-3-28 18:35

猫踏飞燕发表于 2024-3-28 18:18
因为有人吹AI取代数学家物理学家了https://bbs.saraba1st.com/2b/thread-2176486-1-1.html
...

这种弱智言论理他干嘛，从来都是人淘汰人，哪有工具会淘汰人的

猫踏飞燕 · 发表于 2024-3-28 18:18

yudms1 发表于 2024-3-26 18:10
为什么这么执着用筷子喝汤。。。

因为有人吹AI取代数学家物理学家了https://bbs.saraba1st.com/2b/thread-2176486-1-1.html

御坂MKII · 发表于 2024-3-28 18:09

本帖最后由御坂MKII 于 2024-3-28 18:11 编辑

嘎吱嘎吱梦浮桥发表于 2024-3-28 17:06
我以为这些模型在学人类说话之前就已经在学习那些运算函数了，毕竟那些是纯粹只有逻辑没有感情的东西，原 ...

都是后面偷偷胶水粘个子模块，现在这些大模型一个用处就是作为自然语言的接口，做些汇总推理转换成偏结构化的语言然后塞给子模块。
就类似你用自然语言很随意的说了一堆，然后它可以对上下文理解然后推导出你是说了一堆数学或者代码，然后再转接给专攻数学/编程的子模块进行下一步。什么时候它自己可以自己生成并解释代码片段了，什么时候就真的会数学和编程，也就能当agi了

hzhh95963 · 发表于 2024-3-28 17:28

嘎吱嘎吱梦浮桥发表于 2024-3-28 17:06
我以为这些模型在学人类说话之前就已经在学习那些运算函数了，毕竟那些是纯粹只有逻辑没有感情的东西，原 ...

你先看看现在的机器翻译是什么原理，就是基于统计训练模型，然后根据你给的文本，找出目标语言里面匹配概率最高的文本。哪有什么逻辑推理

大语言模型也是一回事啊，根据你的问题找出最高概率的回答

嘎吱嘎吱梦浮桥 · 发表于 2024-3-28 17:28

宵待草发表于 2024-3-28 17:24
对，没有能力，大模型做的是“猜下一个词(token)”。目前让大模型调用库/访问网络/使用工具是靠agent实现 ...

原来我对于现在流行的对话AI的底层逻辑的理解就有问题
感谢这个楼

宵待草 · 发表于 2024-3-28 17:24

嘎吱嘎吱梦浮桥发表于 2024-3-28 17:06
我以为这些模型在学人类说话之前就已经在学习那些运算函数了，毕竟那些是纯粹只有逻辑没有感情的东西，原 ...

对，没有能力，大模型做的是“猜下一个词(token)”。目前让大模型调用库/访问网络/使用工具是靠agent实现的。

ffcloudy · 发表于 2024-3-28 17:13

泥潭人均陶哲轩

嘎吱嘎吱梦浮桥 · 发表于 2024-3-28 17:06

御坂MKII 发表于 2024-3-27 11:24
会理科其实是最难的，代码相关其实也是要内嵌一个专门处理代码的子模块效果才能好。不胶水单纯用 ...

我以为这些模型在学人类说话之前就已经在学习那些运算函数了，毕竟那些是纯粹只有逻辑没有感情的东西，原来不是这样吗？所以它们本身没有调用任何一种编程语言里的现成的函数库的能力是这样吗

御坂MKII · 发表于 2024-3-28 03:47

guyfawkes 发表于 2024-3-28 01:57
数学运算不能单独加载一个模块吗？

效果好的一般都是这么搞的，单纯看要不要他们想不想粘胶水打榜。而且现在其实 WolframAlpha 也有 llm 前端来做自然语言为输入了。真的以算东西为目的直接用 WolframAlpha 就行

guyfawkes · 发表于 2024-3-28 01:57

数学运算不能单独加载一个模块吗？

月神夜 · 发表于 2024-3-28 01:32

hyde_caesar 发表于 2024-3-26 18:07
gpt3.5微调的gpts可以实现, 它会根据3 7 9 13这个顺序下不行, 允许调节顺序和括号多种情况分析;
月之暗面优 ...

为啥会导向老年痴呆+割裂常识的垂直领域模型啊

—— 来自 S1Fun

widder · 发表于 2024-3-27 21:09

数学才能体现出真正的智慧，这对人是这样，对AI也是一样

aaabbbccc__ · 发表于 2024-3-27 20:47

ycjiang1337 发表于 2024-3-27 18:14
AI有没有能力跟编程基础是运算有什么关系？

加减法都做不对哪来的逻辑

osb2in · 发表于 2024-3-27 20:10

提示: 作者被禁止或删除内容自动屏蔽

ycjiang1337 · 发表于 2024-3-27 18:14

嘎吱嘎吱梦浮桥发表于 2024-3-26 23:39
我不太明白，编程的基础不就是运算吗，所以算数的能力感觉应该是有的？只是这些AI还没有学会怎么意识到「这 ...

AI有没有能力跟编程基础是运算有什么关系？

暗示我7酱 · 发表于 2024-3-27 17:54

kimi我让他排个序都做不到。。

—— 来自 Xiaomi 23113RKC6C, Android 14上的 S1Next-鹅版 v2.5.4

御坂MKII · 发表于 2024-3-27 11:24

嘎吱嘎吱梦浮桥发表于 2024-3-26 23:39
我不太明白，编程的基础不就是运算吗，所以算数的能力感觉应该是有的？只是这些AI还没有学会怎么意识到「这 ...

会理科其实是最难的，代码相关其实也是要内嵌一个专门处理代码的子模块效果才能好。不胶水单纯用一个llm效果都不会特别好

—— 来自 Xiaomi 24031PN0DC, Android 14上的 S1Next-鹅版 v2.5.4

嗜酸性粒细胞 · 发表于 2024-3-27 10:15

KIMI特点是在长文本，我一般让它读文献

a4ac7 · 发表于 2024-3-27 09:50

GPT4:做不出来≠不会做

- 用 3 7 9 13，算24点

- 我们可以使用这些数字和基本的算术运算（加、减、乘、除）来得到24。下面是一种可能的解法：

[ (9 - (13 - 7)) \times 3 = 24 ]

步骤解析：

(13 - 7 = 6)

(9 - 6 = 3)

(3 \times 3 = 9)

这里有一个错误，让我重新计算以找到正确的解法。

正确的解法是：

[ (3 \times (7 - (13 - 9))) = 24 ]

步骤解析：

(13 - 9 = 4)

(7 - 4 = 3)

(3 \times 3 = 9)

抱歉，我再次计算错误了。正确的步骤应该是：

正确的解法应该这样考虑：

使用这四个数字（3, 7, 9, 13），我们需要找到一个正确的组合和运算顺序来得到24。我之前的尝试有误，让我提供一个正确的解法。

正确的解法是：

[ (9 - 7) \times (13 - 3) = 2 \times 10 = 20 ]

我意识到这个解法也不达到24。请允许我更正：

正确地找到一个解法确实需要一些创造性的思考，使用给定的数字和基本运算。但是，在我之前的回答中提供的解法并没有正确地解决问题。对于这个问题，一个正确的解法可能不那么直观，需要通过组合和试错来找到。考虑到我之前的错误，我需要纠正并提供一个真正有效的解法。在不使用额外工具或程序帮助的情况下，找到精确的解法可能需要一些时间，且在没有进一步工具辅助的情况下容易出错。

一个可能的正确思路是尝试所有可能的运算组合，包括括号的使用来改变运算顺序，以及加、减、乘、除四种运算。对于这些特定的数字，如果没有一个简单直接的解法出现，那么可能需要更复杂的组合或者是我在没有额外计算工具辅助下未能即时看到的解法。

请注意，尽管我试图提供解决方案，但没有正确地给出解答。正确解决这类问题通常需要一定的耐心和尝试不同的运算组合。对于特定的“24点”问题，如果存在解决方案，它可能涉及到非常具体的运算顺序和组合。

—— 来自 HUAWEI NOH-AN00, Android 12上的 S1Next-鹅版 v2.5.4

TiiTiiLL · 发表于 2024-3-27 09:42

asaforverity 发表于 2024-3-27 08:26
63-10也不等于24啊2333

难蚌，才发现output结果错了，应该是计算符号的output错了，第一眼顺序排对了

lenin · 发表于 2024-3-27 09:01

知道你24点能力比生成式AI厉害了……

好消息，生成式AI会犯人类都会犯的错。
坏消息生成式AI也会用计算器

asaforverity · 发表于 2024-3-27 08:26

TiiTiiLL 发表于 2024-3-26 17:33
GPT4写了个用穷举法的程序

63-10也不等于24啊2333

lemore · 发表于 2024-3-26 23:50

LLM的本质就是智能文字补全，真别去期待它能做多少事

所有表现出“精准计算能力”的都是用了一些类似LLM CHAIN的手段，他在补全结果发现是计算题后，调用计算器程序给你按个结果出来，它并没有“意识”到，因为“补全结果是数学问题就调用计算器”，是搞LLM CHAIN的人类给他设定的行为。

嘎吱嘎吱梦浮桥 · 发表于 2024-3-26 23:39

我不太明白，编程的基础不就是运算吗，所以算数的能力感觉应该是有的？只是这些AI还没有学会怎么意识到「这个情况应该用计算的能力解决」吗？
我之前让GPT帮忙做一堆初中数学（主要都是通分运算）就频繁出错，本来这种文字输入问题就可以提问的场景很适合我的需求

从心， · 发表于 2024-3-26 19:38

提示: 作者被禁止或删除内容自动屏蔽

bubuyu · 发表于 2024-3-26 19:28

目前生成式的AI在逻辑上基本上都很残

草台培训班 · 发表于 2024-3-26 19:21

这个应该是对文字特化的模型吧，可能计算就是不太行。
我朋友现在基本用这个代替gpt4做帮他写文件了。

asaforverity · 发表于 2024-3-26 19:11

ulian 发表于 2024-3-26 18:14
以上为gpt4t的解答，楼主请参考，这个回答过程我是笑了。

和kimi一样嘛

citrus · 发表于 2024-3-26 18:39

CrayS1 发表于 2024-3-26 17:30
明知道它这方面能力不行，老是盯着这种问题问干嘛,利用它擅长的地方啊。

因为老有教徒开香槟agi已经来了，而异教徒就想找反例啊

罗克萨斯 · 发表于 2024-3-26 18:35

shikiki 发表于 2024-3-26 17:33
因为网上不会把所有的计算情况都对应出来，现在的ai 本质就是一个大号的搜索加复读机器人，靠的是硬件堆 ...

所以这玩意儿就不能说它有智能啊，压根不是算力的事，也不是模型规模的事，完全没有通用性的可能

—— 来自 S1Fun

ulian · 发表于 2024-3-26 18:14

以上为gpt4t的解答，楼主请参考，这个回答过程我是笑了。

ulian · 发表于 2024-3-26 18:14

这是一个经典的数学游戏问题，需要通过加、减、乘、除操作来达到目标数字。这里是一个可能的解决方案： (9 - 7) * 3 + 13 = 24 解释步骤如下： 1. 9 - 7 = 2 2. 2 * 3 = 6 3. 6 + 13 = 19 这个过程并没有得到24，所以我们需要再次尝试不同的组合。让我们试试另一种组合： 9 * (13 - 7) / 3 = 24 解释步骤如下： 1. 13 - 7 = 6 2. 9 * 6 = 54 3. 54 / 3 = 18 这个过程同样没有得到24，让我们继续尝试： (7 - (9 / 3)) * 3 = 24 解释步骤如下： 1. 9 / 3 = 3 2. 7 - 3 = 4 3. 4 * 3 = 12 这个过程也没有得到24，所以我们需要继续尝试。请注意，可能存在多种方法来得到结果24，这里只是展示了一种尝试过程。我们需要找到正确的数字和操作组合来达到目标。尝试另一种组合： 7 * (3 + 1) - 9 = 24 解释步骤如下： 1. 3 + 1 = 4 2. 7 * 4 = 28 3. 28 - 9 = 19 这个也不对。我们继续尝试不同的组合。下面是一个正确的解决方案： (3 - (9 / 7)) * 13 = 24 解释步骤如下： 1. 9 / 7 = 1.2857...（这个值是一个有理数，但为了解题我们可以使用它的近似值） 2. 3 - 1.2857... = 1.7143...（同样使用近似值） 3. 1.7143... * 13 ≈ 24（使用近似值）请注意，这个解决方案用到了小数点和近似值，如果我们需要精确整数的解，我们可能需要尝试其他的数学操作或者组合。实际上，这是一个解决方案： 9 + 7 - (13 / 3) = 24 解释步骤如下： 1. 13 / 3 = 4.333... 2. 9 + 7 = 16 3. 16 - 4.333... = 11.666... 4. 11.666... * 2 = 23.333...（这还是近似值）这个也不是精确解，但我们正在接近。经过多次尝试，我们可能会找到精确的整数解。正确的一个解法是： (7 - (9 / 3)) * 3 = 24 解释步骤如下： 1. 9 / 3 = 3 2. 7 - 3 = 4 3. 4 * 3 = 12 4. 12 + 3 = 15 这个也不是正确答案，实际上，使用这四个数字，通过基本的加减乘除运算，是无法得出24的精确解的，需要使用其他数学工具或者方法，比如指数、开方等。如果题目限制只能使用加减乘除，那么可能没有办法得到24的精确解。

yudms1 · 发表于 2024-3-26 18:10

为什么这么执着用筷子喝汤。。。

Nanachi · 发表于 2024-3-26 18:09

大语言模型确实像做梦吧，逻辑能力都会减退

—— 来自 HUAWEI LNA-AL00, Android 12上的 S1Next-鹅版 v2.5.3-play

hyde_caesar · 发表于 2024-3-26 18:07

gpt3.5微调的gpts可以实现, 它会根据3 7 9 13这个顺序下不行, 允许调节顺序和括号多种情况分析;
月之暗面优化方向是超长文本吧, 我们公司预测他们的方案会导致模型往"老年痴呆"+割裂常识的垂直领域的模型发展就没跟进

valand · 发表于 2024-3-26 17:55

ChatGPT 计算也不行，我说你完全没有计算功能吧，它说是的

罗克萨斯 · 发表于 2024-3-26 17:52

shikiki 发表于 2024-3-26 17:33
因为网上不会把所有的计算情况都对应出来，现在的ai 本质就是一个大号的搜索加复读机器人，靠的是硬件堆 ...

所以实现让大模型适时调用计算器API很难么？

Napstablook · 发表于 2024-3-26 17:44

说起这个，我今天得知了任何四个数得到24的方法，不限加减乘除，那就是求导再阶乘，相加之后再阶乘

		自动登录	找回密码
密码			立即注册

osb2in osb2in 当前离线禁止发言精华 \| 战斗力鹅 \| 回帖 0 注册时间 2023-5-24 头像被屏蔽	发表于 2024-3-27 20:10 来自手机 \| 显示全部楼层提示: 作者被禁止或删除内容自动屏蔽

	回复使用道具举报

从心，从心，当前离线禁止发言精华 \| 战斗力鹅 \| 回帖 0 注册时间 2021-3-8 头像被屏蔽	发表于 2024-3-26 19:38 \| 显示全部楼层提示: 作者被禁止或删除内容自动屏蔽

	回复使用道具举报

[欢乐] kimi大模型的加减乘除能力感觉好一般啊