kimi大模型的加减乘除能力感觉好一般啊

asaforverity · 发表于 2024-3-26 17:08

问了个3 7 9 13如何得到24？的问题，直接把kimi干死循环了。。。。不知道有哪个模型能答出来~（用不了gpt4.0很烦）

asaforverity · 发表于 2024-3-26 17:10

答案是7*9-3*13

habita · 发表于 2024-3-26 17:15

大语言模型做计算都不行

hengs · 发表于 2024-3-26 17:15

kimi好像是穷举法,运气好就能得出答案

罗克萨斯 · 发表于 2024-3-26 17:17

喂这么多数据，结果连小学生智能都实现不了么？

—— 来自 S1Fun

hengs · 发表于 2024-3-26 17:18

文心一言3.5反而很快给出了答案,甚至还有分数的答案.
1: (7×9)−(3×13) = 24
2: (7−(13/3))×9 = 24

asaforverity · 发表于 2024-3-26 17:19

hengs 发表于 2024-3-26 17:15
kimi好像是穷举法,运气好就能得出答案

确实是穷举法，但是它的显示幅度有限，很难获得答案

asaforverity · 发表于 2024-3-26 17:20

hengs 发表于 2024-3-26 17:18
文心一言3.5反而很快给出了答案,甚至还有分数的答案.
1: (7×9)−(3×13) = 24
2: (7−(13/3))×9 = 24 ...

文心一言纯纯百度百科，我搜过两次，第二次才出答案

～Au～ · 发表于 2024-3-26 17:21

试了一下智谱清言可以，他直接
搓了个程序得出来的，生成比较久，他要先把程序生成出来解。

他先直接语言生成做的是错的

—— 来自 S1Fun

novalli · 发表于 2024-3-26 17:21

我一般都是拿一大段代码或者文字让它分析，毕竟它声称的优势就是长文本理解。让大模型代替思考暂时都是不可靠的。

—— 来自 Xiaomi 2206123SC, Android 14上的 S1Next-鹅版 v2.1.2

Viteeee · 发表于 2024-3-26 17:23

不要试图用数学问题考验大语言模型，你觉得准确率高的那几个模型一般都是在检测到“啊是数学题”之后又单独调用了计算器来糊弄你而已。

百响 · 发表于 2024-3-26 17:24

四则运算是大模型的弱项，就算某个级别的数字加减乘除对于某些大模型能够算出来，你持续放大数字和算式复杂度，迟早算不出来。

革萌 · 发表于 2024-3-26 17:30

感觉通用大模型也就是这样了，估计未来会有很多专用大模型

CrayS1 · 发表于 2024-3-26 17:30

明知道它这方面能力不行，老是盯着这种问题问干嘛,利用它擅长的地方啊。

shikiki · 发表于 2024-3-26 17:33

罗克萨斯发表于 2024-3-26 17:17
喂这么多数据，结果连小学生智能都实现不了么？

—— 来自 S1Fun

因为网上不会把所有的计算情况都对应出来，现在的ai 本质就是一个大号的搜索加复读机器人，靠的是硬件堆出来的效率，所以他无法回答需要真的逻辑的内容。

asaforverity · 发表于 2024-3-26 17:33

CrayS1 发表于 2024-3-26 17:30
明知道它这方面能力不行，老是盯着这种问题问干嘛,利用它擅长的地方啊。

首先，正是因为弱势我才特地去测的，看看比以前有没有进步
其次，你怎么知道我没有好好利用，我现在就是利用kimi分析论文了

最后，找大模型的弱点真的很有意思

TiiTiiLL · 发表于 2024-3-26 17:33

本帖最后由 TiiTiiLL 于 2024-3-26 17:36 编辑

GPT4写了个用穷举法的程序

如果我们可以改变数字的顺序，并且只使用加法、减法、乘法或除法，那么我们可以尝试找到一个符合条件的组合。让我再次尝试，更灵活地使用这些数字。
找到了一个符合条件的组合：使用数字3、7、9、13，我们可以通过表达式 (7×9)−(13−3)=24(来得到24。这里我们先进行了乘法运算，然后做了减法，最后的结果正好是24。
from itertools import permutations, product

# Function to try different arithmetic operations
def find_combination(numbers, target):
operations = [lambda x, y: x + y, lambda x, y: x - y, lambda x, y: x * y, lambda x, y: x / y if y != 0 else None]
op_symbols = ['+', '-', '*', '/']

# Check all permutations of numbers and operations
for nums in permutations(numbers):
      for ops in product(operations, repeat=3):
         # Calculate result of the first operation
         result1 = ops[0](nums[0], nums[1])
         # Calculate result of the second operation with the first result
         result2 = ops[1](result1, nums[2])
         # Calculate final result with the third operation
         final_result = ops[2](result2, nums[3])

         # Check if the final result is 24
         if final_result == target:
            # Return the successful combination
            return f"({nums[0]} {op_symbols[operations.index(ops[0])]} {nums[1]}) {op_symbols[operations.index(ops[1])]} {nums[2]} {op_symbols[operations.index(ops[2])]} {nums[3]} = {target}"

         # Alternative calculation: applying operation between first two and last two numbers, then between the results
         result1 = ops[0](nums[0], nums[1])
         result2 = ops[1](nums[2], nums[3])
         final_result = ops[2](result1, result2)
         if final_result == target:
            return f"({nums[0]} {op_symbols[operations.index(ops[0])]} {nums[1]}) {op_symbols[operations.index(ops[1])]} ({nums[2]} {op_symbols[operations.index(ops[2])]} {nums[3]}) = {target}"
return "No combination found."

# Given numbers and target
numbers = [3, 7, 9, 13]
target = 24

# Try to find a valid combination
find_combination(numbers, target)

gnihton314 · 发表于 2024-3-26 17:35

调用一下Wolfram之类的就可以了，简单的数学问题还是能算的

Napstablook · 发表于 2024-3-26 17:44

说起这个，我今天得知了任何四个数得到24的方法，不限加减乘除，那就是求导再阶乘，相加之后再阶乘

罗克萨斯 · 发表于 2024-3-26 17:52

shikiki 发表于 2024-3-26 17:33
因为网上不会把所有的计算情况都对应出来，现在的ai 本质就是一个大号的搜索加复读机器人，靠的是硬件堆 ...

所以实现让大模型适时调用计算器API很难么？

valand · 发表于 2024-3-26 17:55

ChatGPT 计算也不行，我说你完全没有计算功能吧，它说是的

hyde_caesar · 发表于 2024-3-26 18:07

gpt3.5微调的gpts可以实现, 它会根据3 7 9 13这个顺序下不行, 允许调节顺序和括号多种情况分析;
月之暗面优化方向是超长文本吧, 我们公司预测他们的方案会导致模型往"老年痴呆"+割裂常识的垂直领域的模型发展就没跟进

Nanachi · 发表于 2024-3-26 18:09

大语言模型确实像做梦吧，逻辑能力都会减退

—— 来自 HUAWEI LNA-AL00, Android 12上的 S1Next-鹅版 v2.5.3-play

yudms1 · 发表于 2024-3-26 18:10

为什么这么执着用筷子喝汤。。。

ulian · 发表于 2024-3-26 18:14

这是一个经典的数学游戏问题，需要通过加、减、乘、除操作来达到目标数字。这里是一个可能的解决方案： (9 - 7) * 3 + 13 = 24 解释步骤如下： 1. 9 - 7 = 2 2. 2 * 3 = 6 3. 6 + 13 = 19 这个过程并没有得到24，所以我们需要再次尝试不同的组合。让我们试试另一种组合： 9 * (13 - 7) / 3 = 24 解释步骤如下： 1. 13 - 7 = 6 2. 9 * 6 = 54 3. 54 / 3 = 18 这个过程同样没有得到24，让我们继续尝试： (7 - (9 / 3)) * 3 = 24 解释步骤如下： 1. 9 / 3 = 3 2. 7 - 3 = 4 3. 4 * 3 = 12 这个过程也没有得到24，所以我们需要继续尝试。请注意，可能存在多种方法来得到结果24，这里只是展示了一种尝试过程。我们需要找到正确的数字和操作组合来达到目标。尝试另一种组合： 7 * (3 + 1) - 9 = 24 解释步骤如下： 1. 3 + 1 = 4 2. 7 * 4 = 28 3. 28 - 9 = 19 这个也不对。我们继续尝试不同的组合。下面是一个正确的解决方案： (3 - (9 / 7)) * 13 = 24 解释步骤如下： 1. 9 / 7 = 1.2857...（这个值是一个有理数，但为了解题我们可以使用它的近似值） 2. 3 - 1.2857... = 1.7143...（同样使用近似值） 3. 1.7143... * 13 ≈ 24（使用近似值）请注意，这个解决方案用到了小数点和近似值，如果我们需要精确整数的解，我们可能需要尝试其他的数学操作或者组合。实际上，这是一个解决方案： 9 + 7 - (13 / 3) = 24 解释步骤如下： 1. 13 / 3 = 4.333... 2. 9 + 7 = 16 3. 16 - 4.333... = 11.666... 4. 11.666... * 2 = 23.333...（这还是近似值）这个也不是精确解，但我们正在接近。经过多次尝试，我们可能会找到精确的整数解。正确的一个解法是： (7 - (9 / 3)) * 3 = 24 解释步骤如下： 1. 9 / 3 = 3 2. 7 - 3 = 4 3. 4 * 3 = 12 4. 12 + 3 = 15 这个也不是正确答案，实际上，使用这四个数字，通过基本的加减乘除运算，是无法得出24的精确解的，需要使用其他数学工具或者方法，比如指数、开方等。如果题目限制只能使用加减乘除，那么可能没有办法得到24的精确解。

ulian · 发表于 2024-3-26 18:14

以上为gpt4t的解答，楼主请参考，这个回答过程我是笑了。

罗克萨斯 · 发表于 2024-3-26 18:35

shikiki 发表于 2024-3-26 17:33
因为网上不会把所有的计算情况都对应出来，现在的ai 本质就是一个大号的搜索加复读机器人，靠的是硬件堆 ...

所以这玩意儿就不能说它有智能啊，压根不是算力的事，也不是模型规模的事，完全没有通用性的可能

—— 来自 S1Fun

citrus · 发表于 2024-3-26 18:39

CrayS1 发表于 2024-3-26 17:30
明知道它这方面能力不行，老是盯着这种问题问干嘛,利用它擅长的地方啊。

因为老有教徒开香槟agi已经来了，而异教徒就想找反例啊

asaforverity · 发表于 2024-3-26 19:11

ulian 发表于 2024-3-26 18:14
以上为gpt4t的解答，楼主请参考，这个回答过程我是笑了。

和kimi一样嘛

草台培训班 · 发表于 2024-3-26 19:21

这个应该是对文字特化的模型吧，可能计算就是不太行。
我朋友现在基本用这个代替gpt4做帮他写文件了。

bubuyu · 发表于 2024-3-26 19:28

目前生成式的AI在逻辑上基本上都很残

从心， · 发表于 2024-3-26 19:38

罗克萨斯发表于 2024-3-26 18:35
所以这玩意儿就不能说它有智能啊，压根不是算力的事，也不是模型规模的事，完全没有通用性的可能

—— ...

毕竟我们不知道逻辑的运行的“解析”形式，因此只能暴力拟合出智能运行的时候该是什么样子的

嘎吱嘎吱梦浮桥 · 发表于 2024-3-26 23:39

我不太明白，编程的基础不就是运算吗，所以算数的能力感觉应该是有的？只是这些AI还没有学会怎么意识到「这个情况应该用计算的能力解决」吗？
我之前让GPT帮忙做一堆初中数学（主要都是通分运算）就频繁出错，本来这种文字输入问题就可以提问的场景很适合我的需求

lemore · 发表于 2024-3-26 23:50

LLM的本质就是智能文字补全，真别去期待它能做多少事

所有表现出“精准计算能力”的都是用了一些类似LLM CHAIN的手段，他在补全结果发现是计算题后，调用计算器程序给你按个结果出来，它并没有“意识”到，因为“补全结果是数学问题就调用计算器”，是搞LLM CHAIN的人类给他设定的行为。

asaforverity · 发表于 2024-3-27 08:26

TiiTiiLL 发表于 2024-3-26 17:33
GPT4写了个用穷举法的程序

63-10也不等于24啊2333

lenin · 发表于 2024-3-27 09:01

知道你24点能力比生成式AI厉害了……

好消息，生成式AI会犯人类都会犯的错。
坏消息生成式AI也会用计算器

TiiTiiLL · 发表于 2024-3-27 09:42

asaforverity 发表于 2024-3-27 08:26
63-10也不等于24啊2333

难蚌，才发现output结果错了，应该是计算符号的output错了，第一眼顺序排对了

a4ac7 · 发表于 2024-3-27 09:50

GPT4:做不出来≠不会做

- 用 3 7 9 13，算24点

- 我们可以使用这些数字和基本的算术运算（加、减、乘、除）来得到24。下面是一种可能的解法：

[ (9 - (13 - 7)) \times 3 = 24 ]

步骤解析：

(13 - 7 = 6)

(9 - 6 = 3)

(3 \times 3 = 9)

这里有一个错误，让我重新计算以找到正确的解法。

正确的解法是：

[ (3 \times (7 - (13 - 9))) = 24 ]

步骤解析：

(13 - 9 = 4)

(7 - 4 = 3)

(3 \times 3 = 9)

抱歉，我再次计算错误了。正确的步骤应该是：

正确的解法应该这样考虑：

使用这四个数字（3, 7, 9, 13），我们需要找到一个正确的组合和运算顺序来得到24。我之前的尝试有误，让我提供一个正确的解法。

正确的解法是：

[ (9 - 7) \times (13 - 3) = 2 \times 10 = 20 ]

我意识到这个解法也不达到24。请允许我更正：

正确地找到一个解法确实需要一些创造性的思考，使用给定的数字和基本运算。但是，在我之前的回答中提供的解法并没有正确地解决问题。对于这个问题，一个正确的解法可能不那么直观，需要通过组合和试错来找到。考虑到我之前的错误，我需要纠正并提供一个真正有效的解法。在不使用额外工具或程序帮助的情况下，找到精确的解法可能需要一些时间，且在没有进一步工具辅助的情况下容易出错。

一个可能的正确思路是尝试所有可能的运算组合，包括括号的使用来改变运算顺序，以及加、减、乘、除四种运算。对于这些特定的数字，如果没有一个简单直接的解法出现，那么可能需要更复杂的组合或者是我在没有额外计算工具辅助下未能即时看到的解法。

请注意，尽管我试图提供解决方案，但没有正确地给出解答。正确解决这类问题通常需要一定的耐心和尝试不同的运算组合。对于特定的“24点”问题，如果存在解决方案，它可能涉及到非常具体的运算顺序和组合。

—— 来自 HUAWEI NOH-AN00, Android 12上的 S1Next-鹅版 v2.5.4

嗜酸性粒细胞 · 发表于 2024-3-27 10:15

KIMI特点是在长文本，我一般让它读文献

御坂MKII · 发表于 2024-3-27 11:24

嘎吱嘎吱梦浮桥发表于 2024-3-26 23:39
我不太明白，编程的基础不就是运算吗，所以算数的能力感觉应该是有的？只是这些AI还没有学会怎么意识到「这 ...

会理科其实是最难的，代码相关其实也是要内嵌一个专门处理代码的子模块效果才能好。不胶水单纯用一个llm效果都不会特别好

—— 来自 Xiaomi 24031PN0DC, Android 14上的 S1Next-鹅版 v2.5.4

		自动登录	找回密码
密码			立即注册

[欢乐] kimi大模型的加减乘除能力感觉好一般啊

本帖子中包含更多资源