四大推理大模型数学与编程能力评测 Grok3、Claude3 7、DeepSeep R1、o3 mini high 到底谁的推理能力最强?
Автор: 马克的技术工作坊
Загружено: 2025-02-27
Просмотров: 708
四大推理大模型数学与编程能力评测 - Grok3、Claude3.7、DeepSeep-R1、o3-mini-high 到底谁的推理能力最强? #DeepSeek-R1 #DeepSeek #ChatGPT #OpenAI #o3-mini-high #Claude3.7 #Claude #Anthropic #Grok #Grok3 #评测 #数学 #推理 #编程 #代码
时间轴
00:00 四大推理模型简要介绍
01:00 评测内容介绍
02:35 算法题目介绍
03:08 DeepSeek-R1做中等难度算法题
03:37 o3-mini-high 做中等难度算法题
04:03 Grok3 做中等难度算法题
04:39 Claude 3.7 做中等难度算法题
05:04 DeepSeek-R1做困难难度算法题
05:28 o3-mini-high 做困难难度算法题
05:54 Grok3 做困难难度算法题
06:10 Claude 3.7 做困难难度算法题
07:21 DeepSeek-R1 写思维导图
10:14 o3-mini-high 写思维导图
11:09 Grok3 写思维导图
12:39 Claude 3.7 写思维导图
16:08 DeepSeek-R1 写迷宫游戏
17:52 o3-mini-high 写迷宫游戏
19:04 Grok3 写迷宫游戏
22:11 Claude 3.7 写迷宫游戏
23:05 评测总结
Доступные форматы для скачивания:
Скачать видео mp4
-
Информация по загрузке: