实测美团 LongCat：快到极致，但是别说追平 DeepSeek-脚本导航

> 自媒体 > （AI）人工智能 > 实测美团 LongCat：快到极致，但是别说追平 DeepSeek

实测美团 LongCat：快到极致，但是别说追平 DeepSeek

来源：AI科技评论

2025-09-07 13:57:01

141

管理

一个偏稳，一个偏快，风格差别非常明显。就这个问题而言，确实 LongCat-Flash-Chat 的反应让人更爽。

这种快究竟能有多快呢？从数据上，它在 H800 硬件上达到了单用户超过100 tokens/秒的生成速度，同时输出成本低至5元/百万 token 。这一速度显著超越了许多主流模型，如同期 Llama 3 的80 tokens/秒（单卡 RTX 4090 ），以及 DeepSeek-V3.1 和 Gemini 2.5 Pro 的约40 tokens/秒（需多张高端 GPU ）。所以反应这块儿，LongCat-Flash-Chat 一马当先。

但一旦到了稍微烧脑一点的推理，LongCat-Flash-Chat 的短板就暴露无遗：回答显得太用力，好像把能想到的角度全都堆上去，结果信息太满，重点反而模糊，看完容易觉得负担大。

相比之下，DeepSeek 的答案就灵活得多。一上来就抓住“但丁”的双关点，从“人名”和“转折词”两个角度切入，再结合“中国话”的语境延展，还顺手补了点背景知识。

逻辑层层递进，不仅解释清楚，还带点机智感和趣味性，读起来轻松顺畅。

而 DeepSeek 的思路则扎实得多。它没有停留在表面罗列背景，而是一步步扣住细节，把父亲为什么会因为“半红半绿的 8”察觉到异常推理出来。

它先是注意到数字“38”被改成“88”，但女儿可能用了不同颜色的笔去修改，导致“8”的上下半部分颜色不一致。接着，它进一步分析父亲当下的反应：愤怒其实源于对女儿作弊行为的震惊与失望，而不是单纯的数字错误。

随后，DeepSeek 又追溯更深层的原因——父亲一直把女儿视作“自己的一部分”，因此对成绩失败格外敏感，当发现“女儿的 8 是一半红一半绿”时，这种错位不仅打破了他长期的认知，还让他猛然意识到自己对孩子教育和情感沟通上的失败，从而情绪崩溃。

换句话说，DeepSeek 并没有停在标签的堆砌上，而是顺着“数字—颜色—父亲反应—心理冲击”这样一条完整的逻辑链条展开。解释过程紧密，因果清晰，也更贴近原故事本身。

再测试模型的抗污染能力，两家的差距同样明显。

在“逸一时，误一世”这句话的测试里，LongCat-Flash-Chat 依旧走的是“百科式”作答。它会把各种可能性一股脑抛出来，信息量确实不少，但缺乏抓住重点的能力。

比如，它先列出几种可能来源：可能是网络流行语（类似“失足成千古恨”）、可能出自游戏或影视台词、可能是某位现代作家的创作、也可能是日语表达的翻译。每个角度都有对应解释，比如网络用语可能是网友自创并传播，文学则可能是某些现代作家的“误一瞬，误一生”式表达，日语则可能来自“瞬间的失败，一生的遗憾”这种说法。最后还给了一个“进一步确认”的建议：去查上下文或在网络搜索。

整体看下来，LongCat 的回答像是把百科里所有可能的条目都拎出来罗列一遍，覆盖面很广，却缺少清晰的判断和推理，读者很难从中得到一个明确结论。

未经「AI科技评论」授权，严禁以任何方式在网页、论坛、社区进行转载！公众号转载请先在「AI科技评论」后台留言取得授权，转载时需标注来源并插入本公众号名片。

赏礼

赏钱

免责声明：本文仅代表作者个人观点，与本站无关。其原创性以及文中陈述文字和内容未经本网证实，对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺，请读者仅作参考，并请自行核实相关内容。凡本网注明 “来源：XXX（非本站）”的作品，均转载自其它媒体，转载目的在于传递更多信息，并不代表本网赞同其观点和对其真实性负责。如因作品内容、版权和其它问题需要同本网联系的，请在一周内进行，以便我们及时处理。 QQ：617470285 邮箱：617470285@qq.com

没有了

软银官宣！清仓英伟达套现58亿美元，转投OpenAI……

17天前