如何看阿里最新开源的推理大模型QwQ-32B效果接近DeepSeek R1满血版？

发布时间：

2025-03-07 22:42

阅读量：

感觉差距还是不小的。

我问deepseek R1和QwQ-32B这样一个问题：小红有两个姐姐，两个妹妹，请问小红的妹妹有几个姐姐？这个问题存在唯一答案吗？

deepseek R1答3个且唯一，告诉它结果不对，马上能够纠正错误，并且找到推理错误的地方。

QwQ32B也是同样的答案，但是如果只是回复答案不对，它还是会一直坚持它最初给的答案，需要指出逻辑错误的地方才能纠正过来。在指正的时候，还需要讲得非常清楚，它才会意识到错误。

END