如何看阿里最新开源的推理大模型QwQ-32B效果接近DeepSeek R1满血版?

发布时间:
2025-03-07 22:42
阅读量:
2

感觉差距还是不小的。

我问deepseek R1和QwQ-32B这样一个问题:小红有两个姐姐,两个妹妹,请问小红的妹妹有几个姐姐?这个问题存在唯一答案吗?

deepseek R1答3个且唯一,告诉它结果不对,马上能够纠正错误,并且找到推理错误的地方。

QwQ32B也是同样的答案,但是如果只是回复答案不对,它还是会一直坚持它最初给的答案,需要指出逻辑错误的地方才能纠正过来。在指正的时候,还需要讲得非常清楚,它才会意识到错误。

END