"通义"搜索结果 1 条
阿里巴巴发布开源推理模型通义千问 QwQ-32B,它的水平如何?

阿里巴巴发布开源推理模型通义千问 QwQ-32B,它的水平如何?

步骤: 0、上周做了QWQ32b、Deepseek-R1历年高考真题1500题测评,数学正确率在满分、99%范围,一个大伙比较关心的疑问是AI是不是背历年真题。 0.1、采用AI自己出新题、AI答题的方法尝试测试AI有没有背题。 1、正式开始。 2、提示词,出新题 3、代码 4、得到QWQ32b、Deepseek-R1各400、800道题 5、AI重新答题。 QWQ正确率平均96%,做QWQ自己出的题目99%,做Deepseek出的题目正确率95% Deepseek正确率平均96%,做QWQ出的题目96%,…