蹭一波通义千问QwQ-32B的热度。前几天阿里巴巴正式发布并开源全新推理模型通义千问QwQ-32B,主打“高性能+低门槛”特性。该模型基于320亿参数规模,在数学推理、代码生成及通用任务中表现亮眼,综合性能对标DeepSeek-R1(6710亿参数,激活量370亿),还是使用我的AMD 锐龙8745H 小主机,ollma上用起来比较简单,LM Studio上需要改一下设置。
ollama
我的机器上 ollama 测试下来 BIOS中核显分配 2g 内存可以运行qwb:32b (Q4_K_M) ,
启动后可以看到内存使用 28.4/29.8GB
推出使用ollama ps
查看一下情况
1 | C:\Users\ls> ollama ps |
使用过程中cpu/gpu占用