SKEPTIK-LOG
skeptik-log
GLM-5 vs Kimi K2.6: la sfida cinese che sta ridefinendo SWE-Bench Pro
Due modelli cinesi open-source, un solo trono su SWE-Bench Pro. Kimi K2.6 vince per 0.2 punti percentuali, ma GLM-5.1 lo batte su task reali di backend, debugging e ragionamento strutturato. E lo fa senza una singola GPU NVIDIA.