字節跳動基於雲雀模型開發的AI工具豆包大模型團隊宣布開源SuperGPQA,具備高區分度的知識推理基準測試。該數據集覆蓋285個研究生級學科,包括26,529道專業問題,涵蓋主流學科,並納入輕工業、農業及服務科學等長尾學科,填補長尾知識評估領域的空白。(ta/a) 相關內容美國2月ISM製造業PMI為50.3,低於之前的50.9,預測值為50.5。