同时作业帮公布了银河大模型在C-Eval、CMMLU两大权威大语言模型评测基准的成绩。 在由MBZUAI、上海交通大学、微软亚洲研究院共同推出的CMMLU榜单中,作业帮银河大模型表现同样出色,在Five-shot和Zero-shot测试中分别以74.03分及73.85分占据榜首。 由美国加州大学伯克利分校、哥伦比亚大学、芝加哥大学等高校联合打造的全球性大规模多任务语言理解评测基准MMLU,在集合了科学、工程、数学、人文、社会科学等领域的57个科目的评测中,作业帮银河大模型平均分71.88分。
来源:TOOM舆情监测
还没有评论,来说两句吧...