Discuz! Board 首页 资讯 查看内容

资讯

订阅

快讯 丨《麻省理工科技评论》中国发布大模型评测报告

2023-08-29| 来源:互联网| 查看: 317| 评论: 0

摘要: 8月16日,《麻省理工科技评论》中国发布中国大模型评测报告,从研发和商业化能力、外界态度以及发展趋势等维......
托福口语扣分常见原因

8月16日,《麻省理工科技评论》中国发布中国大模型评测报告,从研发和商业化能力、外界态度以及发展趋势等维度全方位检测大模型的能力。

据悉,此次评测选取了讯飞星火、百度文心一言、商汤商量、阿里通义千问等中文大模型平台代表展开。

评测使用的测试集包含600道题目,覆盖了语言专项、数学专项、理科综合、文科综合、逻辑思维、编程能力、综合知识、安全性共8个一级大类,126个二级分类,290个三级标签,并针对问题的丰富性和多样性做了优化。

评测整体水平结果显示,前三位分别为:讯飞星火、百度文心一言以及商汤商量,得分率分别为81.5%、75.2%和68.3%,阿里通义千问则以得分率66.9%排名第四。

分享至 : QQ空间

10 人收藏


鲜花

握手

雷人

路过

鸡蛋

收藏

邀请

上一篇:暂无
已有 0 人参与

会员评论

关于本站/服务条款/广告服务/法律咨询/求职招聘/公益事业/客服中心
Copyright ◎2015-2020 平阳信息港版权所有 ALL Rights Reserved.
Powered by 平阳信息港 X1.0