全球播报:GPT-4得不到MIT学位,MIT研究团队回应「作弊」,但网友不买账
几天前,一篇名为《Exploring the MIT Mathematics and EECS Curriculum Using Large Language Models》的论文经历了一场舆论风波。
几天前,一篇名为《Exploring the MIT Mathematics and EECS Curriculum Using Large Language Models》的论文经历了一场舆论风波。
(资料图片仅供参考)
论文地址:https://arxiv.org/pdf/2306.08997.pdf
最初,研究团队从 MIT 的数学、电气工程和计算机科学 (EECS) 专业的课程问题、期中考试和期末考试中,整理出了一个包含 4550 个问题和解决方案的综合数据集,并让各种大语言模型去完成这个数据集的题目,得出了「GPT-4 几乎满分通过 MIT EECS 和数学本科考试」的结论。
这一结果很快被人指出不够严谨,还给出了多项证据和详尽的分析,表示数据集本身就有问题,用 GPT-4 自动打分的评价机制也很有问题:
「我们的批评主要是针对这项研究的方法和严谨性,而不是针对其内容。我们对大型语言模型实际解决麻省理工学院课程的能力没有任何意见,只是认为本文未能以科学严谨的方式证明这一点。」
面对扑面而来的质疑,研究团队在接下来的一周里却没有进行任何公开回应,没有承认,也没有道歉。
但在昨天,人们等到了来自几位教授(也是论文作者)署名的官方通报:
6 月 24 日,Armando Solar-Lezama(MIT EECS 教授和 CSAIL 首席运营官 / 副主任)、Tonio Buonassisi(MIT 机械工程教授)和 Yoon Kim(MIT EECS 和 CSAIL 助理教授)就该论文情况发表了公开声明。
声明内容如下:
6 月 15 日,Iddo Drori 在 arXiv 上发布了一篇与麻省理工学院几十门课程的考试和作业数据集相关的研究论文,他这样做没有得到其他合著者的同意,尽管已经被告知在发表前应该纠正的问题。我们中的一个人在周末旅行后,于 6 月 18 日星期天才知道这个帖子。
在处理这件事的过程中,我们发现,与 Drori 向我们和为该项目收集数据的学生所传达的信息相反,Drori 并没有得到所有导师的许可来收集构成论文主题的数据集的作业和考试题。其中一些涉及课程的导师,在论文出现在社交媒体上和 Drori 未经许可在网上发布数据样本时,才知道这个数据集的存在且其中包含了自己的课程材料。
这些都是正在通过机构渠道解决的严重问题,所以我们不愿意公开发表这样的声明,但我们觉得有必要解释为什么这篇论文不应该被发表而必须被撤回。我们已经要求 Drori 从 arXiv 撤回这篇论文,并且直接联系了 arXiv 解释了这个情况。
我们想强调的是,这篇论文中的所有学生作者都非常努力地工作,如果数据是在同意的情况下收集的,这本来是一篇非常有趣和宝贵的论文。已经发表的工作中出现的问题并不是学生的错。
而且,GPT-4 不能获得麻省理工学院的学位。
这样一份调查声明,真的足够了吗?回想一周前三位质疑者提交的分析,数据集被污染、手动检查的结果与论文所说的「几乎满分通过」相差甚远,这至少意味着论文内容应该被重新审查。
显然,并不是所有人都对调查结果满意,有人表示这是避重就轻的说法,只是关注他们不应该使用这些数据的事实,而不提捏造结果的错误。
「所以这三位麻省理工学院的教授认为,未经同意使用数据是论文的唯一问题。」
针对「这本来是一篇非常有趣和宝贵的论文」的说法,更多人点了反对:「让 GPT-4 给自己生成的答案打分,这就是有趣和宝贵吗?」
另外,有人发现 Iddo Drori 的个人主页已经更新,删掉了「MIT 客座教授」的 title。而且根据领英主页的信息,他将在这个月结束自己的 MIT 访问之旅。
「一些教授决定让一位客座讲师成为替罪羊,并试图将每个人的注意力从方法论转移到数据隐私问题上,却没有批评这篇论文。这是多么典型的学术政治问题。」
正如三位质疑者在博客中所写的那样:「这篇论文道出了最近人工智能领域研究的一个更大趋势。随着该领域的进展越来越快,新发现的时间节奏似乎在缩短,这往往伴随着捷径。一个特别令人担忧的趋势是使用像 GPT-4 这样基于语言的模型来评估一个模型的准确性的技术。」
对于此事,你怎么看?
标签:
- 全球播报:GPT-4得不到MIT学位,MIT研究团队回应「作弊」,但网友不买账
- 瓦格纳“叛乱”背后:普京的“大厨”挑战普京? 焦点短讯
- 《科学》(20230623出版)一周论文导读
- vivo X90s外观公布 青漾配色灵感来源于汉诗-当前要闻
- 焦点播报:天天滚动:播报:天天视讯!当前聚焦:文班亚马2米26身高引媒体关注 美女记者:感觉都不是一个气流层的 天天实时|环球要闻-视讯 世界视讯 焦点热文_世界快资讯|环球简讯-环球新消息|天天信息 世界最新 当前速递
- 天际汽车停产后续:新增被执行超5036万|天天头条
- iPhone印度产能将占全球总量的18%,印度将成苹果全球重要市场_世界视讯
- 引发争议的“调休”,到了该调整的时候了吗?
- 酸菜鱼火锅可以加什么配菜|微资讯
- 4.8万名江门考生赴中考!你们只管冲,身后有我们!-世界今热点
- 含有拟人手法的四字词语有哪些呢_含有拟人手法的四字成语[6个]-当前时讯
- 全球关注:中国与意大利科技企业共同期待合作新机遇
- 全球播报:为什么,二手房市场竟这样?豪宅盘“还有赚”,低价盘“亏得更多”......
- 重登世界第一!阿尔卡拉斯首夺草地赛冠军,力压德约科维奇,剑指温网!_世界动态
- 河北沧州:55个劳务品牌带动12.6万人就业-天天速讯
- 天天快看:刚刚,3号线4站点开通!厦门地铁首末班时刻表公布!
- 强强联合还是菜鸡互啄?QQ悄然支持微信登陆
- 今日最新!cf源武器和英雄武器有什么区别-cf源武器礼券怎么用
- 《原神》3.8版本更新上线时间
- 立法处罚过斑马线“刷手机”不是小题大做_环球资讯
- 毫不动摇严守耕地红线 环球热头条
- 永泰运(001228.SZ):暂未规划介入换电站业务
- 【世界新视野】啤酒狂欢节、亲子泼水节、魔术、相声、脱口秀……麒麟区益宁南市夜街与你畅享夏日狂欢
- 韩国渔业团体集会反对核污水排海:日本怎么不自己留作农业用水?
- 印度又一斥资百亿卢比大桥坍塌:大桥从中间塌陷,当地紧急调查原因-每日头条
- 3999元起!moto razr 40小折叠屏神机开售
- 关于许光汉王若琳《你残忍可爱的傲慢》MV发布 探索深陷爱情状态的各种侵入与未知及许光汉王若琳《你残忍可爱的傲慢》MV发布 探索深陷爱情状态的各种侵入与未知详情|环球新视野
- 海康机器人AMR:助力传统供线实现全流程智能化
- 【世界独家】郑州大学第五附属医院招聘工作人员45人
- 动力电池 进入下半场|环球新视野
- 英国 CMA 再出手,初步否决日立收购泰雷兹轨道信号业务案 今日关注
- 北京高考696分以上考生104人,前20名成绩暂不公布
- 环球时讯:光生物安全蓝光危害_蓝光危害
- 世界微资讯!实况足球2016联赛_实况2016最新转会补丁
- 今日辟谣(2023年6月25日)-全球看点
- 追光|九人排球?海南“村排”了解下_报资讯
- 全球快看点丨“蓝朋友”+|上海化工区举行危化品储罐区物料泄漏应急处置综合演练
- 有栖川彻子(对于有栖川彻子简单介绍)_世界聚焦
- 剪辑抄袭的定义_抄袭的定义_世界关注
- 【速看料】推动盐城红色文化高质量发展
- 闪耀国际舞台!我盟乌兰牧骑5部作品传递“阿拉善之美”~ 今日视点
- 曾岳南(关于曾岳南介绍)
- Java基础入门篇(二)——Java注释、关键字和标识符
- 全球讯息:存款降息潮下的“镜像” 储户银行双“彷徨” 资产配置格局生变
- 铁心桥街道打造秦淮新河方志文化广场 世界通讯
- 跨境电商年进出口规模首超2万亿元 继续保持增长势头 为外贸发展注入新动能
- 世界快看:合肥地铁端午假期安全运送乘客449.50万人次
- 潮州萝卜干怎么炒最好吃?
- 天天通讯!中国出口贸易十强!宁波第5,金华第7,浙江共三城入围
- 每日速看!想加入儿子班级群被拒 学校是否侵犯了家长监护权?
- 甄子菁主演电影全集 甄子菁
- 天天观察:观众齐喊“开空调”!梁静茹沈阳演唱会遭遇尴尬一幕
- 哪吒汽车在东莞成立销售新公司
- 环球焦点!小米回购250万股 损失2290万
- 当前报道:唐嫣太会穿衣了,一入秋就搭配起了西装裙+长筒靴,时髦度超级高
- 每日信息:比7400还强!英特尔N100处理器跑分近满分
- 瑞安联合体杨浦平凉社区地块设计方案公示,联动价21万/平|天天新动态
- 环球今日讯!马路幺贰贰5|什么情况,石sir竟然护送他回家……
- 云梦:关爱留守 “粽”享端午_天天讯息
- A股策略展望:战略布局时点或将出现
- 全球新消息丨炎亚纶的公关秘诀:人不要脸,天下无敌
- 被北京女生的“迷你裙”惊艳了,高级显瘦显腿长,夏天穿超美!
- 即时:王心凌郑州演唱会时间确定了?
- 十二星座在前世的老公,巨蟹座是拓跋浚,双子座是来搞笑的么!
- 当前快看:上甲•超级交易者俱乐部杭州站揭牌 上甲集团全国城市联盟计划正式启动
- 韵达在国内外推出毕业“寄”优惠活动
- 64站降雨超过50毫米 潇水双牌站超警戒水位
- 西安翻译学院师生出征2023年全国指弹球巡回赛(西安站)斩获佳绩
- 【报资讯】一些韩国航空公司暂停部分韩中航班是怎么回事
- 即时焦点:贾跃亭实控乐视子公司被吊销执照
- 谷歌Pixel 8系列新壁纸曝光,颜色信息公布 世界通讯
- 最新消息:体内“穿山甲”微型机器人问世
- 每日速看!央行6月25日开展1960亿元7天期逆回购操作
- 宁夏银川烧烤店燃气爆炸事故4名犯罪嫌疑人被刑拘 环球热讯
- 长沙市口腔医院:大兴调查研究之风 推动医院高质量发展
- “世界海员日”关注船员权益保障 上海高院通报相关工作最新情况|当前要闻
- 天天快讯:内蒙古自治区气象台25日15时10分发布大风蓝色预警信号
- 全球新动态:在这里,你可以独处,也可以一群人喧闹
- 环球简讯:法雷奥亮相2023年法国欧洲科技创新展览会 与Equans签署合作协议,携手应对城市未来挑战
- 全球热门:“唐山撞船致5死案”船主被判死缓,定性由交通肇事改为间接故意杀人
- 全球今头条!【新松机器人】参评“维科杯·OFweek 2023中国智能制造数字化转型卓越服务商奖”
- 世界讯息:中国华能新疆公司清能分公司与玛纳斯县签署合作框架协议
- 2023年IGBT模块行业市场概况分析宏微科技VS斯达半导
- 15年悸动烧仙草蓄力再开挂!今天聊聊这些背后的秘密
- 箭牌家居智能马桶陶瓷体全部自产,上盖部分部件因产能不足尚需外购|每日焦点
- 热点聚焦:商旅文深度融合 假期消费市场活力释放
- 城市迎来“变局”!中国不少“县城”或逐渐萎缩,这意味着什么?-最新消息
- 开展防洪抗汛演练 提升防灾减灾救灾能力|通讯
- 二氧化锰是酸性氧化物还是碱性氧化物_酸性氧化物一定是非金属氧化物_环球今日报
- 包月宽带可以随时暂停_包月宽带 资讯
- 光晕3中文版下载官网_光晕3中文版下载
- 2023年北京mdsk音乐节门票可以在转送几次?
- 天天视讯!佛山高明百村篮球赛免费门票(入口+流程)
- 贵州榕江住宿推荐(地址+预定电话) 世界速讯
- 苍穹巨灵·大别山篇 每日热门
- 别升级iOS 16.5.1正式版了!iPhone 13实测续航爆降
- 比亚迪弗迪租赁公司增资至50亿元,增幅400%
- 机构预计:6月中国50城新房成交面积同比跌逾两成|每日消息
- 争当“大运会”宣讲员,彩虹小学学子做好“家门口”盛会宣传 环球速递
- 东莞本科生引进补贴有效期是多久?