当前位置:首页 > 快集

GRPO在《时空谜题》中击败o1、o3

近日,海外大模型产品平台 OpenPipe 上发布了一项研究,阐述其如何通过 GRPO 在重度推理游戏《时空谜题》中超越R1、o1、o3-mini 等模型。研究作者分别为来自 Ender Resear ...

快集

37年人艺经典《天下第一楼》再“开席”

来源标题:37年人艺经典《天下第一楼》再“开席”《天下第一楼》剧照。 李春光 摄日前,已演出37年的北京人艺经典剧目《天下第一楼》在首都剧场再次登台“开席”,并将持续上演至6月 ...

快集

特朗普宣布将对巴西征收50%关税 巴回应称不公平

来源:财联社财联社7月10日电,据央视新闻报道,美国总统特朗普表示美国将自2025年8月1日起对所有巴西产物征收50%的关税。巴西副总统兼增长、工业、贸易和支持部长热拉尔多·阿尔克明当天表示,特朗普宣 ...

快集

机器人端侧模型的十字路口

作者|朱可轩编辑|陈彩娴自 2023 年以来,以大模型为代表的人工智能与以具身智能为代表的机器人成为科技发展的两股重要力量。与此同时,将人工智能算法、尤其是大模型应用于进一步提升机器人智能水平也成为一 ...

快集

《天下第一楼》600场演来如初见

来源标题:《天下第一楼》600场演来如初见“好一座危楼谁是主人谁是客,只三间老屋时宜明月时宜风。”这副悬挂于老字号福聚德厅堂中的对联,已在舞台上陪伴观众度过37载春秋。6月2日 ...

快集


我要啦免费统计