当前位置:首页 > 风事深

GRPO在《时空谜题》中击败o1、o3

近日,海外大模型产品平台 OpenPipe 上发布了一项研究,阐述其如何通过 GRPO 在重度推理游戏《时空谜题》中超越R1、o1、o3-mini 等模型。研究作者分别为来自 Ender Resear ...

风事深

AI Infra 往事之异构计算篇:吴韧与他的学生们

2013年9月底,吴韧受百度邀请,以杰出科学家的身份加入百度深度学习研究院IDL),此时正值他五十知天命的年纪。吴韧在人工智能领域耕耘多年,当时已是一名顶尖的AI计算科学家。2012年深度学习崛起前后 ...

风事深

朱芷瑩:连续二年闪耀戛纳的中国时尚艺人

来源标题:朱芷瑩:连续二年闪耀戛纳的中国时尚艺人 中国时尚艺人朱芷瑩以双重身份闪耀2025戛纳电影节:戛纳红毯展现东方气质,007主题造型诠释"攻击性时尚",从红毯新人到国际盛事常客,她用多元表现力持 ...

风事深

朱芷瑩:连续二年闪耀戛纳的中国时尚艺人

来源标题:朱芷瑩:连续二年闪耀戛纳的中国时尚艺人 中国时尚艺人朱芷瑩以双重身份闪耀2025戛纳电影节:戛纳红毯展现东方气质,007主题造型诠释"攻击性时尚",从红毯新人到国际盛事常客,她用多元表现力持 ...

风事深

文泰一性侵案一审宣判 获刑3年半

7月10日,据媒体援引韩媒报道,前NCT成员文泰一音译,Moon Tae-il)涉特殊准强奸案今日一审宣判。他被判3年6个月有期徒刑,被当庭拘留。此外,法院要求他完成40小时性暴力治疗课程、公开告知身 ...

风事深