为什么是梁文锋做出了DeepSeek？-热点吃瓜网- 揭开趣味故事，乐享丰富内容

阿里与上交大提出 LLM 长文本计算新解法：可处理文本长达 1900k 字节、效率提升 2.4 倍

2025-07-13 04:09

编译 | 郭思编辑丨陈彩娴在实际应用大模型的过程中，尤其是处理长文本的上下文信息时，如何高效灵活地调度计算资源成为一个学术界与工业界共同关注的问题。大语言模型所能容纳的上下文长度直接影响了诸如 Ch ...

2025-07-13 04:07

清华和上交的最新论文中，上演了一场“学术打假”的戏码。文中研究者们对当前“纯 RL 有利于提升模型推理能力”的主流观点提出了相反的意见。通过一系列实验，他们证明引入强化学习的模型在某些任务中的表现，竟 ...

2025-07-13 04:03

昨天一早，Meta 了放出自家用了 20 万显卡集群训练出的 Llama 4 系列模型，其中包括 Llama 4 Scout、Llama 4 Maverick 和 Llama 4 Behemoth。消 ...

2025-07-13 03:44

这是2025年开年最火的科技明星，短短几天时间，梁文锋从小到大的种种过往都被展现在世人眼前，包括他来不及装修的新房以及在房子里睡觉用的帐篷，都成为了他独特个性的象征。独特个性固然为人津津乐道，但并不是 ...

2025-07-13 03:32

【雷峰网(公众号：雷峰网)消息】上周五，全球最大的开源大模型社区Hugging Face公布了最新的开源大模型排行榜，阿里云通义千问Qwen-72B表现抢眼，以73.6的综合得分在所有预训练模型中排名 ...

2025-07-13 03:29

继7日晚在白宫会见之后，美国总统特朗普当地时间8日表示，他当晚会在白宫与以色列总理内塔尼亚胡再次会面，继续讨论加沙问题。与此同时，在卡塔尔首都多哈，巴勒斯坦伊斯兰抵抗运动哈马斯）与以色列的新一轮间接谈 ...

2025-07-13 03:19

4月25日，Create2025百度AI开发者大会在武汉隆重举办。百度创始人李彦宏发表了题为《模型的世界应用的天下》的演讲。60分钟的演讲中，李彦宏发布了两大模型，多款热门AI应用，并宣布将帮助开发 ...

2025-07-13 02:49

2025 年 1 月 20 日 Kimi k1.5 正式发布，伴随着技术报告的公布，有网友表示：“这应该是全球范围内，除 OpenAI 之外的公司首次实现 o1 正式版的多模态推理性能了吧！”一时间， ...

2025-07-13 02:24

美国总统特朗普9日称，他正在考虑再向乌克兰提供一套“爱国者”导弹系统。此前，特朗普已经在7日表示将向乌克兰运送更多的防御性武器。据消息人士透露，美国政府8日已恢复向乌克兰运送部分武器。五角大楼上周宣布 ...

2025-07-13 02:21

来源标题：死火海漫改游戏的呼叫转移，解锁刀鸣共赴尸魂界真香现场！二十年前，贴吧的战力党还在为“蓝染能否秒杀佩恩”吵得头破血流；火影党争掀起的“鸣雏VS佐樱&rdqu ...