IT之家 4 月 17 日消息,美国医学会旗下期刊 JAMA Network Open 发文,透露业界现有的大型语言模型(LLMs)在临床推理方面仍存在明显短板,尤其是在早期的鉴别诊断阶段,错误率普遍超过 80%。 IT之家参考论文获悉,研究团队利用 29 个标准化临床案例对 GPT-5、Claude 4.5 Opus、Gemini 3、Grok 4 等 21 款主流大模型进行评测,模拟完整医疗决策流程,覆盖鉴别诊断、检查选择、最终诊断、治疗管理及其他临床推理五个阶段。 结果显示,各大模型整体表现存在一定差异,同时在不同诊疗阶段呈现出明显不均衡。具体来看,AI 在“最终诊断”和“治疗管理”环节的准确率相对较高,“检查选择”和其他推理能力处于中等水平, 而在最早期的“鉴别诊断”阶段表现最差,错误率普遍超过 80% ,也就是模型通常会误判病人的具体疾病。 进一步分析认为,AI 更擅长在信息相对完整的情况下给出答案,但在信息不足、需要逐步推理的早期阶段, 往往容易过早收敛到单一结论,导致当前 AI 难以直接应用于临床决策 。相比之下,临床医生通常会在初期保留多种可能性,并随着检查结果和信息积累不断修正判断,最终定论患者的具体疾病。
As part of our efforts to improve service reliability, we are streamlining our model offerings. Over the coming weeks, Opus 4.7 will replace Opus 4.5 and Opus 4.6 in the model picker for Copilot Pro+. 作为我们提高服务可靠性努力的一部分,我们正在精简我们的模型产品。在未来几周内,Opus 4.7 将在 Copilot Pro+ 的模型选择器中取代 Opus 4.5 和 Opus 4.6。 This model is launching with a 7.5× premium request multiplier as part of promotional pricing until April 30th. 作为促销定价的一部分,该模型推出时附带 7.5 倍的 premium 请求乘数 ,此优惠将持续至 4 月 30 日。【优惠结束相当于 opus 4.6 的 5 倍?】 Claude Opus 4.7 will be available to Copilot Pro+ , Business , and Enterprise users. Claude Opus 4.7 将对 Copilot Pro+、Business 和 Enterprise 用户开放。 The GitHub Blog Claude Opus 4.7 is generally available - GitHub Changelog Claude Opus 4.7, Anthropic’s latest Opus model, is now rolling out on GitHub Copilot. In our early testing, Opus 4.7 delivers stronger multi-step task performance and more reliable agentic execution,… Est. reading time: 2 minutes Opus 4.7 will replace Opus 4.5 and Opus 4.6 看来是玩不下去了,变相给 Opus 系列涨 5 倍价格 23 个帖子 - 14 位参与者 阅读完整话题
IT之家 4 月 16 日消息,消息源 yeux1122 昨日(4 月 15 日)发布博文,爆料称三星计划在部分 Galaxy S27 系列机型上, 引入 UFS 5.0 存储,接口速率达 10.8GB/s,性能媲美 PCIe NVMe Gen 5 标准。 IT之家查询公开资料, 三星 Galaxy S26 全系标配 UFS 4.1 闪存,在延续 UFS 4.0 最高 4.2GB/s 峰值读写速度的基础上,引入 WriteBooster 技术和优化碎片整理,配合 AI 优化,文件复制速度提升约 36%,应用安装速度提升约 50%。 根据 JEDEC 标准显示, UFS 5.0 闪存芯片可提供最高 10.8GB/s 的传输速率 ,这一水平已逼近桌面级 PCIe NVMe Gen 5 标准。对于智能手机而言,这意味着 AI 模型加载、大文件传输、应用启动等场景将获得质的飞跃。 三星此前曾计划在 2027 年前后推出 UFS 5.0,重心仍放在 UFS 4.0 的优化上。但随着 AI 手机竞争加剧,时间表明显提速。若研发顺利,Galaxy S27 Ultra 将成为首款搭载该标准的量产机型,为端侧 AI 运算提供更强硬件支撑。
IT之家 4 月 15 日消息,Yeelight 现已在有品上架智能恒温浴霸 M3( 点此访问 ), 定价为 599 元 。 该浴霸采用超薄纯平面板,提供 592mm 摆叶出风口,内置双直流变频电机及 3000W 石墨烯涂层 PTC 陶瓷制热模块,换气效率达 200m³/h,可实现“2 分钟换气除湿”。机身内置 AI 智能恒温系统,接入小米米家 App。 IT之家附产品参数:
IT之家 4 月 14 日消息,据科技媒体 UnGeek 昨天报道,《生化危机:安魂曲》游戏发售已超一个月,截至目前,本作 Steam 版本通关率达到 70%,PS5 版则是 66.9%。 据报道, 《生化危机:安魂曲》能够拥有 70% 通关率已经是远超行业水平 。作为对比,《最后生还者 2》的发售后几个月的通关率是 58%,而《对马岛之魂》发售半年后则是 50%(IT之家注:以解锁主线通关成就 / 奖杯为准)。 由此可以看出, 行业内流程较短 、 线性较强的 3A 作品通关率一般比较难超过 50% ,而对于大型开放世界游戏来说,超过 40% 就已经是表现优异。 不过考虑到《生化危机:安魂曲》本来就是比较线性的游戏, 而且平均通关时间不足 20 小时 , 原本的预期通关率就比较高 。而在 Steam 平台上,有 70% 的玩家获得“新手特工”成就,该成就需要在“休闲”或更高难度通关后解锁,等于是所有打通的玩家都有这个成就,可以作为数据统计。 在 PS 平台上,有 66.9% 的玩家打通主线,虽然略低于 Steam,但仍然是非常出色的表现。
软银集团同意为美元债券支付自己历来最高的利率,这凸显了人们对这家日本企业集团在人工智能AI领域大规模投资的担忧。据公司声明,软银集团周三发行了15亿美元和17.5亿欧元(21亿美元)债券,部分资金将用于偿还与其投资美国科技公司OpenAI相关的过桥贷款。其中发行的10年期美元债券票面利率为8.5%,数据显示,这创下该公司以美元发行债券的最高纪录,超过了去年10月创下的前期高点。(界面)