智能助手网
标签聚合 opus4.6

/tag/opus4.6

linux.do · 2026-04-18 02:00:21+08:00 · tech

介于opus4.7的注意力和gemini差不多只有100k左右的有效注意力,有点想换回opus4.6 1m在Claude code中使用。 就是不知道现在的opus4.6智商是否恢复了,有没有测试过的佬呢? 1. 9.9-9.11=? opus 4.6答错 opus4.7正确 2.洗车问题 “我想洗车,洗车店离我家 50 米,你觉得我应该走路还是开车去?” opus4.6和opus4.7都正确 opus4.6 opus4.7 3.红绿色盲问题 opus4.6错误 opus4.7正确 Claude code中测试,全部设置thinking effort为max,左边为4.7,右边为4.6 1. 9.9-9.11=? opus4.6依旧错误 2.洗车问题 全部正确 3.红绿色盲问题 opus4.6依旧错误,甚至思考了3分钟都错了!!! 总结:web端和claude code端,之前opus4.6能答对的现在正确率1/3,所以opus4.6 智力依旧没有恢复 opus4.7能全部答对,但是编程中有效上下文长度有限 由于llm是概率模型,并且web和cc中不能手动设置这些采样参数,所以每次出来的结果都有可能不一样受到各种采样参数的影响. web端测试均为开启thinking,关闭web search的情形下, Claude code中测试,全部设置thinking effort为max. 9 个帖子 - 6 位参与者 阅读完整话题

linux.do · 2026-04-17 13:22:39+08:00 · tech

在一个黑色的袋子里放有三种口味的糖果,每种糖果有两种不同的形状(圆形和五角星形,不同的形状靠手感可以分辨)。现已知不同口味的糖和不同形状的数量统计如下表。参赛者需要在活动前决定摸出的糖果数目,那么,最少取出多少个糖果才能保证手中同时拥有不同形状的苹果味和桃子味的糖?(同时手中有圆形苹果味匹配五角星桃子味糖果,或者有圆形桃子味匹配五角星苹果味糖果都满足要求) | | 苹果味 | 桃子味 | 西瓜味 | |---|---|---|---| | 圆形 | 7 | 9 | 8 | | 五角星形 | 7 | 6 | 4 | 依旧这个测试题,4.6能稳定回答出21,4.7回答29 6 个帖子 - 5 位参与者 阅读完整话题

linux.do · 2026-04-17 12:33:27+08:00 · tech

平常登5刀会直接触发限额,今天才一半,窗口变10刀了!!!感谢4.7让我用上更耐用的4.6 而且是5小时限额和周限一起翻倍,所以周限额现在是100刀!我的天呐a/大人,性价比拉满啊。 90r用满一个月至少400刀保底,你还花那冤枉钱买既不稳定也不便宜的中转? 非常建议个人用户自己整pro,几乎不封号,尼区还才90一个月,整俩三个号五小时窗口三十刀还不是美滋滋 12 个帖子 - 7 位参与者 阅读完整话题