智能助手网
标签聚合 sonnet

/tag/sonnet

linux.do · 2026-04-15 23:04:13+08:00 · tech

今天去公司汇报,我写出来的harness 可以弥补glm-5和sonnet 4.6的差距,然后所有人都说我吹牛,我也真的是没事给自己找事做,我只好两段一样的提示词,同样往sonnet 4.6和glm-5+harness里面丢。 结果就是harness + glm-5的产出已经开始第二轮增强迭代了,sonnect 4.6的产出物,我这会还要用claude code给他修复bug。 顺便一提,我现在用上harness之后好焦虑啊,harness没有跑代码我就焦虑怎么能不跑代码呢,先跑上我好去干别的,软件人的职业病,并行。跑起来了我又在焦虑,这怎么要跑这么长时间啊,这harness的性能怎么能优化下呢。跑完了,我又开始焦虑了,唉,又要开始验证了。这一来二去,恍惚间都这个点了。 在这边给大家看下sonnet 4.6的劣质品,harness的成品在harness那边帖子上 6 个帖子 - 3 位参与者 阅读完整话题

linux.do · 2026-04-15 16:30:11+08:00 · tech

背景: 昨天偶然在一个群里看到有人犹豫公司内部使用反代的项目选型,刚好自己也想了解为什么L站论坛里有人用 CPA 有人用 sub2api,到底个人和小团队使用哪一个更适合,直觉之外是否有技术指标来辅助做决策。 过程: 1.在 windows11的虚拟机里,用 Antigravity 的 Claude Sonnet 4.6 ,把 CLIProxyAPI 和 sub2api 项目 clone 到本地,并根据项目代码做了一下分析。 2.一共用了三组提示词,先用下面第一组提示词直接生成了 Markdown 版本的分析报告,然后又追加了第二第三组提示词,对分析做了一些补充。 3.第一组提示词: 请比较分析 CLIProxyAPI 与 sub2api 两个项目,从安全性,代码效率,以及其它这两个项目里包含相同的功能可以比较的地方,逐一分析比较,做一个 markdown 格式的专业研究分析报告。请先研究一下如何分析,做个计划 ,然后再严格按照计划去实施。 4.第二组提示词: 请比较单用户使用和100个用户使用的情况下,如果 AI 提供商凭证总数在 1k 级别,两个项目分别在什么配置运行可以覆盖极端较大并发的情况。 5.第三组提示词: 请对这两个项目的用户请求服务器响应速度做个对比。 6.合并提示词: 请把刚才讨论的内容添加到已经完成的对比分析研究报告里,谢谢! 结论 :如果个人使用,CPA 较优,小团队使用,sub2api 较优。 附: TL;DR 3 个帖子 - 1 位参与者 阅读完整话题