Claude Code 出现中文乱码是什么原因啊?好像只有国产模型遇到这个问题目前? 1 个帖子 - 1 位参与者 阅读完整话题
入标题所写,不是那种用于售卖,也不是单个渠道多key 我要的是那种,有个gui,能把多个不同的模型聚合成同一个名字的那种工具,不要newapi,他那个可配置项太少了,还不能配置那个模型被选中的次数,如果报错就换下一个,一个模型最多只用几次这样的内容,有没有有用到过类似的佬友?来问问 5 个帖子 - 3 位参与者 阅读完整话题
其中的模型表 空了,空了,是gpt 拿走了??? 3 个帖子 - 3 位参与者 阅读完整话题
现在是不是有那种自动扫公益站模型的项目啊?一看到gpt-5.4就起飞了? 说明是不看的,模型是要蹬的。 科普: 1.感觉l站最近新人确实有点多了,都以为gpt的pro模型和gemini的pro,claude的opus一样,其实gpt-pro模型更类似gemini的deepthink,所以请不要把这个模型放到codex好吗? 2.我这么大一个 不支持codex,只支持/v1/chat/completions请求 没人看见吗。。。 11 个帖子 - 10 位参与者 阅读完整话题
场景:私有大模型服务器,公司买的K100AI的卡8*64的显存 内存900g 硬盘11T 海光DCU 现在安装模型,只能安装海光的提供的模型,且只能定制对方提供的docker镜像和vllm指定的版本 以及模型。 想用来做claude code的调用安装模型。目前按照了千问的122b激活a8b的模型 但是claude code调用有问题,串行的命令无法执行。 比如:帮我优化某某方法。 私有模型:说一句话就停住了,根本走不下去,没有edit,只有单独的add内容 购买的coding plan 同样的场景 是正常没问题的 有没有佬遇到这种情况,是咋处理的。。。 厂商那边沟通费劲。 5 个帖子 - 2 位参与者 阅读完整话题
旧闻了 iPhone 用户现在也可以在手机上运行 Google 新发布的 Gemma 4 模型了——是真的在手机上运行,断网也能用的那种。 App Store 直接搜 “Google AI Edge Gallery”。打开 APP 后可以选择下载 E2B 或者 E4B。官方显然推荐大家用 E2B 这个更小也更快的版本。 除了文本对话,还有图片识别、语音对话等,甚至还支持 Skills。但是实测知识是 2025 年 1 月以前的。 推理框架用了 iPhone 的 GPU,运行还是相当流畅的。 大家可以试试,日常处理文本翻译之类的应该绰绰有余。 8 个帖子 - 5 位参与者 阅读完整话题
发现大模型尤其是openai家的模型给出的文稿里尤其喜欢使用否定型句式,几乎每一段都有形如「不是…而是…」这种的倾向于给出否定某个方面的句型。如果只是拿它来修代码还好,但如果用于润色文章的话读的真有点抓狂,想问各位佬友有没有什么比较好的解决办法,比如说用什么prompt规范文风什么的?有没有什么好用的提示词推荐? 12 个帖子 - 9 位参与者 阅读完整话题
cloud.tencent.com 大模型服务平台 TokenHub Token Plan 企业版套 产品简介 Token Plan企业版 - TokenHub - 控制台 看起来是 11亿 5000块的样子… 4 个帖子 - 4 位参与者 阅读完整话题
https://www.nature.com/articles/s41586-026-10319-8 1 个帖子 - 1 位参与者 阅读完整话题
扩展一直在更新,但模型停止在4.5好几个月了,亚马逊这是放弃了? 1 个帖子 - 1 位参与者 阅读完整话题
这个工具也能使用高级模型,之前一段时间热度也很高啊我记得 6 个帖子 - 6 位参与者 阅读完整话题
怎么判断模型是不是真的opus4.7,有没有被路由掺水呢 6 个帖子 - 3 位参与者 阅读完整话题
直接说要生成的图片就有了,甚至2选一,询问用户那个更好,我甚至以为这个是竞技场了 。奇怪的是,为什么女主播名字都带鹿鹿的??? 10 个帖子 - 5 位参与者 阅读完整话题
百炼Qwen3.6-Plus用了下,改代码越改越乱,不知道是不是错觉。glm5指令遵循有点差,经常不按在CLAUDE.md或ANGENTS.md中写的测试方法来执行,各位有遇到过吗。kimi2.5用着还行,但百炼上非常不稳定,经常报错,不知道是不是接的claude code的原因。有用百炼coding plan的吗,佬们觉得哪个好用 8 个帖子 - 5 位参与者 阅读完整话题
今天又看到QuiverAI 发布 Arrow 1.1 SVG 生成模型发布,近些这种SVG生成模型好像比较多想求问一下论坛的各位大佬这种类型的模型一般有哪些用途?我个人能想到的是做UI/UX 设计然后就是科研绘图,最主要的还是科研绘图,想问一下有没有佬实操过这类专门为SVG生成的AI绘制一般的科研的图效果如何? 1 个帖子 - 1 位参与者 阅读完整话题
不懂就问,刚刚开始使用阿里的Qcoder,我发现它的auto模式竟然比其他任何一个高级模型的倍率都高,为什么?一般不都是auto模式的倍率比高级模型倍率都要低吗? 3 个帖子 - 3 位参与者 阅读完整话题
如题,之前的最大优点就是语言模型、视频模型、图像模型、声音模型并行,好像是国内唯一几家能够All in one的模型公司。 结果现在编码模型还是M2.7、性能严重落后,原来量大管饱、便宜的优点现在不值一提,直接就是拉完了,而且没有看到公司在编码模型上面还有什么宏大的计划。 视频模型本来也不错,结果字节的模型一出来,openai的sora 都关了。Minimax后续打算咋弄,是学openai,把 视频模型也关了,All in全部算力堆在编码模型上,还是有其他方向? 总之感觉现在Minimax的股价很危险呀,现有的模型实力好像没有体现出什么先进性,原本起步早的优点,小米的新模型都把它冲破了,国内其他传统的额互联网大公司也在冲刺,护城河可以说没有了 附:grok统计的各家模型参数量大小 17 个帖子 - 13 位参与者 阅读完整话题
感谢各位大佬点击该贴。 本帖用于求助各位大佬给些关于 GPU云 部署开源大模型的建议。 我的目的是通过GPU云部署开源大模型为自己提供api使用 欢迎各位佬从我的想法、到平台选择、羊毛攻略、模型选择提供建议 5 个帖子 - 3 位参与者 阅读完整话题
今天突然收到这个短信,这是指可以调用30000次吗 3 个帖子 - 3 位参与者 阅读完整话题
需要给ClaudeCode和LLM两者同时破限。学习资料: Claude破限脚本 - 开发调优 / 开发调优, Lv1 - LINUX DO 发一个破限好的codex的提示词,方便大家codex写注册机之类的 - 开发调优 / 开发调优, Lv1 - LINUX DO 1 个帖子 - 1 位参与者 阅读完整话题