智能助手网
标签聚合 尝试

/tag/尝试

linux.do · 2026-04-18 23:05:12+08:00 · tech

起因:朋友不知道从哪里翻出来他以前上学时写的小说,然后想让我帮他整成电子版方便发给同学看。 我把他的小说一页一页拍完照后,首先想到的是gemini,毕竟都说gemini多模态强。然而我简单测试后却发现准确率不够高,而且还有些幻觉(我觉得我朋友写的字很密和不是很好看是一大原因),总之就是不太能用。 后面我又测试了 豆包、deepseek、kimi、文心、智谱清言、gpt、grok、qwen、元宝 、还有 扫描全能王、微信文字识别、夸克扫描、glmocr和PaddleOCR-VL-1.5 。 结果是 豆包、deepseek、文心、gpt、grok和qwen完全没法用 ,搁那输出了一半就开始 胡编乱造 ,然后 扫描全能王、微信文字识别、夸克扫描、glmocr和PaddleOCR-VL-1.5 准确率不够,而且对于一些涂改和太难看、潦草的字基本没法识别,排版也不好。 kimi2.5、gemini 3 flash和元宝是最后大体能看过眼的,但gemini幻觉比其它两个稍微高一些且准确率也差一点。而kimi2.5和元宝准确率都能有97%以上而且幻觉也非常少,最后我选择了元宝,没别的,kimi2.5官网输出太慢了,而元宝快多了(朋友小说有差不多100页呢,等不了kimi那么慢的速度) 以前一直觉得元宝是腾讯套壳蹭热度的,纯路边一条。然而这两天需要大量识别手写字图片的时候,我才发现我好像错了:对不起元宝 ,我以后再也不骂你是废物了 1 个帖子 - 1 位参与者 阅读完整话题

linux.do · 2026-04-18 22:47:42+08:00 · tech

CPA + Codex 配置避坑指南 前言 本文记录了配置 CLI Proxy API (CPA) 与 Codex 集成时遇到的各种坑,希望能帮助后来者少走弯路。 环境信息 系统 : macOS (Apple Silicon) CPA 版本 : v6.9.29 Codex 版本 : 0.121.0 代理工具 : ClashX / Clash Verge 核心问题:502 Bad Gateway 症状 Codex 启动后尝试连接 API 时,反复出现: Unexpected status 502 Bad Gateway: Unknown error, url: http://localhost:8321/v1/responses 根本原因 系统代理拦截了 localhost 请求! ClashX/Clash Verge 等代理工具默认会拦截所有 HTTP 请求,包括 localhost 和 127.0.0.1 。当 Codex 尝试访问本地 CPA 服务时,请求被代理转发,导致: 请求无法直接到达本地服务 代理返回 502 错误 日志中看不到任何请求记录(因为请求根本没到达目标服务) 解决方案 方法 1:设置 NO_PROXY 环境变量(推荐) # 添加到 ~/.zshrc 或 ~/.bashrc export NO_PROXY="localhost,127.0.0.1" # 应用配置 source ~/.zshrc 重要: 必须在新终端中启动 Codex,才能加载新的环境变量。 方法 2:配置代理绕过规则 在 ClashX/Clash Verge 中添加绕过规则,让 localhost 不走代理。 其他常见问题 1. API Key 不匹配 (401 Unauthorized) 症状: Unexpected status 401 Unauthorized: {"error":"Invalid API key"} 原因: Codex 使用了自己的 API key(格式如 sk-sub-Pack6n6X... ),而不是配置文件中的 api_key 。 解决方案: 将 Codex 使用的 key 添加到 CPA 配置中: # ~/cpa-config.yaml api-keys: - "your-custom-key" - "sk-sub-Pack6n6X_yKXdwEwPB2mT0iGkcQyE4IMMHe-kCN7TIy4L-gf" # Codex 的 key 重启 CPA: pkill -f "cpa.*config" ~/.local/bin/cpa -config ~/cpa-config.yaml > /tmp/cpa.log 2>&1 & 2. 端口被占用 症状: Error: listen EADDRINUSE: address already in use 127.0.0.1:8321 原因: 旧的 shim 进程还在运行 LaunchAgent 自动重启服务 解决方案: # 查找占用端口的进程 lsof -nP -iTCP:8321 -sTCP:LISTEN # 停止进程 kill -9 <PID> # 禁用自动启动 launchctl unload ~/Library/LaunchAgents/com.linkunkun.codex.cliproxy-shim.plist 3. 旧版本冲突 症状: Homebrew 安装的旧版本 cliproxyapi 自动重启。 解决方案: # 停止 Homebrew 服务 brew services stop cliproxyapi # 卸载旧版本 brew uninstall cliproxyapi # 清理配置 rm -rf /opt/homebrew/etc/cliproxyapi* rm -f ~/Library/LaunchAgents/homebrew.mxcl.cliproxyapi.plist 4. Shim 是否必需? 答案:不需要! 早期以为需要 shim 来转换请求格式,但实际上: CPA 原生支持 /v1/responses 端点 直接连接 CPA 更简洁高效 推荐配置: # ~/.codex/config.toml [model_providers.custom] name = "custom" wire_api = "responses" base_url = "http://localhost:8317/v1" # 直接连 CPA api_key = "your-api-key" 完整安装步骤 1. 安装 CPA # 下载最新版本 curl -L -o /tmp/cpa.tar.gz https://github.com/router-for-me/CLIProxyAPI/releases/download/v6.9.29/CLIProxyAPI_6.9.29_darwin_arm64.tar.gz # 解压并安装 cd /tmp tar -xzf cpa.tar.gz mkdir -p ~/.local/bin mv cli-proxy-api ~/.local/bin/cpa chmod +x ~/.local/bin/cpa # 添加到 PATH echo 'export PATH="$HOME/.local/bin:$PATH"' >> ~/.zshrc source ~/.zshrc 2. 配置 CPA # 复制示例配置 cp /tmp/config.example.yaml ~/cpa-config.yaml # 编辑配置 vim ~/cpa-config.yaml 关键配置项: port: 8317 # 管理密钥 remote-management: secret-key: "your-admin-password" # API keys api-keys: - "your-api-key" 3. 启动 CPA nohup ~/.local/bin/cpa -config ~/cpa-config.yaml > /tmp/cpa.log 2>&1 & 4. 配置 Codex # ~/.codex/config.toml model_provider = "custom" model = "gpt-5.4" [model_providers.custom] name = "custom" wire_api = "responses" base_url = "http://localhost:8317/v1" api_key = "your-api-key" 5. 配置代理绕过(关键!) # 添加到 ~/.zshrc echo 'export NO_PROXY="localhost,127.0.0.1"' >> ~/.zshrc source ~/.zshrc 6. 测试 # 测试 CPA curl http://localhost:8317/v1/models -H "Authorization: Bearer your-api-key" # 在新终端启动 Codex codex 调试技巧 1. 查看 CPA 日志 tail -f /tmp/cpa.log 2. 查看 Codex 日志 tail -f ~/.codex/log/codex-tui.log 3. 检查端口占用 lsof -nP -iTCP:8317 -sTCP:LISTEN 4. 测试 API 连接 curl -v http://localhost:8317/v1/responses \ -H "Authorization: Bearer your-api-key" \ -H "Content-Type: application/json" \ -d '{"model":"gpt-5.4","input":[{"role":"user","content":[{"type":"input_text","text":"test"}]}]}' 5. 检查代理设置 # 查看环境变量 env | grep -i proxy # 查看活动连接 lsof -nP -iTCP | grep codex | grep ESTABLISHED 常见错误排查流程 502 Bad Gateway ↓ 检查是否有代理 (lsof -nP -iTCP | grep codex) ↓ 有代理 → 设置 NO_PROXY ↓ 无代理 → 检查服务是否运行 ↓ 401 Unauthorized ↓ 检查 Codex 使用的 API key (查看日志) ↓ 将 key 添加到 CPA 配置 ↓ 重启 CPA 总结 配置 CPA + Codex 的最大坑就是 系统代理 。记住: 设置 NO_PROXY 环境变量 在新终端启动 Codex 直接连接 CPA,不需要 shim 将 Codex 的 API key 添加到 CPA 配置 遵循这些原则,可以避免 90% 的问题。 参考资源 CPA GitHub CPA 文档 管理界面 最后更新 : 2026-04-18 作者 : 基于实际踩坑经历整理 5 个帖子 - 3 位参与者 阅读完整话题

linux.do · 2026-04-18 20:36:15+08:00 · tech

我的问题:我无法在我的vps上用我的claudecode与codex 昨天我的claude与codex都能用,今天又崩了 我尝试把本地的能用的关键配置文件上传到里面,还是失败不能动,我怀疑是网络问题 vps是无界面的linux 我目前有2个GPT 一个team一个plus(官方) 两个中转站 any与jobema (分别调用claude与glm5.1模型) 我的科学工具 1.clash for linux 2.shellcrash 我能不能ping通youtube? export http_proxy="127.0.0.1:7890" 后,依旧不能,但是之前不能,可是codex还是能动 我的尝试方法 1.npx zcf 2.ccr 3.cc-switch 我想要什么? 我想要有个通用万能简单上手的,直接配置ai的 baseurl key model 就能用的,cli下的一个工具 opencode? 目前打算:卸载目前npx zcf,重新安装,重新配置 1 个帖子 - 1 位参与者 阅读完整话题

linux.do · 2026-04-18 17:45:24+08:00 · tech

之前的账号3h就没了,这次准备再新开一个,再次尝试一下! 目前准备: 静态LSP(美国加州) 住宅IP代理的指纹 浏览器 Claude账号注册用的是Gmail(新号)已养号3天 支付使用Visa虚拟卡 使用准备: 养号阶段——Web端对话 测试阶段——开通后先使用2天Web 使用阶段——没问题后,迁移至ClaudeCode(Linux服务器部署),同时我会删除原有的.claude文件夹(之前的残留) 这个帖子用来记录使用日志记录,欢迎各位佬友讨论! 1 个帖子 - 1 位参与者 阅读完整话题

linux.do · 2026-04-18 15:52:20+08:00 · tech

各位佬友,关于 Claude充值有什么好途径吗?仅自用。 我之前尝试用 Google Pay (经佬友提醒,是采用的 Google Play 内购)绑定国内中信(万事达)支付,竟然支付成功了,直接扣的 RMB,不过貌似是按照新加坡元换算的,大概 160 一月。 「我的 Claude 是谷歌登录的,貌似给我算到新加坡区了(可能是我一直用的新加坡节点)」 经佬友提醒,并查询订单,扣费 150,按照美区扣的~~ 这一月内,用的万人骑节点、换过不少 ip/节点(三个机场,混着用),竟然没有被封禁,接下来因为是写论文的关键时期,想再充一个月。 各位有什么建议的渠道吗?继续这样 160/月 SGD 充值? 另外之前有网友介绍过礼品卡,大概 100/月,不过不了解风险。 谢谢各位佬友解答啦。 不知道多少编:自充最佳应该就是美区 Google Play 绑定国内非银联卡(蛮好办的),选免税州,走谷歌商店内购,谢谢各位佬友交流。 另外:礼品卡渠道貌似可以 100 RMB,大家对这个渠道有什么见解吗? 19 个帖子 - 7 位参与者 阅读完整话题

linux.do · 2026-04-18 14:01:47+08:00 · tech

我之前尝试过 spec 驱动开发,但是要写一份长长的 spec 再给 AI 开发实在劝退我。别说自己写 spec,就是 AI 帮我写完,让我 review 我也没耐心看完。于是我发明了 TODO 驱动开发。 什么是 TODO 驱动开发 简单来说,就是将需求拆解后,在项目代码中需要修改处加上 TODO 注释,再让 Coding Agent 使用 git 读 diff,获取所有新增 TODO,再逐一编写代码。 TODO 驱动开发有什么优点 第一,也是最明显的优点,TODO 驱动开发是从源码出发,让你自己找到需要修改的点,可以是一个待完成的函数,一个需要新增的类,甚至是一个模块,加上对应的 TODO 信息,再转交给 agent 进行实现。你的工作流基本还是在 代码编辑器/IDE 中,不需要你改变现有工作流。 第二,Coding Agent 在读取 diff 信息时能顺便看到代码上下文,不需要你费劲说明应该改哪个模块。 第三,由于已经明确具体修改点以及每个点的修改逻辑,对于没那么强的模型也能有相对更好的执行效果。 第四,由于已经明确具体修改点以及每个点的修改逻辑,Coding Agent 的改动更可控,Review 起来也更容易 2 个帖子 - 2 位参与者 阅读完整话题

linux.do · 2026-04-17 22:25:47+08:00 · tech

如题,之前在看到有佬发出利用replit去白嫖opus 4.6的方法,然后我那个时候尝试了四个号,两个号邀请,另外两个号接受邀请,然后绑卡,最后四个号都领到了一个月的会员,并且都开启了那个可以被调用的的服务。结果第二天,我有两个号(一个邀请的和一个被邀请的)被封了,我那个时候还没用多少就被封了(好像20刀都没到)。另外两个号白嫖了100多刀就光荣牺牲了。本来以为以后都见不到这个replit了,结果他突然给我一个早早被封的号发了封邮件,告诉我被解封了 我心想还有这好事?然后我尝试打开之前这个号绑定的网站,结果发现进不去,然后我又用他给的新密码去登陆,结果登陆不了,说什么Invalid username or password. 我只想问何意味?这个误封(其实不是)没有补偿就算了,还不让我登进去 1 个帖子 - 1 位参与者 阅读完整话题

linux.do · 2026-04-17 20:41:37+08:00 · tech

一开始发现一个现象,如果是edit模式,慢慢读文件编辑文件是没问题的。 但是一旦开启计划模式,cc尝试拉起子代理时,因为当前any的haiku似乎不可用,于是cc会自动用opus作为替代向any发起大量请求,大量的opus请求,导致any的后端直接报错,如下: Provider any returned 500: new_api_panic: Panic detected, error: runtime error: invalid memory address or nil pointer dereference. 我不是技术党,咱也不知道啥意思,总之一旦后端返回这个就会给我掐了,所以从行为上我猜大概率是请求速率撞了后端的限制? 于是我灵机一动,既然如此,高频简单的工作让glm干不就好了?果然再没有遇到任何错误开始爽蹬any 17 个帖子 - 10 位参与者 阅读完整话题

linux.do · 2026-04-17 17:50:49+08:00 · tech

周末了,佬友们笑笑缓解一下压力。尝试研究一下现在的AIGC检测具体怎么样。 来自我们可爱的谷歌小猫咪,击米妮给大家创造一点好玩的 AI检测是一门生意,两头吃,一边查一边卖降重,越来越难了啊。 为了防止文言文AI率过高,人家直接白名单不查,至今忘不了岳阳楼记AI率破70的报道 用AI创作,然后用AI查AI,之后再卖AI降AI用AI降低率,这波是知网赢麻了,闭环收米开始喽 首先,为了避免古文白名单,我们现在使用散文,尝试增加AIGC检测碰撞率,不然直接不检测就不好玩了。 然后,请出去年很火的朱雀,当个玩具玩玩,结果自然是100%人工,毕竟朱自清风格白名单啊,总不能人家穿越过来用AI吧。 之后请出paperpass,这个算是免费里面比较好用的了,相对来说还是能分析出来一点AI率的,但是具体哪里像看不出来。 只要你模仿可能在白名单的风格,AIGC直接忽略检测,AI查AI查了个寂寞 4 个帖子 - 3 位参与者 阅读完整话题

linux.do · 2026-04-17 17:26:13+08:00 · tech

更新了4.7,本来还是挺开心的,然后就尝试跟他讨论了一下之前一块聊过的关于我做的一个关于康威生命游戏的变体的规划。 兴致勃勃地开始探讨,离谱的语气和酷似gpt的风格先给我来了个ptsd 随着越来越深入,一些明显存在的设计性问题都看不出来还有对整体的设计理解不深也就罢了(4.6可从来没这问题),我谅他是个llm我也不争辩了吧。 但你把问题指出来了不去解决反倒在那又给我圆了是啥意思??? 我弄个pro本来就是想去探讨探讨规划的,代码能力可能很NB,但光是规划这块真难绷() 严重怀疑A\把4.7从Mythos里面扒出来的时候给孩子扒精神分裂了 已经可以想象到,未来A畜下架4.5/4.6的时候,又来了当年4o昨日重现 5 个帖子 - 4 位参与者 阅读完整话题

linux.do · 2026-04-17 15:51:00+08:00 · tech

最近在尝试用 xiaomi 的 omni 模型跑 openclaw 和 hermes agent,但是发现他这个 token plan 的用量有点奇怪啊,我看了介绍,讲道理 omni 是1x 倍率的,也就是2亿 credits 对应的就是2亿 tokens 吧,怎么这才两天,就是一些简单的任务,还没上强度呢,就7000多万下去了,我也看了两个 agent的 dashboard 里面统计的用量,完全匹配不上这7000多用量啊,有同样感觉的兄弟吗?是 agent 的统计有误呢还是小米水分太多了呢 1 个帖子 - 1 位参与者 阅读完整话题

linux.do · 2026-04-17 14:38:45+08:00 · tech

我全程没手写一行代码,只用 Trae + 下面这套现成提示词,就做出了功能完整的全屏滚动字幕小程序。不用懂前端、不用懂 Canvas、不用调样式,复制粘贴就能生成全套代码,直接上架微信。 首页:5 种预设样式一键切换(滚动字幕、动感摇滚、表白神器、舞台荧光、寻人牌) 展示页:全屏竖排文字滚动,支持荧光 / 闪烁 / 故障风等特效 可自定义:文字、颜色、字号、字体、滚动速度 底部控制面板 + 右侧滑出设置栏 常用语、历史记录、用户配置自动保存 微信开发者工具直接运行,零修改、零报错 1. 一键生成完整小程序 创建一个"大字君"类型的微信小程序项目,功能要求如下: 页面结构 首页(pages/index)- 模板选择页面 5个预设样式按钮:滚动字幕、动感摇滚、表白神器、舞台荧光、寻人牌 输入框可自定义文字 展示页(pages/display)- 文字展示页面 全屏 Canvas 竖排显示滚动文字 底部悬浮控制面板 右侧滑出设置侧边栏 核心功能 Canvas 文字滚动 文字竖排显示(旋转90度) 滚动速度可调:0(停止)/0.5x/1x/2x 字体大小可选:100/150/200/260 支持的字体:渔阳、金榜、黑体、方圆、大楷、刀隶 文字效果 无效果(none) 闪烁(blink)- 文字交替显示/隐藏 荧光(glow)- 文字发光效果 shadowBlur=30 故障风(glitch)- RGB分离偏移效果 描边(stroke)- 文字边缘描边 阴影(shadow)- 文字阴影效果 预设样式配置 BUTTON_STYLES = { ‘滚动字幕’: { textColor: ‘ #ecf0f1 ’, bgColor: ‘ #2c3e50 ’, textEffect: ‘none’ }, ‘动感摇滚’: { textColor: ‘ #000000 ’, bgColor: ‘ #f5576c ’, textEffect: ‘glitch’ }, ‘表白神器’: { textColor: ‘ #ffffff ’, bgColor: ‘ #ff6b9d ’, textEffect: ‘glow’ }, ‘舞台荧光’: { textColor: ‘ #0ff ’, bgColor: ‘ #1a1a2e ’, textEffect: ‘glow’ }, ‘寻人牌’: { textColor: ‘ #8b4513 ’, bgColor: ‘ #fff8e7 ’, textEffect: ‘none’ } } 控制面板 主页/设置按钮 文字输入框(实时输入确认) 常用语横向滚动列表 添加常用语按钮 背景使用 rgba(0, 0, 0, 0.6) 半透明黑色,顶部圆角 24rpx 设置面板(侧边栏) 字体颜色选择器(8种颜色) 字体大小选择(4种) 字体选择(6种字体) 播放速度选择(4档) 文字效果选择(6种) 背景颜色选择器(8种颜色) 数据存储 用户配置:wx.getStorageSync(‘user_config’) 保存:fontSize, speed, textColor, textEffect, bgColor, fontFamily, phrases, lastText 历史记录:wx.getStorageSync(‘history_texts’) 最多保存50条,带时间戳 去重处理(相同文字移到顶部) 生成新页面(需要加页面时用) 创建一个微信小程序页面,包含 wxml、wxss、js、json 四个文件,使用数据驱动、规范命名、事件绑定,逻辑清晰可直接运行。 实现 Canvas 竖排滚动动画 在微信小程序中实现 Canvas 竖排文字滚动动画,支持闪烁、荧光、故障风、描边、阴影等效果,使用标准动画循环与竖排渲染方式,代码稳定不卡顿。 实现用户配置存储 在微信小程序中实现用户配置保存功能,自动存储字号、速度、颜色、效果、字体等设置,页面隐藏时自动保存,打开时自动读取。 实现历史记录管理 实现文字历史记录功能,最多保存 50 条,自动去重,新记录置顶,带时间戳,本地持久化存储。 实现右侧设置面板 创建设置侧边栏,支持字体颜色、字号、速度、文字效果、背景颜色选择,界面美观、操作简单。 实现常用语功能 实现常用语添加、删除、展示功能,支持弹窗编辑,数据本地保存。 实现预设样式按钮 创建 5 种预设样式按钮,一键切换文字颜色、背景色与特效,适配大字君项目使用 按照顺序将提示词发给 Trae,大体功能基本就出来了,最后只用根据自己的喜好写点页面和交互的提示词微调就可以了。 微信小程序开发规范 项目初始化 app.json 包含 pages、window、style、sitemapLocation 每个页面必须:wxml + wxss + js + json Canvas 规范 使用 type=“2d” canvas initCanvas 在 onReady 执行 动画变量挂 this,不进 data 用 requestAnimationFrame 循环 数据存储 用户配置:user_config 历史记录:history_texts onHide 自动保存 文字效果 blink:显隐切换 glow:shadowBlur=30 glitch:RGB分层偏移 stroke:描边 shadow:阴影 附小程序体验码: 1 个帖子 - 1 位参与者 阅读完整话题

linux.do · 2026-04-17 10:26:46+08:00 · tech

这段时间一直和奥特曼斗智斗勇,也尝试过很多大佬的方案,这两天用古法注册机的时候发现了一个情况。我有一台设备的谷歌浏览器,无论换什么ip节点,用什么邮箱(只要不是被封杀的),都能够一次性注册成功,不跳add-phone。于是我就在同一台设备,做了几组对照实验,得出一个结论:注册跳add-phone更像是某一套特定浏览器/设备身份被服务端放进了“先补手机号”的分流桶,而不是邮箱或网络环境直接导致。后续就没有了…仅供一乐,下面是一些对照实验的截图。 2 个帖子 - 2 位参与者 阅读完整话题

linux.do · 2026-04-17 05:17:05+08:00 · tech

看书还是有必要的,市场上各种教程都有些浮躁,我尝试着用给AI讲戏的方法来做视频,效果还是很可观的,偷了个懒有错别字,佬们可以参考一二。感觉这个方向出来的东西还可以。视频我还没学会上传到这里劳大家移步?穷鬼用不起贵的模型直接pixversv6整的 PixVerse | Create Amazing AI Videos from Text & Photos with AI Video Generator PixVerse | Create Amazing AI Videos from Text & Photos with AI Video Generator Transform your photos into captivating AI videos with PixVerse's powerful AI model. Create viral content with trending effects like AI Kiss, Hug, Muscle & more for all social platforms. 1 个帖子 - 1 位参与者 阅读完整话题