感觉自己太久没有自己写过前端UI了,最近想干什么全交给AI了,最近想想要不像自己几年前以前那样写个网页小工具,然后就有了这个玩意 一个随便产生的想法,本来打算直接AI掉的,结果还是自己写了 我的想法是抄一下终末地官网先做个加载界面,再搞几个游戏内的UI组件上去 加载画面的话我没有完全照搬,而是搞了循环动画,反正我自己挺满意的,组件的话抄起来太麻烦了,还得给按钮搞背景图片,我直接偷懒搞纯色,感觉还是不太对味,算了就这样吧 然后数据分析和导出docx是AI写的,说白了还是懒~ 今天一天之内干的,不知道佬友觉得这个玩意如何 链接在这里 (其实还有好几个域名) : t.ftz.is-a.dev 《明日方舟:终末地》集成工业助手提示词生成器 终末地真好玩 1 个帖子 - 1 位参与者 阅读完整话题
直接说要生成的图片就有了,甚至2选一,询问用户那个更好,我甚至以为这个是竞技场了 。奇怪的是,为什么女主播名字都带鹿鹿的??? 10 个帖子 - 5 位参与者 阅读完整话题
今天又看到QuiverAI 发布 Arrow 1.1 SVG 生成模型发布,近些这种SVG生成模型好像比较多想求问一下论坛的各位大佬这种类型的模型一般有哪些用途?我个人能想到的是做UI/UX 设计然后就是科研绘图,最主要的还是科研绘图,想问一下有没有佬实操过这类专门为SVG生成的AI绘制一般的科研的图效果如何? 1 个帖子 - 1 位参与者 阅读完整话题
23号到期 sk-cp-ecX_dNHFQlzyf3W6jljM3tQXrg4kPEVQSLNxECs7g3ShRQAcdqGx9EYrcWZwMEpFrvCwK-SWfBh5ETIuoFyIDWH0JA7IXVN4D_00O5xLcu2N5W7utx0iNko 支持生成音乐 各位佬蹬个痛快,蹬爽的话,赞一个留个回复助我完成升级指标 5 个帖子 - 4 位参与者 阅读完整话题
cpa里面挂了一些plus账号,生成的key先挂在cc switch中,vs code中用codex,一会儿能用一会儿不能用。报错codex报401,cc swtich报502。cpa日志里400 401 各种日志都有。 用了几天,一会儿能用一会儿不能用的。大多场景发生在所有账号额度用完,下5小时额度出来的时间节点,各种报错。 17 个帖子 - 11 位参与者 阅读完整话题
最近半年一直在折腾一个项目——用 AI 自动生成短视频。起因是身边做小生意的朋友总问我能不能帮忙剪视频发抖音,我想这事儿应该能自动化,就开始做了。 分享一下技术方案和踩过的坑,希望对有类似想法的朋友有参考价值。 整体架构 用户上传素材 + 输入文案 ↓ TTS 语音合成(MiniMax / 火山引擎) ↓ 根据语音时长自动分配素材时间轴 ↓ 云端渲染(转场、字幕、BGM) ↓ 成品视频 后端 FastAPI + MySQL,前端 Vue 3,视频渲染走云端 API,手机端用 Capacitor 套了个壳。一个人全栈,没有团队。 几个有意思的技术点 1. TTS 选型 试了一圈,最后主力用 MiniMax speech-2.8-hd,中文多音字准确率目前最好。火山引擎作为补充,主要是剪映生态的独有音色(奶气萌娃、广告解说这种)。Azure 的中文效果一般,Fish Audio 没深入测。 踩坑:TTS 返回的音频时长和文字长度不是线性关系,语气词、停顿都会影响。批量生成时如果对时长有严格要求,需要做重试机制。 2. 素材自动分配 这块逻辑最复杂。用户上传 N 个素材(视频+图片混合),系统要自动决定每个素材展示多久、从视频的哪个位置截取。 几个关键决策: 视频从中间 70% 区域截取(跳过开头 20% 和结尾 10%),因为大部分手机拍的视频开头都是晃动的 图片展示时长根据总时长动态计算,保证每张都出现,最少 1 秒/张 批量生成时用发牌算法分配素材,保证每条视频的封面帧不同 3. 批量生成去重 做矩阵号的核心需求是"一组素材生成几十条不重复的视频"。去重策略: AI 扩写多组文案时分配不同的切入角度(预定义了 30 个角度) 每条视频的素材起始偏移不同 视频截取位置随机化 第一个 clip 强制用不同素材保证封面不同 4. 浮点精度问题 这个坑最隐蔽。视频时间轴用浮点数计算,多个 clip 拼接时 accumulated 会漂移,导致素材重叠或出现缝隙。解决方案是每次用 round 后的值更新 accumulated: cs = round(clip_start, 1) ce = round(clip_end, 1) accumulated += (ce - cs) # 不是 accumulated += clip_dur 5. 实时语音输入 加了个语音输入功能,用户对着手机说文案直接转文字。技术上是浏览器 AudioContext 采集 PCM → WebSocket 传到后端 → 转发到阿里云 paraformer-realtime-v2。 踩坑:中间结果和最终结果的拼接如果处理不好会闪烁,最后用了"快照 + 增量"的方案解决。 技术栈汇总 层 技术 前端 Vue 3 + Vite + Capacitor 后端 Python 3.13 + FastAPI + SQLAlchemy 数据库 MySQL 8 存储 阿里云 OSS + CDN AI 文案 通义千问 TTS 火山引擎 语音识别 阿里云 paraformer-realtime-v2 目前自己和几个朋友在用,做餐饮和服装的,反馈还行。有兴趣的可以体验一下: https://zj.xinghepay.com ,Android 也有 APK https://media.xinghepay.com/xinghe/app/xhzj.apk 技术上有什么想聊的欢迎评论区交流,特别是视频处理和 TTS 这块,踩的坑比较多,能聊的也多 6 个帖子 - 5 位参与者 阅读完整话题
GPT-IMAGE-2 生成海报以假乱真 搞七捻三 今天看到很多人在讨论GPT-IMAGE-2,自己去生成了几张海报试了下,效果是真不错啊,提示词很简单,就是:例如“生成跑跑卡丁车,qq 飞车这两款游戏联动活动宣传海报”这样的,以下来欣赏一下效果图: [7b41f8dca6c867884de42b617f2f4c9f] [61dd66732b673860edd9cd34bda48c71] [4f2f2f0ccf6905230792f1b63… 从这个贴的评论里发现还有不少佬有没有被灰度到,可以 直接回复提示词 ,我帮你生成。 附昨天让 gpt 生成的感觉效果最惊艳一张 99 个帖子 - 50 位参与者 阅读完整话题
IT之家 4 月 18 日消息,科技媒体 PCWORLD 今天(4 月 18 日)发布博文,测试显示 Anthropic 发布的 AI 设计工具 Claude Design 功能强大,但词元(tokens)消耗极高, 25 分钟耗尽 Claude Pro 用户 80% 周配额。 IT之家今天报道,设计小白用户通过 Claude Design 工具,也能制作出媲美专家的优秀视觉作品,用户通过文本提示词,可以让其生成网页原型、应用线框图及营销物料,并导出 HTML、PDF 等多种格式。 该媒体编辑本 · 帕特森(Ben Patterson)输入“创建解释 AI Token 的交互图表”提示,Claude Design 通过多轮问答明确需求,制定了编辑风格的设计方案。 工具界面采用左右分栏布局,左侧为对话栏,右侧为实时画布。仅 5 分钟,系统便生成了包含实时交互功能的网页草稿,文案清晰准确,基本符合预期,在 25 分钟内工具完成了 3 个版本的原型设计。 然而,高昂的词元消耗成为核心痛点。测试进行 25 分钟后, Claude Pro 订阅用户的周配额已消耗 80% ;在切换至成本较低的 Sonnet 4.6 模型后,仅 5 分钟后便耗尽了剩余配额。 相关阅读: 《 你也能设计出专业作品:Claude Design 视觉创作工具上线,分钟级转化创意到原型 》
发现了提示词网站,他的前端界面,做的很漂亮,但是和我项目技术栈不搭,所以想要蒸馏为一个skill 就是这样提示词,gpt 都能写出这样页面来,感觉超牛的 佬们有没有什么好的项目推荐: motionsites.ai MotionSites — Premium Hero Prompts Your Design Al Superpowers In One Click 7 个帖子 - 6 位参与者 阅读完整话题
因个人兴趣 平时喜欢生成一些 Ai视频,来玩一些,陆陆续续冲过即梦会员和小云雀会员,后面即梦排队巨久,一排有时候就是1-2天 后面就去冲了 小云雀 的会员 不过后续 他俩都卡审核 ,沾一点真人脸基本上就不通过。一开始给图片上一层浅浅的高斯模糊还行的,后面咋整都不行。 我主要是用sedance 2.0 其他 没怎么用过,看了也有香蕉pro 不过估计没有其他平台的api便宜 填一下问卷 大概第二天傍晚就会通过,注册完成会送5000积分 不是很多就只够生成3-4个seedancce 2.0的视频 大概看了一下,应该比即梦和小云雀便宜,主要是不卡人脸 这个是我购买的主要目的 这也是我头一次 知道原来sedance 是可以生成4k视频的 不过目前本人只试过2k(之前一直在用720p) 200块钱 一口气给64800 积分 相当于可以生成43个 1080p 的10秒 视频,个人感觉还是比较爽的 已经在爽玩了 3 个帖子 - 2 位参与者 阅读完整话题
GPT灰度的新生成图片的模型在哪个平台可以用? 继此贴 贴下各类佬友的方法 我测试了一下发现并非切换到pro就可以进入灰度,而是切换各个模型都有可能进入灰度 上图为thinking模式 上图为instant模式 (时间上紧接着thinking模型之后,另开新窗口重新生成) 因此推测: 切换模式 确实可以进入到灰度 8 个帖子 - 7 位参与者 阅读完整话题
只能说是有点才能在身上的 3 个帖子 - 3 位参与者 阅读完整话题
IT之家 4 月 18 日消息,当地时间 4 月 17 日,OpenAI 视频生成平台 Sora 负责人比尔 · 皮布尔斯宣布离职。公司正在调整战略,以减少“支线项目”,将重点转向编程和企业应用,皮布尔斯的离开正是这一系列调整的一部分。 据IT之家了解,OpenAI 上个月宣布,放弃其视频生成工具 Sora。 皮布尔斯在 X 上表示,“我非常感谢萨姆、马克、阿迪提亚和雅库布营造的研究环境,使我们能够探索偏离公司主线路线图的想法。人生中很容易只聚焦最重要的一件事,但对于研究机构来说, 保持多样性才是长期发展的关键 ,萨姆对此深有理解。Sora 是一个 只有在 OpenAI 才能实现 的项目,我也将一直珍视这段经历。” 同时,OpenAI 负责科学 AI 的副总裁凯文 · 韦尔也将离职,并宣布周五是其最后一天。他在 X 上称,其团队“将被分散到其他研究团队中”。 另据《连线》报道,OpenAI 此前推出、由韦尔负责的科研平台 Prism 也将被关闭,公司计划将其能力整合进 Codex 桌面应用。
两张3090 48G显存 私有化部署35B大模型, 生成速度142.65tokens/s 上下文长度262144 真香 8 个帖子 - 5 位参与者 阅读完整话题
比以前版本好多了,有点东西… 1 个帖子 - 1 位参与者 阅读完整话题
因为刷到这个佬友的帖子 最终兵器!!一块钱生成5.65秒seedance2.0,即梦国际版37000积分一个月。 于是注册了几个账号去 https://dreamina.capcut.com/ 看了看,分别是加拿大、日本、美国、新加坡。 加拿大 :每月约 283.93 元 (56.9 CAD),37,037积分,seedance2.0每秒 23 积分,相当于每秒仅 0.18元 ! 日本 :每月约 270.04 元 (6280 JPY),12,840积分,seedance2.0每秒 24 积分,相当于每秒 0.50元。 美国 :每月约 286.44 元 (42 USD),8,645积分,seedance2.0每秒 17 积分,相当于每秒 0.56元 。 新加坡 :每月约 301.28 元 (56 SGD),11,580积分,seedance2.0每秒 22 积分,相当于每秒 0.57元 。 且每个账号都有一次 免费 的 seedance2.0fast 可用,最多能有15s。 而国内的即梦: 如果同为标准版的seedance2.0,每秒 8 积分,就相当于每秒要 0.65元 了。 没有对应ip测土耳其和墨西哥的 各位佬友见谅。 但总的来说,加拿大地区的优惠跟这些相比,无疑是断档的第一啊! PS :附上他们每日的免费额度。 白嫖时长仅供参考,因为没会员用不了seedance2.0 ,只能生生图和用1.5以下的模型 4 个帖子 - 3 位参与者 阅读完整话题
要用于比赛awa,能图生图的www 可以ldc awa,或者有啥免费的渠道… 谢谢喵 3 个帖子 - 3 位参与者 阅读完整话题
m.sohu.com 人类首张太空AI生成图问世!清华系企业携手开启“天地同算”新纪元 人类计算史迎来里程碑时刻——一颗运行在数百公里高空的卫星,成功生成了首张AI图像。共绩科技则构建了全球首个闲时算力调度网络。更值得关注的是"算力外包"模式——当地面数据中心超载时,任务可自动分流至太空星座,形… 遥遥领先于马斯克() 1 个帖子 - 1 位参与者 阅读完整话题
最近尝试了用gemini(nanobanana) gpt 和 qwen用来生成PPT,发现效果远不如小红书等平台上调出来的效果,生成中文经常鬼画符,图标也容易和解释文字关系不大。不知这种问题一般如何解决.本人目前用的还是官网入口的免费模型 2 个帖子 - 2 位参与者 阅读完整话题
请把我们这次对话整理成一份“学习过程记录”,不要写成只保留结论的总结。 要求: 按照对话推进的先后顺序记录,从我最开始的疑问写到最后问题解决。 保留我的问题演化过程,包括: 最初的问题 中途冒出的新问题 更基础的追问 卡住的地方 理解发生变化的地方 不要把我的问题重写成一篇平滑的教程,要保留“我是怎么一步步学到这里的”这条线。 尽量保留我原本提问的意思和顺序,可以整理语句,但不要改变原意。 每个阶段都写清楚: 我当时在问什么 我为什么会问到这里 关键解释或关键代码点是什么 这个阶段又引出了什么新问题 我在这一阶段学到了什么 如果对话里有代码,要结合代码上下文来写,不要脱离代码空讲概念。 最后单独补一个“最终结论 / 当前理解”,但这个部分只能放在最后,不能代替前面的过程记录。 请按下面格式输出: 学习主题 一句话说明这次主要在学什么 学习起点 我最开始的问题是什么 我当时为什么会问这个问题 学习过程记录 第1阶段 我的问题: 当时的困惑点: 关键解释 / 关键代码点: 引出的新问题: 这一阶段学到了什么: 第2阶段 我的问题: 当时的困惑点: 关键解释 / 关键代码点: 引出的新问题: 这一阶段学到了什么: (按实际对话继续) 关键误区与转折点 列出我中途哪些地方理解错了,后来是怎么被纠正的 最终结论 / 当前理解 用简洁的话总结我最后已经搞懂了什么 仍可继续追问的点 列出这次虽然解决了,但后续值得继续深入的问题 1 个帖子 - 1 位参与者 阅读完整话题