智能助手网
标签聚合 视觉

/tag/视觉

www.ithome.com · 2026-04-18 14:44:34+08:00 · tech

IT之家 4 月 18 日消息,OPPO 官方今天在微博宣布 Find X9s Pro 手机将搭载新一代 1nit 明眸护眼屏, 4 月 21 日发布 。 IT之家了解到,这款手机应用新一代 U9 Pro 屏幕材料,支持 1nit 暗光护眼。拥有行业首款德国莱茵 TÜV 低动态干扰认证,支持人因科学自研视觉舒适调节。 参数方面,OPPO Find X9s Pro 预计将搭载 6.32 英寸 1.5K+144Hz LTPS 直屏,配备天玑 9500 处理器,拥有 7025mAh 电池、80W 有线快充、50W 无线充,支持 3D 超声波指纹,重量 198g。 此外,该机将配备 200Mp HPE 1/1.4" 主摄 +50Mp 超广角 +200Mp HP5 1/1.56" F2.6 2.8X 潜望长焦 +3.2Mp 多光谱镜头,253mm 增距镜。

www.ithome.com · 2026-04-18 07:17:00+08:00 · tech

IT之家 4 月 18 日消息,Anthropic 昨日(4 月 17 日)发布博文,宣布推出 Claude Design 工具,基于 Claude Opus 4.7 模型, 定位是视觉创作工具。 该工具支持用户通过对话生成设计、原型和演示文稿,具备品牌系统自动应用、多源导入和精细化调整功能。 IT之家注:Claude Design 工具目标是帮助设计师拓展探索空间, 同时让产品经理、创始人等非设计背景人员在几分钟内高效产出视觉作品 ,目前该功能已向 Claude Pro、Max、Team 及 Enterprise 订阅用户逐步开放。 在核心功能方面,Claude Design 支持用户通过自然语言描述需求,由 AI 生成初版设计。用户可通过对话、行内评论、直接编辑或自定义滑块进行精细化调整。 产品支持导入文本提示词、图片及 DOCX、PPTX 等多格式文档,此外为确保原型与实际产品一致,还支持抓取网页元素。其内置的品牌系统能读取企业代码库与设计文件,自动应用统一的配色、字体与组件规范。 该工具覆盖多种应用场景,包括将静态模型转为交互原型、快速产出产品线框图、生成融资演示文稿及营销物料等。 实测数据显示,Brilliant 团队曾用其他工具需 20 余次提示词才能完成的复杂页面,在 Claude Design 中仅需 2 次提示词即可实现。设计完成后,用户可导出为 Canva、PDF、PPTX 或独立 HTML 文件,也可打包移交 Claude Code 进入开发流程。

linux.do · 2026-04-17 23:09:14+08:00 · tech

识别里面的"菜品名"与"点菜数量"只有出现黑色打勾的行才算点菜,如果价格“XX元”后面出现了手写数字,则该手写数字为“点菜数量”,否则“点菜数量”默认为1“菜品名”永远原样输出“·······”之前的文本,不要自行篡改菜品名,比如,严禁将“炒二冬”自行改名“炒冬笋” 只输出 YAML,严格使用以下格式: 菜品名A: 点菜数量 菜品名B: 点菜数量 举例: 溪水石斑鱼: 1 手抓羊排: 1 除 YAML本体 外不要输出任何解释、前后缀、标题或 Markdown code fence 试了下 GLM-5V-Turbo、qwen3.6plus、qwen3 VL plus、minimax2.7、kimi k2.5 、gemini3.1pro没一个能识别对的,难道是我姿势不对? 20 个帖子 - 10 位参与者 阅读完整话题

linux.do · 2026-04-16 23:42:08+08:00 · tech

Anthropic 发布其最新模型 Claude Opus 4.7,在高级软件工程领域较 Opus 4.6 实现显著提升,尤其在最高难度任务上表现突出。用户反映可将此前需要紧密监督的高难度编程工作放心交由 Opus 4.7 独立完成,模型能够在复杂长流程任务中保持严谨与一致性,并在反馈前自行验证输出结果。 网络安全方面,Opus 4.7 是 Project Glasswing 计划下首款搭载新型网络安全防护机制的模型,可自动检测并拦截违禁或高风险的网络安全相关请求;其网络安全能力弱于 Mythos Preview,Anthropic 表示将借此次部署积累经验,为 Mythos 级别模型的广泛发布做准备。视觉能力方面,Opus 4.7 支持最高 2,576 像素长边(约 375 万像素)的图像输入,超过此前 Claude 模型的三倍,进一步拓展了计算机使用代理、复杂图表数据提取等多模态应用场景。 Opus 4.7 现已在 Claude 全系产品及 API、Amazon Bedrock、Google Cloud Vertex AI 和 Microsoft Foundry 上线,定价与 Opus 4.6 一致,API 输入价格为每百万 token 5 美元,输出为每百万 token 25 美元,开发者可通过 claude-opus-4-7 调用。此次更新同步推出多项新功能:新增 xhigh 努力等级(位于 high 与 max 之间);API 侧以公测形式上线任务预算功能;Claude Code 新增 /ultrareview 深度代码审查命令,并将自动模式扩展至 Max 用户。 anthropic.com Introducing Claude Opus 4.7 Anthropic is an AI safety and research company that's working to build reliable, interpretable, and steerable AI systems. 5 个帖子 - 4 位参与者 阅读完整话题

www.ithome.com · 2026-04-16 10:45:55+08:00 · tech

IT之家 4 月 16 日消息,联想来酷 Lecoo 官方今日发布了全新视觉体系,号称用更纯粹的视觉语言告别繁杂, 启用全新 VIS 系统 (视觉识别系统,包括 Logo 、标准色等)。 IT之家查询来酷官网获悉,来酷科技有限公司成立于 2017 年 12 月 18 日。产品品牌 Lecoo 发布于 2018 年 4 月 16 日,业务覆盖个人计算、智能可穿戴、智能家居、智能影音、智能外设及 AI 服务等领域;2025 年 5 月 8 日,发布全新品牌“斗战者 BELLATOR”。 ▲ 旧版来酷 logo 官方对新 logo 进行了解读: 无限可能:尾部 ∞ 象征探索永无止境 进取动能:字母 e 上扬定格爆发的动感 极简流线设计,精准传达“Cool”的先锋态度

www.ithome.com · 2026-04-15 14:22:04+08:00 · tech

IT之家 4 月 15 日消息,据《福布斯》当地时间 4 月 14 日报道,华特迪士尼公司 CEO 戴明哲宣布,公司将启动大规模裁员,以“精简运营”。此次调整将 影响约 1000 名员工 ,范围覆盖影视制作、电视网络、体育及主题体验等多个业务板块。 漫威 成为受影响最严重的部门之一。纽约与伯班克团队均有裁员,涉及电影与剧集制作、漫画、IP 运营、财务和法务等多个领域,其中包括 漫威影业几乎整个曾获奥斯卡奖的视觉开发团队 。 该团队主要负责漫威影视作品的视觉设计,由艺术家、角色设计师及环境设计师等组成,参与打造从《复仇者联盟》到《银河护卫队》再到《夜魔侠》等作品的整体风格。不少成员在漫威工作超过 10 年。 此次裁员 几乎清空该部门 ,仅保留少量核心制作人员,用于按项目协调外部资源。这一裁员消息在周二中午开始通过媒体报道和社交平台迅速扩散。 据IT之家了解,知情人士称,此举主要源于漫威影业此前缩减制作规模,同时也属于迪士尼整体成本控制的一部分。目前来看,这些岗位调整并非出于人工智能因素,尽管 AI 已在其他创意行业引发类似变动。 部分视觉开发人员将转为项目制合同合作。此次裁员发生在娱乐、广告、游戏及媒体制作行业创意岗位普遍收缩的大背景下。 戴明哲在内部信中表示:“我知道这很艰难。这些决定并不反映员工的贡献,也不代表公司整体实力,而是出于持续优化资源配置、将资源投入更关键业务的需要。”

linux.do · 2026-04-15 14:19:43+08:00 · tech

把个人物品放好,一出来就看见一双黑色红底高跟鞋,不得不说看着真的很有视觉冲击力 然后我环视了一圈发现健身房里大部分的男同胞都在看,看来大家审美是一致的 御姐穿个大衣,健身房里很热也不知道她热不热。 我也就是被吸引了一下,很快我就把目光放在另一边的健身教练 。脑中开始好奇吃什么长大的?身体发育那么好,感觉前凸后翘的夸张 9 个帖子 - 9 位参与者 阅读完整话题

linux.do · 2026-04-14 11:17:16+08:00 · tech

任务: 生成15秒中文脱口秀视频。 视觉特征: 一位漂亮的中国年轻女孩,面部和身材特征参考图,真人实拍风格,皮肤白皙,身材匀称。穿白色泡泡袖褶皱衫、高腰牛仔短裤、白色厚底鞋。舞台中心,垂直聚光灯,深色剧场背景,8K电影级写实画质。 动态与脚本: 步态优雅且精准。关键点:说话时面部上半部分几乎静止,仅嘴唇随台词开合,保持职业冷感微笑。 台词: “你不用给我情绪价值,请直接上价值。只要价值到位了,情绪我自己能控制。我和人过不去,我还能跟钱过不去吗?人为什么情绪总是不稳定?那是由于价值不稳定。主打就是:花谁的钱,听谁的话;没花你钱,请少说话。” 声音与剪辑: 声音清脆如职业主持,语速均匀,字正腔圆,带有一种理性的压迫感。剪辑节奏: 金句点后插入0.5秒观众(男女皆有)爆笑和鼓掌的特写镜头。镜头在女孩独白时进行缓慢的推焦特写,强化视觉冲击。 https://x.com/i/status/2043317050307957003 7 个帖子 - 6 位参与者 阅读完整话题

linux.do · 2026-04-14 10:35:21+08:00 · tech

众所周知,codex的平面设计能力感觉不太行,所以我直接走了3D。所以加载可能需要点时间,如果网络环境不是很好的话,并且这个网页是重特效,所以拒绝了非桌面端访问。 isaca.run 建议大屏幕访问,首页的空间站模型需要加载一点时间。 如果是核显可能有掉帧感觉 佬友们如果有什么好的想法也可以说出来 来一个优化高手教教如何优化,确实有点小卡 19 个帖子 - 17 位参与者 阅读完整话题