智能助手网
标签聚合 训练

/tag/训练

linux.do · 2026-04-18 16:11:45+08:00 · tech

Grok 4.3 (beta) 已对订阅最高档 SuperGrok Heavy 的用户开放。17 日,用户已在 Grok.com 下拉菜单里看到该版本带有「Early Access」标记。18 日早晨,X 用户 Mark Kretschmann 发帖称这一版本拥有 1T 参数、体量是 Grok 4.20 的两倍,训练时间也显著更长。xAI 及特斯拉 CEO 马斯克(Elon Musk)随后在同条推文下更正,当前的 4.3 (beta) 仍是 0.5T 模型,只是一份更新的训练检查点,并非外界推测的 1T 新模型。 马斯克同时透露,真正的 1T 旗舰距离初始训练完成还剩约 5 天。他形容 1T 模型将在编码、长上下文和各项技能上形成阶跃式提升,并称 SpaceXAI 模型工厂已经跑通,之后预计每两周能下线一版改进后的基础模型。 13 个帖子 - 9 位参与者 阅读完整话题

www.ithome.com · 2026-04-17 14:46:22+08:00 · tech

IT之家 4 月 17 日消息,科技媒体 The Decoder 昨日(4 月 16 日)发布博文,报道称英伟达研究人员推出 Lyra 2.0 系统, 可从单张照片生成跨度约 90 米的连贯 3D 环境 ,解决现有模型在长距离漫游中的画面扭曲与遗忘难题。 当前 AI 生成 3D 场景的核心痛点之一,是虚拟摄像机长距离移动后,画面会出现色彩与结构扭曲,返回已探索区域时模型常重新构建环境。 英伟达团队为提高机器人仿真训练质量,针对视频模型离开视野即遗忘已见区域,以及逐步生成过程中误差累积导致严重扭曲两大挑战,发布 Lyra 2.0 系统,仅需单张照片即可生成可实时漫游的 3D 场景。 Lyra 2.0 通过存储每一帧的 3D 几何数据解决记忆问题,当摄像机重返旧地后,系统调取历史空间信息作为参考,避免重复生成。针对误差累积,研究团队在训练中让模型暴露于自身有缺陷的输出,让其学会识别并纠正质量下降,而非传递错误。 基准测试显示,Lyra 2.0 在图像质量、风格一致性和摄像机控制等几乎所有指标上击败 GEN3C、Yume-1.5、CaM 等 6 种竞品,其 Fast 版本在质量相当的情况下,视频生成速度提升约 13 倍。 生成的 3D 场景支持交互式探索,并可导出为网格格式用于 Nvidia Isaac Sim 等物理引擎。 这意味着训练机器人无需采集真实世界 3D 数据,可在完全生成的虚拟环境中训练。 IT之家附上参考地址 Lyra 2.0: Explorable Generative 3D Worlds

linux.do · 2026-04-17 08:13:51+08:00 · tech

现在X上骂声一片,我自己也感觉味道不对 骂声集中在: 大量的合成数据和蒸馏训练痕迹,开始不说人话了,Anthropic的基因没了 蠢得一塌糊涂,完全比不上正常情况下的Opus 4.6 目前看到的两个实测分别是Opus 4.7说GPT-5.4的实现有问题,先骂骂咧咧了一通然后开始修复,结果功能全部不正常 还有一个是尝试使用Opus 4.7来实现一个Opus 4.6未实现的功能,结果花了三十分钟改坏了三个功能 Opus 4.7只有在Effort=Max下才是可用的,但在Max下Rate Limit根本吃不消,一个Session几次对话就限额了 9 个帖子 - 9 位参与者 阅读完整话题

www.ithome.com · 2026-04-16 15:51:06+08:00 · tech

IT之家 4 月 16 日消息,在今天进行的京东具身智能生态发布会上,京东正式发布旗下 JoyEgoCam 超高清采集终端,该产品主要用于 AI 具身智能训练使用,同时也是全球首个覆盖“采、存、标、训、评、仿、测”全链路的具身智能数据基础设施。 据介绍,JoyEgoCam 配备双目摄像头,可实现 130 度垂直 / 水平 FOV 覆盖,支持录制 2160x2160 分辨率 60 FPS 视频,能够高速捕捉动作细节,适合数据采集、仿真评测等场景。 京东同时表示,其从上月开始展开人类历史上规模最大数据采集行动,计划两年内真实场景视频数据突破 1000 万小时。

linux.do · 2026-04-16 15:42:10+08:00 · tech

英伟达 CEO 黄仁勋在 Dwarkesh Patel 采访中强烈反对 AI 芯片出口管制政策,认为这不仅无法阻断中国的 AI 能力,还在过去几年已经制造了适得其反的结果。 黄仁勋的核心论点是:中国已越过临界点。他说,中国拥有大量 7nm 芯片产能和充裕的廉价能源,而 AI 训练是并行计算问题,更多的旧芯片可以弥补单芯片的性能差距。「你们担心的那个能力门槛,中国早就达到了,而且已经超过了。」Anthropic 的 Mythos 是在「相当普通的算力规模」上训练出来的,而这种算力在中国已大量存在。黄仁勋称华为刚刚实现了公司历史上最高的单年业绩,出货了数以百万计的芯片,「远多于 Anthropic 所拥有的」。不过华为 2025 年报显示其营收为 8809 亿元,实为历史次高,低于 2020 年的 8914 亿元峰值。 他还指出 中国拥有全球约 50% 的 AI 研究者,算法创新往往比算力堆叠更能决定模型能力的上限,DeepSeek 是他举出的具体证据:「DeepSeek 不是一个可以忽视的进步。如果未来某天 DeepSeek 级别的模型率先在华为芯片上发布,那对我们的国家将是一个可怕的结果。」这一假设场景可能即将成为现实:据 The Information 报道,DeepSeek 正准备在华为 Ascend 芯片上发布 V4 模型,预计 4 月下旬上线,将成为首个不依赖英伟达硬件的前沿 AI 模型。阿里巴巴、字节跳动、腾讯等中国大厂也在大量采购华为芯片,价格数周内上涨了约 20%。 出口管制已带来反效果。限制措施加速了中国本土芯片产业的崛起,迫使中国 AI 生态转向为本土硬件优化。黄仁勋认为这对美国才是真正的威胁:「如果未来 AI 模型在别人的技术栈上运行最好,那才是美国的噩耗。」中国占全球技术产业约 40%,放弃这一市场将损害美国芯片层面的长期竞争力。 他明确区分了两个可以并行的目标:国内保持算力领先,同时在全球市场竞争。我们不应该主动放弃市场。如果最终输了就输了,但为什么要拱手相让? Jensen Huang – Will Nvidia’s moat persist? 17 个帖子 - 12 位参与者 阅读完整话题

linux.do · 2026-04-16 10:48:53+08:00 · tech

背景:本人是植物病理学的研究生,做的是水稻病害。导师上一年在田间做试验的时候,喊我拍一些田间发病的水稻病害,覆盖好几个生育期,说是弄到做数据训练,然后看看能不能整个文章。但是我对上述的东西都不太了解,我ai了一下,说是进行叶片病斑标记,然后找一个模型进行训练。 条件:课题组里有一个服务器,但是基本上就我一个人在用,我也不知道能不能用来训练,平时我都是用来分析数据的(正在学) 求教:请教各位大佬,有没有做相关的方向,指点迷津。如果有佬有时间可以合作整一下。 不怎么会发帖子,如有错误,请各位斧正。 10 个帖子 - 6 位参与者 阅读完整话题

linux.do · 2026-04-16 10:48:00+08:00 · tech

9to5Mac – 15 Apr 26 Report: Apple to send Siri engineers to multi-week AI coding bootcamp - 9to5Mac The Information reports that a group of Apple engineers who are working on Siri will be sent to a “multi-week bootcamp to learn to code using AI.” Est. reading time: 3 minutes [!quote]+ 据报道,在目前为 Siri 工作的数百名工程师中,有 "不到 200 人 "将前往一个 “为期数周的训练营”,以提高他们的人工智能编码技能。 The Information称,人工智能编码工具已在苹果公司的某些部门(如其软件工程组织)兴起,促使一些团队为Claude Code分配了大量预算。这与最近的行业报告不谋而合,包括最近同样来自 The Information 的一份报告称,Uber 已经用完了其最初为整个 2026 年设定的人工智能预算。 报道还称,新兵训练营将 “留下大约 60 名 Siri 核心开发团队成员”,并补充说,“另外 60 名成员将在一个小组中工作,该小组负责评估 Siri 的性能,包括处理来自用户的命令以及是否符合苹果的安全标准”。 https://www.theinformation.com/articles/apple-sends-siri-staffers-coding-bootcamp-latest-shakeup-organization 2 个帖子 - 2 位参与者 阅读完整话题

www.ithome.com · 2026-04-16 06:48:53+08:00 · tech

IT之家 4 月 16 日消息,科技媒体 The Information 昨日(4 月 15 日)发布博文,报道称苹果公司为追赶 AI 竞争对手,安排近 200 名 Siri 工程师参加为期数周的 AI 编程训练营,学习使用 Claude Code 等工具辅助开发。 报道称苹果公司为了在 AI 竞赛中增强 iOS 27 版 Siri 的竞争实力,内部正在积极“练兵”, 近 200 名 Siri 工程师将参加为期数周的 AI 编程训练营,系统学习如何利用 AI 工具辅助编写代码。 报道指出在训练结束后,这批工程师中仅保留 60 人作为核心开发团队,另外 60 人转岗负责评估虚拟助手的性能表现。 苹果正通过 AI 编程训练营重塑 Siri 开发团队 IT之家援引博文介绍,随着 OpenAI Codex、Anthropic Claude Code 等 AI 编程助手的普及,传统开发模式正被重塑。 Xcode 26.3 已添加对 Agentic Coding 工具的支持,苹果内部部分部门也大量采购 Claude Code 等工具,预算投入显著增加。 Siri 团队的架构调整同样剧烈。原 AI 负责人 John Giannandrea 不再主导该项目,接手的是曾领导 Apple Vision Pro 发布的 Mike Rockwell。 技术层面,苹果底层模型也在寻求突破。Google Gemini 的介入将助力提升 Apple Intelligence 模型,从而让新版 Siri 具备多步指令执行能力,并提供类似 ChatGPT 的对话式体验。但与竞品的实际差距能否缩小,仍需等待产品验证。 发布日期方面,苹果计划在 WWDC 2026(6 月 8 日开幕)发布 Siri 升级版。

www.ithome.com · 2026-04-14 07:29:36+08:00 · tech

IT之家 4 月 14 日消息,据 Wired 报道,本月,《USA Today》刊发了一篇出色的报道,揭露了美国移民与海关执法局如何拖延披露其拘留政策影响的关键信息。报道作者利用互联网档案馆(Internet Archive)的“时光机(Wayback Machine)”工具,整理并分析了该机构的拘留统计数据,追踪其在特朗普政府时期的变化。这只是“时光机”为公共利益保存信息的无数案例之一,这款工具会抓取并留存网页内容。而据“时光机”负责人马克 · 格雷厄姆称,这件事本身“颇具讽刺意味”。 《USA Today》集团(前身为甘尼特集团,运营着同名报纸及 200 多家其他媒体),却禁止“时光机”存档其内容。格雷厄姆表示:“他们能完成这篇调查报道,正是因为‘时光机’的存在。可与此同时,他们却在封禁访问权限。” 近期,其他多家美国主流新闻机构也开始限制“时光机”存档其报道,其中包括《纽约时报》。据人工智能检测初创公司 Originality AI 分析,目前已有 23 家主流新闻网站屏蔽了“ia_archiverbot”—— 这是互联网档案馆为“时光机”项目使用的网络爬虫。社交平台 Reddit 也采取了同样做法。另有媒体以其他方式加以限制:《卫报》并未屏蔽爬虫,但将其内容排除在互联网档案馆 API 之外,并在“时光机”界面中过滤相关文章,导致普通用户更难查阅其存档内容。 《USA Today》集团发言人拉克-玛丽 · 安东强调,此举“并非专门针对互联网档案馆”,而是该机构全面封禁所有爬虫程序的举措之一。《卫报》商务与授权总监罗伯特 · 哈恩则称,该报正与互联网档案馆沟通,原因是“担忧人工智能公司可能滥用为存档目的抓取的内容”。 如今,记者们正自发抵制这一趋势。本周,电子前沿基金会、为未来而战等倡导组织联合记者声援“时光机”。该联盟收集到逾百名在职记者的签名,他们认可这款工具的价值,并向互联网档案馆递交了支持信。联署者既有知名电视主播蕾切尔 · 玛多,也包括独立媒体记者。信中写道:“在过去,记者会查阅地方报纸或公共图书馆的实体档案,调取历史报道,追溯当下事件的来龙去脉。如今大量报纸关停,地方公共图书馆又缺乏明确途径保存纯数字新闻,守护新闻记录的责任越来越多地落在互联网档案馆身上。” 联署人、《拦截》播客监制劳拉 · 弗林表示,互联网档案馆在其职业生涯中是“不可或缺的工具”,在事实核查与音频片段检索方面发挥了关键作用。另一位联署人、《芝加哥读者》撰稿人米科 · 卡波拉尔称,撰写老牌乐队与文化人物相关报道时,“时光机”能提供已消失的旧时粉丝网站内容,否则这些资料将彻底湮没。 卡波拉尔还表示,这款工具在其工会组织者工作中同样实用。“我在工会组织工作中大量使用‘时光机’,查找旧招聘信息,对比公司宣称的招聘岗位与实际分配的工作内容,或是查看不同职位在不同时期的调整情况。这些帖子还能帮我们追踪机构内部长期的薪资波动。” 其他出版商则以担忧科技公司利用互联网档案馆数据训练人工智能模型为由,为封禁“时光机”的决定辩护。《纽约时报》发言人格雷厄姆 · 詹姆斯称:“问题在于,互联网档案馆中的时报内容正被人工智能公司用于训练,违反版权法,与我们形成直接竞争。”(时报方面未说明这是既成事实,还是仅为假设性担忧。) Reddit 此前也曾表示,对人工智能的担忧同样促使其屏蔽“时光机”爬虫。出版商与人工智能公司之间正围绕 AI 工具未经许可使用其内容训练的合法性展开激烈博弈;美国逾百起人工智能版权诉讼中,多数都聚焦这一问题。科技公司会抓取全网内容,而“时光机”拥有海量资料,因此被视为极具吸引力的数据来源。 据IT之家了解,互联网档案馆已成立 30 年,存档网页超一万亿个。这家非营利机构自 2020 年以来历经多场重大法律诉讼。最近,其与一批主流音乐出版商达成和解,后者曾就其“伟大 78 转唱片”项目(存档老式录音)索赔高达 7 亿美元。尽管目前暂无重大经济处罚风险,但越来越多媒体机构封禁“时光机”,仍对其使命构成严重威胁。 目前尚无公开工具能与“时光机”媲美。若其持续失去主流新闻来源的访问权限,其存档工作将大幅受损,早期数字历史记录会变得难以查阅,甚至彻底遗失。值得注意的是,这款工具曾被用于针对《纽约时报》的报道:2016 年,该报因修改一篇关于佛蒙特州联邦参议员、时任总统候选人伯尼 · 桑德斯的文章编辑内容而受到质疑,这些修改正是通过“时光机”首次被追踪到的。 若类似事件如今发生,监督类媒体记者可能难以用同样方式追溯时报旧文版本。功能受限的“时光机”不仅不利于监督新闻业,还会对司法体系造成打击,该工具存档的网页在美国各类诉讼中常被作为证据引用。 互联网档案馆的马克 · 格雷厄姆并未放弃希望,认为部分当前封禁其爬虫的出版商最终可能改变态度。他表示,这家非营利机构正与《纽约时报》等媒体“沟通协商”。但就目前而言,格雷厄姆称:“毫无疑问,公共网络越来越多的内容被封锁,正在削弱社会了解世界真相的能力。”

linux.do · 2026-04-13 15:46:28+08:00 · tech

Meta 正在开发 CEO Mark Zuckerberg 的 AI 版本,用于代替他与员工互动。 《金融时报》援引知情人士报道,该项目属于 Meta 更广泛的写实 AI 3D 角色计划的一部分,这类角色能够与用户实时对话,而扎克伯格的 AI 分身近期被列为优先项目。 扎克伯格本人亲自参与了这个 AI 角色的训练和测试。该角色基于他的举止习惯、说话风格、公开发言,以及他对公司战略的最新思考进行训练,建成后可为员工提供对话和反馈。Meta 在全球拥有超过 7 万名员工,一个能模拟 CEO 风格的 AI 角色理论上可以将他的「存在感」扩展到整个组织。 这一项目是 Meta 过去一年投入数百亿美元发展 AI 的产物之一。 扎克伯格此前将公司目标定义为打造「个人超级智能」(personal superintelligence),以缩小与 OpenAI 和谷歌在前沿 AI 领域的差距。 https://www.ft.com/content/02107c23-6c7a-4c19-b8e2-b45f4bb9ce5f?syn-25a6b1a6=1 https://www.investing.com/news/stock-market-news/meta-builds-ai-version-of-zuckerberg-to-interact-with-employees-ft-93CH-4609201 1 个帖子 - 1 位参与者 阅读完整话题