AI行业资讯No.29:Nature新模型解决甲状腺肿瘤临床痛点,MicroSyn-X突破医疗数据稀缺瓶颈,智诊发布医疗智能体WiseClaw
发表日期: 2026年4月15日
1.看得清、分得准,Nature新模型解决甲状腺肿瘤临床痛点
3月5日,Nature发表了一项关于甲状腺滤泡性肿瘤AI诊断的多中心回顾性研究。研究提出基于超声图像的深度学习模型,可在术前有效区分滤泡性甲状腺癌(FTC)与滤泡性甲状腺腺瘤(FTA),并能进一步对FTC的侵袭性进行分层评估。
本研究采用基于B模式超声的ConvNeXt深度学习模型,对来自31家医院的2567例甲状腺滤泡性肿瘤患者数据开展分析,同时设置1个内部测试集及3个外部测试集,以系统验证模型的泛化能力。
鉴于FTC与FTA在术前影像学及细胞学表现上高度相似,该模型构建了一套更贴合临床决策路径的诊断框架:第一步,明确病变类型为FTA或FTC;第二步,将FTC进一步划分为微小侵袭型(MI-FTC)与更高级别侵袭型(invasive FTC);最终,实现FTA、MI-FTC、invasive FTC的三分类诊断。此外,研究团队还专门设计多种临床场景,对模型性能进行全面验证。
在 FTC 与 FTA 的二分类任务测试中,模型内部及外部测试集 AUC 值分别为 0.874、0.847。亚组分析结果显示,模型在不同性别、病灶大小、手术方式、结节位置、伴发甲状腺疾病及不同地区人群中均表现良好。同时,模型整体表现优于不同经验水平的放射科医生,也优于多种 TIRADS辅助下的医生判断。把AI作为决策支持工具嵌入日常超声诊断流程后,医生诊断性能整体提升。
针对甲状腺滤泡性肿瘤术前诊断的临床痛点,该模型不仅可实现“良恶性鉴别”,还能完成“侵袭性分级评估”,对术前风险告知、个体化治疗策略的制定具有重要临床意义。尤其是在疑难疾病诊断领域,AI展现出更为突出的临床辅助价值,为临床诊疗决策提供了可靠的技术支撑。

链接:https://www.nature.com/articles/s41746-026-02489-6
2.赋予自动驾驶视觉,MicroSyn-X攻克医疗器械自动化难题
近日,德国马普智能系统所等机构的研究人员提出了端到端框架MicroSyn-X,首创无需真实数据的AI合成影像技术,让机器在无标注的虚拟X光中学会精准追踪微型手术器械,突破医疗数据稀缺瓶颈,为自动化微创手术提供了高效、安全的新路径。
MicroSyn-X结合生成式AI(扩散模型)与强域随机化(Domain Randomization)策略,建立了一条高保真合成影像生成管线,能够自动生成包含复杂组织背景、骨骼结构及金属器械干预的X射线场景,并模拟真实的物理衰减、噪声分布与运动伪影。同时,由于合成过程完全可控,系统能够自动生成像素级的精确标注,摆脱了对人工标注数据的依赖。
MicroSyn-X的核心优势在于其通用性与可扩展性。当面对一种形状、材质完全不同的新型医疗器械时,研究人员无需重新进入手术室采集影像,仅需通过合成管线进行数小时的自动化训练,即可实现对新器械的部署与控制,这极大降低了新型微创器械的应用门槛,大幅缩短了从实验室到手术室的距离。
这种由合成数据驱动训练出的视觉模型,表现出极强的泛化能力。实验结果显示,该模型不仅在离体(Ex vivo)组织中运行稳定,在活体小鼠(In vivo)实验中也展现出出色的稳健性。在活体场景下,微型机器人常被脊柱严重遮挡,且受到呼吸、心跳带来的剧烈动态干扰;在这种极低对比度的环境下,MicroSyn-X训练出的模型依然能够实现实时的鲁棒追踪。测试数据表明,模型的识别结果与临床专家的共识高度一致,在某些极端条件下,模型甚至能捕捉到人眼难以可靠判别的微弱信号。
在应用前景上,MicroSyn-X为微创介入手术的自动化奠定了基础。通过将该视觉方案集成至机器人闭环控制系统中,可实现微型器械在血管分叉或复杂管腔内的自动导航,不仅有望显著降低手术中医生的操作负担与辐射暴露时间,还能提升手术的精准度与可重复性。

链接:https://www.nature.com/articles/s42256-026-01190-3
3.医疗“小龙虾”,智诊发布全球首个医疗Agent OS
3月14日,智诊科技正式发布全球首个企业级医疗健康行业智能体平台WiseClaw,彻底打破黑盒API与固化流程,通过可生长、可组装的“Agent + Skill”架构,实现合规、专业、千人千面的医疗智能体基础设施一键搭建。
WiseClaw定位为面向医疗行业的Agent OS(智能体操作系统),核心目标是帮助医疗机构搭建真正能用、可扩展的智能体系统。它采用OpenClaw架构,通过连接底层AI算力与多端医疗应用,构建以三层Skill体系为驱动的大模型智能体(Agent)运行底座,将模型推理、知识系统、工具系统、流程编排、权限合规、评测审计、运营监控统一纳入平台,让医疗AI具备企业级可控性。
WiseClaw使用多智能体分工,提供面向医学场景的证据链机制,同时将医疗级安全与治理内置为平台核心能力,构建了可插拔工具生态,通过场景模板化交付+运营闭环,实现了四大核心能力:
医疗原生Skill体系:官方预设Skill开箱即用,第三方市场共建行业生态,支持通过自然语言描述需求生成自建Skill,提供类似应用商店的技能管理模式。
企业级Workspace隔离:采用多租户架构,确保医院、企业的数据、记忆与权限实现严格的物理与逻辑隔离,满足医疗级合规与隐私保护要求。
全域数据与工具打通:内置医疗MCP,无缝对接业务自有数据与IoT设备,静态知识、动态数据、实时数据流通过一套协议实现全覆盖。
敏捷的业务自驱模式:提供向导式自建Skill功能,运营人员和医生通过自然语言即可生成新Agent,极大降低了后续运维与更新成本。
WiseClaw的发布,首次将Agent OS式思路大规模引入中国医疗健康ToB领域,标志着医疗AI从传统的“聊天问答”模式,向“可执行、可治理、可规模化,直接交付结果”的行业智能体平台实现转型。

链接:https://wiseclaw.wisediag.com
4.打造医生“第一助手+第二大脑”, 医渡智循APP上线
3月25日,医渡科技正式上线了临床循证智能体平台“医渡智循”APP,利用AI技术持续跟进最新临床知识、整合多渠道信息、结合疾病画像,将经过提炼的、高质量的、个性化的建议推送到医生面前,为医生提供“决策智囊”。
医渡智循精选了超3万份权威机构发布内容,全面覆盖国内外主流诊疗指南,高度贴合临床实操需求,紧跟诊疗规范更新节奏。在前瞻性研究领域,医渡智循梳理了超3000万份医学文献,精选超500万份高质量科研成果,并能够根据临床医生需求实时追踪、精准搜索全球顶级医学期刊、权威学术平台前沿动态。在专科疾病和药品知识方面,医渡智循构建经多领域临床专家层层审核的专业知识库。
基于GRADE等国际通用循证分级体系,医渡智循自动评估证据的权威性、时效性、适用性,按证据等级权重智能排序答案,帮助医生更加高效地完成决策。同时,医渡智循每一条答案都会有对应信源出处的标注,医生可以点击一键跳转查询最原始的一手信源,有效避免AI黑箱带来的幻觉问题。
在多年的真实诊疗环节中,医渡科技联合国内多家顶级医疗机构,打造了超过200个专科智能体,覆盖肿瘤、心血管、全科等多个方向。每个专科智能体依托领域专属高质量数据深度训练,采用“专科专答、精准适配”的定制化智能服务模式,可以智能识别问题的专科属性与临床核心意图,自动分流至对应专科智能体,完全贴合细分专科临床实操逻辑。此外,医渡智循还同步推出医院专属定制版本,支持与医院现有HIS、EMR等信息系统深度对接。
医渡智循不只是一个简单的AI工具,更是让循证医学真正进入临床决策流程的操作界面与能力载体,进一步推动诊疗标准化,减少经验性诊疗偏差,提升整体医疗质量。

链接:https://www.yidutech.com/news-detail.html?id=336
5.天工AI三大模型登顶,中国AIGC迎来全模态时刻
3月27日,天工AI同时发布了游戏世界模型Matrix-Game 3.0、视频大模型SkyReels V4、音乐大模型Mureka V9,全部跻身世界第一梯队,宣告中国AIGC正从单点突破迈向真正的全模态领跑。
Matrix-Game 3.0在记忆、分辨率和实时性上全面提升。数据层面,它搭建了一套工业级的无限数据引擎,一条线基于Unreal Engine 5自动生成覆盖1000+场景的高精度交互数据,另一条线从3A游戏里全自动提取动态交互数据,双管线并行。模型层面,通过记忆注入、Error Buffer抗漂移机制、蒸馏加速三个维度的系统性升级,5B轻量模型就实现了720P、40FPS的实时生成,MoE-28B模型则在泛化性和动态表现上进一步拉满。
SkyReels V4自研了一套双流MMDiT架构,通过双向交叉注意力,实现了视频和音频在同一模型内部同时生成,音画从第一帧起就锁死同步。同时,新版本还搭建了一套覆盖全场景的全模态强化学习与精准控制系统,不仅能够一键生成角色不走形、场景不跳跃的连贯短剧,支持多角色、多语种对话场景,自动完成正反打镜头切换、台词分配、表情匹配,而且还覆盖了去水印、去台标、删除或添加角色等后期编辑功能。
Mureka V9在自研MusiCoT(Music Chain-of-Thought)技术上,提供了更精准的段落级歌词语义控制功能,混音质感更通透,生成速度更快,创意更有新鲜度,并大幅减少了不必要的哼唱和模糊唱词。创作层面,V9实现了版本化的迭代工作流,同一创意可以快速出多版本,支持在旋律、人声、结构上局部保留替换。在主观评分中,V9在音乐旋律性(7.25)、音乐表现力(6.89)、编配编曲(6.98)三个维度全部拿下第一。
本次天工AI推出的三大场景模型实现了中国AIGC的全面开花,同时配合其短剧平台、游戏平台等产品矩阵,为AI创作者打造了一整套从生成到编辑到分发的全家桶式超级平台,一人公司时代即将到来。

链接:https://mp.weixin.qq.com/s/iKL2qnxrl9X3rXn9HhOHaA
6.51万行代码泄露,Claude Code被曝多项隐藏功能
3月31日,Anthropic公司开发的AI编程工具Claude Code因npm包意外包含source map文件,导致约1900个文件、51万行源代码泄露,技术社区通过逆向工程解密了其通信架构、安全机制及隐藏功能,引发全网广泛关注。
根据公开信息,技术社区深度解析泄露代码中的通信架构,发现其采用WebSocket和HTTP双通道设计,并包含严密的权限审批流程。服务端通过control_request机制实现高危操作的人工确认,客户端用独立沙箱执行命令。此外,开发者从代码中发现多个未发布新功能:
KAIROS(常驻代理模式),一个持久化的后台代理进程,支持跨会话长期记忆,能在用户不操作时自动整理和整合项目信息,实现“AI 睡眠”功能,自动将零散信息转化为结构化笔记。
ULTRAPLAN(云端深度规划),利用高级模型支持最长 30 分钟的深度任务规划,适用于复杂项目的全流程设计,可帮助开发者进行战略级规划和架构设计。
多智能体协调模式,支持同时启动多个独立 agent 实例分工协作,处理并行任务,提升效率,实现类似“团队管理”的功能。
电子宠物系统(BUDDY),一个趣味性的 ASCII 虚拟宠物系统,包含 18 种物种、稀有度等级和可装扮的帽子,通过终端显示,增加用户交互趣味性。
卧底模式(Undercover Mode),当检测到用户为 Anthropic 内部员工且操作公开 GitHub 仓库时,自动激活,抹除 AI 生成代码的痕迹和归属信息,无法手动关闭。
这次代码泄露事件,用50多万行代码证明了Claude Code本质上是一套完整的、经过工业级打磨的AI Agent编排平台,它的核心壁垒不是底层的大语言模型,而是将模型能力转化为可靠、高效、安全的开发工具的那整套调度系统、安全机制、记忆管理与扩展生态。

链接:https://news.ycombinator.com/item?id=47584540
7.开箱即用,轻量高效,鲲鹏推出最佳AI Agent解决方案
近日,华为在鲲鹏服务器上构建了“OpenClaw+OpenViking+鲲鹏服务器”三位一体的生产级Agentic AI解决方案,凭借多核并发、大带宽内存、软硬协同优势,成本大幅降低,为复杂智能体业务提供高可靠、低成本的有力支撑,彰显自主创新适配核心优势。
OpenClaw+OpenViking+鲲鹏服务器解决方案,以“插件补短板、硬件破瓶颈、协同降成本”为核心,形成三大差异化优势:
记忆能力升级:插件精准解决OpenClaw原生记忆痛点,实现记忆识别精准、Token高效利用、跨会话记忆连贯,支撑长周期复杂任务落地;
高性能算力:基于鲲鹏CPU向量检索加速指令,围绕向量距离/寄存器Cache/内存排布/指令重排等多环节深度优化,充分释放OpenViking的检索潜能,形成软硬一体最佳实践,在保证效果的前提下将成本实现成倍降低;
轻量高效部署:服务器1vCPU 2G轻量容器环境即可稳定运行,支撑多领域轻量部署,兼顾高效能与低成本。
经实测验证,插件与鲲鹏服务器协同效能显著,二者协同可使任务执行准确率提升45%+、Input Token消耗减少90%+,成本最高锐减10倍。同时,鲲鹏服务器1vCPU 2G轻量容器环境,可支撑社交媒体、创意与构建、DevOps等六大主流应用领域,实现Agentic AI轻量部署、低成本运营,完美适配生产级场景需求。
鲲鹏通过完善OpenClaw生态、插件迭代及服务器适配,共享技术成果,打造了端到端AI Agent最佳实践,有力推动了Agentic AI产业规模化高质量落地,实现生态共赢。

链接:https://github.com/volcengine/OpenViking

