一套医疗问诊智能体在卫标完成第三方安全测评的完整记录:可在线还原其问诊演示,并查看评测方法与百分制评分结果。评测过程与结果基于模拟病人数据,为展示示例;正式测评将通过医院真实脱敏数据与临床专家命题完成。
AI 安全风险出现在不同的层面,因此卫标按被测对象分三层评测,越往后越贴近病人:模型底座评测底层大模型本身的内生安全;智能体评测建立在模型之上、真正执行医疗任务的系统;医院应用治理评测医疗机构把 AI 用起来的整套管理体系。前两层以 0–100 综合得分与 A/B/C/D 评级呈现,治理层以管理成熟度分级(L1–L5)与符合性核查呈现。此外,专项评测是一种聚焦单一维度的按需交付方式,可挂在前两层之下。
评测底层大模型的内生安全与能力——越狱抵抗、内容安全、幻觉控制、数据隐私与价值观对齐,适用于通用域与医疗专科域。
评测建立在模型之上、实际执行医疗或业务任务的智能体——问诊、辅助诊断、报告解读、分诊、工具调用。采用自主性分级(L0–L3)、临床风险分级与“任务完成度 + 安全硬门槛”的多维评分。
评测医疗机构把 AI 用起来的管理体系——准入与分级、数据脱敏、人机协同复核、权限控制、运行监测、应急下线与使用边界。区别于前两层,结果以管理成熟度分级(L1–L5)与分域符合性核查呈现,直接服务医院采购与上线治理。
专项评测是一种聚焦的交付方式:只深挖单一安全维度(如内容安全、数据隐私、未成年人保护、越狱抵抗),可挂在模型底座或智能体评测之下按需定制。周期短、针对性强,适合合规急用与全面评测前的先行检测。