2026守己利他智能时代做负责任的技术
发布时间:2026-04-22 08:52:53| 浏览次数:

随着人工智能技术迈向多模态、强推理和智能体爆发的新阶段,如何让AI既强大又安全、既普惠又可控,成为全球关注的核心命题。阿里巴巴联合上海人工智能实验室发布的《守己利他——智能时代做负责任的技术》,系统阐述了在“云+AI”战略下,围绕“守己、利他、合作”三大原则构建负责任AI的实践路径。这份报告不仅是技术白皮书,更是一份面向产业、学界和公众的治理行动指南。
“守己”强调从技术源头保障模型与应用的全生命周期安全。报告指出,大模型正向多模态、强推理和智能体方向快速演进,安全技术必须跟上智能发展的步伐。阿里巴巴构建了“评测牵引、内外兼备、能力全面、技术领先”的AI安全体系。
评测体系方面,建立覆盖全链路、全模态、全场景的安全度量标准,融合红队攻击测试和神经元探针技术,实时刻画模型安全水位,并持续迭代。
内生安全方面,将安全能力“编译”进模型训练全周期。通过预训练阶段的数据清洗、有监督微调阶段的安全QA对学习、直接偏好优化内化人类价值观,以及组相对策略优化形成“安全直觉”,让模型从“知道安全”走向“本能安全”。针对强推理模型的幻觉问题,报告提出引入不确定性建模、反思-验证架构和检索增强生成等缓解方案。
外层护栏方面,研发流式原生护栏技术,利用模型生成过程中的中间隐藏状态实时感知风险,在有害内容输出前即时拦截,实现“边写边检”。同时,数字水印和AI生成内容检测技术已在淘宝、高德等多个业务落地,并牵头制定多项国家标准,有效防范AI盗用与滥用。
应用安全层面,依托公共云基础设施,贯彻“纵深防御、零信任、最小权限”原则,构建从基础设施到模型服务的全栈防护矩阵。针对Agent爆发带来的新挑战,报告提出建立智能体专属权限体系、插件沙箱机制和多智能体协同防护,确保自主执行中的可控性。
“利他”体现了技术向善的主动担当。报告认为,开源开放是降低技术门槛、实现知识民主化的核心路径。中国已成为全球开源大模型生态的重要贡献者,阿里巴巴开源的Qwen系列模型在全球榜单中占据领先地位。开源生态通过“开放基础能力+增值服务”的分层策略,既实现了技术普惠,又构建了可持续商业模式。
在开源风险治理上,报告提出“以生态自律为主、坚守法律底线”和“分级分层治理”两大原则。开源方负责安全发布与透明披露,开源社区制定规范并提供合规工具,开发者对应用场景风险担责。这种精准责任分配既避免过度抑制创新,又确保风险可控。
大模型作为“全球造、全球用”的全球化工具,其发展天然依赖多语言语料和共享算法。报告强调,中国模型出海需要在坚持自身立场的同时,通过技术手段适配不同文化的价值诉求,例如在训练阶段引入多元文化安全任务,在推理阶段通过动态提示和安全护栏组合实现本地化适配。
AI对经济社会的影响深远而复杂。报告指出,AI正重塑能源格局、生产力结构和组织边界。一方面,智算集群能耗激增,需要全国“三级纵深”算电协同布局;另一方面,AI作为生产力工具大幅提升效率,也催生了新就业机会和劳动力转型。在商业领域,AI优化供需匹配,改变流量分配逻辑,但需要兼顾多方利益平衡,探索分阶段、分类型的商业合作模式。报告特别强调,要坚持长期价值建设,利用AI技术强化正能量内容的生产、识别和分发,重建“流量逻辑”与“质量逻辑”的平衡。
“合作”是构建安全、向善、可持续AI发展范式的必然选择。报告展示了阿里巴巴与全国80余所高校、近300个合作项目的产学研成果,涵盖大模型、AI安全等领域。通过“阿里安全课堂”、“大模型安全撬壳计划”等赛事和培训,培养兼具技术能力与责任意识的复合型人才。
在知识共享方面,连续四年发布AI治理系列报告,发起《追AI的人》直播栏目和《这个AI不太冷》研讨会,累计超百万人次参与,将复杂技术“翻译”成公众可理解的语言,增进社会信任。
标准制定上,阿里巴巴和上海人工智能实验室积极牵头国内外标准,包括ISO/IEC TS 25568《生成式人工智能风险应对指南》、GB 45438—2025《人工智能生成合成内容标识方法》等,将产业实践经验转化为行业共识。
报告最后提出“AI安全全球公共产品”倡议,主张安全知识、能力和资源应具有非排他性和非竞争性。上海人工智能实验室探索因果推理、形式化验证和自主免疫等前沿技术,打造SafeWork通用安全平台,推动安全与性能协同提升。这一理念已写入国际AI安全共识,并获得牛津大学等机构的研究呼应。
总之,这份报告传递了清晰的信号:智能时代的负责任技术,不是被动合规,而是主动构建安全能力;不是封闭垄断,而是开源共建;不是单打独斗,而是全球合作。唯有守己、利他、合作并举,才能让AI在向善的轨道上行稳致远。