摘要:
为推动AI的应用规范和准则设计,商汤科技于去年成立了AI伦理委员会,在公司内部产品审核等各项流程中严格进行AI伦理的审查,并在今年6月与上海交通大学清源研究院联合发布《AI可持续发展白皮书》,为AI行业伦理发展提出规范性意见。与此同时,在产品的底层框架与技术研发的过程中,商汤科技也进行了前瞻探索,从根源上降低数据安全性隐患。
由于涉及隐私等…
|
为推动AI的应用规范和准则设计,商汤科技于去年成立了AI伦理委员会,在公司内部产品审核等各项流程中严格进行AI伦理的审查,并在今年6月与上海交通大学清源研究院联合发布《AI可持续发展白皮书》,为AI行业伦理发展提出规范性意见。与此同时,在产品的底层框架与技术研发的过程中,商汤科技也进行了前瞻探索,从根源上降低数据安全性隐患。
由于涉及隐私等问题,全球各国都针对医疗数据制定了相关的保护政策,使得多中心数据共同训练变得愈发困难,而这又是医疗AI模型开发迭代必须的步骤。近两年异军突起的“联邦学习”,为这一问题提供了全新的解题思路。联邦学习是一种分布式的机器学习方法,可以在不共享数据的情况下对多中心的数据进行联合建模,从技术上实现了保证数据安全的同时实现协作。联邦学习的提出受到了产、学、研各界的广泛关注,成为AI领域的一项前沿课题。
依托深厚的学术研发底蕴以及对行业趋势的敏锐洞察,商汤科技自2019年便开始了对联邦学习的前瞻性研究,并于近日携手美国罗格斯大学计算机系计算生物医学成像和建模研究中心,在全球顶级计算机视觉会议ECCV(欧洲计算机视觉国际会议)上发表了一项新的研究成果,创新地使用基于分布式生成对抗网络(GAN)的结构来实现联邦学习,为打通AI医疗应用的最后一公里开辟出一条“新的道路”。
该研究通过将位于多个数据孤岛的分布式异步鉴别器和一个中心生成器组成对抗网络,让中心生成器在不接触原始隐私数据的情况下,也能进行合成训练,从而能够生成与各数据孤岛中原始数据相近似的合成数据样本,供下游任务使用。在此基础上,还采用了2种损失函数,使得中心生成器具备一定的终身学习能力,可以在动态变化的数据孤岛(鉴别器)环境中持续学习,比如学习过程中有新的机构加入或某些原有机构退出的情况。经试验模拟,这套学习方法能够从不同的数据孤岛中渐进地学习到同类数据甚至不同类数据的近似分布,并在医学图像分割任务中,取得了较理想的效果。
由于避免了对原始数据的直接访问,这套研究方法秉承了联邦学习的核心优势,很好地解决了医疗数据的隐私保护问题。不仅如此,相较于传统的联邦学习,由于在实现方法上“另辟蹊径”,该研究成果还有效减少了中心与数据孤岛之间的通信数据量,仅需传输合成图像数据和反馈误差而非整个模型的所有参数数据,而且各数据孤岛之间无需交换任何数据或参数,因而可显著降低医疗机构之间通过联邦学习进行研究的成本,加快研究效率和AI模型的生产速度。
此外,这种创新、低成本的联邦学习模式还可以推动低效率的分散型数据中心向高效的集约型数据网络升级,从而更好地助力地区性数据中心或行业标准数据库的建立。这正契合了国家“新基建”的战略指导方针,加速“数据智能”的基础设施建设,为医疗乃至更多行业节约成本,创造价值。
自AI在国内快速发展以来,国家陆续出台了相关政策鼓励AI产业发展, 推动了AI技术与产业的深度融合和落地应用,可持续发展的理念更将推动AI创新与应用的永续前行。对于医疗大健康行业,商汤科技将继续以研究和应用双擎驱动,横向持续拓展SenseCare®️智慧诊疗平台能力服务更多临床业务场景,纵向打通底层技术创新与上层应用的连接,在保证数据安全和患者隐私的基础上,为医疗行业的数字化、智能化以及安全性等方面提供全方位助力,让AI的价值不断绽放,惠民利民。
正如金征宇教授在演讲中所说,“相信医学界能够利用AI为自己插上一对理想的翅膀,为科学和人类发展做出更大贡献。”
参考链接:https://www.sensetime.com/cn/product-detail?categoryId=51134040
|