Lionbridge 的 TRUST 框架
建立对 AI 应用的信任
选择语言:
作者:Mark Aiello、April Crehan
毫无疑问,数据是人工智能 (AI) 的“燃料”。在进行 AI 开发时,无论您的解决方案多么精妙、先进,您都需要经过清理的多样化数据来训练您的系统。要想训练机器,使其变得更加智能,就必须获取海量优质数据。但这并非易事,在医疗领域甚至更加困难。
可以理解的是,患者不愿与医生以外的任何人共享自己的信息(即,患者的个人数据)。另一方面,医生受到法律和道德规范的约束,也必须保护患者的隐私。这些限制使得现有的 医疗数据集变得更加有价值。那么,什么样的因素会促使公司或机构共享其独占的患者信息和数据集呢?
数据共享能够为社会带来巨大的益处。此外,数据共享可以提高工作效率、加快结果再现并减少重复工序,让临床试验领域中的每个人直接受益。
研究一次又一次地表明,协作可以提高每个相关人员的工作效率。对数据所有者而言,与利益相关者(患者、医生、药品开发商、研究人员等)共享专有数据,可能意味着更快、更经济高效地获得成功。Elsevier 在一份报告中指出,共享研究数据“可以加快研究速度”。这份报告展示了一项荟萃分析结果,即与安慰剂治疗相比,所有抗抑郁药物对急性成人抑郁症的短期治疗效果更佳,从而证明了协作的重要性。这项分析结合了已发表的研究和以前从未公布的数据集,Elsevier 称之为“迄今为止最全面的抗抑郁药物评估”。这项元分析得以完成,归功于研究人员、监管机构和制药公司都应要求共享了他们的研究成果,而几位作者也公布了完整的数据集,以便进行验证性研究并供将来使用。这意味着,最初的协作可能会对未来的研究产生积极的连锁反应。
您已经知道,开发新药需要高昂的成本。在进入试验阶段的药物中,大约八分之七从未获得批准。假如另一家公司已经进行过同样的工作,结果却未获成功。试想一下,事先了解这一信息会有什么好处。如果研究成败的信息得以共享,那么您可以重新分配资源,用于其他方法、药物分子或疾病的研究工作。您甚至可以直接对即将面市的产品进行改进。尽早发现这些错误并对外公布,也可以使患者免受伤害。在隐瞒阴性结果甚至不确定结果的情况下继续使用药物,已不止一次造成严重的负面结果(甚至死亡)。
研究和试验实践越透明,其他人就越容易对您的研究工作提供支持(或提出反驳)。再现性是科学进步的关键,当数据公诸于众时,再现性研究就会更加简单。在 AI 领域,共享测试集可以帮助他人尝试改进现有的 AI 系统。研究人员越早发现需要改进的地方,就能越快地进行迭代。
尽管共享数据有着明显的好处,但仍然存在一个主要挑战:患者不愿共享他们的医疗数据。研究人员和试验申办者怎样才能克服这个问题呢?共享数据,进而推动 AI 在医疗领域中的开发和应用,关键之一是对数据进行匿名化,从而在一定程度上减轻患者对隐私的担忧。将愿意在互利 的基础上共享匿名数据的少数研究人员组织起来,可能是促进信息共享的一种有效方式。一些政府和期刊已经要求在一定程度上进行数据共享,以便为科研工作提供资助或发表科研成果。这反过来也起到了促使研究人员共享数据的作用。
那么,究竟有哪些数据是可以共享的呢?
共享训练集(AI 系统的蓝图)可能会危及知识产权。但是,至少可以共享您用来证明系统有效性的测试集,这有何不可呢?如果您真的相信自己使用的 AI 系统,那么其他人应该可以使用您的测试数据,对自己的系统进行测试,看看他们的系统性能是否可以超越您的系统。
人人都乐于标榜成功,但失败同样可以提供有用的信息。我们需要建立一种文化,在这种文化中,人们不仅愿意分享自己成功的经验,也愿意分享自己失败 的教训。同行可以跟您一起,从您所犯的错误中吸取教训,或许他们还可以推断出导致您犯错的原因。正如前面提到的,公开坏消息甚至可以挽救生命。
AI 在医疗领域最强大的应用之一便是招募患者并为其匹配临床试验。由于 AI 有助于确定试验的理想受试者,于是防止潜在受试者“被挖走”的压力也会因此减轻。在 AI 的帮助下,您可能会发现,您的临床试验患者库中有一些患者与竞争对手的试验非常匹配,反之亦然。
总而言之,在医疗领域使用 AI 有望为患者创造一个更美好的世界。在临床试验领域进行更多的数据共享,就能加速可能真正改变患者生活的创新。
想进一步了解 AI 如何彻底改变临床试验领域?单击即可获得更多信息。