公共数据集如何解决成功付费的数据障碍:为残疾退伍军人提供服务的示范
对政策制定者、政府机构和服务提供者来说,通过将资金与有意义的、持久的成果联系起来,“成功付费”已成为推动基本社会服务改善的一种有吸引力的方式。由于这种对结果的强调,深入了解服务的目标人群对于任何成功付费项目都是至关重要的。对于许多项目来说,没有完美的数据源。
项目(重新)发射
作为成功报酬工作的一部分,AIR开发了一个解决这些项目面临的常见数据障碍的方法。AIR公司签约为圣地亚哥开发评估设计项目(重新)发射在那里,Third Sector Capital Partners, Inc.担任项目经理。该项目旨在通过提供强化的病例管理和全面支持,改善与服务相关的残疾退伍军人的就业和健康结果。
为了确定项目(重新)启动可能对与服务相关的残疾退伍军人产生什么有意义的影响,AIR团队需要获得关于圣地亚哥这一特定退伍军人群体的经济和健康措施的基线数据。空军研究人员发现了一些关于退伍军人信息的公共数据集,但它们没有包括所有需要的数据。
例如,AIR研究人员探索的数据集之一是美国社区调查(ACS),其中包括退伍军人的身份信息及其与服役有关的残疾状态。AIR团队能够使用ACS收集基线经济结果,但数据集不包括与健康相关的结果。另一个数据集,行为风险因素监测系统(BRFSS),包括身体和心理健康结果的信息,并确定受访者是否为退伍军人,但它缺乏与服务相关的残疾信息。
空气团队因此集中在确定能否预测是否有资深service-connected残疾通过ACS数据与service-connected残疾退伍军人和因素共同对ACS和BRFSS数据集,如年龄、种族、性别、残疾类型、教育和收入。数据集中的信息被去识别了。
数据解决方案
Burhan Ogut他是AIR的首席研究员,负责寻找创造性的解决方案。奥古特说:“我们能够开发一个模型,其中我们拥有预测另一个数据集缺失的变量所需的信息,然后我们将这个模型的结果应用到另一个数据集,这个数据集缺乏这一信息,但包含了我们需要的其他数据。”AIR和第三部门的简介详细描述了这种方法。
该模型的另一个好处是,AIR研究人员发现了其他可能没有的与服务相关的残疾退伍军人的额外信息。例如,收集到的数据显示,与服务相关的残疾退伍军人的就业市场结果(就业和工资)较低,而且比与服务无关的残疾退伍军人更有可能面临心理健康挑战。
这种方法的应用范围不仅限于寻找退伍军人的数据。例如,研究人员可能想知道学生的免费或减价午餐状况,或其他贫困的衡量标准,但无法在特定数据集中找到这些信息。如果已知有与该变量相关的因素,使用具有类似预测变量的另一个数据集可以预测感兴趣数据集中学生的免费或减价午餐状态。该方法还可以用于预测缺失的信息,如接受职业康复服务或504或个性化教育项目的状态,在一个数据集中的残疾人。
“你可以将这个模型应用于任何群体。如果你遗漏了目标人群的识别信息,而这些信息存在于另一个数据集中,并且这两个数据集有共同的变量可用于预测,那么你可以使用我们所做的相同的想法,”奥格特说。