他具体介绍了自己论文的研究方法,“这项研究是在住院病人中开展的回顾性研究,纳入研究的病人,从出院诊断中有‘药物性肝损伤’相关诊断的病例中做进一步筛选,所有出院诊断中有药物性肝损伤相关诊断的病例,需进一步用RUCAM量表(注:对药物与肝损伤的因果关系进行综合评估的专业量表)和专家评估意见进行药物和肝损伤的因果关系评估,而这也是目前开展药物性肝损伤研究国际公认的方法。”

“从非结构化数据当中提取信息,是非常重要的工作。非结构化数据可以是影像,也可以是文本。”汉斯说,将来源不同的数据与具体病例关联,进而进行研究。“这些数据需要在机器内部互相理解,比如手术报告,医生会以个性化的语言书写,除了真相外,医生还会写下他怀疑的信息,否定的信息等,如何将这些信息提取出来,进行分门别类的分析呢?”汉斯介绍,很多医疗领域从业者已经建立了很大的知识库,比如联合医疗语言系统,这是一个非常大的知识体系,有22万不同的概念,算是一个小型的“知识图谱”,作为基础架构更待共同完善。