了解最新公司动态及行业资讯
采集、脏数据处理、多款大数标注、据产架省究院合成、品上质检……在南京汉卫公共卫生研究院有限公司,数交所汉一批批来自疾控机构的卫研卫生健康“脏数据”,正通过AI治理技术被转化成高质量数据集。让开这里不仅沉淀了跨场景、口说高标准的脏数据高质量数据集,更具备全流程定制、多款大数构建高质量数据集的据产架省究院能力。不久前,品上公司多项数据产品在江苏省数据交易所正式上架,数交所汉成为卫生健康数据领域率先挂牌的卫研重要数据产品之一。
卫生健康数据长期面临错项、让开漏项、标准不一、影响因子复杂等问题。“错项和漏项同样致命。”汉卫研究院总经理闫艳说。针对这些痛点,汉卫研究院定向、精准地收集与构建多源数据,借助隐私计算、联邦学习、多模态对齐与融合、时序轨迹预测、语义认知与结构化等核心技术,从海量数据中剔除并修正异常值,使数据能够直接匹配临床科研、产品研发等专业需求,确保用于训练模型的数据既量大又质优。
目前,汉卫研究院已构建覆盖智慧疾控、慢病管理等领域的高质量数据治理方案,相关产品在多个垂直模型中落地应用。公司累计获得国家数据局、国家卫生健康统计信息中心、工信部、中华预防医学会等部门颁发的11项国家级奖项荣誉以及50项省市级荣誉。
“高质量数据集不是简单的数据堆积,而是要通过专业处理让数据‘说话’。”闫艳表示。聚焦“三医”协同,汉卫研究院具备区域数据项目顶层设计、治理实施与场景落地的全流程服务能力。针对不同区域,研究院梳理本地数据资源,面向临床、科研和产业转化需求,提供高质量数据集建设方案。
在科研应用层面,汉卫研究院依托自持专病高质量数据,自研AI大模型驱动临床前肿瘤药物研发一体化平台,开展靶点发现研究。目前已筛选出多个潜在成药靶点并锁定核心靶点,相关科研成果正联合医院与专家团队推进临床验证。同时,研究院携手阿里巴巴AIData团队、江苏省数据集团开展慢病领域的多模态大模型评测合作,搭建标准化评测体系,推动模型临床规模化、标准化应用。2025年,该平台在细分赛道的市场占有率达15.18%,位居行业前列。“在高质量数据集与AI工具双轮驱动下,正成为提升项目效率瓶颈的关键变量。”闫艳说。
作为江苏省数据标准化技术委员会副主任委员单位,汉卫研究院深度参与省级数据标准化顶层设计与实践落地。2026年4月,在江苏省数据标准化技术委员会主办的“标准周”活动上,汉卫研究院受邀分享了实践经验,为高质量数据集建设提供可复制的参考。(通讯员:韩轩)
(本文来源:日照新闻网。本网转发此文章,旨在为读者提供更多信息资讯,所涉内容不构成投资、消费建议。对文章事实有疑问,请与有关方核实或与本网联系。文章观点非本网观点,仅供读者参考。)