干细胞领域知识发现平台

提升科研信息化水平
支撑研究所科技创新

  融合多源信息    打通数据孤岛
  挖掘知识关联    放大数据价值
  集成知识计算    促进知识发现

建 设 背 景

        干细胞知识发现平台(以下简称“平台”)是中国科学院“十三五”信息化项目“面向干细胞领域知识发现的科研信息化应用”的主要成果之一。平台围绕干细胞领域知识发现对科研信息化的需求,结合成都文献情报中心科技信息数据资源与广州生物医药与健康研究院干细胞领域科研优势,基于中国科技云等信息化基础设施,重点提供干细胞领域科技大数据集成、知识计算及基于大数据知识计算的知识发现等三类知识服务。其建设与服务的宗旨是融合多源信息、打通数据孤岛,挖掘知识关联、放大数据价值,集成知识计算、促进知识发现,推进科研活动与信息化的融合,产生国际先进的科研信息化应用。



        综合运用知识图谱技术与文本挖掘方法,集成领域科技大数据资源,实现了“多形态-多粒度-多维度”知识有效融合。①基础数据汇聚:汇聚干细胞论文专利、基金项目、临床实验、产品法规、专家机构等十二类基础科技信息。②知识内涵挖掘:从科学仪器、动物模型、实验技术、细胞器官、疾病基因等科研人员关心的视角挖掘出2万多知识实体,多维度、细粒度地揭示领域知识内涵。③知识语义关联:基于引用、致谢、合作网络、知识实体共现等关系,建立各类科技信息之间知识语义关联。④热点前沿探测:从国际研发重点、中国研发重点、中科院重点突破方向等不同层面,挖掘领域的热点前沿主题。⑤科研画像:从项目、论文、专利、新闻等角度,为科研机构、科学家及热点前沿主题进行科研画像。



        从通用知识计算框架与专业领域知识计算环境两面,集成干细胞领域知识计算相关算法、模型与工具。①通用知识计算框架:基于中国科技云,在Zstack云环境上构建了基于SPARK的通用知识计算框架,集成了26种数据清洗规则与NLP、分类、回归、推荐等30种通用数据挖掘算法。②专业领域知识计算环境:从知识计算与知识服务流程的角度,基于干细胞领域知识图谱与通用知识计算框架,集成20个干细胞领域知识计算模型,开发了可视化工具包与研究报告自动生成工具。



        为干细胞科研活动与科研管理工作提供 “精、准、全”的基础数据、信息产品及情报服务支撑。①干细胞快报编辑:基于平台数据,高效、高质量编辑《干细胞研发动态》。②干细胞高价值专利挖掘与培育:项目组完成了《干细胞研究产业专利分析及预警研究报告》、《干细胞研究产业专利统计数据报告》专利分析报告,服务于广州健康院的高价值专利挖掘、布局与培育工作。③情报分析报告:项目组完成了《干细胞发展趋势分析报告》、《2018干细胞再生医学与新型药物研发态势分析报告》等多份情报分析报告。④应急支持:基于平台,项目组应急建立全球首个“人胚胎基因编辑”法律法规数据库,为向广东省及中科院相关领导提供“人类胚胎实验伦理规范”应急数据和情报服务提供信息化支撑。



联 系 我 们


■ 成都文献情报中心(CLIC)    电话:028-85220240 电子邮箱:huzy@clas.ac.cn ■ 广州生物医药与健康研究院(GIBH)    电话:020-32015320 电子邮箱:song_yibing@gibh.ac.cn