# 数据统计

# 数据规模

  • 概念数量(CIDs)28,475,876
  • 术语数量(SIDs)54,557,067
  • 三元组(实验中)数量(RIDs)112,278,752

# 语义类型分布

语义类型名称 语义类型ID 概念数量 占比(%)
化学物质或药物 2 9,376,545 32.81
基因或基因组 36 2,459,724 8.61
疾病或综合症 6 1,191,999 4.17
治疗或预防程序 24 1,153,601 4.04
解剖结构 1 999,596 3.5
生理 19 836,385 2.93
细胞 34 669,681 2.34
器械 28 635,481 2.22
微生物 17 463,772 1.62
实验室程序 22 436,868 1.53
动物 31 415,455 1.45
肿瘤病变 11 370,757 1.3
诊断程序 20 311,022 1.09
植物 29 273,607 0.96
症状、体征或临床发现 10 225,865 0.79
真核生物 18 212,264 0.74
食物 37 145,803 0.51
细胞成分 35 127,351 0.45
受伤或中毒 9 124,834 0.44
解剖异常 7 99,808 0.35
细胞或分子功能障碍 39 95,870 0.34
精神或行为障碍 8 90,348 0.32
身体物质 33 47,877 0.17
个体行为 38 35,570 0.12
临床属性 32 4,301 0.02
未知 999 7,772,713 27.2

# 三元组(实验中)分布

关系类型名称 关系类型ID 三元组数量 占比(%)
是一种 1 56,139,376 50.00
包含 2 56,139,376 50.00

# 语言分布

语言 术语数量 占比(%)
英文 33,467,535 61.34
中文 21,089,532 38.66