数据统计
数据规模
- 概念数量(CIDs): 26,934,213
- 术语数量(SIDs): 54,152,925
- 三元组(实验中)数量(RIDs): 69,600,356
语义类型分布
语义类型名称 | 语义类型ID | 概念数量 | 占比(%) |
化学物质或药物 | 2 | 8,762,372 | 32.34 |
基因或基因组 | 36 | 2,408,171 | 8.89 |
治疗或预防程序 | 24 | 1,078,771 | 3.98 |
疾病或综合症 | 6 | 1,073,513 | 3.96 |
解剖结构 | 1 | 900,496 | 3.32 |
生理 | 19 | 827,784 | 3.06 |
细胞 | 34 | 638,884 | 2.36 |
器械 | 28 | 595,200 | 2.2 |
微生物 | 17 | 422,069 | 1.56 |
实验室程序 | 22 | 419,664 | 1.55 |
动物 | 31 | 393,090 | 1.45 |
肿瘤病变 | 11 | 330,998 | 1.22 |
诊断程序 | 20 | 308,512 | 1.14 |
植物 | 29 | 248,171 | 0.92 |
症状、体征或临床发现 | 10 | 227,349 | 0.84 |
真核生物 | 18 | 194,347 | 0.72 |
食物 | 37 | 137,147 | 0.51 |
细胞成分 | 35 | 118,712 | 0.44 |
受伤或中毒 | 9 | 115,935 | 0.43 |
细胞或分子功能障碍 | 39 | 96,547 | 0.36 |
解剖异常 | 7 | 91,800 | 0.34 |
精神或行为障碍 | 8 | 87,198 | 0.32 |
个体行为 | 38 | 50,453 | 0.19 |
身体物质 | 33 | 45,085 | 0.17 |
临床属性 | 32 | 7,890 | 0.03 |
人类 | 30 | 2,322 | 0.01 |
未知 | 999 | 7,510,670 | 27.72 |
三元组(实验中)分布
关系类型名称 | 关系类型ID | 三元组数量 | 占比(%) |
是一种 | 79 | 34,592,027 | 49.7 |
是一种(反向) | 87 | 34,592,027 | 49.7 |
有相互作用 | 78 | 194,876 | 0.28 |
可治疗(反向) | 83 | 37,345 | 0.05 |
可治疗 | 86 | 37,345 | 0.05 |
鉴别诊断 | 76 | 33,142 | 0.05 |
有不良反应 | 77 | 26,318 | 0.04 |
有不良反应(反向) | 80 | 26,318 | 0.04 |
可诊断(反向) | 82 | 21,162 | 0.03 |
可诊断 | 85 | 21,162 | 0.03 |
禁忌用药 | 75 | 8,100 | 0.01 |
可导致 | 84 | 5,267 | 0.01 |
可导致(反向) | 81 | 5,267 | 0.01 |
语言分布
语言 | 术语数量 | 占比(%) |
英文 | 35,591,834 | 65.72 |
中文 | 18,561,091 | 34.28 |