数据统计
数据规模
- 概念数量(CIDs): 28,475,876
- 术语数量(SIDs): 54,557,067
- 三元组(实验中)数量(RIDs): 112,278,752
语义类型分布
语义类型名称 | 语义类型ID | 概念数量 | 占比(%) |
化学物质或药物 | 2 | 9,376,545 | 32.81 |
基因或基因组 | 36 | 2,459,724 | 8.61 |
疾病或综合症 | 6 | 1,191,999 | 4.17 |
治疗或预防程序 | 24 | 1,153,601 | 4.04 |
解剖结构 | 1 | 999,596 | 3.5 |
生理 | 19 | 836,385 | 2.93 |
细胞 | 34 | 669,681 | 2.34 |
器械 | 28 | 635,481 | 2.22 |
微生物 | 17 | 463,772 | 1.62 |
实验室程序 | 22 | 436,868 | 1.53 |
动物 | 31 | 415,455 | 1.45 |
肿瘤病变 | 11 | 370,757 | 1.3 |
诊断程序 | 20 | 311,022 | 1.09 |
植物 | 29 | 273,607 | 0.96 |
症状、体征或临床发现 | 10 | 225,865 | 0.79 |
真核生物 | 18 | 212,264 | 0.74 |
食物 | 37 | 145,803 | 0.51 |
细胞成分 | 35 | 127,351 | 0.45 |
受伤或中毒 | 9 | 124,834 | 0.44 |
解剖异常 | 7 | 99,808 | 0.35 |
细胞或分子功能障碍 | 39 | 95,870 | 0.34 |
精神或行为障碍 | 8 | 90,348 | 0.32 |
身体物质 | 33 | 47,877 | 0.17 |
个体行为 | 38 | 35,570 | 0.12 |
临床属性 | 32 | 4,301 | 0.02 |
未知 | 999 | 7,772,713 | 27.2 |
三元组(实验中)分布
关系类型名称 | 关系类型ID | 三元组数量 | 占比(%) |
是一种 | 1 | 56,139,376 | 50.00 |
包含 | 2 | 56,139,376 | 50.00 |
语言分布
语言 | 术语数量 | 占比(%) |
英文 | 33,467,535 | 61.34 |
中文 | 21,089,532 | 38.66 |