# 更新说明
# 一、更新内容
# 1. 数据规模相比V1有显著提升
2022V1 | 2022V2.1 | 提升比例 | |
---|---|---|---|
概念数量 | 4,135,287 | 28,475,876 | 589% |
术语数量 | 7,379,681 | 54,557,067 | 639% |
三元组(实验中 )数量 | 7,339,584 | 123,899,378 | 1588% |
# 2. 语义类型进行了一些新增和删改:
新增类型:
- 动物(Animal)
- 身体物质(Body Substance)
- 临床属性(Clinical Attribute)
- 细胞(Cell)
- 细胞成分(Cell Component)
- 细胞或分子功能障碍(Cell or Molecular Dysfunction)
- 食物(Food)
- 基因或基因组(Gene or Genome)
- 个体行为(Individual Behavior)
- 植物(Plant)
修改类型(旧=>新):
- 疾病(Disease or Syndrome) => 疾病或综合症(Disease, Syndrome or Pathologic Function)
- 解剖结构(Anatomy) => 解剖结构(Anatomical Structure)
- 医疗器械(Medical Device) => 器械(Device)
- 研究仪器(Research Device) => 器械(Device)
删除类型:
- 研究行为或技术,Research Activity or Technique
需要注意的是,部分术语的语义类型尚未给定,标记为“未知”("NA")。
# 3. 关系类型探索了上下位关系抽取,尚处于试验阶段(isa和reverse isa),暂时移除了其他关系类型。
# 二、遗留BUGs
当前版本暂无已知问题。
如果您发现任何问题或建议,请联系我们: bios@idea.edu.cn.
# 三、下一步计划
- 增加BIOS和UMLS的人工质量评估
- 新增更多关系类型的三元组
- 进一步优化BIOS质量