# 更新说明

# 一、更新内容

# 1. 数据规模相比V1有显著提升

2022V1 2022V2.1 提升比例
概念数量 4,135,287 28,475,876 589%
术语数量 7,379,681 54,557,067 639%
三元组(实验中)数量 7,339,584 123,899,378 1588%

# 2. 语义类型进行了一些新增和删改:

  • 新增类型

    • 动物(Animal)
    • 身体物质(Body Substance)
    • 临床属性(Clinical Attribute)
    • 细胞(Cell)
    • 细胞成分(Cell Component)
    • 细胞或分子功能障碍(Cell or Molecular Dysfunction)
    • 食物(Food)
    • 基因或基因组(Gene or Genome)
    • 个体行为(Individual Behavior)
    • 植物(Plant)
  • 修改类型(旧=>新)

    • 疾病(Disease or Syndrome) => 疾病或综合症(Disease, Syndrome or Pathologic Function)
    • 解剖结构(Anatomy) => 解剖结构(Anatomical Structure)
    • 医疗器械(Medical Device) => 器械(Device)
    • 研究仪器(Research Device) => 器械(Device)
  • 删除类型

    • 研究行为或技术,Research Activity or Technique

    需要注意的是,部分术语的语义类型尚未给定,标记为“未知”("NA")。

# 3. 关系类型探索了上下位关系抽取,尚处于试验阶段(isareverse isa),暂时移除了其他关系类型。

# 二、遗留BUGs

当前版本暂无已知问题。

如果您发现任何问题或建议,请联系我们: bios@idea.edu.cn.

# 三、下一步计划

  • 增加BIOS和UMLS的人工质量评估
  • 新增更多关系类型的三元组
  • 进一步优化BIOS质量