# 更新说明
# 一、更新内容
# 1. 优化术语
V2.2术语在V2.1的基础上进行了清洗和新增,清洗了约340万个脏术语,新增了约300万个缩写术语对应的全称。
V1 | V2.1 | V2.2 | |
---|---|---|---|
术语数量 | 7,379,681 | 54,557,067 | 54,152,925 |
# 2. 优化概念聚合
V2.2概念聚合算法进行了优化,解决了相同中文术语不属于同一个概念的问题。
V1 | V2.1 | V2.2 | |
---|---|---|---|
概念数量 | 4,135,287 | 28,475,876 | 26,934,213 |
# 3. 优化关系抽取
V2.2基于概念的PT构建三元组,且扩充了更多的语义类型。
V1 | V2.1 | V2.2 | |
---|---|---|---|
三元组(实验中 )数量 | 7,339,584 | 123,899,378 | 69,600,356 |
# 4. 新增了英文术语的质量评估
详情参见质量评估。
# 二、遗留BUGs
当前版本暂无已知问题。
如果您发现任何问题或建议,请联系我们: bios@idea.edu.cn.
# 三、下一步计划
- 进一步优化BIOS术语和概念的质量
- 丰富三元组关系类型和数量