# 更新说明
# 一、更新内容
# 1. 优化中文术语
V3英文术语相比V2.2基本没变化,重点通过使用新翻译模型和提高筛选阈值提升了中文术语质量,最后收录的中文术语比V2.2减少约800万个。
V1 | V2.1 | V2.2 | V3 | |
---|---|---|---|---|
术语数量 | 7,379,681 | 54,557,067 | 54,152,925 | 46,024,274 |
# 2. 优化概念聚合
V3使用新方法重新进行同义术语识别和聚类,聚合结果相比V2.2更为精准。
V1 | V2.1 | V2.2 | V3 | |
---|---|---|---|---|
概念数量 | 4,135,287 | 28,475,876 | 26,934,213 | 22,104,559 |
# 3. 优化关系抽取
V3使用大模型技术全面更新了关系提取与关系生成,且同时提供了关系原始发现的术语ID(V3关系数量以关系原始发现的术语ID统计,相比V2.2以概念表示的关系存在重复)。
V1 | V2.1 | V2.2 | V3 | |
---|---|---|---|---|
三元组(实验中 )数量 | 7,339,584 | 123,899,378 | 69,600,356 | 99,849,860 |
# 二、遗留BUGs
当前版本暂无已知问题。
如果您发现任何问题或建议,请联系我们: bios@idea.edu.cn.
# 三、下一步计划
- 持续优化BIOS图谱质量