# 版本速览

更新时间: 2024-3-7

生物医学信息本体系统(Biomedical Informatics Ontology System, BIOS)V3 于2024年3月7日正式开放下载

# 版本亮点

  • 术语聚合优化:本版本使用全新的基于术语解释的嵌入表示方式识别同义术语,并通过大模型技术辅助进行同义术语聚类,同义术语识别效果比BIOS V2.2更准确。查阅技术详情 (opens new window)

  • 关系提取优化:本版本使用大模型技术全面更新了关系提取与关系生成,三元组更准确。此外,区别于BIOS V2.2的关系三元组仅提供概念ID和关系类型,本版本还同时提供关系原始发现的术语ID。查阅技术详情 (opens new window)

  • 中文术语优化:本版本使用基于大模型底座训练的生物医学翻译模型重新生成中文术语,并提高筛选阈值,最后保留下来的中文术语相比BIOS V2.2更准确、更纯净。

  • 数据集全面更新:本版本在BIOS V2.2基础上,通过上述方法在概念聚合、关系发现、中文术语等方面进行了优化,并提供了关系三元组原始发现的来源术语。BIOS V3共收录医学概念22,104,559个,医学术语46,024,274个(其中中文10,233,353个,英文35,790,921个),关系三元组99,849,860个(以关系原始发现的术语ID统计,相比以概念表示的关系存在重复)。本版本涉及27种概念语义类型和13种医学关系类型,与上版本一致。

# 如何获取数据?

我们提供了在线搜索 (opens new window)文件下载API服务 (opens new window)等多种方式帮助您使用BIOS。在使用数据和服务之前,您需要先在BIOS网站注册 (opens new window)以获取相关权限。

# 如何使用数据?

我们在下载包中提供了脚本助您将数据文件加载到SQL数据库中。此外,还提供在线医学NER Demo (opens new window)和离线医学NER工具: BIOS Helper (opens new window),帮您识别自由文本中的BIOS术语(离线工具支持批量文件识别)。

# 如何构建BIOS?

我们提供了BIOS构建的技术论文,并开源了相关代码。本版本新增了关于术语聚合关系提取相关工作的论文,您可以在技术文档 (opens new window)查阅详情。




打造面向全球值得信赖的开放医学知识全集是BIOS的目标和使命,秉着开放共建、持续提升的理念,我们期待您的反馈与合作!

如果您有任何宝贵的意见和建议,请联系我们: bios@idea.edu.cn