• ISSN: 1674-7461
  • CN: 11-5823/TU
  • 主管:中国科学技术协会
  • 主办:中国图学学会
  • 承办:中国建筑科学研究院有限公司

基于自然语言处理的结构设计规范分类方法
张吉松, 张庆森, 赵丽华, 刘鑫, 任国乾
2022,14(4):1-8. doi: 10.16670/j.cnki.cn11-5823/tu.2022.04.01
规范转译是BIM模型合规性审查的重要步骤,也是实现设计审查自动化和智能化的技术基础和前提条件。规范转译第一步是将设计规范自动分类为预定义类别,以便为后续文本分析和规则提取做准备。然而,由于结构设计领域语料库缺乏,导致设计规范自动分类技术有待开发,因此,依据《混凝土结构设计规范》和《建筑抗震设计规范》,创建结构设计语料库,按照IFC实体名称目录,通过Python语言编程,基于机器学习的文本分类算法,提出一种结构设计规范自动分类方法。过程的实现包括:数据准备和文本预处理;特征提取和选择;分类器的训练、测试和评估。结果表明:该分类方法可以有效实现结构设计规范的自动分类,分类器对测试规范的精确率和召回率可达到75%和83%。
关键词: 结构设计规范, 文本分类, 自然语言处理, 机器学习, 合规性审查, 朴素贝叶斯
面向公路工程规范的多粒度知识提取与知识应用方法
孙克强, 张嘉鸿, 伍震, 胡振中
2024,16(1):15-21. doi: 10.16670/j.cnki.cn11-5823/tu.2024.01.03
针对公路工程领域知识繁多而应用效率低的问题,提出面向公路规范类文本的多粒度知识提取与知识应用方法。在词语粒度上构建了公路工程领域词库;在语段粒度上提出TEARS定义,将复杂语段转换为结构化的三元组结构;在子句粒度上总结了四种主要句法,并各自设计了语义信息的抽取方法。以967本公路规范类文本为数据源,从中提取知识并构建了公路工程领域知识图谱,通过与深度学习方法比较验证了正确性,开发公路工程安全信息检索与应用系统。结果表明:该方法实现了非结构化公路规范类文本的知识提取,构建的领域知识图谱质量较高,满足工程应用需求。
关键词: 公路工程, 信息抽取, 自然语言处理, 中文规范, 知识图谱

出版年份

相关作者

相关热词

  • 版权所有© 《土木建筑工程信息技术》编辑部
  • 京ICP备17057008号
  • 地址:北京市朝阳区兴化路2号院1号楼
  • 电话:010-64517910 邮编:100013
  • 微信号:tmxxjs  QQ:342182902  E-mail:tmxxjs@163.com
本系统由北京仁和汇智信息技术有限公司设计开 技术支持: info@rhhz.net