• ISSN: 1674-7461
  • CN: 11-5823/TU
  • 主管:中国科学技术协会
  • 主办:中国图学学会
  • 承办:中国建筑科学研究院有限公司

2022, 14(2): 110-115. doi: 10.16670/j.cnki.cn11-5823/tu.2022.02.16

基于深度学习的变电站钢结构图纸标题栏文字检测与识别

国网上海市电力公司,上海 200120

网络出版日期: 2022-04-01

作者简介: 秦辞海(1977-),男,工程师,主要研究方向:变电站工程建设数字化研究

Text Detection and Recognition of Drawing Title Bar of Substation Steel Structure Based on Deep Learning

State Grid Shanghai Municipal Electric Power Company, Shanghai 200120, China

Available Online: 2022-04-01

引用本文: 秦辞海, 顾万里. 基于深度学习的变电站钢结构图纸标题栏文字检测与识别[J]. 土木建筑工程信息技术, 2022, 14(2): 110-115. doi: 10.16670/j.cnki.cn11-5823/tu.2022.02.16

Citation: Cihai Qin, Wanli Gu. Text Detection and Recognition of Drawing Title Bar of Substation Steel Structure Based on Deep Learning[J]. Journal of Information Technologyin Civil Engineering and Architecture, 2022, 14(2): 110-115. doi: 10.16670/j.cnki.cn11-5823/tu.2022.02.16

摘要:为实现变电站工程建设中钢结构与电力设备的配套控制管理,需要从大量的钢结构图纸标题栏中识别相关信息,并与实物进行匹配。针对标题栏中字体模糊、表格形式多样、信息量混杂等问题,提出了基于深度学习CNN+RNN模型的文本检测和CRNN模型的文字识别方法。对现有钢结构变电站工程施工现场钢结构数据集的检测与识别显示,该方法的检测精确率达到80%以上,识别准确率达到90%以上,均优于其他文本检测与识别方法。工程应用结果表明,该方法有效解决了因文字的大小、字体、颜色与排列方式等差异引起的特征提取困难,提高了变电站钢结构图纸标题栏文字识别的准确率。

关键词: 变电站, 结构, 文本检测, 字识别, 深度学习, 图纸标题栏
[1]

Krizhevsky A, Sutskever I, Hinton G E. Imagenet classification with deep convolutional neural networks[J]. Communications of the ACM, 2017, 60(6): 84-90.doi: 10.1145/3065386

[2]

周翔, 陈会, 张锴, 等. 复杂背景下的图像文本区域定位方法研究[J]. 计算机工程与应用, 2013, 49(12): 101-105.doi: 10.3778/j.issn.1002-8331.1110-0134

[3]

黄娜君, 汪慧兰, 朱强军, 等. 基于ROI和CNN的交通标志识别研究[J]. 无线电通信技术, 2018, 044(002): 160-164. 

[4]

He P, Huang W, He T, et al. Single Shot Text Detector with Regional Attention[C]. 2017 IEEE International Conference on Computer Vision(ICCV). IEEE, 2017.

[5]

Shi B, Bai X, Belongie S. Detecting oriented text in natural images by linking segments[C]. Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition. 2017: 2550-2558.

[6]

Zhang Z, Zhang C, Shen W, et al. Multi-oriented Text Detection with Fully Convolutional Networks[C]. 2016 IEEE Conference on Computer Vision and Pattern Recognition(CVPR). IEEE, 2016.

[7]

Wang T, Wu D J, Coates A, et al. End-to-end text recognition with convolutional neural networks[C]. Proceedings of the 21st international conference on pattern recognition(ICPR2012). IEEE, 2012: 3304-3308.

[8]

Lecun Y, Bottou L. Gradient-based learning applied to document recognition[J]. Proceedings of the IEEE, 1998, 86(11): 2278-2324.doi: 10.1109/5.726791

[9]

Dubey A K, Jain V. Automatic facial recognition using VGG16 based transfer learning model[J]. Journal of Information and Optimization Sciences, 2020, 1-8. 

[10]

Gers F A, Schraudolph N N, Schmidhuber J. Learning Precise Timing with LSTM Recurrent Networks[J]. Journal of Machine Learnig Research, 2003, 3(1): p. 115-143. 

[11]

Shi B, Bai X, Yao C. An End-to-End Trainable Neural Network for Image-based Sequence Recognition and Its Application to Scene Text Recognition[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2017, 1-1.doi: 10.1109/TPAMI.2017.2701373

[12]

Shi B, Yao C, Liao M, et al. ICDAR2017 Competition on Reading Chinese Text in the Wild(RCTW-17)[C]//2017 14th IAPR International Conference on Document Analysis and Recognition(ICDAR). IEEE, 2017.

[13]

孙凯, 姚旭峰, 黄钢. 基于机器学习的白细胞六分类研究[J]. 软件, 2020, 41(10): 98-101+134. 

[14]

Nayef N, Yin F, Bizid I, et al. ICDAR2017 Robust Reading Challenge on Multi-Lingual Scene Text Detection and Script Identification-RRC-MLT[C]//2017 14th IAPR International Conference on Document Analysis and Recognition(ICDAR). IEEE, 2017.

[15]

Wenhao He, Xu-Yao Zhang, Fei Yin, Cheng-Lin Liu. Deep Direct Regression for Multi-Oriented Scene Text Detection[J]. arXiv preprint arXiv: 1703.08289v1.

[16]

Yao C, Bai X, Liu W, et al. Detecting texts of arbitrary orientations in natural images[C]. Computer Vision & Pattern Recognition. IEEE, 2012.

[17]

Song Y, Cui Y, Hu Han, et al. Scene Text Detection via Deep Semantic Feature Fusion and Attention-based Refinement[C]. 2018 24th International Conference on Pattern Recognition(ICPR). 2018.

[1]

徐志, 刘小云, 芮继东, 刘建秋, 余学霜, 商文念. 三维信息模型在变电站构架设计软件中的应用[J]. 土木建筑工程信息技术, 2016, 8(4): 109-113. doi:10.16670/j.cnki.cn11-5823/tu.2016.04.20

[2]

史松峰, 顾闻, 朱春叶, 朱江. 基于BIM的变电站清单与工程量自动生成的研究[J]. 土木建筑工程信息技术, 2018, 10(2): 56-59. doi:10.16670/j.cnki.cn11-5823/tu.2018.02.11

[3]

陈剑佳, 焦柯, 杨远丰. 基于Revit建筑结构施工图表达的实用方法[J]. 土木建筑工程信息技术, 2015, 7(5): 28-34. doi:10.16670/j.cnki.cn11-5823/tu.2015.05.05

[4]

吉久茂, 童华炜, 张家立. 基于Solibri Model Checker的BIM模型质量检查方法探究[J]. 土木建筑工程信息技术, 2014, 6(1): 14-19.

[5]

陈海涛, 陈国兵, 朱志坚. 变电站工程施工管理中的BIM应用与实践-以泰州文东高山220KV变电站为例[J]. 土木建筑工程信息技术, 2017, 9(5): 98-102. doi:10.16670/j.cnki.cn11-5823/tu.2017.05.18

[6]

许永宏. 勘测设计一体化平台的图签栏识别设计与实现[J]. 土木建筑工程信息技术, 2011, 3(1): 52-55.

[7]

张晓龙, 马恩成, 夏绪勇, 晋娟茹, 陈玉林. 钢结构三维模型碰撞检测技术研究及应用[J]. 土木建筑工程信息技术, 2009, 1(2): 51-54.

[8]

孙武, 袁颖. 基于有限元模型和不完备模态测试信息的结构损伤识别方法研究[J]. 土木建筑工程信息技术, 2013, 5(5): 50-56.

[9]

杨雅钧, 石轩潞, 唐禧妍, 靳晓勇, 许镇. 基于BIM与机器学习的建筑智能巡检眼镜研究[J]. 土木建筑工程信息技术, 2022, 14(1): 20-26. doi:10.16670/j.cnki.cn11-5823/tu.2022.01.04

[10]

张志远, 王文婷, 刘立渠, 杨国威, 高明芹, 周曹俊. 建筑检测与评定(鉴定)系统的研制[J]. 土木建筑工程信息技术, 2016, 8(4): 105-108. doi:10.16670/j.cnki.cn11-5823/tu.2016.04.19

[11]

黄俊杰, 许福, 龙士国, 彭亿洲. PC构件检测信息可视化管理及其在套筒灌浆饱满度检测中的应用[J]. 土木建筑工程信息技术, 2018, 10(3): 86-90. doi:10.16670/j.cnki.cn11-5823/tu.2018.03.16

[12]

王子豪, 周建亮, 周颖绮, 陈博华, 徐欣燕, 朱宏斌. 基于CNN算法与无人机技术的临边护栏识别方法探索[J]. 土木建筑工程信息技术, 2021, 13(1): 29-37. doi:10.16670/j.cnki.cn11-5823/tu.2021.01.05

[13]

任磊, 苗作华, 李自强, 刘礼坤, 汤阳, 王梦婷, 谢媛. 基于YOLOv3算法的危险区域工人识别[J]. 土木建筑工程信息技术, 2022, 14(2): 10-17. doi:10.16670/j.cnki.cn11-5823/tu.2022.02.02

[14]

杜明芳. 基于BIM+Multi-Agent增强学习的智慧建筑及城市运维软件设计[J]. 土木建筑工程信息技术, 2018, 10(6): 1-9. doi:10.16670/j.cnki.cn11-5823/tu.2018.06.01

[15]

任江, 钟崇光, 郭娜. 基于物联网技术的施工现场管理深度应用研究[J]. 土木建筑工程信息技术, 2013, 5(5): 40-44, 62.

[16]

王静岩. 浅谈关于海量城建档案数据的深度挖掘和分析[J]. 土木建筑工程信息技术, 2018, 10(3): 108-111. doi:10.16670/j.cnki.cn11-5823/tu.2018.03.20

[17]

许健, 苏以通, 王甫来, 李翔, 卢宁, 丁党盛. 青岛新机场项目深度数字化项目管理[J]. 土木建筑工程信息技术, 2019, 11(1): 1-8. doi:10.16670/j.cnki.cn11-5823/tu.2019.01.01

[18]

赵程昊, 邓思华, 李晨光. 轻型木结构房屋结构设计研究[J]. 土木建筑工程信息技术, 2014, 6(5): 26-30,37.

计量
  • PDF下载量(2)
  • 文章访问量(56)
  • HTML全文浏览量(19)
目录

Figures And Tables

基于深度学习的变电站钢结构图纸标题栏文字检测与识别

秦辞海, 顾万里

  • 版权所有© 《土木建筑工程信息技术》编辑部
  • 京ICP备17057008号
  • 地址:北京市朝阳区兴化路2号院1号楼
  • 电话:010-64517910 邮编:100013
  • 微信号:tmxxjs  QQ:342182902  E-mail:tmxxjs@163.com
本系统由北京仁和汇智信息技术有限公司设计开 技术支持: info@rhhz.net