安全与环境工程
 首页  |  期刊介绍  |  编 委 会  |  投稿指南  |  期刊订阅  |  广告服务  |  联系我们  |  留言板
安全与环境工程
安全理论与安全管理 最新目录 | 下期目录 | 过刊浏览 | 高级检索 Previous Articles  |  Next Articles  
道路交通事故信息文本预处理技术研究与实践
河南理工大学安全科学与工程学院,河南 焦作 454000;日本长冈技术科学大学原子能系统安全工程系,日本 长冈 9402188;安阳工学院,河南 安阳 455000;日本国家产业技术综合研究所人工智能研究中心,日本 东京都 1350064
Research and Practice for the Text Preprocessing Technology of Road Traffic Accident Information
School of Safety Science and Engineering,Henan Polytechnic University,Jiaozuo 454000,China; Department of Nuclear System Safety,Nagaoka University of Technology,Nagaoka,9402188; .Anyang Institute of Technology,Anyang 455000,China; Artificial Intelligence Research Center, National Institute of Advanced Industrial Science and Technology (AIST),Tokyo,135 0064
 全文: PDF (1170 KB)   HTML (1 KB)  输出: BibTeX | EndNote (RIS)      背景资料
摘要 文本预处理是文本挖掘的关键一步,建立与信息相匹配的标准语义集合能缩短信息处理的时间,提高信息的提取率和识别精度。根据国家交通事故信息采集规范要求,从国家公共安全行业标准中抽取相关交通事故基本信息的标准词汇及代码,构建了一套含有12个属性项目、185个标准词汇的交通事故信息文本预处理用标准化语义集合,并将其应用于国家安全生产监督管理总局的事故查询系统,对系统中2004—2014年期间所收集的8 156件重大道路交通事故信息中的文本数据进行分析。结果表明:利用这套语义集合能更多地提取交通事故信息,可为准确捕捉交通事故特征和研究交通事故发生机理提供重要依据,也为开发交通事故自动信息识别系统创造了重要的条件。
服务
把本文推荐给朋友
加入我的书架
加入引用管理器
E-mail Alert
RSS
作者相关文章
张坤
梅诗冬
景国勋
西田佳史
三上喜贵
关键词文本预处理   交通事故信息   语义集合   数据挖掘   文本数据     
Abstract: Text preprocessing is the key and timeconsuming step in text mining.Because of the lack of tools,much meaningful information is undiscovered in the narrative records of traffic accidents.In the essay,we aim at developing a tool for text mining which can shorten the time of information procession,enhance the extraction ratio and improve the accuracy of identification.According to the Chinese Specifications for Road Traffic Management Information Collection,this paper builds a systematic semantics set for preprocessing of the descriptive texts in the traffic accident information.The set comprises 12 items and 185 standard words,which are standard words and codes extracted from the fundamental traffic accident information defined in the standards of National Public Security.the paper extracts 8156 severe traffic accidents collected between 2004 and 2014 from the Accident Query System operated by State Administration of Work Safety.Then the paper applies the semantic sets to analyzing the descriptive text in the traffic information.The practice demonstrates that by using the standard semantic sets in analyzing the descriptive texts,more information related to environments can be extracted,more characteristics of the accidents can be well captured,and it is helpful to understand the mechanism of occurrence.The study also provides a key prerequisite in developing an automatic identification system for traffic accident information.
Key wordstext preprocessing   traffic accident information   vocabulary set   data mining   narrative text   
基金资助:

国家自然科学基金项目(51474098);日本学术振兴会(JSPS)特别研究员奖励费基金项目(JP2604306);河南理工大学博士基金项目(B2013008)

作者简介: 张坤(1977—),女,博士,讲师,主要从事安全事故数据信息挖掘技术与安全人机环境关系方面的研究。E-mail:kunzhang@hpu.edu.cn
引用本文:   
张坤,梅诗冬,景国勋等. 道路交通事故信息文本预处理技术研究与实践[J]. 安全与环境工程, 2017, 24(04): 112-116.
ZHANG Kun,MEI Shidong,JING Guoxun et al. Research and Practice for the Text Preprocessing Technology of Road Traffic Accident Information[J]. Safety and Environmental Engineering, 2017, 24(04): 112-116.
链接本文:  
http://aqyhj.cug.edu.cn/CN/10.13578/j.cnki.issn.1671-1556.2017.04.020
 
没有找到本文相关图表信息
没有本文参考文献
[1] 何朝阳,巨能攀,黄健. 地质灾害海量监测数据处理方法研究[J]. 安全与环境工程, 2014, 21(05): 115-120.
[2] 胡 畅 牛瑞卿. 三峡库区树坪滑坡变形特征及其诱发因素研究[J]. 安全与环境工程, 2013, 20(02): 41-45.
[3] 刘 强,庄东明,王 伟. 数据挖掘在应急救援决策支持中的应用研究[J]. , 2011, 18(4): 116-121.

版权所有 © 2012 《安全与环境工程》编辑部
本系统由北京玛格泰克科技发展有限公司设计开发 技术支持:support@magtech.com.cn