基于深度学习算法的城市交通问题挖掘与治理优化方法研究
一、研究背景
“12328”市民服务热线是非紧急类求助热线,基本属性是遇难求助、有事即拨,均为诉求人以真实需求为导向而产生的,属于典型的行为或痕迹数据,具有广泛性与分散性,且规避了调查主体的主观偏差与采集过程中的样本偏差。因此,“12328”热线数据的时效性、真实性和广泛性使其成为了交通规划交通治理方面数据来源的强有力补充,其内在蕴含的事件内容、主要成因、情感倾向以及时空信息等极具价值,不仅能为交通规划治理方向聚焦、策略引导、价值判断提供重要依据,同时也是践行“以人民为中心”发展理念的重要途径。
本次研究工作重点聚焦百姓急难愁盼民生问题,如交通出行、人居环境等方面。采用人工智能大语言模型技术算法,深度挖掘政务留言大数据,快速获取诉求信息、研判热点问题、了解趋势成因、锁定争议区域,从而精准掌握百姓的关注重点和真实诉求,在此基础上融合城市其他数据,针对性提出改善建议,为政府部门在城市治理方面提供数据支撑和决策参考,有效推动“察民情、听民声、知民意、解民忧”的城市治理体系的构建, 在助力提升城市治理现代化水平上善作善成。
二、研究目的和内容
1.研究目标
本次研究工作采用多源异构数据融合技术,对“12328”热线、“12345”热线、“北方网政民零距离”网站等渠道产生的近110万条数据,开展标准化预处理工作,形成百姓诉求数据标准数据库,开展人工智能大语言模型算法研发,从百姓留言文本数据中实现主题细化归类、趋势预警研判、时空关联匹配、关键语义提取等信息挖掘提炼。在此基础上聚焦热点专题,如公共交通服务质量、共享单车停车投放、网约车运营规范等,挖掘问题成因,探寻优化建议,形成面向百姓真实诉求的专题分析报告,做到实时监测、快速感知、精准评估、科学决策,促进城市交通精细化治理的效率与质量提升,打造人民城市理念下的新质生产力,为政府在交通治理优化方面提供决策参考。
2.研究内容
(1)国内外热线服务发展现状
本研究通过调查国内外城市热线服务现状,深入了解热线服务变革,了解智能化热线服务发展现状。研究发现,现阶段深度学习算法与大语言模型以强大的数据处理和智能分析能力,推动着政府治理朝着更加精准化、智能化、高效化的方向发展,在提升公共服务水平、构建和谐社会等多方面具有极为重要的战略意义和广阔的应用前景,正逐渐成为热线数据分析以及政府治理领域的强大助力,为提升公共服务质量和治理效能开辟了新的路径。
(2)数据预处理,构建标准数据库
引入“12328”市民服务热线工单文本数据,开展针对文本数据规范化的预处理工作,旨在将文本信息从人类语言转换为机器可读的格式,为后续开展文本向量化转化、文本分类处理等工作提供数据基础,预处理工作主要包括:数据清洗、语料分词及去除停用词、特征提取及向量化三部分内容。
(3)基于深度学习算法的文本数据发掘,提炼深层信息价值
采用强大的Pytoch框架和Bert大语言模型,完成工单数据主题细化归类、趋势预警研判、时空关联匹配等信息数据挖掘提炼,主要方法包含:
①多标签主题分类:采用多标签分类深度学习算法,借助“12328”热线已有工单数据构建多标签数据训练集,通过Pytoch框架和Bert 语言模型,进行深度学习特征提取,形成“12328”热线精细化归类算法,完成热线数据主题及责任部门自动化归类。
②情感倾向性分析:采用深度学习算法(Pytorch+Bert),预测百姓留言情感倾向,通过统计负面情绪留言总留言中的占比,可对研究区域或相关主题进行情感指数的横向对比。
③空间位置关联匹配:创新提出了根据文本内容分离出更加具有规划价值的空间信息的方法。对百姓留言中相关地址位置信息进行匹配提取,借助互联网地图的地址解析功能进行经纬度坐标的转换,从而将百姓留言与城市空间进行关联,形成对城市规划城市治理来说真正具有价值的数据。
④类型实体知识图谱建设:通过相关算法,识别留言类型和责任实体间的语义关系,通过知识图谱建立责任实体问题清单,指导后续工作的精细化实施和精准化治理。
(4)百姓关注热点场景专题分析
结合天津市交通运输委自身工作职能,基于12328热线2021年9月-2023年12月受理涉及交通出行类相关诉求数据约20.1万条,通过深入分析挖掘可知,百姓主要关注排名前5的交通问题为常规公 交、网约车、高速公路、出租车、小客车指标、物流管理、共享单车 等内容,对这几个场景进行现状分析,并提出改善建议。
三、研究成果
(1)建立政务留言标准数据库
数据库构建主要是用于作为深度学习模型训练标注,因此主要保留3类字段信息,分别为标题、留言内容以及留言时间。两类数据融合后,共同组成了百姓民意留言标准数据库,包含约为131万条留言数据。
(2)基于城市治理的民意感知的算法设计
采用当前自然语言处理领域主流的大语言模型分析技术,对百姓留言数据进行学习推理,实现从看似杂乱无章的非结构化文本数据中挖掘出更具价值的主题信息、时空信息、情感信息以及责任关系等深层价值信息,形成针对“12328”热线数据的完整分析路径体系。
构建留言数据、空间位置、主题类型、责任部门间的网络联系,搭建民意诉求知识图谱网络,实现百姓诉求留言自动推送以及责任部门问题清单一键生成等功能,高效提升政府部门治理水平。
(3)聚焦热点专题,形成专题研究报告
在对“12328”热线数据文本挖掘的基础上,聚焦热点专题,如公共交通服务质量水平、网约车运营规范、共享单车停车投放等,从关注度排名、负面情绪感知、问题热点区域时空分布、高频词统计等方面,开展问题成因分析研判,并给出优化路径建议,制定相关专题报告,为政府部门在城市治理方面提供数据支撑和决策参考。
本次研究工作,选取百姓较为关注的3方面交通问题,为常规公交服务、网约车营运以及共享单车管理,从百姓留言中感知问题,结合其他城市交通运行数据进行融合分析,针对性提出改善建议,形成了相应专题报告。