基于大模型语义理解与动态拓扑优化的四至边界精准提取方法
王跃1,马祎程2,贝聿运1,
张一帆2,方润泽1,禹文豪2
1. 上海市大数据中心,上海 200040;
2. 中国地质大学 地理与信息工程学院,武汉 430074
摘 要:传统四至边界提取方法主要依赖人工判读与预定义规则,难以应对现实场景中道路数据断裂、多线表达等复杂拓扑问题,存在效率低、适应性差的局限性。为此,本文提出一种融合大语言模型智能体与动态拓扑优化的自动化四至边界精准提取方法,以实现从用户自然语言描述到高精度空间边界生成的全流程智能化处理。首先,构建基于大语言模型的多层次语义解析框架,用于自动识别用户查询中的地理实体及其空间拓扑关系;其次,设计具有双向校验机制的Text-to-SQL转换器,将语义解析结果转换为可执行的空间查询语句,实现高精度空间数据检索;最后,提出动态拓扑优化算法,通过多级缓冲区迭代与自适应闭合环检测,自动修复道路数据断裂与多线表达问题,生成符合几何与拓扑约束的闭合边界。以上海市道路网络数据为实验对象,结果表明,本文方法在封闭与非封闭道路场景下的总体精度达83.93%,较传统最小外接矩形方法提升显著,且在道路断裂、多线表达等复杂情况下仍能保持较高的几何精度与拓扑一致性。
关键词:大语言模型;四至边界;Text-to-SQL;语义增强;动态拓扑优化;地理信息自动化
引用格式:王跃, 马祎程, 贝聿运, 张一帆, 方润泽, 禹文豪. 2026. 基于大模型语义理解与动态拓扑优化的四至边界精准提取方法. 时空信息学报, 33(2): 208-218
Wang Y, Ma Y C, Bei Y Y, Zhang Y F, Fang R Z, Yu W H. 2026. Precise extraction method for four-boundary based on large model semantic understanding and dynamic topologial optimization. Journal of Spatio-temporal Information, 33(2): 208-218, doi: 10.20117/j.jsti.202602013
1 引 言
在不动产测绘与土地管理中,高精度四至边界数据具有重要价值,可为城市规划、国土空间优化及开发区资源整合等提供关键支撑。如何从地理空间数据库中高效提取符合用户需求的高精度四至边界,已成为科学划定空间范围、优化土地资源配置、提升区域产业发展能力的重要基础。然而,传统四至边界提取方法主要依赖人工采集与处理,普遍存在效率低、成本高等问题,亟需开展自动化提取方法研究以提升整体效能(金宝站,2024)。
目前,GIS与人工智能(885728)的融合框架已在国土空间规划的数据处理、环境监测与资源调度中展现出智能化应用潜力,且测绘地理信息为空间分析提供了关键的数据与方法支持(康超,2025;赵文龙和张健一,2025;马昭亭,2026)。近年来,以Transformer为代表的大模型技术在地面沉降预测等时序地学任务中表现优异,超越了部分传统方法(彭文祥和张德英,2024)。这为推动其在更复杂的空间拓扑推理问题(如四至边界提取)中的应用提供了新思路。大模型技术正成为时空计算服务向智能化、自主化转型的关键驱动力,尤其与GIS的深度融合,也是构建下一代智能化空间服务平台的重要路径(沈妙等,2025;张新长等,2025)。
传统的四至边界提取方法主要包括四种,分别为:①中心点–射线法,通过地块中心发射射线,确定最远交点为四至;其简单但对于凹多边形数据效果差(方衎和胡维,2015);②最小外接矩形法,直接以地块外接矩形四边为四至;其计算高效但会简化不规则边界(薄鑫等,2016);③交界线法,利用地块间共享边界判定四至;其精度高但对拓扑数据质量要求严格(邵晴晴和朱福利,2014);④方位角法,通过相邻地块重心连线方位角判定四至(涂梨平等,2017)。这些方法均基于固定的几何或拓扑规则,在规整数据条件下可发挥作用,但其共性瓶颈在于对数据质量与形态的强依赖,导致场景适应性严重不足。尤其是,当面临现实路网中普遍存在的道路断裂、双线或多线表达两大挑战时,方法性能会显著衰退。主要表现为:中心点–射线法易丢失真实边界;最小外接矩形法必然产生概化失真;交界线法因拓扑中断而失效;方位角法则受不规则形态干扰而产生误判。其中以多线道路场景最为突出,传统方法至今缺乏稳健的处理能力。因此,现有方法难以满足大规模、异构地理空间数据库的自动化处理需求,人工干预仍是当前生产流程中的必要环节。此外,自动化四至边界提取的核心障碍源于地理空间数据库的数据质量缺陷,集中表现如:①道路数据未正确相交(徐永洋等,2025);②道路存在多段断裂(曹云刚等,2025);③道路以双线或多线形式存储等问题(王安东等,2023)。前两种情况导致边界不闭合,而多线情况可能造成边界空洞、膨胀或偏移。这些因素显著加剧了四至边界自动提取的技术难度。传统方法在处理不闭合边界与复杂道路形态时已显现固有瓶颈,而人工修补方式不仅效率低下,更难以应对大规模路网中高度可变的空间形态。上述因素共同导致四至边界提取的准确性和稳定性难以保证。
为突破上述瓶颈,近年来部分研究尝试从数据修补与规则增强两条路径寻求突破。前者借助缓冲区生长、断点连接等几何手段修复道路断裂(徐永洋等,2025;曹云刚等,2025);但修复尺度难以自适应,且易引入拓扑歧义。后者通过方位判读、邻域分析等策略优化四至判定规则(邵晴晴和朱福利,2014;涂梨平等,2017);但仍无法有效应对双线或多线表达等复杂存储结构(王安东等,2023)。总体而言,现有研究仍多停留于单一技术环节的局部优化,尚未形成从用户语义理解到缺陷数据修复,再到闭合边界生成的全链路一体化解决方案。如何将自然语言描述的柔性意图与刚性几何拓扑约束深度融合,已成为当前四至边界自动化提取研究的核心攻关方向。
针对上述挑战,本文提出一种基于大模型智能体的四至边界自动提取方法,通过将自然语言处理能力与GIS空间推理相结合,以实现从用户文本描述到高精度边界的智能转换。具体地,首先通过大语言模型(large language model,LLM)智能体(agent)对用户输入的自然语言描述进行多层次语义解析,自动识别地理实体及其空间关系;其次通过具有双向校验机制的Text-to-SQL转换器,生成精确的空间查询语句以检索相关数据;最后利用动态拓扑优化算法,自动修复道路数据的断裂与多线表达问题,生成几何与拓扑完备的闭合边界,从而实现从语义理解到空间生成的全流程自动化。
2 研究方法
通过依托LLM的语义理解能力,构建从自然语言到空间边端的端到端处理流程。图1展示了以LLM智能体为核心驱动的四至边界精准提取框架的原理。首先,用户输入四至边界提取需求后,LLM识别用户查询中的地理实体与空间关系,生成结构化请求;其次,通过具有双向校验机制的Text-to- SQL转换器将该请求转换为有效的空间查询指令,检索道路几何数据;最后,采用动态拓扑四至方法生成精确四至边界。主要包括如下三个关键层次:
(1)语义解析层,LLM识别用户输入文本需求中蕴含的地理实体及拓扑关系;
(2)数据检索层,基于具有双向校验机制的Text- to-SQL转换器将需求信息转换为专业的空间查询指令,进而从地理空间数据库中获取空间数据;
(3)边界生成层,结合动态缓冲区对缺陷数据进行动态拓扑修复,实现自适应闭合四至边界构建。
2.1 四至边界生成的自动化工具调用机制
为实现从用户意图到地理处理工作流的自动化转换,构建基于LLM的智能任务调度机制。其核心在于使模型能够理解用户需求,并自主协调预定义工具集中的工具调用,从而替代传统依赖人工分解与执行的低效流程(An等,2024;Zhang 等,2024)。具体而言:①从非结构化文本中精准识别用户需求,实现用户意图到工具输入的映射;②动态决策是否触发特定函数,并衔接自然语言输出与预定义工具调用。
针对地理边界提取任务,设计一套专用的地理信息智能处理工具集,由三个紧密耦合的模块构成。主要包括:①语义驱动的需求参数提取模块,利用LLM从自然语言中精准解析地理实体及其空间关系;②双向校验的空间数据检索模块,通过设计Text-to-SQL转换器实现生成—执行—验证闭环检索;③动态拓扑优化的边界生成模块,采用多级动态缓冲区策略与自适应闭合环检测,自动修复道路数据缺陷并生成拓扑合理的四至边界。当LLM智能体识别用户意图后,自动协调并依次调用上述模块,形成完整的端到端处理工作流,如图2所示。采用模块化设计,支持各模块独立优化与灵活替换。
工具调用机制进一步引入循环决策模式,通过多轮迭代形成一个规划—执行—反思—调整的智能决策闭环,以增强模型在复杂需求场景下的适应性与执行准确性。每一轮迭代的具体步骤如下。
(1)规划与执行。基于当前任务状态,智能体规划本步需调用的工具及其输入参数,随后执行工具。
(2)反思与判断。获取工具执行的结果后,系统将结果的关键空间特征,如提取出的候选边界环数量、最大环的面积与周长、未连接的道路端点数量,与从用户意图中解析出的期望特征进行量化比对。终止条件则具体定义为:① 成功生成唯一一个边界闭合环;② 该环严格满足下文所述四项几何–拓扑约束;③ 环的空间范围与用户描述的道路逻辑位置一致。若同时满足则判定成功并终止循环。
(3)调整与再迭代。若未满足终止条件,系统根据反思信息识别的主要误差来源动态调整下一轮工具调用的参数。例如,若因道路断裂导致无闭合环,则倍增动态拓扑优化模块的初始缓冲区距离;若产生多个闭合环,则可能触发对用户意图的澄清或尝试融合相邻环。调整后的参数将应用于下一轮迭代,循环直至成功或达到最大迭代次数。
总之,这一模式使系统能够基于具体空间规则与实时反馈进行自主决策,提升处理复杂、模糊四至描述的稳健性。
2.2 四至边界数据的自然语言映射
在完成意图理解与任务规划后,系统需将自然语言描述转换为可执行的空间数据查询。在自然资源管理等复杂业务场景中,通过构建领域知识库与优化提示工程,可显著提升LLM专业问答的准确性与可靠性(陈卉等,2025)。为此,针对地理空间数据的特殊性,设计具有双向校验机制的Text-to-SQL转换器,以实现从自然语言到专业空间SQL语句的高精度、可靠转换。
四至边界数据的自然语言映射利用LLM的语义理解和推理能力,引导模型准确理解用户意图并生成相应的SQL语句(Guo等,2025)。考虑到地理空间数据与其他模态数据的不同,设计双向校验机制。首先根据用户需求输出对应的空间SQL查询语句,执行完查询操作后,会获取查询数据结果的基础空间信息,如面积、长度、区域位置等;其次将这些信息回传至LLM。通过首先检验查询结果是否符合用户需求,确认符合需求后,将对应的信息反馈至用户,让用户知晓查询依据、查询结果,过程透明且可随时中断,实现双向校验。
双向校验机制的核心在于利用LLM的推理能力对查询结果进行可信度评估。具体步骤如下:①LLM根据用户问题和数据库模式生成空间SQL语句并执行;②系统从查询结果中提取关键空间统计摘要信息,包括返回的几何对象数量、总面积、总长度及其合并后的空间范围;③将这些统计信息与原始用户问题组合成一个验证性提示,交由LLM判断结果是否合理。若判断为“是”则采纳结果;否则,尝试重新生成SQL或提示用户修改输入。四至边界数据处理的自然语言技术流程如图3所示。
设计结构化的提示工程来实现具有双向校验机制的Text-to-SQL方法。具体步骤为:①连接数据库获取表结构信息;②使用提示模板将用户问题和数据库结构信息组合成结构化提示输入LLM,引导模型生成专业化的空间SQL指令;③执行SQL查询获取对应空间数据,并以GeoJSON格式返回对应数据的基础地理信息。整个过程通过链式调用机制整合,实现数据库连接、提示模板、模型调用等组件有效联通,从而实现从自然语言到SQL的转换。
在提示工程方面,为地理空间查询定制提示模板。模板中明确注入领域知识,如空间关系术语映射,将“围合”“东至”等自然语言表述关联至对应空间函数;数据库模式上下文,提供空间表的名称、几何字段类型及关键属性字段;空间函数示例,包含ST_Intersection、ST_Union等经典空间操作的SQL语句。通过这种方式,将通用LLM引导至专业的地理空间SQL生成任务。这是对现有Text-to- SQL技术的重要领域化适配与增强。道路数据SQL查询的提示工程示例如图4所示。
2.3 动态拓扑优化四至边界提取方法
在获取道路空间数据后,如何从可能存在断裂、多线表达的线数据中生成拓扑闭合的精确边界,是需要解决的核心几何处理问题。为此,提出基于动态拓扑优化的边界生成方法,通过多级缓冲区迭代与自适应闭合环检测,实现对缺陷数据的自动修复与边界构建。基于道路线数据生成封闭边界,采用多级动态缓冲区策略实现边界优化。具体地,通过对道路线施加小尺度缓冲区生成多边形带,进而提取外围边界线检测闭合环结构。
生成的闭合环要求满足四项几何-拓扑约束。具体而言:①几何闭合性。要求起点与终点严格重合。②面积阈值约束。环内面积需大于一个与道路总长度相关的动态阈值T,T=K×L2,其中,L为相关道路总长度,K为根据区域道路密度和几何特征设定的比例系数,以避免生成无意义的小环。③拓扑连接约束。必须与至少两条不同道路保持有效连接。④覆盖率约束。同时与原始道路缓冲区的重叠面积比例需控制在90%以下,以确保边界对原始路网有足够的覆盖。
对于未能形成封闭结构的区域,采用自适应的多级动态缓冲区策略进行迭代处理。缓冲区距离搜索范围设定为5~1000 m。其设置依据由基于实际道路数据统计分析确定:下限5 m用于修复微小制图误差;上限1000 m容纳大型地理要素或数据缺失所导致的断裂。从最小距离开始,以固定步长或比例递增的方式,自动执行缓冲区生成—边界提取—闭合环检测循环。每次迭代中,对道路线施加当前缓冲区,检测是否形成满足四项核心条件的有效闭合环。循环终止于发现有效环或超过最大距离。若未发现有效环,则选取面积最大的候选环作为调整基础。这通过递增搜索寻找最小充分缓冲区距离,在保证拓扑闭合的同时最大限度地保留道路形态特征。
3 实验与结果分析
3.1 实验设计
实验所需道路网络数据来源于上海市大数据中心。构建一个用于系统测试与评估的专用数据集,共包含3056个四至边界样本。其中,封闭道路样本占69.5%(2124个);非封闭样本占30.5%(932个),覆盖各类复杂拓扑结构,如道路断裂、单线或双线或多线道路配置,以及非相交道路等多种复杂场景。
此外,为验证方法可行性,以常用的最小外接矩形法(minimum bounding rectangle,MBR)为基准方法进行比较分析。具体而言,对于测试数据集中的每一个样本,即每一组用户指定的道路,首先提取这些道路的几何集合,其次计算该集合的最小外接矩形,并直接将该矩形的四条边界线作为提取出的四至结果输出。在此过程中,未设置任何额外的平滑、缓冲或优化参数,以遵循其常规应用方式。
本文方法中的关键参数,其具体数值通过对训练数据集的统计分析来确定。经在训练集上多次测试,动态拓扑优化算法中用于判定有效闭合环的面积阈值系数,设置取值0.005。其能够有效区分因缓冲区偶然连接形成的无效小环与反映实际地块范围的合理闭合环。
3.2 结果分析
3.2.1 动态拓扑优化四至边界提取方法评价
如图5所示,针对存在断裂和不闭合现象的道路数据,采用500 m缓冲区处理后,生成了四至边界区域。其有效保留了原始道路的曲率特征,确保了边界形态的准确性。这表明,本文方法提取的四至边界与实际的四至边界的大小之间差距较小,精度在可以接受的范围内,弥补了传统方法难以处理道路缺陷、不封闭等场景的不足。
不同方法不同场景的总体精度评价结果见表1。在封闭道路场景中,本文方法的总体精度(overall accuracy,OA)达97%,在非封闭道路场景中,达47.32%;本文方法在实验区域的OA达到83.93%。相较于基准方法,本文方法提升显著,表明在不同场景下均能稳定生成精确的区域边界。
进一步对不同类别场景的数据进行比较分析,在部分封闭道路场景区域进行实验。由表2可知,不同指令,对封闭数据及其对应的四至边界区域的结果。这表明本文方法可以有效处理封闭道路样本场景。
此外,由表1可知,在非封闭道路场景样本中,本文方法的OA达到了47.32%,较基准方法提升了14.43%。这验证了动态拓扑优化策略对复杂道路网络的有效性。非封闭数据及其对应的四至边界区域示例见表3。同样表明,本文方法所生成的四至边界区域满足设计要求,且在多种非封闭道路场景下均表现出良好的适应性。
3.2.2 动态拓扑优化四至边界提取结果分析
为具体演示并验证方法的实际运行机制,选取一个包含明确方位描述的复杂查询作为案例进行实验分析。以用户查询“东至嘉松中路、西至纪鹤公路、南至赵重公路、北至沪常高速的四至边界区域”为例,LLM智能体对查询的语义理解与工具调用过程,系统识别用户意图后调用boundary_four工具,如图6(a)所示。图6(b)则展示了数据检索环节中Text-to-SQL转换器自动生成的空间查询语句。从自然语言输入开始,经由LLM智能体进行语义理解与任务规划,触发并协调后续专用工具集,包括Text-to-SQL转换与动态拓扑优化,直至最终生成结果的全过程。这揭示了各模块间的信息流转与决策逻辑,是对所述端到端处理链的直接验证。从系统评估角度看,所提出的集成双向校验机制的Text-to-SQL转换器,在实际应用中有效降低了非专业用户与复杂空间数据库交互的门槛。用户无须掌握专业的SQL语法与空间函数知识,即可通过自然语言描述完成高精度的空间数据检索。这一设计不仅避免了因人工编写查询语句可能引入的错误,还将从意图理解到数据获取的端到端流程效率显著提升,为后续动态拓扑优化提供了可靠、高质量的数据输入基础。
此外,由图6还可看出,从自然语言输入到最终边界输出的完整处理链条,依次涵盖语义解析、工具调用、数据检索(Text-to-SQL)及动态拓扑优化等核心模块。具体来说,通过LLM接口获取工具参数后,系统将道路名称传递至Text-to-SQL转换模块,基于预设提示工程模板自动生成对应的数据检索SQL语句。通过执行该SQL查询,可提取相应的四至边界数据。
图7展示了动态拓扑优化结果,道路数据的缺失程度与最终生成边界的空间失真存在明显关联。当原始道路缺失较少时,生成边界的几何形态失真有限;即使在道路缺失较为严重的情况下,生成的整体边界轮廓仍能保持相对合理,主要几何偏差集中于数据缺失的局部区域。究其原因,本文方法能够根据输入道路数据的实际空间分布,自适应地调整缓冲区参数,在强制实现拓扑闭合的同时,最大限度地维持了边界整体的空间保真度。这说明本文方法在处理不完整、断裂道路数据时,具有较好的稳健性与实用性。
4 结 论
针对传统四至边界提取方法依赖人工、复杂场景适应性差等问题,本文提出了一种融合LLM智能体与动态拓扑优化的自动化四至边界精准提取方法。通过构建语义解析—数据检索—边界生成三层联动的技术框架,实现了从自然语言描述到高精度地理边界的全流程自动化处理。实验结果表明,在封闭、非封闭两种道路场景下,本文方法均具有较高提取精度,显著降低了对人工干预的依赖。此外,还包括:①双向校验机制的Text-to-SQL。面向地理信息检索需求,提出了集成语义解析与结果验证的双向校验转换器,通过生成—执行—反思闭环有效提升了空间查询的语义保真度与执行可靠性,为非专业用户提供了低门槛、高可信的数据交互接口。②自适应动态拓扑优化算法。设计了多级缓冲区迭代与闭合环几何约束联合优化的拓扑修复策略,在强制闭合与形态保真之间取得平衡,显著提升了复杂场景下边界提取的几何精度与拓扑一致性。
总之,本文通过构建LLM智能体与动态拓扑优化深度融合的四至边界自动化提取方法,实现了从自然语言意图理解到空间边界几何生成的全流程智能贯通。研究成果将LLM智能体与空间拓扑推理深度融合,为四至边界自动提取提供了高精度、可扩展的技术方案,对智慧城市建设和国土空间规划的智能化发展具有重要应用价值,也为土地管理、空间规划等领域的信息化转型提供了高效可靠的智能化技术支撑。
尽管本研究在提升自动化水平与处理复杂数据方面取得了进展,但仍存在不足之处。由于对LLM的依赖,整体处理效率相比传统方法仍有提升空间;在极端道路断裂或高密度路网中存在多闭合解等复杂情形下,几何容错与语义推理能力仍需进一步增强。未来将重点围绕多模型协同优化、语义反馈集成及自适应参数学习等方面展开深入研究,探索与时空知识图谱的深度融合,以进一步提升在边缘场景下的稳健性与实用性,推动其在智慧国土等实际业务中的规模化应用。
《时空信息学报》是由自然资源部主管,国家基础地理信息中心、中国地理信息产业协会、黑龙江测绘地理信息局共同主办的中文学术期刊,双月刊。为分享最新研究成果,搭建学术交流平台,中国地理信息产业协会公众号开设“时空信息学报”专栏,独家刊载《时空信息学报》论文,供广大读者研阅。欢迎产学研用各界关注、分享!
