九州地学大模型:进展和展望
编号:149
访问权限:仅限参会人
更新:2025-09-10 15:16:38 浏览:4次
口头报告
摘要
随着地球科学观测和模拟技术的快速发展,领域内数据和文献呈现爆炸式增长,研究人员亟需高效的计算工具来整合信息、克服认知障碍并加速科学发现。大语言模型(Large Language Models,LLMs)作为新一代智能基础设施,展现出在信息检索、问题求解、假设生成等方面超越人类专家的潜力。本文系统回顾了近年来地球科学大语言模型与自主智能体的发展进展,并提出若干创新性研究工作。首先,设计了PreparedLLM 前预训练框架,在仅使用20%地学语料的情况下提升模型效果30%,并显著降低训练能耗。其次,构建了参数规模达70亿的地学大语言模型JiuZhou,在GeoBench评测中超越GPT-3.5,并应用于地学知识获取与推理。进一步,提出了ClimateChat 气候变化知识问答系统和 GeoFactory增强框架,分别在气候科学知识服务以及事实性和推理性地学任务中展现优越性能。此外,研发的TagRouter模型协同推理方法,实现了多模型间的高效路由与融合,为开放域地学智能体的构建提供了解决方案。本文最后展望了地学大语言模型的未来发展方向,包括构建可进化的模型协同生态系统、发展地学多模态大模型、探索高效训练与增强方法,以及研制具备外部交互能力的自主智能体。
关键词
地球科学,大语言模型,自主智能体,模型增强
发表评论