特别策划 | 文化馆数字化建设中AI大模型应用的一些思考
编者按
在科技浪潮奔涌的当下,AI无疑是最瞩目的引领者。伴随着春晚机器人扭秧歌、AI公务员深圳上岗等不断涌现的“新鲜事”,关于“人类的工作将被AI取代”的讨论愈发热烈。
在这股AI热潮中,文化馆作为公共文化服务的重要阵地,也面临着新的机遇与挑战。2025年,《广东公共文化》推出全新专题“特别策划”,在文化馆行业率先聚焦“AI与文化馆”这一前沿话题,深入探讨AI与文化馆各项业务的融合实践,分享业内同行的思考,力求为文化馆事业在数字化时代的创新发展探寻新路径,为公共文化服务的高质量提升注入新活力。
文化馆数字化建设中AI大模型应用的一些思考
方崴
(广东省文化馆数字文化部主任,研究馆员)
摘要:今年开年以来,以国产大模型DeepSeek为代表的人工智能技术火爆全球,各行业探索与人工智能深度融合已成为当前高质量发展的大趋势。本文结合当前AI大模型的发展,就文化馆数字化建设中AI大模型应用展开分析论述,从需求出发,结合实际,就AI大模型在文化馆业务中的诸多应用场景、文化馆行业垂直AI大模型建设等方面作重点讨论,希冀抛砖引玉,文化馆行业能快速介入其中,推动业态智慧化转型,让AI更好赋能公共文化高质量发展。
关键字:文化馆数字化;AI大模型
1.前言
近年来,文化馆数字化建设进入高速发展期,在脉络上大致可以分类两个阶段,一是“十三五”期间,随着2015年中办、国办《关于加快构建现代公共文化服务体系的意见》等一系列政策文件出台,文化馆的发展进入了数字化转型的快车道,依托文化和旅游部全国公共文化发展中心在全国启动的数字文化馆试点建设,从2015年到2019年,国内各级文化馆陆续获得数字文化馆试点建设项目支持,文化馆数字化建设在平台建设、资源建设、服务推广等方面获得了长足进步,文化馆业务纷纷实现数字化转型,有效推动了公共文化服务在城乡均衡化、普惠化的快速发展。二是“十四五”期间,在国内高质量发展要求的背景下,文化馆数字化建设进入高质量发展期,中央支持地方公共数字文化建设项目也由先前的平台建设类项目转向服务和资源类项目为主的建设方向,各地数字文化建设服务新模式不断出现,公共文化服务向出成效,出效益的高质量方向发展。
而今,在“十五五”期间,文化馆数字化建设在经历了前期的数字化、网络化发展后,必然向智能化、智慧化的方向发展。恰逢当前以DeepSeek、ChatGPT等为代表的AI大模型新技术兴起,让文化馆数字化建设找到了下一步发展的动力和方向。本文就AI大模型在文化馆系统的应用做一些粗浅的探讨。
2.了解AI大模型能干什么
2025年2月以来,深圳市及下属龙岗、福田、罗湖等区政务服务部门,纷纷推出基于国产大模型DeepSeek-R1全尺寸模型的政务服务,如龙岗区上线34个政务AI应用,广泛覆盖政务办公、城市治理、民意速办等核心领域,同时也成为广东首个在政务信创环境下部署上线该模型的政府部门单位。可以看到,随着AI大模型的日渐成熟,尤其今年开年以来,国产大模型DeepSeek凭借开源模式和成本优势火爆全球,成为迄今为止最快突破3000万日活跃用户量的应用程序,各行各业数百家企业纷纷接入,智能化变革席卷全国,各行业探索与人工智能深度融合已成为当前高质量发展的大趋势。对于如何应用AI大模型,我们首先需要了解它能干什么、应用场景如何,能否带来更好的服务体验和更高的效率。
AI大模型(Large Language Model)是指基于深度学习技术、拥有海量参数(通常达到数十亿甚至数万亿级别)的神经网络模型。这些模型通过在大规模数据集上进行训练,能够学习复杂的模式和规律,在多种任务中表现出强大的通用性和适应性。不同的AI大模型的算法不同,训练方法不同,参数集大小和质量不同,擅长的领域不同。如Kimi大模型擅长于长文本生成、联网搜索、数据处理、代码编写、用户交互、翻译等,主要应用场景为专业学术论文的翻译和理解、文章写作、辅助分析法律问题、快速理解API开发文档等。DeepSeek R1大模型主要擅长于逻辑推理、自然语言理解与生成、图像与视频分析、语音识别与合成、个性化推荐、大数据处理分析、跨模态学习、实时交互与响应等,可提供自然语言下的语义语境理解、智能会话、文本生成、数学推理、代码生成纠错等复杂应用场景。当下的AI大模型赛道非常拥挤,国内外各大厂家推出的模型非常之多,擅长的领域各有千秋,迭代非常之快速。如何选择安全、可靠、高效的大模型,这个就需要文化馆人从自身需求出发,亲历亲测,坚持实践出真理的原则,了解大模型的功能特色、擅长的工作领域,结合模型实际的参数大小和类型,数据训练的可操作性、安全性等因素,在充分实践的基础上,挑选适合的模型来实现不同的应用场景。
以需求为导向,以提升服务效能为驱动,文化馆各类业务都可开展相应的AI大模型应用和植入,在细分业务场景中找方向,逐步开展文化馆特色的AI大模型应用场景打造。本文结合实践,就AI大模型在文化馆智慧场馆建设、对外服务、业务建设、运营推广和文创建设等方面具体应用作些许场景展望:
3.1智慧场馆建设方面
国内文化馆基础设施建设不断完善,一些地方的文化馆成为当地的文化地标,如广州市文化馆、深圳市文化馆等新馆建设,场馆的智慧化管理和服务是必然选择,智慧场馆与AI大模型的结合,可在设备设施管理(数字孪生,智能安防监控、人流分析与预警、功能室管理、停车场管理、信息化系统管理、基础设施设备管理等);智能导览与互动体验;到馆用户行为分析;馆内活动(如展览、培训等)分析;场地利用率分析等方面开展深度融合。AI大模型赋能智慧场馆建设,可以有效提升文化馆对于群众需求的感知,提升群众到馆服务体验,促进场馆的管理效率和运营水平,大大地丰富场馆服务的互动性、可获得感。
3.2对外服务方面
面向不同的用户服务需求,可基于AI大模型打造功能各异的智能服务模块,特别是文化智能体(AI Agent)建设,提供丰富的个性化、智慧化的服务,如文化活动助手类型,可以实现活动推荐、 活动预订、活动提醒、活动参与规划等服务;导览员(讲解员)类型,可提供展览讲解、作品讲解、文化专题讲解、线上虚拟体验项目导览等服务;培训辅导类型,可提供课程咨询、学习指导、作品点评、课程管理等服务;资源推荐类型,可提供艺术作品资源(各类音视频资源、图片资源等)、文化专题资源(各地文化、特色文化、红色文化、旅游文化等)、慕课资源、直录播资源等服务推介;线上客服(FAQ)类型,可提供咨询解答(场地、培训、活动等服务信息)、问题处理、意见反馈等服务。各类智能模块和文化智能体(AI Agent)的引入可大大拓展文化馆服务的深度和广度,丰富服务手段,节省人力成本,让文化馆提供7×24小时智慧服务成为可能。
3.3业务建设方面
在行政业务建设和专业业务建设方面,可以引入或自建功能不同、安全适用的AI大模型,实现高效业务建设与管理。此类应用场景可以有:实现办公业务的AI化,如公文辅助写作(通知、文件、PPT等)、调研报告分析和辅助撰写等;实现业务数据分析AI化,如财务数据分析、业务报表分析等,通过数据挖掘为管理决策提供支持;实现内部业务流程AI化,公文流转、公文审批、设备管理维护、人事管理、财务管理等内部流程的自动化和智能化,提高工作效率;实现员工培训与知识管理AI化,提供个性化的培训内容,提升员工的专业技能和数字化素养;开展行业特色的垂类专有大模型建设(重点在服务数据、特色资源数据、专业服务等方向);开展数据治理等。
3.4运营推广方面
目前,大多数文化馆都建立了自己的线上宣传渠道,各类活动上线推广是常态,结合AI大模型的发展,可以考虑的一些融合方向,一是利用AI实现精准分析与个性化服务,分析群众的偏好和行为数据,为文化馆提供精准的运营策略、优化供给侧服务产品、个性化服务定制;二是开展智慧化社群运营,AI可实现各类兴趣社群的互动管理(如作品评价,活动通知、回复等),辅助管理(课程作业布置,课程管理等)等工作;三是在宣传工作中可以引入AI实现宣传推文、短视频、海报等宣传物料的高效产出。AI赋能将极大减轻繁重的日常运营工作,同时也将创造出更多新鲜的运营方式和方法。
3.5文创建设方面
可以看到,生成式AI大模型的出现,在诗歌、绘画、小说、文化产品创意等文创领域都展现出强大的创作、创新能力,如在日前在“融合·共美”广东省非物质文化遗产馆高质量发展主题活动上,清华大学团队开发的AI生成器,结合传统皮影艺术,创作了交互艺术装置《影灯·灯影》,观众可以通过互动体验数字化皮影形象,触发剧情故事。文化馆可以重点考虑:一是培育专业创作人员AI技能,丰富创作手段,辅助创作文艺作品,提升创作效能,激发文化创新活力。二是在各种文化活动项目中融入AIGC能力,如各类非遗文创项目、互动式体验项目、培训教学项目等,不断创新服务模式,活化服务内容,增强群众体验。
综上展望,AI技术在文化馆领域尚在探索阶段,应用场景是广泛的,以上场景仅限于笔者经验,在具体的建设中,一定是以需求为导向,积极融合,在不断探索中发现新的应用场景。
4.文化馆行业垂直AI大模型建设探讨
通用大模型虽然具备广泛的应用能力,但在特定行业的复杂需求面前,往往难以达到精准适配的效果。行业垂直AI大模型通过对特定领域的深度数据训练,能够更好地理解行业特有的语言、逻辑和业务流程,从而提供更精准的服务解决方案。
目前,文化馆一部分业务可直接引用市面上的通用AI大模型来赋能,如在公文写作中,可以直接利用Kimi、通义千问等大模型工具来实现报告、论文、PPT、推文等题材的文档辅助编写;利用DeepSeek可以快速的完成业务报表分析、数据分析等,这些都有不错的表现。在另外的一些场景中,对于文化馆自身专业服务运营和特色资源推荐等方面,如大量的活动、场馆信息,文化专题信息,文化艺术知识、非遗知识等,还是需要通过行业垂直大模型来满足需求。这里就行业垂直大模型建设作一探讨。
4.1通识类、特色类行业垂直大模型
通识类行业垂直大模型建设:文化馆的主要职能是全民艺术普及和传统文化传承,全民艺术普及工作中涉及的如基础乐理、乐器演奏、基础舞蹈、基础声乐等通识类知识普及是重要的工作内容,作为通识类知识,往往是一些通用大模型初始训练在公开领域的语料素材,故此,文化馆开展基础业务服务时,可以直接利用、微调、蒸馏此类大模型来满足学习咨询、培训辅导等实际业务需求。
特色类行业垂直大模型建设:数据来源是行业内特色资源数据,其特征是行业特有,有版权边界,是行业内最有价值的数据,如群众文艺作品、非遗资料等,故此类大模型需要专门建设。
4.2行业数据特色
在行业垂直大模型建设中,我们往往会遇到选择什么类型的数据适合作行业特色大模型,此类模型的应用场景是什么的问题。在数字文化馆的建设中可以看到,文化馆的行业特色数据来源主要有:一是来自于数字文化馆面向用户服务过程中产生的服务类数据,如服务信息,培训、场馆、活动中产生的预订预约数据,各类活动的点击、分享、收藏、评价数据,用户数据等;二是各类文化活动产生的文化资源类数据,如演出、赛事活动中产生的音乐、舞蹈等各门类的音视频作品数据,美术、书法展览活动中产生的图片作品数据,培训活动中产生的各类慕课数据;三是大量的传统文化、非遗资源数据等。优质行业特色数据集是开展行业垂直大模型建设的基石。
4.3规范数据的建设
文化馆作为公益文化服务一类单位,在信息服务中,对于信息数据的准确性、权威性还是有一定的要求,不能张冠李戴,信口杜撰,误导群众,这就要求行业垂直大模型在内容输出的可靠性更加要慎重,建设优质的行业数据集就成为必然选择,数据集的规范性是必然的要求。十三五以来,国内文化馆在数字文化馆建设之初还是非常重视标准规范建设,起草立项了系列实用的数字化建设标准,如国家标准《数字文化馆资源和技术基本要求》、行业标准《文化馆服务数据采集要求》《公共文化云平台资源共享操作导则》《文化馆公共文化资源标签和用户标签通用要求》等,体现了文化馆行业对于数字化建设规范性的重视,通过多年建设,文化馆积累了数量可观的规范、优质数据集,这也为行业垂直大模型的开展训练微调、RAG知识库建设等提供了优质的语料基础。
4.4预训练基础模型的选择
当前,各厂商的AI大模型迭代的速度非常快,不同模型的能力、参数规模、适用环境在不同时期也在不断改变,如阿里的通义大模型自推出以来,从自然语言处理任务起步,逐步扩展至多模态任务,覆盖金融、医疗等垂直领域,并融入社交媒体、在线教育等日常应用。最新版本实现全尺寸、全模态、多场景升级,适应性和灵活性不断提升。模型在不断适应场景,不断进化,为各行业大模型训练应用开拓了广阔的前景。文化馆在行业大模型训练中选择预训练基础模型的时候,首先应在了解自身的应用场景,在语料特征、训练成本、训练时长、技术储备、资金支持等因素的基础上,选择适合的基础模型开展训练,据笔者了解,国家公共文化云以通义千问为基模开展训练为学才艺板块服务,一些为文化馆服务机构也根据产品情况选用不同的基模开展训练,如常规问答选用通义千问、联网问答选用文心一言、深度思考选用DeepSeek等,现实中的案例有很多,目前孰优孰劣,尚需要时间检验。作为文化馆智慧化建设的崭新领域,相信后期会涌现出大量鲜活的案例。
4.5一些训练策略与方法
不同的数据集,不同的应用场景,大模型的建设与训练方式也不同,这里就一些4.2中涉及的文化馆行业特色数据训练列举一二通用做法。一是基础大模型微调(SFT)。即在通用大模型的基础上,使用文化馆行业的数据进行指令微调,笔者认为,此类训练方式,更适合文化馆服务数据的应用领域,如FAQ、场馆服务、规章制度、年报揭示等,特点是数据规模不是很大,便于形成问答对数据集,训练时间短,可以快速适应文化领域的特定需求,适合资源有限的场景。二是通用大模型+向量知识库(RAG)。对于文化馆长期沉淀的文艺作品、慕课、各类活动的音视频资源,此类数据的特点是知识性强,对准确检索需求大,数据规模大(不便形成问答对),更新的频次高,更加适合通过RAG检索增强的方式,向量化数据,形成外挂知识库,再通过通用大模型+向量知识库+提示词的方式应用,将文化馆的特色资源与模型的生成能力结合,适合动态更新知识的场景。随着技术的成熟和基础软硬件的规模化市场化,训练行业大模型将会更加便利和快速。
4.6数据安全的一些考虑
普通人在使用AI大模型的时候,往往只关注其强大的功能和便利性,而忽视其间存在安全问题,这里就一些在行业大模型建设中的安全问题作一讨论。一是数据被恶意收割问题。在训练过程中数据被收割,一些厂商提供的大模型训练工具,在目前法律和监管缺乏的情况下,可能存在用户在公网或租用云资源中训练模型时导致数据被非法收割,解决方法有:选取业界公认的可靠的训练工具、在私有网络或加密环境中训练等;在对外服务中数据被收割问题,如知识蒸馏,目前是作为一种优化技术,广泛用于将大型复杂模型的知识迁移到小型高效模型中的方式,这就有可能出现模型未经授权而被恶意蒸馏的问题(模型被恶意复制或提取关键知识),可以通过数据加密或访问限制等方式解决。二是数据意识形态、伦理道德问题。当前的大模型内容参数越来越丰富,推理能力越来越强大,尤其生成式推理型AI的出现,让AI具备了相当的内容创造性,在实际使用中,可能无意或有意创造输出有违意识形态和伦理道德的内容,建议在实际应用中,加入内容前置审核机制,让内容输出的可靠、可用。在大模型建设还会遇到诸多安全问题,面对行业优质数据、专有数据,在建设中更要提升数据、服务安全意识,不断在实践中发现问题、解决问题。
综上,当前行业大模型建设各行业都在探索中,在技术迭代、参数训练、模型微调等方面都在快速发展,文化馆在这方面的认知和经验尚比较粗浅,应用案例相对比较少,以上论述仅供参考,作为新时代智慧化建设的核心工作,必将引领文化新业态发展。
5.结语
文化建设的高质量发展离不开前沿技术的赋能。AI大模型的应用为文化馆的智慧化建设带来了前所未有的机遇,各种创新应用模式成为可能。面对智慧化大发展趋势,文化馆应积极介入,以服务群众为核心,以需求为导向,结合自身职能,发挥资源特色,让AI大模型为公共文化建设注入新活力。在此过程中,还应充分考量技术的发展、行业领域特征和伦理规范,努力打造智慧、健康、可持续发展的行业新生态,推动文化馆事业迈向新的高度。
参考文献
[1] 罗云川,焦延杰,王雅松,马睿智,李隼.基于人工智能的文化馆数字化的探索与前瞻[J].中国文化馆,2024(11):91-99.
[2] 朱蓉婷.广东省非遗馆开启“创新年”持续扩大非遗“朋友圈”[EB/OL].腾讯网,(2025-02-01)
https://news.qq.com/rain/a/20250201A01QZJ00.
[3] 邓宁. 关于AI大模型在文旅领域应用的问题思考[EB/OL].北二外数字文旅研究中心微信公众号,(2024-10-06).
[4] 李翼. 与DeepSeek一起发布2025年文旅行业预测[EB/OL].文旅思维微信公众号,(2025-02-13).
[5] 深圳市龙岗区人民政府.DeepSeek赋能!龙岗开启智慧政务新篇章[EB/OL].深圳市龙岗区人民政府网,(2025-02-11)
https://zj.qq.com/a/20200730/008448.htm.
相关推荐
- 这个五月带你“潮玩艺夏”,2025年广东 “文化馆服务宣传月”系列活动 在省文化馆小剧场正式启动!
2025-04-29
- 【直播预告】倒计时1天!广东“文化馆服务宣传月”即将启幕,请你“云”享文化惠民大礼包!
2025-04-27
- 潮玩艺夏!广东文化馆邀你共享五月文艺盛宴!
2025-04-25
- 【线上展播】云岭山川鼓声起,舞动乡村新风尚广场舞《云岭踏鼓谣》
2025-04-23