人大交叉评论
“人工智能技术与中国古代旋律生成——以敦煌乐舞传承为例”的文化计算研究
发布日期: 2025-11-27

周天歌,系北京师范大学未来设计学院艺术与科技实验室负责人

  一、引言

  (一)为什么需要“文化计算”

  数字人文的纵深发展正推动人文研究从传统的个案解读与定性分析,向规模化、精准化的跨学科探索转型。但长期以来,文化数字化实践仍然多停留在“保存”层面,无论是古籍的扫描归档、乐舞影像的录制,还是文物的三维建模,本质上都是将文化载体转化为数字形式留存,未能触及文化遗产的核心,即那些蕴含在形式之下的生成规律、风格特质与精神内涵。这种“存而不识”“存而不用”的状态,使得大量珍贵文化遗产陷入传承断层的风险。在这一背景下,文化计算应运而生,它将传统数字化的研究问题从“保存”推进为“认知”,在方法论层面上取得重要突破,推动人工智能技术与人文遗产的深层链接。

  文化计算的价值在于突破文化传承中“意会知识”不可传递这一困境。波兰尼提出的“我们所能知道的多于我们能说出的”这一洞见,恰如其分地概括了文化遗产中最珍贵也最脆弱的隐性知识的特征。传统艺术形式中存在着大量难以用语言精确描述的隐性知识(如舞者的身法韵律、乐师的演奏触感、诗歌的意象表达等),其往往通过师徒传承、身体实践等方式传递,具有高度的语境依赖性和个体差异性。当传统传承人逐渐老去,这些“只可意会”的文化精髓便面临断代危机。文化计算的核心目标,就是要将这些在实践中高度嵌入的意会知识转译为中层特征与高维向量表征,从而在可计算、可操作与可检验的框架内推进跨媒介、跨时段的人文研究与创作。

  (二)控制论视角下的文化传承系统

  控制论创始人维纳曾提出“复杂系统之调节”命题,其核心在于通过反馈机制和信息传递实现动态平衡,强调系统在变化环境中维持稳定状态的规律,在人机协作和文化传承中体现为将“调节”作为持续优化的过程。从控制论的视角来看,文化传承可以被理解为一个需要持续调节的“人-机-环境”复杂系统。在这个系统中,人工智能技术负责开拓超越人类直觉的大规模可能性空间,而人类专家则负责提供文化语境、价值判断和艺术裁决。需要强调的是,这种人机协作的模式不仅没有削弱人的作用,反而对研究者提出了更高要求:在文化计算的框架下,研究者必须更加精确地定义“让系统学什么、守什么、变什么”,需要深入把握文化传统的核心要素与可变边界,从而在技术创新与文化传承之间建立良性互动关系。

  二、共同方法论:把“意会知识”转化为“高维可言传”

  (一)材料结构化

  材料结构化是文化计算的基础环节,其目标是将非结构化的文化艺术内容转化为机器可读的结构化数据。文化遗产的原始形态多为非结构化或半结构化,既包括肢体动作、口头传唱、文本意象等无形内容,也涵盖乐谱手稿、绘画作品、器物纹样等有形载体,其核心特征是缺乏统一的解析标准与量化维度。材料结构化的核心任务并非单纯的数据格式化,而是基于人文社科的专业研究成果,对文化内容进行分层拆解与特征提取,将抽象的文化内涵转化为“可量化、有意义”的中层特征与结构化数据。通过结构化转化,原本依赖个体经验解读的文化素材,被赋予明确的逻辑结构与数据形态,为后续的计算分析奠定基础。

  (二)表征学习

  表征学习是文化计算的重要环节,承担着“解读文化密码”的关键作用。其核心目标是通过统计模型或深度学习模型,从已结构化的基础数据中提取具有文化语义的高维向量,将文化内容的“风貌”(即蕴含其中的风格特质、情感倾向、时代印记、审美范式等深层属性)转化为可计算、可比对的数学对象。与表层数据记录不同,高维向量表征能够捕捉文化内容的隐性关联与整体特征,实现对“意会知识”的精准建模,将抽象的文化“风貌”固化为可运算的数字形态,既保留文化的核心特质,又具备规模化处理与生成的可能性。

  (三)中层约束

  中层约束是保障文化计算结果“不失真”的核心“护栏”,也是避免技术主导下风格漂移的关键设计。表征学习依赖模型对数据规律的自主挖掘,但纯数据驱动的学习可能忽略文化内容背后的历史逻辑、艺术规范与语境约束,导致生成结果仅在表面形式上符合数据规律,却违背文化遗产的本质属性与传承脉络。中层约束的核心作用,是将人文社科研究确立的历史规则、艺术范式、文化语境等“隐性知识”转化为模型可遵循的显性约束条件,为计算过程划定明确的边界。这些约束条件并非静态的规则罗列,而是动态适配的弹性框架,既为模型提供明确的学习方向,又为文化创新预留合理空间,确保计算结果既符合传统本质,又具备时代适应性。

  (四)人机协作闭环

  人机协作闭环是实现文化计算“落地应用”的关键环节,也是连接技术输出与人文实践的重要桥梁。文化计算的最终目标并非生成抽象的数据结果,而是服务于文化遗产的传承、解读与创新,这就要求算法输出必须具备可解释性、可执行性与可复演性。人机协作闭环打破了“技术生成—人工使用”的单向模式,构建起“算法生成—人工校准与排练/近读”的闭环,使模型输出在“可解释—可演/可证”之间往复修正,构成可复演管线,实现技术理性与人文智慧的深度融合。在此框架下,谱面或者记号从“判读规则”转为“组织与沟通”;谱面不再是“只有唯一正确阅读版本”的法律文书,而是引导耳朵、指挥协作的导航界面。

  三、案例研究

  (一)敦煌乐舞的跨媒介共创

  敦煌乐舞的传承难题在于“身法与乐句的协同意会”。传统传承方式下,舞者与乐师需通过长期磨合形成默契,舞者的动作节奏跟随音乐变化,乐师的演奏又呼应舞者的身法姿态,这种协同关系难以通过文字或乐谱固定下来,需要构建一套可复演的跨媒介共创系统,将这种“协同意会”转化为可传递的标准化方案。

  本研究通过运动捕捉技术采集专业舞者的核心动作数据,基于DAMUS原型思想,将舞蹈动作与音乐材料建立可计算的映射:舞段以骨架关键点、节奏密度、能量包络等作为观测序列,采用隐马尔可夫模型(HMM)进行“身法-乐句”的序列对齐与段落切分,再由编舞、作曲等专家在排练中执行人工校准(含“呼吸点-收势”“错峰对齐”与空间化声像的舞台验证)。DAMUS将舞蹈模块(MoCap/Labanotation数字化)与音乐模块(节拍/速度/风格约束的素材生成)以可交互方式耦合,强调“创意碎片—快速变奏—再选择”的循环,以减少跨工种语言壁垒与时间消耗,形成可追溯的版本树与证据链。HMM的可解释状态空间使“近读的专业经验”可嵌入“远读的统计表征”,人工校准则将模型输出拉回“可演与可达”的区间;二者共同确保“可言传”不失“可舞台执行”。最终形成的系统可实现“舞-乐”双向生成与协作界面设计,以缩短沟通成本并提升迭代效率。在实际创作过程中,编舞家和作曲家通过可视化的交互界面实时调整算法参数,观察“舞-乐”对应的变化效果。这种即时反馈机制显著提高了创作效率,同时,交互系统记录了所有的创作决策和修改轨迹,形成了完整的创作证据链,为后续研究和教学提供了宝贵资料。

 

1 DAMUS工程结构设计(周天歌、于博柔、闵嘉剑、王泽宇团队)

 

2 敦煌舞动态捕捉(舞蹈演员来自北京舞蹈学院史敏教授敦煌舞团队)

 

(二)潮汕“八板”的旋律延续

本研究旨在以潮汕“八板”为例,探究“非欧陆中心”的传统格律中像本体又能展开的生成。潮汕“八板”是流传于潮汕地区的传统民间乐种,以“八板为体、灵活变奏”为特征,其核心传承价值在于“在固定格律下的即兴延续能力”,乐师掌握“八板”的基本框架,根据演奏场景即兴发挥,但始终不离“八板”的风格精髓。然而,这种即兴能力依赖乐师的“意会”经验,年轻传承人难以快速掌握,导致“八板”旋律的延续面临断代风险。

研究首先对现存的八板音乐进行全面的音乐学分析,归纳出其音高行进、节拍落点、句法边界与句末归属等风格要素。这些分析结果既作为训练标签,也作为解码护栏,嵌入到LSTM旋律生成模型中。在模型训练阶段,采用RNN/LSTM对音高-时值序列进行建模(教师强制训练),并在解码阶段引入板腔与句末归属约束,抑制“越界”与“违式”片段;同时以滑窗在“气口—身法节拍—落点”之间二次筛选,保障乐句的呼吸与张力。

这种方法的优势在于既尊重传统又鼓励创新,RNN/LSTM的长程依赖与连贯优势,在“板腔语法—历史音域—落点归属”等护栏内得到风貌稳定性;而“人-机-排练”的闭环把生成空间收敛为可演版本,构成制度化的制作管线,从而实现在传统格律的框架内探索新的音乐可能性,生成既熟悉又新颖的旋律变体。

 

3 潮汕音乐八板旋律的频谱分析

 

4 潮汕音乐八板旋律生成算法的计算机全流程拆解

  (三)唐宋“花在时与媒”的情感轨迹

  花卉意象是唐宋诗词中承载情感与时代精神的重要文化符号,“牡丹”与“梅花”尤为典型,唐代牡丹象征盛世繁华,宋代梅花则寄托清寒坚贞的品格,这种情感内涵的差异与唐宋的时代背景、艺术风格紧密相关。传统研究多采用个案分析或定性描述的方式,难以全面呈现花卉意象情感轨迹的整体特征。本研究利用文化计算方法,对唐宋诗词中花卉意象的情感轨迹进行规模化分析,并将其与同时期绘画/器物的风格进行比对,揭示其在时代与媒介中的情感语义变化规律。

  研究对《全唐诗》和《全宋词》进行了系统的文本清理和标注,建立意象词表与修辞标签:利用经结构化诗词文本训练后的中文BERT模型进行七类情绪(怒、厌、惧、乐、中性、哀、惊)分布估计;同时建立“时代语境约束”与“意象关联约束”规则,标注诗词的创作时代与关联艺术形式,进行风格分期的跨媒介互证。

分析结果呈现出清晰的情感轨迹:唐代牡丹意象以“欢宴/喧腾”为主,并随中晚唐政局转折出现“愤怒”的增长,其中也伴有唐宪宗元和中兴时期短暂的欢愉气氛;宋代梅意象强化“清寒/坚贞/自守”,在两宋之际与家国叙事、亡国之痛密切勾连。文本端的情绪强度变化,与绘画之构图/色相与留白美学演进呈现可辨的同频,个体诗家(如李清照、王安石、陆游等)亦见差异化的政治与性别维度。这种规模化、量化的分析模式,以BERT的上下文敏感向量承接“意象—修辞—情绪”之间的模糊边界,以“跨媒介互证”把远读统计与近读风格学闭合为可证链条,回应了数个既有研究脉络(如面向古典语料的领域化BERT与艺术史风格分期的量化尝试),使人文研究增添了传统研究视角下未见的温度。

 

5 唐朝牡丹诗词的时序情感分布

 

6 宋代梅花诗词的时序情感分布

 

  四、结语:面向中文人文社科的方法学意义

文化计算的实践表明,这一方法论为中文人文社科研究带来了深刻的变革。它并非技术在人文领域的简单应用,而是构建了“技术—人文”协同的研究生态,推动技术与人文的深度协作,技术人员需要理解人文研究的核心诉求,人文研究者也需要了解技术的可能性与局限性。文化计算不是把人文学科“外包”给算法,而是在可解释的中层与可学习的高维之间开辟一条双向通道:一方面,它建立了一套将隐性知识显性化的技术路径,使那些依赖于个人经验和直觉的传统技艺得以系统化传承,让海量材料的模式化洞见成为可能;另一方面,它要求研究者以更高的自觉来制定边界与价值。技术不是要取代人的创造力和判断力,而是要增强人类的文化理解力和创造力。这是需要强调的重点,文化计算让意会知识变得可言传,不是为了代替人的判断,而是为了让判断在人机对话的语境中可沟通、可复用、可检验,由此形成“保存—认知—再创作”的循环,并得以在学术舞台与各类跨媒介载体之间自由流通,动态前行。

“人工智能技术与中国古代旋律生成——以敦煌乐舞传承为例”的文化计算研究.pdf