探索生成式人工智能在开发语言教学视频中的应用

摘要

        教育领域对生成式人工智能(GenAI)的接受程度不断增加显示了它在教学和学习方面巨大的潜力。GenAI已经具有生成自然语言和逼真虚拟人物的高级能力。然而,GenAI在设计和制作教学视频的领域尚待更多的探索。本文主要探讨使用GenAI工具创建教学视频的可行性。作者分享了使用D_ID工具来创建虚拟人物和基于先进大语言模型建构的XIPU AI平台来协助开发学术英语(EAP)课程的教学视频。此尝试旨在增进我们对GenAI技术用于制作教育材料的潜力的理解。

 
关键词:虚拟人物,大语言模型,生成式人工智能,XIPU AI,教育视频,语言教学材料
 

介绍

       生成式人工智能(GenAI)是一种新型的人工智能,在语言学习领域受到越来越多的关注。然而,GenAI工具在开发教学材料方面的研究较少,将GenAI应用于语言教育还需要更多的探讨(Law,2024)。本文探索了D_ID和XIPU AI这两种GenAI工具在开发教学视频中的应用。文章首先回顾目前使用的大语言模型在教育领域的研究,例如ChatGPT和人工智能创建的虚拟人物。其次,文章分享了使用GenAI工具为学术英语课程(EAP)教学材料创建视频脚本和虚拟人物的经验。最后,文章总结并提出将人工智能工具融入制作教育视频的建议。
 

大语言模型(LLMs)

      GenAI被定义为一种新型的人工智能。它可以用来创建新的内容,如文字、图片、音乐、代码或视频(What Is Generative AI, no date)。与利用机器学习算法或利用之前数据进行分析预测的人工智能不同,GenAI利用大语言模型、大量的图像、艺术品和视频数据集来生成新的文字、内容、图片、音频或视频 (Law, 2024)。作为GenAI的一种形式,大语言模型的优势已经被研究证实。例如,ChatGPT可以处理和生成自然语言,从而自动运行各种任务并为其提供想法 (Cai et al., 2023)。对于语言教学和学习,大语言模型可制作文章摘要,创建教学材料,设计不同水平的评估,并为学生的写作任务提供反馈。这些大语言模型不仅拥有能够创建具有连贯性和语法正确的文本的能力;研究人员还进一步指出,大语言模型在当前的研究中表现出具有创造性的潜力 (Hubert, Awa, and Zabelina, 2024)。大语言模型在处理各种任务时表现出色,但也存在一些缺点。当应用大语言模型时,可能会产生一些偏见、虚假信息和明显的错误,它们也被称为幻觉 (Cai et al., 2023)。此外,与人类撰写的文章相比,人工智能生成的文章被发现存在准确性和质量问题 (Ariyaratne et al., 2023)。尽管教育者意识到了采用GenAI的风险和挑战,但他们仍在尝试如何有效地利用大语言模型协助学习和教学(Hinman, 2023; Law, 2024)。
 

人工智能创建逼真的虚拟人物

       逼真虚拟人物指的是能够模拟自然人类外观和面部表情的数字化人类(Seymour, Riemer and Kay, 2018)。AI生成的化身和虚拟媒体应用广泛地出现在商业视频内容中;然而,它们在以教学和学习目的上的应用并不常见,并且在教育研究方面仍然有限 (Leiker et al., 2023; Vallis et al., 2023) 。人们对于AI生成的虚拟人物有一个担忧,即所谓的“恐怖谷”理论,意思是观察者可能会对一个看起来几乎与人类相似的数字人类产生厌恶 (Seymour et al., 2021)。研究人员指出,人们对虚拟人物的反应各不相同,恐怖谷效应具有个体差异性 (Seymour et al., 2021)。研究人员认为,尽管逼真的数字人物可能看起来并非完美无缺,但有很高的可能性已成功帮助人们克服“恐怖谷”现象(Seymour et al., 2021, p.608)。
 
       虽然探讨人工智能生成的虚拟角色及使用合成媒体在教学和学习中的影响还是一个相对较新的领域,但是已有学者开始尝试并研究。一些研究人员调查了学生在一门商业道德课程中对人工智能虚拟角色讲师的学习体验。学生们对在课程中使用人工智能角色作为讲师的方式持有积极的看法,甚至有些学生偏好这种方式(Vallis et al.,2023)。另一项研究比较了人工智能生成的虚拟讲师的视频和传统的讲师制作的视频对学生在线学习环境中的学习成绩和学习体验的影响。结果显示,学生在这两种条件下都有显著的进步。然而,在学生习得和学习体验方面,两种方法并没有发现显著的差异。研究人员建议,人工智能生成的视频可作为除了讲师制作的传统视频的另一种可行方法(Leiker et al., 2023)。另一项研究,则对两种现实感——一个逼真的虚拟人物和一个卡通漫画人物,调查了参与者的偏好、自然喜爱和可信度。结果表明,在VR环境中那些与虚拟人物互动及讨论的参与者持有积极态度,而通过3D虚拟现实设备或2D屏幕观察的参与者尽管他们对两者都有偏好,但对人类虚拟人物的评价较高 (Seymour et al., 2021)。学者并总结逼真的虚拟角色已协助人们“跨越恐怖谷”(Seymour et al., 2021, p.608)。目前的一些研究显示使用虚拟人物具有积极结果;然而,我们仍需要更多的研究来评估数字人类在教学和学习中的应用效果和影响。
 

教育视频

      教育视频是指为教学和学习而设计的视觉内容,并在高等教育中已被广泛用于各种学习目的的可视化内容(McNulty和Lazarevic,2017)。视频的教学和学习可以增加学习者的参与度和学习动机,并适应学生多样化学习的偏好。制作教育视频的方法有多种,例如使用现有的视频剪辑或媒体资源。一个常见的方法是,教师先编写一个脚本,然后通过软件或其他设备录制内容。这个过程可能会耗费大量时间。此外,学习不同的录制和编辑软件可能会给老师们带来压力。而合成媒体等人工智能技术可以简化视频制作的过程,使教育从业者更容易创建视频。
 

范例分享:视频在D-ID和XIPU AI的帮助下创建。

       D-ID (https://www.d-id.com/) 是一个可以生成视频和语音的平台。用户可以创建由AI生成的合成视频,将数字人物转换为AI讲述者,并将文本转换为自然的口语音频。AI生成的虚拟人物具有细微的面部表情、头部运动、手势和与音频相匹配的嘴唇同步。另一方面,基于先进的大型语言模型,GPT-4 Turbo,XIPU AI被用来支持视频剧本的创建和学习活动的设计。下面的三个范例是为一门EAP商业语言课程开发的课堂教材,课程主题是“数字化转型和网络安全”。
 

范例一

       教师们经常在他们的课堂上使用网上的视频,比如YouTube,来帮助学生理解新的概念、想法和介绍背景。然而,选择的视频有时可能不完全符合课堂学习目标。合成媒体提供了一种解决方案,它让教育工作者通过利用人工智能技术将现有视频得以重新设计、制作。第一个范例展示了如何利用人工智能技术从现有的视频中创建练习听力技能的课堂材料。
 

活动设计:听力技能练习

• 提供学生的指示如下: 
       场景:想象你是一家本地公司的CEO,意识到为企业进行数字转型可能会在市场上获得持久的竞争优势。你将观看一个视频介绍数字转型,共包括两部分,请收集信息并完成两项后续活动。(请注意:这些视频是由AI辅助创建的。主讲人是一个由AI生成的说话者。)
 
• 创建听力活动视频的步骤如下所述: 
步骤一:准备视频脚本 
       脚本改编自Simplilearn的YouTube视频“What is Digital Transformation”(2021)。作者将原始文字稿缩编并分成两部分,用于两个后续的听力活动:第1部分填空题和第2部分是非题。
 
步骤二:使用D_ID平台生成视频 
       使用D_ID,将剧本的两部分生成为两个视频,并由AI生成的虚拟人物来呈现。该平台提供多种选项,包括现有虚拟人物、各式语音类型(如贬低的或平静的)、语言类型、口音、性别、背景及标题。
 
 
 
步骤三:使用XIPU AI GPT 4 Turbo设计后续活动
       第一部分是填空题,着重听力细节的练习;因此,原始的文本被直接使用,题目设计针对学生对具体细节的理解。第二部分“是非题”,着重内容大意,作者让XIPU AI根据提示“总结这段文章:(演讲文本)……”来总结每一段的主要观点,然后再用这些总结来设计问题。如果直接让XIPU AI根据提示“根据这段文章设计一个是非题:(演讲文本)……”,有些生成的回答由于过于简单或存在逻辑问题而不适用,例如:“数字化转型的加速主要是由于技术进化缓慢。”
 

范例二

        EAP教师经常利用角色扮演活动,设计模拟现实中的各种场景,让学生练习口语技能。然而,对于一些学生来说角色扮演可能令人生畏或尴尬。本例是用两个由人工智能生成的虚拟人物作为学生示范者,以支持和激励学生参与这项活动。生动的视觉内容可增加学生的参与度,并扩展他们在课堂上的学习体验。
 

活动:口头报告_角色扮演 

• 提供学生的指示如下: 
        情景:作为CEO,在听完演讲后,向公司董事会成员分享你的想法。准备并发表一分钟的演讲(分组活动)。
 
• 以下是创建示范视频的步骤: 
步骤一: 使用XIPU AI GPT 4 Turbo准备视频脚本
       作者首先在XIPU AI上创建一个提示,内容为:“写一份大约一分钟的短剧本:你是一家本地公司的CEO,认为公司应该进行数字化转型。你与董事会成员分享你的想法。”然而,XIPU AI没有生成回复。作者在XIPU AI上创建另一个提示:“公司进行数字化转型的原因。”XIPU AI列出六个原因。然后,作者创建另一个提示:“将以上内容重写为一个剧本。”XIPU AI生成一个剧本。基于XIPU AI的剧本,作者进行编辑和重新设计,制作两个简短视频的剧本。
 
步骤二:使用D_ID平台生成视频 
       两个脚本分别使用D_ID生成两个视频;每个示例都有一个使用人工智能生成的虚拟人物作为示范者。下面展示两个角色:一个男学生和一个女学生。背景选择的是教室,简要大纲也显示在背景中。
 
 
范例三
       场景式学习是指在课堂之外创造一个真实的或仿真的情境。它采用主动的学习策略,让学生通过运用他们的背景知识或新学习的知识来练习解决问题和练习批判性思维的能力(Morgan, 2024)。本例展示了一个由人工智能D_ID生成的虚拟人物作为网络攻击的故事的叙述者。学生需要分析所呈现的情况,并在小组合作中提供解决问题的方案。
 

活动:小组讨论 

• 提供学生的指示如下: 
       首先,听Ann的故事并做笔记。然后,小组讨论以下问题:
 
1.你认为这是怎么发生的? 2. Ann能够阻止吗?3. 类似情况也可能会发生在公司吗?(请注意:故事和讨论问题改编自What is Cyber Security(2022)。视频是由人工智能辅助创建的,主讲人是一个由人工智能生成的演讲者。)
 
• 创建视频的步骤如下: 
步骤一:使用D_ID平台生成视频 
       脚本改编自Simplilearn的YouTube视频《What Is Cyber Security》(2022)。经过编辑的脚本使用D_ID生成了一个视频,根据故事内容使用一个女性虚拟人物略贬义的声音。
 
 

步骤二:使用XIPU AI GPT 4 Turbo生成话题讨论的答案

        作者依次在XIPU AI上创建了三个提示:“阅读这个故事,并分析为什么会发生这种情况(脚本粘贴在此处)”,“阅读这个故事,并提出如何防止这种情况(脚本粘贴在此处)”,然后“阅读这个故事。公司会发生这种情况吗?(脚本粘贴在此处)”。作者编辑了XIPU AI生成的每个问题的回答,并将它们用作讨论问题的补充建议答案。

 

讨论和结论

        本文分享了使用两种GenAI工具,D_ID和XIPU AI平台,制作教育视频。它们所展示的强大功能包括创建虚拟人物合成视频,以及为各种任务生成文字和信息并提供想法。教师仅需使用准备好的脚本文本,使用人工智能的合成媒体,在数分钟内即可完成制作,极大地提高了视频制作效率。各类型的AI虚拟人物也可以应用于多种场景设计,并为学生创造更具吸引力和活跃的学习环境。此外,借助基于大语言模型的XIPU AI的帮助,生成的内容有助于提升教师开发教材和活动的效率。虽然GenAI工具增强了自动化效率和生产力,但教育工作者在将GenAI工具纳入教学实践和教材开发时仍应谨慎(Law,2014)。教师可以尝试使用不同的提示与XIPU AI交流,以获得满足期望和要求的回应或结果。此外,鉴于可能存在的不准确性,建议教师对AI生成的内容进行检查确认(Cai等,2023)。采用Gen AI工具为语言学习提供动态环境意味着开启开发教学视频新的范式。

 

 
 
 
 

参考文献

Ariyaratne, P. et al. (2023) 'A comparison of ChatGPT-generated articles with human-written articles,' Skeletal Radiology 52, pp.1755-1758. doi: 10.1007/s00256-023-04340-5
Cai, Z.G. et al. (2023) 'Do large language models resemble humans in language use?' Available at: http://arxiv.org/abs/2303.08014 (Accessed: 7 April 2024).
Caltech (No date) What Is Generative AI? Available at: https://scienceexchange.caltech.edu/topics/artificial-intelligence-research/generative-ai (Accessed: 31 July 2024)
Hinman, S. (2023) 'ChatGPT in the classroom: enhancing teaching strategies with artificial intelligence assistance', Delta Kappa Gamma Bulletin, 90(1), pp. 42–44.
Hubert, K.F., Awa, K.N. and Zabelina, D.L. (2024) 'The current state of artificial intelligence generative language models is more creative than humans on divergent thinking tasks,' Scientific Reports 14, 3440. doi: 10.1038/s41598-024-53303-w
Law, L. (2024). 'Application of generative artificial intelligence (GenAI) in language teaching and learning: A scoping literature review,' Computers and Education Open, 6, 100174. doi: 10.1016/j.caeo.2024.100174 
Leiker, D. et al. (2023) 'Generative AI for learning: Investigating the potential of synthetic learning videos' Available at: https://arxiv.org/pdf/2304.03784 (Accessed: 7 April 2024). 
McNulty, A., and Lazarevic, B. (2017). 'Best practices in using video technology to promote second language acquisition,' Teaching English with Technology, 12(3), pp.49-61. Available at: https://files.eric.ed.gov/fulltext/EJ1144964.pdf (Accessed: 4 April 2024).
Morgan, A. (2024) 'Enhancing access in an online course using Universal Design for Learning (UDL) and Scenario-Based Learning (SBL)', TechTrends. doi:10.1007/s11528-024-00981-y 
Seymour, M., Riemer, K., and Kay, J. (2018). 'Actors, avatars and agents: potentials and implications of natural face technology for the creation of realistic visual presence,' Journal of the Association for Information Systems, 19(10), pp.953–981. doi:10.17705/1jais.00515 
Seymour, M. et al. (2021) 'Have we crossed the uncanny valley? understanding affinity, trustworthiness, and preference for realistic digital humans in immersive environments', Journal of the Association for Information Systems, 22(3), pp. 591–617. doi:10.17705/1jais.00674
Vallis, C. et al. (2023) 'Student perceptions of AI-generated avatars in teaching business ethics: we might not be Impressed', Postdigital Science and Education, pp. 1–19. doi:10.1007/s42438-023-00407-7
What Is Cyber Security (2022) YouTube video, added by Simplilearn [Online]. Available at https://www.youtube.com/watch?v=inWWhr5tnEA (Assessed: 6 July 2024).
What is Digital Transformation (2021) added by Simplilearn [Online]. Available at https://www.youtube.com/watch?v=508CR1fd8ws&t=81s (Assessed: 6 July 2024).

作者
Ashlee Tai
英语语言中心,语言学院,西交利物浦大学

日期
2024年10月12日

相关文章