国外人工智能教育应用最新热点问题探讨

更新时间:2019-06-14 来源:人工智能论文 点击:

【www.rjdtv.com--人工智能论文】

   【摘要】 本文通过典型案例法和文献计量法,分析近三年来(即从2007年初到2009年底),国外人工智能教育应用研究的最新进展。典型案例法表明,一个成效显著的语言和文化智能教学系统综合运用了自然语言处理、智能代理等人工智能技术。文献计量法结果则显示,智能代理和自然语言处理是人工智能教育应用中出现频次最多的两个关键词。殊途同归,特殊案例和普遍性的文本分析结合起来,可以发现,自然语言处理、智能代理等是近三年来人工智能教育应用国际研究中应用最多的技术,也是最为关注的问题。

    【关键词】 人工智能; 教育应用; 个案分析; 文本统计;

        一、个案分析从历史渊源上看,人工智能研究的一个重要试验田和应用领域就是教育。 所以在人工智能领域的学术会议和期刊上,也有不少智能教学系统的论文。 比如,美国人工智能促进学会(AAAI,前身为美国人工智能学会) 会刊 《人工智能杂志》(SCI 期刊)发表的七篇论文(Article),是从 2008 年在芝加哥举行的第 20 届 AAAI/IAAI(Innovative Applica-tion of Artificial Intelligence,人工智能创新应用)年会上发表的 4 篇部署应用论文(Deployed Papers,即获得了创新性的部署应用奖的论文) 和 18 篇新技术论文(Emerging Papers)中选择后,请作者进一步扩充、三位同行专家盲审修订而成。 而 AAAI/IAAI 年会是国际上人工智能界最为权威的学术会议之一,论文录取率一般低于 20%。 七篇论文中的两篇是关于语言和文化学习的智能系统的,其中的文献为 30 年来该权威性人工智能期刊上发自中国大陆的第一篇论文。 上个世纪 80 年代我国着名人工智能专家蒋新松院士与其他学者一道,在该期刊发表了一篇报道(Report),介绍当时中国的人工智能研究进展,主要包括五个方面, 其中的第四个方面就是计算机辅助教学的工作,即计算机辅助的数学问题解决。 关于文献,在文献中有详细介绍 ,不再赘述 ,所以本文主要介绍 30卷第 2 期中的一篇计算机辅助语言文化教学方面的文章,即文献。 该文对计算机辅助语言文化学习、学习型游戏开发等都具有很大的参考价值。
  战术语言和文化训练系统 (The Tactical Lan-guage and Culture Training System ,简称 TLCTS)可帮助人们快速获取外国语言和文化中的交流技能,语言种类包括伊拉克语、法语和普什图语(阿富汗之主要语言)。 从 2003 年以来,该系统获得了美国军方的多项重大资助,总额高于一千万美元。 从系统的用户分布上看,首先是世界各地的美国军人(海军、陆军、空军等),他们都可以通过作为身份特征的军方电子邮件地址,自由下载这个系统,各取所需地使用和学习;美国、加拿大和澳大利亚等国军方也多次将该系统与面授进行的语言文化学习课程结合起来,进行混合式学习。 其次,军事服务人员、无军职人员和高校学生等也在使用这个系统。 全世界已经有超过 20000 名学习者使用过 TLCTS 课程。 独立进行的伊拉克语和普什图语版本的系统评估表明, 使用该系统的用户在目标语言及其文化知识方面获益颇丰, 增强了实际交流的自信心。 对军官的访谈还表明, 这个系统的使用有助于他们独立地和当地人交流,而不必借助于翻译,从而改进了与当地居民的关系,提高了作战能力,甚至减少了战地伤亡。
  TLCTS 的使用方法包括三种:装备了头戴麦克风设备的可以进行三维视频游戏的微机上的客户端国外人工智能教育应用最新热点问题探讨软件,手持设备上的客户端软件,和微机上的网页。每门课程包含了一套交互式的技能训练课程, 强调培训特殊的交流技能。 课程内容采用 XML 格式来定义,保存在一个 Web 兼容的内容数据库中。 一个被称作 Kona 的门户网站可以管理这个内容库,并支持合作性的编辑工作。 其中的每个项目都被看作一本书,包括了一系列的章节,每个章节定义了一节课程或者一个游戏场景。项目成员可以检查每个章节,使用基于 Web 的编着工具来更新内容。 一个底层的版本控制框架可以组织同步进行的编辑, 允许返回到早前的版本, 这种办法使得编着工作更加快捷和简易。
  微机版本的 TLCTS 被称作 Lapu, 它使用着名游 戏 引 擎 公 司 Epic Game (的 Unreal 游戏引擎 2.5 版本,该版本可以处理场景渲染,提供了一套用户界面类库。 Lapu 的主要功能体现在对虚拟人物的社会性模拟上。 学习者使用语音和菜单中可选的形体语言(如身体姿势、手势等),与游戏中的人物交流。 输入管理器将语音和形体语言解释为一种交流性行为 (例如形体语言增强的言语行为)。社会性模拟引擎决定虚拟环境和其中的虚拟人物如何对学习者行为做出反应。 虚拟人物行为由行为计划表实现,它对 Unreal 引擎发出行为动作指令。随着学习者与系统的交互,学习者模型不断更新,来反映学习者当前的技能掌握程度。交互记录和学习者对话录音都被保存下来, 用于以后的分析。这些系统成分基本都使用编程语言 Python,一些支持性的例行程序由 C++和 Unreal 引擎的 Unre-alScript 编写。
  手持设备上的 TLCTS 版本被称作 Uko。 比如IPod 上的版本,包括了文字、图片、音频和视频等静态教学内容,以及交互式练习。一个新的基于 Web 的客户端叫做 Wele, 用户也越来越多。 Wele 目前仅支持技能训练功能。 通过Web 浏览器 , 特别是 Internet Explorer, 可以访问Wele。 它是由 Adobe Flex3 Internet 应用框架构建的。 Wele 运行客户端计算机上的作为插件的语音识别软件,交互式的对话和动画是通过网页上的 Flash文件实现的。
  一个叫做 Kahu 的轻型学习管理系统通过一个局域网和客户端计算机通讯。 TLCTS 用户经常在学习实验室中组织其训练计算机, 使用特殊的局域网络,比如微软的 Windows 共享,然后移动计算机,将它们组织成不同的形状。 Kahu 为学习者特征提供数据库并进行管理, 支持这些实验室的简易重构和断开操作。 这个系统为培训管理者提供一种机制来建立和调整用户以及用户组,并产生培训报告。管理者也使用它来获取学习者档案、系统日志、训练场所的录音,并将它们保存到一个数据仓库中,用于将来的分析。这些记录可以重新训练并改进语音识别器,而日志和学习者档案可以用来分析用户如何应用这个训练系统,并指出将来需要进一步改进之处。TLCTS 在多方面使用了人工智能技术, 包括:
  编着过程和处理学习者语音的程序, 解释学习者行动,控制虚拟人物角色的反应,评估和测量学习者表现和成熟度。主要的技术包括:语音识别、对话模型、可信的虚拟人物、编着、学习者模型。 语音输入是该系统最基本的输入模式, 所以与外语学习者相适应的自动语音识别至关重要。 TLCTS 课程中驻扎的虚拟人物可以和学习者对话, 人工智能技术用来给虚拟人物的决策过程建模,并支持产生它们的行动。这就为用户提供了充分的对话练习机会。 学习者建模软件持续监控每个学习者应用交流技能的情况,以估算他们对这些技能的掌握情况, 并引导他们到需要特别训练的地方。 教师和培训管理人员也能获取这些学习者情况, 这就在一定程度上实现了个性化教学。 人工智能技术还被整合到系统的内容编着工具里,协助创建和验证教学内容。
  1.语音识别这是 TLCTS 最值得称道的一个功能。识别学习者的语音非常必要,又极富挑战性。对于外语学习者而言,语音识别器要能指出用户发音的错误。而一般的典型的语音识别器则会忽略用户的语音错误,而尽量将语音转换为文字。所以 TLCTS 没有采用一般的打了包的语音识别软件, 而是开发了自己独特的语音识别模型。 它基于隐含马尔科夫声音模型,应用 Julius 开源语音识别工具包来开发。
  2.对话模型该模型在语音层次将对话限制到一定范围,而不是无边界的聊天; 在行动层次管理用户可以进行的行为,并将语音映射到行动上。
  3.可信的虚拟人物用户的一次输入会被看作一次用 PsychSim 系统实现的人物代理的抽象的行动,该代理然后选择一种行为让虚拟人物来执行。
  4.编着编着功能支持语音和自然语言处理, 提供编写功能和分析工具来定义交互式对话。 对话内容可以是顺序的脚本,也可以是有分支的故事,乃至以代理为中心的模型。
  5.学习者模型中国电化教育 总第282期 技 术 与 应 用学习者的学习进程可以通过多种渠道体现出来, 比如在游戏和测验中的表现, 和在对话中的表现。 TLCTS 记录了这些表现,并使用模型跟踪技术来测量学习者的技能熟练程度。 技能包含三个方面:
  语言、文化和工作。 某种给定技能的每次正确或者错误的使用都会为这种技能的熟练程度提供一种概率性的佐证。 这种证明可能是不确定的,因为学习者会猜测一个答案,由于疏忽或者无意识而出错,或者语音识别器可能错误解释学习者的反应。 不过通常来说,经过较短的一段训练时间后,学习者模型就可以正确地测定被训练者所掌握技能的程度了。
  从以上介绍可以看出, 战术语言和文化训练系统 TLCTS 系统地将自然语言处理(语音识别和对话模型)、智能代理和学习者模型等成熟的人工智能技术应用到语言和文化学习中, 取得了很好的教学效果。 可以说这是一个成功的智能教学系统的案例。那么从普遍应用上讲, 最近三年的智能教学系统研究中,大家都使用和关注哪些技术呢? 下面笔者通过定量分析关于智能教学系统研究的大量期刊文献,来尝试回答这一问题。
  二、文献统计分析文献计量方法中的词频分析法,是指参照关键词在某个领域一段时期内出现的频次高低以及频次的变化,来确定该领域研究重点和发展方向。 “关键词是文献研究内容的高度概括和体现,关键词在文献中的出现频次在一定程度上反映出该研究内容在相应领域受关注的程度,因而统计关键词出现频次的高低有助于掌握领域研究的重点, 统计关键词的频次在一定时间范围内的变化则有助于探寻领域研究热点的变迁。 ”
  基于关键词的词频统计,文献[10]分析了 2002-2008 年我国教育技术研究的重点及其演进。
  1.文献选取国际上关于人工智能教育应用的论文主要发表于三个期刊:《英国教育技术期刊》(British Journal of Ed-ucational Technology, 以下简称 BJET),《人工智能教育应用国际期刊》(International Journal of Artificial In-telligence in Education, 以下简称 IJAIE),《教育技术与社会期刊》(Journal of Educational Technology and So-ciety,以下简称 JETS)。 所以我们的研究就集中于对这三个期刊 2007、2008、2009 三个年度发表的原创论文(Article)的统计,共收集论文 603 篇,其中的 IJAIE 只编辑到 2009 年第二期,所以也仅仅收集到该期内容。尽管这些期刊文献中, 某些论文的核心不是人工智能教育应用, 但是其内容也会涉及到人工智能的一些概念, 所以本文将统计所有论文中与人工智能有关的词汇的出现频率。
  2. 所有单词的平均词频笔者使用自己开发的国外教育技术全文检索和数据挖掘系统(ETLIDM),对这三年的期刊进行了单个单词的词频统计。 排除常见的冠词、连词、介词等虚词,每年度所有单词的数量、出现总次数和每个单词的平均出现次数(即词频)如表 1 所示。
  3.绝对词频和相对词频为了比较人工智能领域关键词在每个年度和期刊所出现的频率多少, 我们将以上的平均词频作为基准,考察各个关键词与该平均词频的比率,称之为相对词频。 如果用 RF 表示相对词频,AF 表示绝对词频,MF 表示平均词频,则 RF=AF/MF。 一个关键词的相对词频越大, 说明该词在该年度该期刊中被提及的次数越多, 即越受重视。 如果相对词频小于1,说明该关键词在该年度该期刊出现的次数低于平均词频,被提及和讨论的机会较少。
  有关人工智能(AI,Artificial Intelligence)本身的关键词词频分布如表 2 所示。 除了 2009 年的 BJET外, 其它年度各个期刊中人工智能关键词的相对词频都大于 1,不过没有什么变化规律。 绝对词频和相对词频最高的都为 2007 年的 IJAIE。 作为研究人工智能教育应用的专业期刊,IJAIE 理应更多地提到人工智能的概念,相对词频分布也大体如此。
  一般而言,人工智能(Artificial Intelligence, 简称期刊 年度 单词数量 总词频平均词频(总词频/单词数量)“人工智能”词频统计115总第282期 中国电化教育技 术 与 应 用2010.7AI) 的研究领域包括 : 知识表示方法 (KnowledgeRepresentation)、 知识推理 (Reasoning 或者 Infer-ence)、智能代理(Agent)、自然语言处理(Natural Lan-guage Processing)、 机器学习 (Machine Learning)等等。在教育领域的应用中,这些底层技术还常常被应用到适应性(Adaptive)及个性化(Personalized)学习系统和综合性的智能教学系统 (Intelligent TutoringSystem)中。 所以我们着重考察这些关键词在三个重要期刊的词频统计情况。
  4.人工智能领域重要关键词的词频统计知识表示方法(Knowledge Representation)在三个期刊三个年度的分布如表 3 所示, 每个年度每个期刊的相对词频都大于 1。 JETS 中该关键词的相对词频还呈现逐年上升的趋势,2009 年达到三个期刊中历年的最高值。
  语义网络(Semantic Web)作为一种知识表示方法,在最近几年受到研究者较多的关注。那么其频率分布如何呢? 如表 4 所示,除了 JETS 各个年度的相对频率都较高,其它两个期刊则不是很高。 2009 年的 IJAIE 居然没有提及该词汇, 而该年度的 JETS中,该词汇的出现率则最高。知识表示中与语义网络相关的技术是本体论(Ontology), 与这个概念相关的关键词的频率分布如表 5 所示。 与语义网类似,仍然是 JETS 的相对词频最高,而另外两个期刊都不是很高,甚至还有小于1 的情况。 2007 年的 JETS 中该关键词的词频最高,无论从绝对数值上还是相对比较上。
  有关智能代理(Agent)的词频分布如表 6 所示,2008 年 IJAIE 中该词的绝对词频最高,而 2009 年 I-JAIE 中该词的相对词频最高。
  有关适应性系统(Adaptive System)的关键词词频统计如表 7 所示。 JETS 中该词出现的词频逐年增加,不论是绝对值还是相对值,2009 年都达到最大值。
  有关知识推理(Reasoning 或者 Inference)的关键词词频分布如下页表 8 所示,JETS 和 IJAIE 中该关键词的词频较高。
  有关机器学习、 数据挖掘的关键词词频统计如下页表 9 所示,JETS 的词频无论从绝对数值还是相对比率上都是逐年增长。 而其它两个除了 2008 年的IJAIE 较高外,词频都比较低。
  关于自然语言 处理(包括语音识别和语音合成年度 期刊 绝对词频 相对词频 的关键词词频分布如表 10 所示, 很明显,JETS的绝对值和相对比例都远远超过其它两个。
  关于智能教学系统的关键词词频统计如表 11所示,IJAIE 的绝对词频和相对词频都远远高于其它两者, 因为该刊物论文偏向于人工智能教育应用的设计和开发, 智能教学系统作为一个集大成的应用领域,历来为该刊物的研究重点。
  三、研究结论1. 个案分析的结论从个案分析来看, 战术语言和文化训练系统TLCTS 服务于美国国家战略需求,集成了自然语言处理(包括语音识别和语音合成)、智能代理、游戏、个性化学习等人工智能研究的最新成果, 并与学习情境紧密融合,取得了很好的社会效益和经济效益,值得我国教育技术研究者和实践者学习。
  2. 文本统计的结论从文本统计结果来看,2007 年到 2009 年这三年中, 三个期刊关于人工智能教育应用的关键词变化并无显着规律。 在统计分析的 10 个关键词中,JETS在 8 个方面的绝对词频和相对词频都比较高;而 I-JAIE 在另外两个方面比较高。 相比较而言,BJET 没有特别突出的方面。 这点可以这样解释:BJET 作为一个综合性的教育技术国际期刊, 人工智能教育应用只是它所刊发论文的一小部分。IJAIE 则是人工智能教育应用的专业期刊, 至少在某些领域刊发文章较多。 JETS 作为国际电子电器工程师协会(IEEE)学习技术专业委员会的会刊, 也对技术性较强和人工智能应用的论文比较青睐。
  2007 年 JETS 中“本体论”的绝对词频为 438,为各期刊各年度比较中词频最高的一个,这说明“本体论”在 2007 年被关注很多;2009 年 IJAIE 中“智能代理”的相对词频则最高,为 60.6,这说明该年度该期刊“智能代理”是一个研究热点。如果将这三年中所有期刊某个关键词(除去“人工智能”本身)的绝对词频相加,按照绝对词频之和从大到小排列,结果如表 12 所示。 “智能代理”绝对词频最高,“自然语言处理”次之,这两者的绝对词频基本上是其它关键词绝对词频的两倍以上; 两者绝对词频之和占据了所有总和的 41%之多。 可见,智能代理技术和自然语言处理是近三年来, 人工智能教育应用中最被关注的两个问题。
   中国电化教育技 术 与 应 用 两种方法的一致结论综合审视典型案例和文献统计两种方法的研究结果,本文发现:自然语言处理、智能代理等是近三年来人工智能教育应用国际研究中使用最多的技术,也是最为关注的问题。因为时间有限, 本文仅对三个期刊近三年内的论文作了统计分析, 所以不能看出长时间的变化趋势。笔者下一步的研究,将囊括更多的教育技术类的国际期刊,跨越更长的时间段,并使用机器学习等方法来开展文本数据挖掘, 以探索人工智能教育应用的发展趋势。
  参考文献:
  [1] 陈天云, 张剑平.智能教学系统( ITS ) 的研究现状及其在中国的发展[J].中国电化教育,2007,(2):95-99.
  [2] 赵建华.智能教学系统概述[J].中国电化教育,2007,(7): 5-11.
  [3] 张剑平,陈仕品.计算机辅助教学的智能化历程及其启示[J].教育研究,2008,(1): 76-83.
  [4] 贾积有.教育技术与人工智能[M].长春:吉林大学出版社,2009.

本文来源:http://www.rjdtv.com/jisuanjilunwen/152.html

推荐内容