摘 要
【目的】跨学科的研究内容推动了科学重大发现的产生,科研人员需要了解其研究方向中所出现的跨学科研究内容。科学文献规模变得越来越庞大,采用人工阅读的方式从科学文献中寻找跨学科的研究内容变得越来越困难,需要计算机辅助科研人员对跨学科研究内容进行揭示。
【方法】本文提出了一种跨学科研究内容的自动识别方法,此方法利用人工智能中词嵌入语义分布的特性,在构建的约170万自然科学常见词汇的词嵌入的基础上,通过让计算机从论文的作者关键词中自动识别出语义异常的词汇来发现跨学科的研究内容。
【结果】将该方法应用于深度学习研究方向,挖掘出了若干跨学科的自然科学研究内容。
【局限】由于传统词嵌入在表示一词多意上的缺陷,语义异常作者关键词识别的准确性有待提升。
【结论】本文的方法为跨学科研究内容的发现提供了一种新的解决思路。
关键词:跨学科研究;词嵌入;语义异常;深度学习
引 言
近些年随着科学技术的快速发展,学科间的边界逐渐被打破,在不少研究方向上都出现了学科间的渗透与融合现象,学科交叉逐渐成为现代科研原始创新的主要活动组织方式[1]。这些跨学科的研究促进了不同领域科研人员的合作,推动了科学重大发现的产生,并且为学科的持续发展提供了新的增长点。在这样的情况下,科研人员对其研究领域中所出现的跨学科研究内容进行主动发现就显得尤为重要。与此同时,科技文献规模变得越来越庞大,采用人工阅读的方式从数量众多、主题多样的科技文献中寻找跨学科的研究内容变得越来越困难。因此设计出自动或者半自动的方法对跨学科研究内容进行揭