神经AI还能够在工业、艺术创意、健康改善等领域大放异彩。比如,神经AI通过生成正确的图像和声音,将帮助刚做完准分子激光手术或人工耳蜗植入手术的人更快恢复视力或听力,甚至帮助医疗卫生领域实现新的突破。这些创新还将有益于其他新技术的发展,如增强现实(AR)与脑机接口(BCI)将会因此变得更加强大。
神经AI是一门新兴学科,旨在:1)通过研究人的大脑来促进AI技术发展;2)利用AI来更好地研究人的大脑。神经AI的核心工具之一是使用人工神经网络来创建特定大脑功能的计算机模型。这种方法始于2014年,当时麻省理工学院和哥伦比亚大学的研究人员发现,深度人工神经网络可以解释大脑的物体识别区域——颞下皮层(IT)的反应过程。于是引入了一个基本的实验方法:将人工神经网络与大脑进行比较。然后反复迭代测试各种大脑反应过程:形状识别、运动处理、语音处理、手臂控制、空间记忆等,并相应建立各个反应对应的大脑处理模型。
大脑部分区域的神经AI模型有两个关键特征。首先它是可计算的——给这个计算机模型提供刺激变量,它将能算出相应的大脑区域会如何反应。其次它也是可微分的——它是一个深度神经网,我们可以运用和研究视觉识别与自然语言处理模型相同的方式进行优化。也就是说,神经科学家可以借助所有推动深度学习革命的强大工具来更好做研究,包括PyTorch和TensorFlow等张量代数系统。
我们感知各种媒体,99%是通过眼睛和耳朵。眼睛和耳朵本身并不负责解释体验,它们只是传感器:是我们的大脑在处理和理解这些信息。面对不同的传媒内容,我们大脑会根据我们的所见所闻解析出不同的思考与情感,但是被解析出的结果,不一定是创作者想要传达的、被受众接受的。
如果想要确定一个作品中预留的信息是否如预期那样被受众接收,就需要不断地测试。一些互联网公司中,比较流行的解决办法是使用“A/B测试”。比如,谷歌曾测试过50种不同深浅的蓝色用在显示搜索结果的超链接上,最终他们找到的最优解使谷歌的收入比基线提高了2亿美元,约占当时谷歌收入的1%;Netflix会为用户调整影片缩略图以优化用户体验。
当前,神经AI在预测人们对视觉材料的反应方面已经做得越来越好。例如,Adobe的研究人员就正在研究相关的视觉设计工具,帮助设计人员更好地预测和引导人们的注意力。例如,通过编辑照片,使其在视觉上更令人难忘或更具美感。
人工神经网络甚至可以找到比现实图像更有效地传达信息的方法。OpenAI的CLIP工具便可以帮助你找到与想要传达的情感相一致的图像;再比如OpenAI和谷歌,可以根据文字提示生成逼真的图像。
目前在优化视听媒体、网站,尤其是广告方面存在巨大的市场需求,而我们其实早就已经开始将神经AI和算法艺术引入这一过程了。巨大的市场需求会催生良性的发展循环,随着越来越多的资源被投入到实际应用中,神经AI也将变得更好、更有用。
神经AI最令人兴奋的应用之一是提高产品的可及性。
大多数媒体其实是为“一般普通人”设计的,然而每个人处理视听信息的方式却各不相同。比如有色盲困扰的人群和一般人群的信息处理方式是不同的,因此大量的媒体并不适合他们。虽然如今有不少产品可以模拟色盲效果,但需要一个色觉正常的人先为产品做解释,然后才能去做相应的调整改变。直接做静态的颜色重映射无法满足他们需求,是因为有些材料在颜色重映射后语义会发生变化(例如,图表会变得难以读懂)。但有了神经AI之后,我们就可以在保持现有图形语义的情况下,自动生成适合色盲阅读的材料和网站。
一个将使神经AI应用变得更加强大的技术是AR眼镜。因为可以完美融入到我们的日常生活中,AR技术具备着成为无处不在的计算平台的潜力。众多科技巨头、互联网巨头都在加快步伐研究更高阶的AR眼睛,所以在供应方面就已经有巨大的推动力在助推其发展。而这将使人们广泛使用上一种比今天的静态屏幕强大得多的显示设备。
如果参照VR设备的发展轨迹,它最终还会将眼球追踪功能集成进来。也就是说,我们可以远远超越目前可能的技术手段,以更可控的方式实现更广泛的视觉刺激。另外这些设备在健康领域也将具有非常深远的应用前景。
有了出色的显示器(图像)和扬声器(声音),我们可以精确控制大脑的主要输入信号。而通过感官传递刺激的下一个更强大的阶段,是通过只读的脑机接口(BCI)验证大脑是否以预期的方式做出反应。如此一来,我们便可以评估刺激对大脑的影响,如果不符合预期,还可以在所谓的闭环控制中做相应的调整。