给学生的解释(基本):
生成式人工智能是一种可以创造新的原创内容的技术,例如艺术、音乐、软件代码和写作。 当用户输入提示时,人工智能会根据从互联网上现有示例中学到的知识生成响应,通常会产生独特且富有创意的结果。
给开发者的解释(技术):
生成式人工智能是人工智能的一个分支,以能够生成原始内容的计算机模型为中心。 通过利用大型语言模型、神经网络和机器学习的力量,生成式人工智能能够生成模仿人类创造力的新颖内容。 这些模型使用大型数据集和深度学习算法进行训练,这些算法可以学习数据中存在的底层结构、关系和模式。 结果是基于输入提示的新的、独特的输出,包括图像、视频、代码、音乐、设计、翻译、问答和文本。
生成式人工智能模型的工作原理是使用受人脑神经元启发的神经网络从现有数据中学习模式和特征。 然后,这些模型可以生成与其所学模式相符的新数据。 例如,在一组图像上训练的生成式人工智能模型可以创建与训练时相似的新图像。 这类似于语言模型如何根据为上下文提供的单词生成广泛的文本。
生成式人工智能利用生成对抗网络 (generative adversarial networks - GAN)、大型语言模型、变分自动编码器模型 (variational autoencoder models - VAE) 和变换器器(transformers)等先进技术来创建跨动态领域的内容。 下面解释了有关这些方法的更多细节。
这些模型可以从大型数据集中学习,通过迭代训练过程来完善其输出。 该模型分析给定数据内的关系,有效地从提供的示例中获取知识。 通过调整参数并最小化所需输出和生成输出之间的差异,生成式人工智能模型可以不断提高生成高质量、上下文相关内容的能力。 结果,无论是一首异想天开的诗歌还是聊天机器人客户支持响应,通常与人类生成的内容没有什么区别。
从用户的角度来看,生成式人工智能通常从引导内容生成的初始提示开始,然后是探索和完善变化的迭代过程。
生成式人工智能采用各种模型来创建新的原创内容。 一些最常见的生成人工智能模型类型包括:
生成对抗网络 (Generative adversarial networks - GAN):GAN 由两个关键组件组成:生成器和鉴别器。 生成器根据从训练数据中学到的模式生成合成数据。 鉴别器充当法官,评估生成的数据与真实数据的真实性,并确定其是真是假。 训练过程教会生成器产生更真实的输出,而鉴别器则提高区分真实数据和合成数据的能力。 GAN 广泛应用于图像生成,并在创建异常逼真的视觉效果方面展示了令人印象深刻的结果。
变分自动编码器 (Variational autoencoders - VAE):VAE 是学习编码和解码数据的神经网络。 编码器将输入数据压缩为称为潜在空间的低维表示。 同时,解码器从潜在空间重建原始数据。 VAE 通过对潜在空间中的采样点并将其解码为有意义的输出来生成新数据。 该方法在图像和音频合成中特别有价值,可以操纵潜在表示来产生多样化和创造性的输出。
大型语言模型 (Large Language Models - LLMs):最常见的 LLM 类型,例如 ChatGPT(Generative Pretrained Transformer - 生成式预训练变换器),是根据大量文本数据进行训练的。 这些复杂的语言模型使用来自教科书、网站和社交媒体帖子的知识。 他们利用 transformer 架构来理解并根据给定的提示生成连贯的文本。 Transformer 模型是大型语言模型最常见的架构。 它们由编码器和解码器组成,通过根据给定提示创建 token 来发现它们之间的关系来处理数据。
本质上,transformer 模型预测单词序列中接下来出现的单词来模拟人类语音。 LLMs 有能力参与现实对话、回答问题并生成创造性的、类人的响应,这使它们成为从聊天机器人、内容创建到翻译等语言相关应用的理想选择。
生成式人工智能在个人和商业层面上都提供了强大的优势。 随着技术的发展,其影响只会越来越大。 从短期来看,最直接和最显着的好处之一是提高效率和简化工作流程。 自动化任务的能力可以为人们和企业节省宝贵的时间、精力和资源。 从起草电子邮件到进行预订,生成式人工智能已经在提高效率和生产力。 以下是生成式人工智能发挥作用的一些方式:
虽然生成式人工智能拥有巨大的潜力,但它也面临着一定的挑战和限制。 一些关键问题包括:
生成式人工智能模型有多种形式,每种都有独特的功能和应用程序 —— 生成式人工智能接口的数量似乎每天都在成倍增加。 目前,最流行、最强大的生成式人工智能模型包括:
ChatGPT 是 OpenAI 开发的大型语言模型,自 2022 年 11 月公开发布以来取得了巨大成功。 它使用对话式聊天界面与用户交互并微调输出。 它旨在理解文本提示并生成类似人类的响应,并且它已经展示了进行对话交流、回答相关问题甚至展现幽默感的能力。
据报道,最初的 ChatGPT-3 版本免费提供给用户,并使用来自互联网的超过 45 TB 的文本数据进行了训练。 不久之后,微软将一个版本的 GPT 集成到其 Bing 搜索引擎中。 OpenAI 的升级版、基于订阅的 ChatGPT-4 于 2023 年 3 月推出。
ChatGPT 使用尖端的 Transformer 架构。 GPT 代表 “生成式预训练 Transformer”,Transformer 架构彻底改变了自然语言处理 (natural language processing - NLP) 领域。
DALL-E 2 同样来自 OpenAI,专注于生成图像。 DALL-E 将 GAN 架构与变分自动编码器相结合,根据文本提示生成高度详细且富有想象力的视觉结果。 通过 DALL-E,用户可以描述他们想要的图像和风格,模型将生成它。 与 MidJourney 和新晋 Adobe Firefly 等竞争对手一起,DALL-E 和生成式 AI 正在彻底改变图像创建和编辑的方式。 随着整个行业不断涌现的能力,视频、动画和特效也将发生类似的转变。
Bard 最初基于 Google LaMDA 系列大型语言模型的一个版本构建,后来升级到更先进的 PaLM 2,是 Google ChatGPT 的替代品。 Bard 的功能类似,能够编码、解决数学问题、回答问题、写作以及提供 Google 搜索结果。
尽管该技术相对年轻且发展迅速,但生成式人工智能已经在各种应用和行业中站稳了脚跟。 任何需要制作书面材料、代码、设计或图像的组织都将从中受益。 用例包括:
生成式人工智能的未来充满希望。 随着技术的进步,日益复杂的生成式人工智能模型正在针对各种全球问题。 人工智能有潜力通过生成和测试分子解决方案来快速加速药物发现和开发的研究,从而加快研发过程。 例如,辉瑞公司在冠状病毒大流行期间使用人工智能进行疫苗试验1。 人工智能也是解决许多环境挑战的新兴解决方案。 值得注意的是,一些人工智能机器人已经开始协助海洋清洁工作。
生成式人工智能还能够生成超现实、令人惊叹的原创且富有想象力的内容。 营销、娱乐、艺术和教育等跨行业的内容将根据个人喜好和要求量身定制,这可能会重新定义创意表达的概念。 进步最终可能会导致虚拟现实、游戏和沉浸式讲故事体验中的应用,这些体验与现实几乎无法区分。
在短期内,随着高级功能嵌入到我们日常使用的工具中,从电子邮件平台和电子表格软件到搜索引擎、文字处理器、电子商务市场和日历,生成式人工智能的影响将被最直接地感受到。 工作流程将变得更加高效,重复性任务将实现自动化。 分析师预计市场所有领域的生产力和效率都会大幅提高。
组织将使用根据自己的数据进行训练的定制生成人工智能解决方案来改善从运营、招聘和培训到供应链、物流、品牌和沟通的各个方面。 开发人员将使用它在很短的时间内编写出完美的代码。 与之前的许多根本性变革技术一样,生成式人工智能有可能影响我们生活的各个方面。
随着越来越多的组织将生成式 AI 集成到其内部和外部运营中,Elastic 设计了 Elasticsearch Relevance Engine™ (ESRE),为开发人员提供支持基于人工智能的搜索应用程序所需的工具。 ESRE 可以提高搜索相关性并大规模生成嵌入和搜索向量,同时允许企业集成自己转换器(transformer)模型。
我们的相关性引擎是为构建人工智能驱动的搜索应用程序的开发人员量身定制的,其功能包括支持通过 API 集成第三方 transformer 模型,例如生成式 AI 以及 ChatGPT-3 和 ChatGPT-4。 Elastic 在专有数据和生成式 AI 之间架起了一座桥梁,组织可以通过上下文窗口为生成式 AI 提供定制的、特定于业务的上下文。 Elasticsearch 和 ChatGPT 之间的这种协同作用可确保用户收到针对其查询的事实、上下文相关且最新的答案。
Elasticsearch 的检索能力与 ChatGPT 的自然语言理解能力相结合,提供了无与伦比的用户体验,为信息检索和人工智能辅助树立了新标准。 ChatGPT 在改善检测、响应和理解方面的潜在雄心勃勃的应用甚至对安全的未来产生了影响。
要了解有关使用 Elastic 和生成式 AI 增强搜索的更多信息,请注册免费演示。
Elasticsearch 安全地为 ChatGPT 提供对数据的访问,以生成更相关的响应。
生成式 AI 的示例包括 ChatGPT、DALL-E、Google Bard、Midjourney、Adobe Firefly 和 Stable Diffusion。
人工智能(AI)是指开发能够执行模拟人类智能任务的系统的广泛领域,而机器学习(ML)是人工智能的一个子集,涉及使用复杂的算法和技术,使系统能够从数据中学习,识别模式,并在没有明确指示的情况下提高性能。
生成对抗网络 (Generative adversarial networks - GAN):GAN 是一种神经网络架构,由生成器和判别器组成,它们协同工作以生成真实且高质量的内容。
自动编码器(Autoencoder):自动编码器是一种学习编码和解码数据的神经网络架构,通常用于数据压缩和生成等任务。
循环神经网络 (Recurrent neural networks - RNN):RNN 是用于顺序数据处理的专用神经网络。 它们有一个记忆组件,可以让它们保留之前步骤的信息,使它们适合文本生成等任务。
大型语言模型 (Large language models - LLMs):大型语言模型(包括 ChatGPT)是基于大量文本数据训练的强大的生成式 AI 模型。 他们可以根据给定的提示生成类似人类的文本。
机器学习 (Machine Learning):机器学习是人工智能的一个子集,它使用算法、模型和技术使系统能够从数据中学习并进行适应,而无需遵循明确的指令。
自然语言处理 (Naturual language processing - NLP):自然语言处理是人工智能和计算机科学的一个子领域,涉及计算机和人类语言之间的交互。 它涉及文本生成、情感分析和语言翻译等任务。
神经网络 (Neural networks):神经网络是受人脑结构和功能启发的算法。 它们由互连的节点或神经元组成,用于处理和传输信息。
语义搜索 (Semantic search):语义搜索是一种以理解搜索查询的含义和搜索内容为中心的搜索技术。 它的目的是提供更多上下文相关的搜索结果。
向量搜索 (Vector search):向量搜索是一种将数据点表示为高维空间中的向量的技术。 它通过计算向量之间的距离来实现高效的相似性搜索和推荐系统。
原文:What is Generative AI? | A Comprehensive Generative AI Guide | Elastic