• 打破对ChatGPT的依赖以及如何应对ChatGPT的错误和幻觉


     

    OpenAI的ChatGPT是第一个真正流行的生成式AI工具,但它可能不是最好的。现在是时候扩大你的AI视野了。 

    ChatGPT成为了基于大语言模型(LLM)的聊天机器人的同义词。但是现在是时候停止对ChatGPT的痴迷,开始发现这个新世界中强大的替代品了。 

    首先,让我们明确我们在讨论什么。 

    LLM及其工具 

    LLM是一种通常训练了无数文本数据的AI系统。它通过在这些数据中寻找规模模式,以预测下一个词或句子,从而实现类似人类的沟通对话。 

    聊天机器人是可以访问LLM的工具。ChatGPT就是一个聊天机器人。免费版本可以访问一个叫GPT-3.5的LLM,付费版本可以访问GPT-4.0。 

    这些只是两个LLM,或者说是同一个LLM的两个版本。但现实中有许多类似的模型。事实上,数量令人难以置信的多。 

    斯坦福的科学家们最近发表了对LLM进行分类的工作。目前可用的LLM多达15821个。为了帮助我们理解,研究人员搭建了一个称为“Constellation”的资源,他们称之为LLM的“图鉴”,用于可视化LLM。 

    走出ChatGPT 

    LLM聊天机器人本质上是多用途的。但这并不意味着你应该把ChatGPT用于所有事情。此外,一份有争议的新报告从斯坦福和加州大学伯克利分校表明,对于某些用途,ChatGPT实际上正在变“笨”。 

    微软和Meta推出的最新LLM产品之一是LLaMA 2。(两家公司声称LLaMA 2是开源的,但评论人士说它不是。尽管如此,它远比来自谷歌或OpenAI的LLM要更“开放”。)

    除此之外,还有许多更多的LLM即将推出。甚至苹果也据说在谷歌机器学习框架Jax之上构建了一个,它在谷歌云上运行。其代号为“Ajax”,一些内部工程师非正式地称它为“AppleGPT”。员工将其用于产品原型工作和其他用途。 

    就像智能手机一样,改变世界的将是应用程序 

    非开发人员使用LLM的最佳方式之一是通过网站、应用程序、浏览器扩展来访问它们。 

    随着每天出现新的工具,以及现有工具的不断的更新,通过Futurepedia和AI Top Tools来保持对新产品的关注非常重要。 

    例如,对于搜索引擎替代工作,有Phind,Perplexity。它们是基于LLM的搜索引擎,既给出LLM派生的结果,也给出它用于获取数据的出处链接。在当下知识信息获取方面它们都远胜于ChatGPT。一般来说,基于LLM的聊天机器人在搜索引擎的功能方面确实差很多,最好的方法是结合搜索和AI。[1] 

    对于帮助写电子邮件或生日贺卡,Anthropic的Claude倾向于写出更好的散文。 

    鉴于这些工具演变的速度,需要提醒大家的是,下个月甚至下周的上述所说的情况就会变得完全不同。 

    如何应对ChatGPT的错误和幻觉 

    你实际上无法指望基于LLM的聊天机器人提供准确的信息。你也无法预测它们是否会给你一个不完整、误导、完全错误还是完美的结果。 

    避免错误和幻觉的一个诀窍是获取第二意见——第三和第四意见。由于不同LLM的聊天机器人很容易进行比较,因此在浏览器中的书签文件夹中多放几个聊天机器人很重要。例如,你可以在一个文件夹中加载Phind、ChatGPT、Bard和Claude。输入一个提示,将其复制粘贴到每个聊天机器人中,然后比较结果。这是一个非常快速的方法,既可以确保你拥有事实信息,也可以比较最佳结果。 根据我的经验,如果你从这三四个工具的回复中找到它们的共识,那这个信息通常是可靠的。[2] 

    我曾几年前警告过,如果我们让AI为我们写作,我们的写作(和思考)能力就会退化。现在,我有一个更细微的建议。如果我们只是输入提示,然后将结果复制粘贴用于自己的交流还是推荐的。或者,我们可以将AI用作写作伙伴,以提高我们的写作和思考能力。

    现在AI的世界如此多样化和复杂,我能给出的最佳建议是:像疯狂的科学家一样进行实验。尝试尽可能多的新工具。实验将AI集成到你的工作中,进行创造性的查询。并将AI用作头脑风暴伙伴和倾听对象。 

    参考资料

    [1] https://www.94c.cc/info/dealing-with-chatgpt-errors-and-hallucinations.html[2]https://www.computerworld.com/article/3703058/it-s-time-to-break-the-chatgpt-habit.html

     

  • 相关阅读:
    飞机大战Java版完整版
    pytorch Tensor
    C++STL-string类的使用
    数据库原理(数据库设计)——(3)
    scss 使用变量名注意事项
    NodeJs实战-Express构建照片存储网站(2)-上传、展示文件
    【八股】Java基础、集合、JVM
    Java异常
    笔试强训——day04
    【STC32G12K128开发板】——STC32G12K128单片机CAN程序
  • 原文地址:https://blog.csdn.net/2302_76860168/article/details/132567487