摘要:据报道,OpenAI前CEO萨姆·阿尔特曼有望重新担任CEO职位,并对公司董事会进行重大改变。微软等投资人正努力恢复阿尔特曼的职位,尽管董事会仍然是一个障碍。阿尔特曼计划推出一家新的AI企业,而阿尔特曼和前总裁格雷格·布罗克曼预计将加入该企业。OpenAI管理团队表示,他们对阿尔特曼的领导能力缺乏信心。总体而言,该新闻在公众兴趣、新颖性、重要性和影响力等方面都具有一定的分量。
摘要:谷歌开发的Gemini AI计划未能按期发布,延后到明年第一季度。Gemini是一款强大的大语言模型,将结合AlphaGo技术,目标是比OpenAI的GPT-4更强大。Gemini AI将支持聊天对话、分析图表数据、创建图像和用自然语言命令控制软件等功能。谷歌的Gemini AI在竞争中可能发挥重要作用,但谷歌对于基于人工智能的产品开发和部署持谨慎态度。
摘要:Facebook和Instagram将推出两款基于AI的图像编辑工具,Meta公司宣布发布名为"Emu Edit"和"Emu Video"的工具。"Emu Edit"工具可根据文本指令修改图片,包括添加、移除背景以及替换主体等功能;"Emu Video"使用了与"Emu Edit"相同的模型,可根据文本提示和静态图像生成视频。Meta公司表示这些工具目前仅用于基础研究,但在艺术、创作和生活等方面有广泛的潜在应用。虽然无法取代专业艺术家和动画师,但可帮助人们以全新的方式表达自己。
摘要:手机厂商Nothing宣布推迟发布其聊天应用Nothing Chats,以与合作伙伴Sunbird修复多个错误。一篇博客引起广泛关注,显示使用Sunbird系统发送的消息并未进行端到端加密,存在易于破解的风险。尽管Sunbird回应否认安全问题,但很多用户对此并不买账,认为缺乏端到端加密和缺少HTTPS协议是明显错误。总体评分为80分。
摘要:OpenAI的ChatGPT可能将推出一项新功能,即记住用户之前的聊天内容并从中学习。这使得ChatGPT能够理解用户的偏好和信息,并为日后的聊天提供更个性化的回应。该功能可以让ChatGPT成为用户更像朋友而不仅仅是一个聊天机器人。不仅如此,这个新功能还可以手动开启和关闭,并提供忘记和重置记忆的选项。此外,还有传闻称ChatGPT还将推出一个“临时聊天”功能,不会学习和保存当前对话和历史记录。这个新功能可谓令人期待。
这篇文章主要讨论了低秩适应(LoRA)技术在训练自定义语言模型(LLM)中的应用和效果。LoRA通过将权重更新矩阵分解为较小的矩阵,可以节省GPU内存,并且在多次运行中结果保持一致。文章还回答了关于LoRA的十个常见问题,包括数据集的重要性、领域适应、最佳秩的选择、避免过拟合等。此外,文章介绍了QLoRA和学习率调度器的应用,并对Adam和SGD优化器的内存使用进行了比较。总的来说,LoRA是一种有效的训练自定义LLM的技术,可以节省内存并提高模型性能。
总结了语言模型研究的历史和发展,特别是关于大型语言模型(LLM)的开源和闭源的问题。初始时,闭源的模型限制了研究者对其工作原理的理解和改进。然而,随着时间的推移,开源的语言模型逐渐出现,为进一步研究和发展提供了基础。这些开源模型虽然落后于闭源模型,但为改善模型的鲁棒性和解决偏见和有害内容等问题奠定了基础。
更多AI工具,参考国内AiBard123,Github-AiBard123