大模型日报 2024-06-28

大模型日报 2024-06-28
大模型日报

2024-06-28

大模型资讯

1.寒武纪1号诞生：谢赛宁Yann LeCun团队发布最强开源多模态LLM
谢赛宁 Yann LeCun 团队发布了寒武纪1号，这是一个开源的多模态LLM模型。该模型以视觉为中心，探索了多种不同的视觉编码器及其组合，并设计了一种动态且可感知空间的新型连接器，将视觉特征与LLM整合在一起。团队还开发了一个以视觉为中心的基准评测工具CV-Bench。该模型在多个基准上表现出色，尤其擅长以视觉为中心的任务。

🔗：https://www.jiqizhixin.com/articles/2024-06-28-5
1. 炸裂！讯飞现场大秀强干扰语音识别，星火4.0霸榜八个榜单，74种语言自由交流
  科大讯飞的星火4.0在语音识别和个性化AI助手方面取得了突破。语音识别在强干扰场景下的准确率达到了91%，并且支持74种语言的自由交流。个性化AI助手基于用户画像和个人资料进行增强学习，提供个性化的表达和内容。此外，科大讯飞还在医疗和教育领域应用中取得了进展，提供医疗问答、学生学习辅导等功能。讯飞星火APP已经成为人们日常生活中使用的工具之一，具备写作、编程、工作、学习等多种实用功能。
🔗：http://mp.weixin.qq.com/s?__biz=MzIzNjc1NzUzMw==&mid=2247736139&idx=2&sn=cbdba96b6db088f5d670be14221c1c6d&chksm=e9e9a6d640489c7bab01363c6d666a6589725c088d350cf5e80cdf5c0b4ea3e446cea54765b2&scene=0#rd
1. 字节大模型团队Depth Anything V2模型入选苹果最新CoreML模型
  苹果公司在HuggingFace上发布了20个新的Core ML模型和4个数据集，其中字节大模型团队的单目深度估计模型 Depth Anything V2入选。该模型在细节处理上更精细，鲁棒性更强，并且速度上有显著提升。经过工程优化后，在iPhone 12 Pro Max上的推理速度达到了31.1毫秒。该模型可以应用在自动驾驶、3D建模、增强现实、安全监控以及空间计算等领域。
🔗：https://www.jiqizhixin.com/articles/2024-06-28-11
1. 谷歌「诚意之作」，开源9B、27B版Gemma2，主打高效、经济！
  谷歌发布了Gemini家族的新成员Gemma 2，提供了90亿和270亿参数的两个版本，具有卓越的性能和高效的推理能力。Gemma 2在同等体积类别中表现出色，能够与体积超过其两倍的模型竞争。它还具有低成本、高速推理和易于部署等特点。谷歌提供了广泛的框架兼容性，使其能够轻松与主要的AI框架结合。开发者可以在Google Cloud上轻松部署和管理Gemma 2，并通过Gemma Cookbook获取实用示例和指南。谷歌还向开发者开放了Gemini 1.5 Pro的200万token上下文窗口访问权限。
🔗：https://www.jiqizhixin.com/articles/2024-06-28-15

大模型论文
1. 符号学习助力自进化智能体
- 摘要: 本文提出符号学习框架，使语言智能体能自主优化，模仿连接主义学习算法，实现自进化。
1. 大规模提示探索用于评估LLM的研究
- 摘要: 本文介绍了PrExMe，通过720多种提示模板评估开源LLM在机器翻译和摘要数据集上的表现，揭示提示策略的稳定性和变化性。
1. CharXiv：多模态LLM图表理解评估
- 摘要: CharXiv提供2323个复杂图表，评估多模态大语言模型在图表理解中的表现，揭示现有模型的不足。
1. ChatGPT与教授谁更擅长解释？
- 摘要: 研究比较了LLMs与人类在对话中解释能力，采用5-Levels数据集评估GPT4的解释效果，并通过人类评审进行验证。
1. 语言模型对强化学习代理的心智建模研究
- 摘要: 本文探讨大型语言模型能否通过推理建立强化学习代理的心智模型，发现其尚需进一步创新来实现全面建模。
1. 上下文学习是否为梯度学习的一种？
- 摘要: 研究发现大型语言模型在上下文学习中表现出逆频率效应，支持其为梯度驱动学习的一种形式。
1. 角色扮演零样本提示的多语言对话模型
- 摘要: 本研究探讨通过角色扮演零样本提示，利用多语言LLMs实现高效开放域对话，表现超越微调模型。
1. 基于大语言模型的显著事件图生成
- 摘要: 提出CALLMSAE框架，通过生成摘要识别显著事件，迭代代码优化生成事件关系图，提升生成图的准确性。
1. 基于LLMs的企业数字化转型评估方法
- 摘要: 本研究提出了一种基于大语言模型的创新评估方法，通过分析4407家上市公司年报，构建全面的数字化转型指标，发现数字化转型显著提升公司财务表现。
1. IRCAN：通过识别和重加权上下文感知神经元缓解知识冲突
- 摘要: IRCAN框架通过识别和重加权上下文感知神经元，解决LLM生成中的知识冲突问题，提升上下文处理能力。
大模型开源项目
1. Modelscope：探索扩散模型的魔力
- 摘要: Modelscope项目使用Python语言编写，带你体验扩散模型的神奇魅力。
1. Claude Opus智能子代理框架
- 摘要: Doriandarko是一个用Python编写的框架，用于智能地协调Claude Opus的子代理。
1. CISO助手：一站式GRC管理工具
- 摘要: CISO助手涵盖风险、应用安全和审计管理，支持46+框架，使用Python编写，适用于全球多种合规标准。
1. Lepton AI：对话式搜索演示
- 摘要: Lepton AI项目使用TypeScript构建快速对话式搜索演示，展示了高效的搜索功能和友好的用户交互体验。
以上就是2024-06-28的大模型日报，很高兴为你服务！

本文由mdnice多平台发布
相关阅读:
西门子6ES72881ST600AA0
【回溯】组合总和
 蓝桥杯每日一题2023.10.19
c#中字段和属性的区别，委托和事件的区别
 数据结构与算法（Java版） | 几个经典的算法面试题（上）
推特群推掀开营销新篇章
 华为od德科面试数据算法解析 2022-5-29 计算字符串最后一个单词的长度
 LeetCode 0791. 自定义字符串排序
 华为OD机考-C卷
 VisualSFM的配置与使用 & MeshLab的网格生成与纹理添加
原文地址：https://blog.csdn.net/weixin_40262196/article/details/140026765

大模型日报

大模型资讯

大模型论文

大模型开源项目