码农知识堂 - 1000bd
  •   Python
  •   PHP
  •   JS/TS
  •   JAVA
  •   C/C++
  •   C#
  •   GO
  •   Kotlin
  •   Swift
  • 大模型日报 2024-06-28


    大模型日报

    2024-06-28

    大模型资讯

    1.寒武纪1号诞生:谢赛宁Yann LeCun团队发布最强开源多模态LLM
    谢赛宁 Yann LeCun 团队发布了寒武纪1号,这是一个开源的多模态LLM模型。该模型以视觉为中心,探索了多种不同的视觉编码器及其组合,并设计了一种动态且可感知空间的新型连接器,将视觉特征与LLM整合在一起。团队还开发了一个以视觉为中心的基准评测工具CV-Bench。该模型在多个基准上表现出色,尤其擅长以视觉为中心的任务。

    🔗:https://www.jiqizhixin.com/articles/2024-06-28-5

    1. 炸裂!讯飞现场大秀强干扰语音识别,星火4.0霸榜八个榜单,74种语言自由交流
      科大讯飞的星火4.0在语音识别和个性化AI助手方面取得了突破。语音识别在强干扰场景下的准确率达到了91%,并且支持74种语言的自由交流。个性化AI助手基于用户画像和个人资料进行增强学习,提供个性化的表达和内容。此外,科大讯飞还在医疗和教育领域应用中取得了进展,提供医疗问答、学生学习辅导等功能。讯飞星火APP已经成为人们日常生活中使用的工具之一,具备写作、编程、工作、学习等多种实用功能。

    🔗:http://mp.weixin.qq.com/s?__biz=MzIzNjc1NzUzMw==&mid=2247736139&idx=2&sn=cbdba96b6db088f5d670be14221c1c6d&chksm=e9e9a6d640489c7bab01363c6d666a6589725c088d350cf5e80cdf5c0b4ea3e446cea54765b2&scene=0#rd

    1. 字节大模型团队Depth Anything V2模型入选苹果最新CoreML模型
      苹果公司在HuggingFace上发布了20个新的Core ML模型和4个数据集,其中字节大模型团队的单目深度估计模型 Depth Anything V2入选。该模型在细节处理上更精细,鲁棒性更强,并且速度上有显著提升。经过工程优化后,在iPhone 12 Pro Max上的推理速度达到了31.1毫秒。该模型可以应用在自动驾驶、3D建模、增强现实、安全监控以及空间计算等领域。

    🔗:https://www.jiqizhixin.com/articles/2024-06-28-11

    1. 谷歌「诚意之作」,开源9B、27B版Gemma2,主打高效、经济!
      谷歌发布了Gemini家族的新成员Gemma 2,提供了90亿和270亿参数的两个版本,具有卓越的性能和高效的推理能力。Gemma 2在同等体积类别中表现出色,能够与体积超过其两倍的模型竞争。它还具有低成本、高速推理和易于部署等特点。谷歌提供了广泛的框架兼容性,使其能够轻松与主要的AI框架结合。开发者可以在Google Cloud上轻松部署和管理Gemma 2,并通过Gemma Cookbook获取实用示例和指南。谷歌还向开发者开放了Gemini 1.5 Pro的200万token上下文窗口访问权限。

    🔗:https://www.jiqizhixin.com/articles/2024-06-28-15

    大模型论文

    1. 符号学习助力自进化智能体
    • 摘要: 本文提出符号学习框架,使语言智能体能自主优化,模仿连接主义学习算法,实现自进化。
    1. 大规模提示探索用于评估LLM的研究
    • 摘要: 本文介绍了PrExMe,通过720多种提示模板评估开源LLM在机器翻译和摘要数据集上的表现,揭示提示策略的稳定性和变化性。
    1. CharXiv:多模态LLM图表理解评估
    • 摘要: CharXiv提供2323个复杂图表,评估多模态大语言模型在图表理解中的表现,揭示现有模型的不足。
    1. ChatGPT与教授谁更擅长解释?
    • 摘要: 研究比较了LLMs与人类在对话中解释能力,采用5-Levels数据集评估GPT4的解释效果,并通过人类评审进行验证。
    1. 语言模型对强化学习代理的心智建模研究
    • 摘要: 本文探讨大型语言模型能否通过推理建立强化学习代理的心智模型,发现其尚需进一步创新来实现全面建模。
    1. 上下文学习是否为梯度学习的一种?
    • 摘要: 研究发现大型语言模型在上下文学习中表现出逆频率效应,支持其为梯度驱动学习的一种形式。
    1. 角色扮演零样本提示的多语言对话模型
    • 摘要: 本研究探讨通过角色扮演零样本提示,利用多语言LLMs实现高效开放域对话,表现超越微调模型。
    1. 基于大语言模型的显著事件图生成
    • 摘要: 提出CALLMSAE框架,通过生成摘要识别显著事件,迭代代码优化生成事件关系图,提升生成图的准确性。
    1. 基于LLMs的企业数字化转型评估方法
    • 摘要: 本研究提出了一种基于大语言模型的创新评估方法,通过分析4407家上市公司年报,构建全面的数字化转型指标,发现数字化转型显著提升公司财务表现。
    1. IRCAN:通过识别和重加权上下文感知神经元缓解知识冲突
    • 摘要: IRCAN框架通过识别和重加权上下文感知神经元,解决LLM生成中的知识冲突问题,提升上下文处理能力。

    大模型开源项目

    1. Modelscope:探索扩散模型的魔力
    • 摘要: Modelscope项目使用Python语言编写,带你体验扩散模型的神奇魅力。
    1. Claude Opus智能子代理框架
    • 摘要: Doriandarko是一个用Python编写的框架,用于智能地协调Claude Opus的子代理。
    1. CISO助手:一站式GRC管理工具
    • 摘要: CISO助手涵盖风险、应用安全和审计管理,支持46+框架,使用Python编写,适用于全球多种合规标准。
    1. Lepton AI:对话式搜索演示
    • 摘要: Lepton AI项目使用TypeScript构建快速对话式搜索演示,展示了高效的搜索功能和友好的用户交互体验。

    以上就是2024-06-28的大模型日报,很高兴为你服务!

    本文由mdnice多平台发布

  • 相关阅读:
    【CSS】H5_css美化
    大数据算法系列13:最小生成树算法
    计算机mfc140.dll文件缺失的修复方法分析,一键修复mfc140.dll
    软件架构思想和系统架构图
    ES12 学习
    fft_傅里叶
    金蝶云苍穹融资租赁系统V5.0发布。
    acl的构成-scheme与id、permissions
    Java程序猿如何用Supplier来优化代码?
    Go语言读取文件内容
  • 原文地址:https://blog.csdn.net/weixin_40262196/article/details/140026765
  • 最新文章
  • 攻防演习之三天拿下官网站群
    数据安全治理学习——前期安全规划和安全管理体系建设
    企业安全 | 企业内一次钓鱼演练准备过程
    内网渗透测试 | Kerberos协议及其部分攻击手法
    0day的产生 | 不懂代码的"代码审计"
    安装scrcpy-client模块av模块异常,环境问题解决方案
    leetcode hot100【LeetCode 279. 完全平方数】java实现
    OpenWrt下安装Mosquitto
    AnatoMask论文汇总
    【AI日记】24.11.01 LangChain、openai api和github copilot
  • 热门文章
  • 十款代码表白小特效 一个比一个浪漫 赶紧收藏起来吧!!!
    奉劝各位学弟学妹们,该打造你的技术影响力了!
    五年了,我在 CSDN 的两个一百万。
    Java俄罗斯方块,老程序员花了一个周末,连接中学年代!
    面试官都震惊,你这网络基础可以啊!
    你真的会用百度吗?我不信 — 那些不为人知的搜索引擎语法
    心情不好的时候,用 Python 画棵樱花树送给自己吧
    通宵一晚做出来的一款类似CS的第一人称射击游戏Demo!原来做游戏也不是很难,连憨憨学妹都学会了!
    13 万字 C 语言从入门到精通保姆级教程2021 年版
    10行代码集2000张美女图,Python爬虫120例,再上征途
Copyright © 2022 侵权请联系2656653265@qq.com    京ICP备2022015340号-1
正则表达式工具 cron表达式工具 密码生成工具

京公网安备 11010502049817号