• 假期get新技能?低代码模型应用工具HuggingFists


    HuggingFists是什么?

           HuggingFists是一款研究和使用HuggingFace模型和数据集的AI应用工具。

        众所周知,Hugging Face是一家人工智能(AI)技术公司,致力于开发和推广自然语言处理(NLP)技术,通过搭建开源的模型平台和社区,为开发者提供了许多NLP模型和工具,并能够构建和部署自己的NLP应用程序,通过社区模式实现开发者之间的模型共享和技术讨论,因此受到无数大模型研究人员的推崇和拥趸。

          HuggingFists基于Sengee(神机)低代码平台的API快速接入能力,集成了HuggingFace文本分类、命名实体识别、对话问答、文本生成、机器翻译、语音识别等应用API的能力,为AI大模型训练人员提供便捷快速的应用方式。在大模型的部署和应用中,模型的准确性和适用性决定了模型的价值。HuggingFist正是从模型选择和应用验证的需求出发,提供了模型快速部署、模型价值验证的便捷通道。

        如下是HuggingFist的产品Logo,

    图片

    为什么选择HuggingFace

        我们在切入多模态大模型领域的时候,也做过研究和考虑,针对国内外的各种AI Models进行研究和分析,其中Hugging Face是目前公认的模型数量最多、社区活跃度最高的AI Models。HuggingFace的预训练模型在多个自然语言处理任务上的出色表现,如自然语言生成、文本分类、问答系统等,再加上丰富的工具和API,因此,可以帮助研究人员更加方便地使用预训练模型进行实验和研究。

        HuggingFace的主要优势如下:

        大量预训练模型:HuggingFace库包含了各种最新的预训练模型,比如BERT、GPT-2、T5、XLNet等。这些模型已经在大规模文本数据上进行了预训练,能够理解语言的各种复杂模式。这意味着,可以直接使用这些模型,而不需要从零开始训练,大大节省了时间和计算资源。

        海量模型持续更新:HuggingFace团队始终紧跟最新的NLP研究,不断更新库中的多模态模型和工具。任何人都可以很方便地使用最新的NLP技术,而不需要自己去实现它们。

        活跃的模型贡献者:HuggingFace的所有模型和工具都是开源的,这意味着任何人可以自由地使用和修改它们,甚至可以贡献你自己的代码。截至目前HuggingFace的Model数量已经达到了34万+,并且保持每天近千个Model的持续增长。

        跨平台支持能力:HuggingFace支持多种编程语言,比如Python和Node.js,以及多种深度学习框架,比如PyTorch和TensorFlow。无论在哪个平台上工作,无论喜欢使用哪种语言或框架,都可以使用HuggingFace的模型。

        高效的微调技术:HuggingFace提供了一套工具,可以帮助你在特定任务上微调预训练模型。微调是一种迁移学习技术,可以让模型更好地适应新的任务,而不需要重新训练整个模型。

        活跃的社区服务:HuggingFace的开发者社区非常活跃,可以在社区中找到各种有用的资源,比如教程、问题解答和最佳实践。如果遇到问题,可以在社区中与其他开发者和HuggingFace的团队成员进行交流。

    HuggingFists如何集成HuggingFace

        在使用HuggingFace的过程中,如何快速找到能能够匹配业务需求或研究效果的模型依然比较困难。毕竟在几十万的模型库中搜索到合适的模型,并比较模型的差异化都是一个巨大的工作量。HuggingFists根据HuggingFace暴露出Inference API,将每个 API都封装成一个算子,每个算子都具备一种模型的能力,任何人只需要调用或者编排算子就能完成对模型的使用。因此根据模型训练的场景,HuggingFists提供了本地化部署应用以及Inference API申请应用的两种方式。其中本地化部署需要将模型下载到本地,并且要求具备一定的算力资源来运行。而通过Inference API方式可以申请使用HuggingFace的计算资源。

    1)本地化部署

        首先,需要进入到模型页面下载目标模型,如下图,除了说明类文档外,其他文件或者目录都是模型装载运行所必需的,均需下载到本地。

    TipsHugging Face没有提供文件的打包下载功能,需手动逐个下载相关文件。

    图片

        然后,将这些下载的文件都存放在同文件夹下。在HuggingFists的流程管理中创建模型的应用流程,并在模型的配置信息中输入模型【选择模型的相对路径】,从而完成调用。

    图片

    图片

    2)通过Inference Endpoints方案部署

        HuggingFace也提供了Inference Endpoints的解决方案,允许使用者为Inference API申请专属的计算资源,以确保获得合适的响应性能。在使用Inference API的方式前,需要先在网站上进行注册,添加个人的资源账号,以及申请访问令牌,同时需要注意设置访问代理。

    图片

    图片

    目前已经集成的API如下

    HuggingFaceTimm图像分类

    HuggingFace图像Embedding

    HuggingFaceVit模型图像分类

    HuggingFace图像分类

    HuggingFace本地化图像切分

    HuggingFace图像切分

    HuggingFace标记分类

    HuggingFace图像转文字

    HuggingFace对话

    HuggingFace文本Embedding

    HuggingFace对象检测

    HuggingFace文本翻译

    HuggingFace对象识别

    HuggingFace文本分类

    HuggingFace零样本图像分类

    HuggingFace文本生成

    HuggingFace零样本文本分类

    HuggingFace文本相似

    HuggingFace蒙版填充

    HuggingFace文本摘要

    HuggingFace视频分类

    HuggingFace文本转语音

    HuggingFace图生成

    HuggingFace语音分类

    HuggingFace图生图

    HuggingFace语音识别

    HuggingFists的部署和使用

          HuggingFists提供了容器化的快速部署方式,部署环境的基本要求如下:

    • CentOS 7.6及以上版本;

    • 至少 4 核 8G;

    • 支持使用容器(容器以及镜像会固定存放到/data 目录)。

    安装包下载地址:

    https://pan.baidu.com/s/1hJWJuwhTBVD0dUQq0JPjrw?pwd=xxep

       为了方便大家熟悉如何使用HuggingFists,包括具体的操作及配置,我们录制了操作视频,扫描下方二维码即可观看:

    图片

    或者访问链接:

    https://www.bilibili.com/video/BV1Ku4y1r72H/
  • 相关阅读:
    Ubuntu 22 Python 虚拟环境配置
    示例:WPF中绑定枚举到ComboBox想显示成中文或自定义名称如何实现
    C语言利用计算机找系统的最小通路集的算法
    【Python第三方包】爬虫前言(request包)
    自定义pycharm的debug控件
    【数组】-数组里的所有数字都在 0 到 n-1范围内,判断该数组中是否有重复的数
    口袋参谋:如何快速挑选宝贝核心关键词?三种方法,简单有效!
    stata空间计量模型基础+检验命令LM检验、sem、门槛+arcgis画图
    强化学习-task2
    [附源码]计算机毕业设计springboot咖啡销售平台
  • 原文地址:https://blog.csdn.net/colorknight/article/details/133465895