• 大模型实战—大模型web服务部署


    大模型实战—大模型web服务部署

    这里我们使用的是一个叫做open-webui开源项目

    Open WebUI Demo

    目前这个项目在Github 上已经得到了比较高的star 数

    image-20240317105716037

    这个项目提供了多种部署方式,这里我们使用docker 进行部署,如果你的web 服务和你的模型服务在同一个节点上,可以使用下面的命令

    docker run -d -p 3000:8080 --add-host=host.docker.internal:host-gateway -v open-webui:/app/backend/data --name open-webui --restart always ghcr.io/open-webui/open-webui:main
    
    • 1

    如果不是,也就是你的web服务和模型服务在不同节点的话,这里只需要指定OLLAMA_BASE_URL 即可

    docker run -d -p 3000:8080 -e OLLAMA_BASE_URL=https://example.com -v open-webui:/app/backend/data --name open-webui --restart always ghcr.io/open-webui/open-webui:main
    
    • 1

    如果你的docker 版本比较老的话,可能会遇到下面这个问题

    invalid argument "host.docker.internal:host-gateway" for "--add-host" flag: invalid IP address in add-host: "host-gateway"
    See 'docker run --help'.
    
    • 1
    • 2

    这里建议升级docker ,当然也有其他方式,这里的–add-host 主要是为了可以让容器访问宿主机,所以可以参考老版本的解决方式

    image-20240317091329315

    接下来就会自动下载并且运行了

    image-20240317092705499

    当上面的命令执行完成后,我们可以查看一下容器有没有起来,可以看到我们的容器已经成功起启动了

    image-20240317103022025

    接下来我们就打开浏览器

    首次我们可以去注册一个账号

    image-20240317103339955

    然后直接就跳转登录了,登录后整体页面如下,我们可以看到和ChatGPT 的页面基本一样

    image-20240317103549002

    选择模型和下载模型

    在使用之前我们先要去选择一个本地已经下载的模型

    image-20240317103730360

    由于我们之前已经下载过两个模型了,当然你如果没有下载的话也没有关系,可以使用下面的命令下载即可

    ollama run llama2
    
    • 1

    这里我们直接选择即可

    image-20240317103920078

    选完之后就如下所示

    image-20240317103937546

    当然我们可以进入设置页面的模型菜单,可以选择下载模型或者删除模型

    image-20240317104051324

    基本使用

    接下来我们就可以在web 页面上和我们的大模型对话了

    image-20240317104452513

    解析文件

    我们可以点击对话框的内容,选择文件上传,然后就可以让大模型基于上传文件的内容,做一些对话,这里我们主要让大模型总结一下这本书的主要内容,这其实也就是为什么我们要本地部署,不然我们也不能上传公司的文件,因为涉及泄密

    image-20240317105928035

    当然我们也可以针对我们上传的资料进行提问

  • 相关阅读:
    说说未来趋势 「元宇宙」是什么?
    分布式复制系统设计-总结
    Sentinel滑动时间窗口的原理及源码实现
    BUUCTF Web 极客大挑战 2019 EasySQL
    【MySQL数据库和JDBC编程】第三章-第一节:MySQL的增删查改基础篇
    NLP模型笔记2022-33:Sentence-BERT STS模型列表与预训练方法
    js遍历数组和对象的常用方法
    ShardingJdbc实战-分库分表
    simple foc 移植odriver foc的 anti-cogging(抗齿槽算法)
    labview 常见快捷键
  • 原文地址:https://blog.csdn.net/2401_84052244/article/details/138190110