码农知识堂 - 1000bd
  •   Python
  •   PHP
  •   JS/TS
  •   JAVA
  •   C/C++
  •   C#
  •   GO
  •   Kotlin
  •   Swift
  • mac本地搭建ollama


    mac本地搭建ollama webUI

    *简介:ollama-webUI是一个开源项目,简化了安装部署过程,并能直接管理各种大型语言模型(LLM)。本文将介绍如何在你的macOS上安装Ollama服务并配合webUI调用api来完成聊天。

    开源地址

    • https://github.com/812781385/ollama-webUI.git,开源不易感谢star
    • 微信公众号

    环境要求

    • macos系统
    • nodejs >= 18
    • 没错,其他的都不需要了

    目标

    • 运行ollama
    • 启用webUI
    • 启用API服务
    • 启用RAG

    安装ollama

    • 官网直接安装,ollama官网。
    • 选择macos,点击download for mac下载
    • 得到的是个压缩包,解压,然后一路next
    • 安装完成,直接使用
    • 系统可会默认启动ollama,在电脑的右上角能看到这个标记,如果没有,请看下一步

    在命令行使用ollama

    • 打开终端,输入ollama -h,查看到所有的命令。

    • 点击这里搜索你需要的模型,然后直接启动,例如:ollama run llama3,可看到下载速度非常快,取决于你的宽带。

    • 下载完成,现在可以与他聊天了

    • control + D退出聊天

    调用ollama的API

    • ollama提供api的形式调用,直接查看官网文档
    • ollama serve启动服务,发现端口被占用

    需要点击电脑右上角的ollama图标来退出ollama,再来运行ollama serve

    • ollama服务默认是http://127.0.0.1:11434,目前在macOS上修改ip和端口无效,官方未解决(2024-5-9)。
    • 调用api会出现跨域,所以需要做一个服务端。我已经做好了,点击查看源码,感谢star

    安装ollama-webUI和serve

    • git clone https://github.com/812781385/ollama-webUI.git

    • cd client

    • pnpm i

    • 修改.env 里的VITE_APP_AXIOS_BASE_URL 为自己的ip地址

    • npm run dev 运行webUI

    • cd serve

    • npm i

    • npm run dev 运行服务端

    • 浏览器访问http://localhost:8080/

    • 点击设置按钮,打开设置对话框,输入模型名称,例如:qwen:0.5b,点击按钮开始拉取模型

    • 选择刚刚拉取好的模型后,点击确定。就可以开始聊天了

    使用RAG

    什么是RAG,例如你问AI:你的名字叫什么?,他会告诉你他是个ai模型...,这不是我想要的答案,怎么办?有两种方式,1.训练自己的模型。2.在prompt里嵌入自己的文案。例如:你的名字叫小虎,请参考这个问题来回答: 你的名字叫什么,这时候他会回答,他的名字叫小虎。

    • 如果你要使用RAG,请先安装chroma数据库,点击查看官网文档
    • chroma run 启动数据库服务
    • 你还需拉取ollama的嵌入式模型mxbai-embed-large,点击查看官网文档
    • 然后调用serve/app/router里的接口,添加数据router.post('/addData', controller.chat.addDataForDB);
    • 在webUI的设置对话框里,开启RAG开关,就可以聊天了

    模型推理内存损耗

    • 以llama2为例计算

    视频演示

    播放

  • 相关阅读:
    模块首页UX交互升级,接口测试支持禁用本地执行,MeterSphere开源持续测试平台v2.4.0发布
    多功能电力仪表在物联网的应用
    大数据常见面试题
    Opencv——图像模板匹配
    1.5-33:计算分数加减表达式的值
    pcsx2模拟器怎么设置流畅?
    海康G5系列(armv7l) heop模式下交叉编译Qt qmqtt demo,出现moc缺少高版本GLibc问题之解决
    把请求头信息添加到请求报文中,然后发送请求到淘宝,显示回复信息
    宁波银行金融科技部2023届校招开始了!内推码:90OF50
    如何写一个可以找到工作的简历不至于太烂
  • 原文地址:https://www.cnblogs.com/wangrui38/p/18183562
  • 最新文章
  • 攻防演习之三天拿下官网站群
    数据安全治理学习——前期安全规划和安全管理体系建设
    企业安全 | 企业内一次钓鱼演练准备过程
    内网渗透测试 | Kerberos协议及其部分攻击手法
    0day的产生 | 不懂代码的"代码审计"
    安装scrcpy-client模块av模块异常,环境问题解决方案
    leetcode hot100【LeetCode 279. 完全平方数】java实现
    OpenWrt下安装Mosquitto
    AnatoMask论文汇总
    【AI日记】24.11.01 LangChain、openai api和github copilot
  • 热门文章
  • 十款代码表白小特效 一个比一个浪漫 赶紧收藏起来吧!!!
    奉劝各位学弟学妹们,该打造你的技术影响力了!
    五年了,我在 CSDN 的两个一百万。
    Java俄罗斯方块,老程序员花了一个周末,连接中学年代!
    面试官都震惊,你这网络基础可以啊!
    你真的会用百度吗?我不信 — 那些不为人知的搜索引擎语法
    心情不好的时候,用 Python 画棵樱花树送给自己吧
    通宵一晚做出来的一款类似CS的第一人称射击游戏Demo!原来做游戏也不是很难,连憨憨学妹都学会了!
    13 万字 C 语言从入门到精通保姆级教程2021 年版
    10行代码集2000张美女图,Python爬虫120例,再上征途
Copyright © 2022 侵权请联系2656653265@qq.com    京ICP备2022015340号-1
正则表达式工具 cron表达式工具 密码生成工具

京公网安备 11010502049817号