码农知识堂 - 1000bd
  •   Python
  •   PHP
  •   JS/TS
  •   JAVA
  •   C/C++
  •   C#
  •   GO
  •   Kotlin
  •   Swift
  • DIY一个智能音箱


    十一假期里将蓝牙音箱改造成一个智能音箱, 参考了网上的实现方法, 后台的大语言模型使用的是百度的文心一言.

    账号

    1. Picovoice 唤醒词服务 https://console.picovoice.ai/
      我绑定了github账号.
      访问https://picovoice.ai/,注册账号,然后进入控制台, 目前不支持中文唤醒词, 设置唤醒词后, 然后选择Windows操作系统,就能下载了,下载后的压缩包要解压,才能得到.ppn文件.
      Picovoice 提供了python SDK包 pvporcupine, 在程序中可使用该sdk通过对比.ppn内容来识别唤醒词.
    2. 百度智能云-语音类: https://console.bce.baidu.com/ai
      实现语音转文本服务, 使用之前需要在console中新增一个应用.
      百度也提供唤醒词服务, 但不支持windows, 所以我使用了 PicoVoice.
    3. 百度智能云-大语言模型类: https://console.bce.baidu.com/qianfan/ais/console/applicationConsole/application
      提供大语言模型问答功能, 使用之前需要在console中新增应用, 并选择一个大语言模型类型, 我使用的是 ERNIE-Bot-turbo 模型, token较为便宜.
    4. edge-tts: 实现文本转语音服务
      不同于微软和百度的TTS, 这个库不需要账号

    教程

    Picovoice离线语音识别在Linux系统的部署https://www.cnblogs.com/darren-channel/p/14860973.html

    文心一言教程:https://zhuanlan.zhihu.com/p/656681903https://zhuanlan.zhihu.com/p/641298242

    edge-tts:https://zhuanlan.zhihu.com/p/619612276

    百度千帆大模型平台测试

    对话url:
    千帆大模型平台集成了业界多个大语言模型, 下面是三个大语言模型的url.
    wenxinworkshop/chat/completions -- 文心一言模型
    wenxinworkshop/chat/eb-instant -- ERNIE-Bot-turbo模型, token较为便宜
    wenxinworkshop/chat/llama_2_7b -- llama_2_7b模型

    api官方文档: https://cloud.baidu.com/doc/WENXINWORKSHOP/s/4lilb2lpf

    POST 测试:

    1. POST https://aip.baidubce.com/rpc/2.0/ai_custom/v1/wenxinworkshop/chat/eb-instant?access_token=24xxxxxx"
    2. content-type: application/json
    3. {
    4. "temperature": 0.9,
    5. "messages": [
    6. {
    7. "role": "user",
    8. "content": "假设你是个智能伙伴,名字叫牛顿, 英文名为Newton, 你是一位百科全书式的人物, 你的回答需要非常简洁. 我的问题是:四大名著?"
    9. }
    10. ]
    11. }

    源码参考

    https://github.com/MedalCollector/Oratorhttps://github.com/FlickerMi/hello-chatgpt/blob/main/requirements.txthttps://notemi.cn/integrate-voice-services-to-achieve-voice-conversations-with-chatgpt.htmlhttps://github.com/wzpan/wukong-robothttps://github.com/phodal/awesome-smart-speaker

    深度文章

    Keyword Spotting 语音唤醒技术https://vaisramana.github.io/2019/08/03/keyword-spotting-语音唤醒技术.html

    ChatGPT应用https://wqw547243068.github.io/chatgpt_application

    大语言模型沉思录 Deep Think in LLMhttps://wqw547243068.github.io/llm

    GPT-4要来了,一文看尽大型语言模型的过去现在未来https://www.thepaper.cn/newsDetail_forward_22275233

  • 相关阅读:
    常用Linux命令
    【MATLAB教程案例7】基于Gardner环的定时误差检测matlab仿真
    备忘录模式简介
    计算机毕业设计之java+springboot基于vue的地方美食分享网站
    【2023】springboot通过阿里云oss进行文件单个批量文件上传下载
    单例设计模式是什么?什么是 Singleton 单例设计模式?Python 单例(单件)设计模式示例代码
    clang vectorization
    Day 62 django form modelform组件
    一套以云平台、云服务器为基础开发的智慧校园电子班牌系统源码 智慧校园源码 智慧班牌源码
    基于改进螺旋更新位置模型的鲸鱼优化算法-附代码
  • 原文地址:https://blog.csdn.net/csdnharrychinese/article/details/133642277
  • 最新文章
  • 攻防演习之三天拿下官网站群
    数据安全治理学习——前期安全规划和安全管理体系建设
    企业安全 | 企业内一次钓鱼演练准备过程
    内网渗透测试 | Kerberos协议及其部分攻击手法
    0day的产生 | 不懂代码的"代码审计"
    安装scrcpy-client模块av模块异常,环境问题解决方案
    leetcode hot100【LeetCode 279. 完全平方数】java实现
    OpenWrt下安装Mosquitto
    AnatoMask论文汇总
    【AI日记】24.11.01 LangChain、openai api和github copilot
  • 热门文章
  • 十款代码表白小特效 一个比一个浪漫 赶紧收藏起来吧!!!
    奉劝各位学弟学妹们,该打造你的技术影响力了!
    五年了,我在 CSDN 的两个一百万。
    Java俄罗斯方块,老程序员花了一个周末,连接中学年代!
    面试官都震惊,你这网络基础可以啊!
    你真的会用百度吗?我不信 — 那些不为人知的搜索引擎语法
    心情不好的时候,用 Python 画棵樱花树送给自己吧
    通宵一晚做出来的一款类似CS的第一人称射击游戏Demo!原来做游戏也不是很难,连憨憨学妹都学会了!
    13 万字 C 语言从入门到精通保姆级教程2021 年版
    10行代码集2000张美女图,Python爬虫120例,再上征途
Copyright © 2022 侵权请联系2656653265@qq.com    京ICP备2022015340号-1
正则表达式工具 cron表达式工具 密码生成工具

京公网安备 11010502049817号