开源模型应用落地-业务优化篇（六）

一、前言

经过线程池优化、请求排队和服务实例水平扩容等措施，整个AI服务链路的性能得到了显著地提升。但是，作为追求卓越的大家，绝不会止步于此。我们的目标是在降低成本和提高效率方面不断努力，追求最佳结果。如果你们在实施AI项目方面有经验，那一定会对GPU服务器的高昂价格感到惋惜。一台基础的v100 24G的GPU云服务器就需要将近3,000元人民币/月。导致很多公司都希望尝试AI，但面对昂贵的服务器成本，只能退缩。接下来，让我们一起努力，对项目进行深度优化，探索更好的解决方案。

通过“开源模型应用落地-业务优化篇（五）”学习，我们已经搭建了基于Redis的第一级缓存，本篇将尝试使用向量数据库Miluvs作为AI服务的第二级缓存。

二、术语

2.1、向量数据库

向量数据库是一种专门用于存储和处理高维向量数据的数据库系统。与传统的关系型数据库或文档数据库不同，向量数据库的设计目标是高效地支持向量数据的索引和相似性搜索。

在传统数据库中，数据通常是以结构化的表格形式存储，每个记录都有预定义的字段。但是，对于包含大量高维向量的数据，如图像、音频、文本等，传统的数据库模型往往无法有效地处理。向量数据库通过引入特定的数据结构和索引算法，允许高效地存储和查询向量数据。

向量数据库的核心概念是向量索引。它使用一种称为向量空间模型的方法，

相关阅读:
R绘制世界统计地图——猴痘最新数据
java学习第六步-常见类和api
精通Git（四）——Git服务器
ElasticSearch浅谈
Kotlin 操作集合的高阶函数
【MyBatis】MyBatis查询数据库
Istio Service Entry介绍
Qt扫盲-QSqlTableModel理论总结
Flink学习7：应用程序结构
【Bug】Apache POI 读取Excel小数补位问题

原文地址：https://blog.csdn.net/qq839019311/article/details/136210398