目前很多业务的场景,使用mysql进行搜索时不够现实的,因为很多业务的搜索场景都是跨不同的业务场景,因此需要搜索的场景,需要将多种不同的业务数据源dump到搜索引擎中形成一张宽表,对这个宽表进行搜索。
目前业务开源的搜索引擎,es,solor,
阿里开源 | 大规模分布式检索系统Havenask
阿里的opensearch 收费
内部需要一个中间件,将离线数据表,在线mysql数据表,以及增量的数据进行以更新搜索引擎的宽表,这样就可以是实现搜索引擎工程的能力,
具体的推荐算法,数据挖掘可以基于搜索之后的结果排序的时候,按照算法再次进行排序。