• 如何通过ip查询用户的归属地


    背景

    最近公司做了一些营销活动,投入资金进行了流量推广,pv、UV都做了统计。老板说,我要看下用户的区域分布的数据。

    以前的文章我讲过,pv、UV如何统计?我们是基于ip进行统计的。用的ip能获取到,那通过ip查询归属地就ok了。

    思维扩展下,ip 查询归属地的的场景还蛮多的,我列举一些:

    场景

    1. 网络安全调查:当发生网络攻击或恶意行为时,通过查询IP地址的归属地可以帮助调查人员追踪攻击者的位置和身份,进而采取相应的应对措施。
    2. 电商网站反欺诈:电商平台可以通过查询IP的归属地来检测是否有异常行为,如异地登录或使用虚假身份信息下单,从而防止欺诈行为发生。
    3. 广告定向投放:在在线广告市场中,根据用户所在地区进行IP归属地查询可以帮助广告主精准定位目标受众,提高广告投放效果和ROI。
    4. 地理位置服务:地图应用、天气预报和周边生活服务等可以利用IP归属地查询来确定用户的大概地理位置,提供个性化的地理服务和信息。
    5. 网站流量分析:网站管理员可以利用IP归属地查询来分析网站访问的地域分布情况,评估市场覆盖范围,制定针对性的营销策略和内容优化计划。

    这些具体的使用场景说明了IP归属地查询在网络安全、营销推广、个性化服务等方面的重要作用,能够帮助用户更好地理解用户行为和优化业务流程。

    谷歌搜索了下,第三方提供的ip查询归属地服务,挺多的,但是收费、收费、收费!!!免费也有些,但是怕不稳定。

    无意间找到了ip2region这个项目,一直持续维护更新,试用后,效果杠杆的。那我们怎么用的,继续往下看

    ip2region

    Ip2region 是什么

    ip2region - 是一个离线IP地址定位库和IP定位数据管理框架,10微秒级别的查询效率,提供了众多主流编程语言的 xdb 数据生成和查询客户端实现。

    Ip2region 特性

    1、IP 数据管理框架

    xdb 支持亿级别的 IP 数据段行数,默认的 region 信息都固定了格式:国家|区域|省份|城市|ISP,缺省的地域信息默认是0。 region 信息支持完全自定义,例如:你可以在 region 中追加特定业务需求的数据,例如:GPS信息/国际统一地域信息编码/邮编等。也就是你完全可以使用 ip2region 来管理你自己的 IP 定位数据。

    2、数据去重和压缩

    xdb 格式生成程序会自动去重和压缩部分数据,默认的全部 IP 数据,生成的 ip2region.xdb 数据库是 11MiB,随着数据的详细度增加数据库的大小也慢慢增大。

    3、极速查询响应

    即使是完全基于 xdb 文件的查询,单次查询响应时间在十微秒级别,可通过如下两种方式开启内存加速查询:

    1. vIndex 索引缓存 :使用固定的 512KiB 的内存空间缓存 vector index 数据,减少一次 IO 磁盘操作,保持平均查询效率稳定在10-20微秒之间。
    2. xdb 整个文件缓存:将整个 xdb 文件全部加载到内存,内存占用等同于 xdb 文件大小,无磁盘 IO 操作,保持微秒级别的查询效率。

    Ip2region 支持那些语言

    Ip2region大部分主流语言都支持,支持的语言如下:

    Ip2region怎么用

    在这里,我以golang语言作为演示,其他语言,可以看下官方文档

    例子:我需要查询ip为:218.63.140.248 的归属地

    下载ip2region.xdb包

    访问ip2region 项目,ip的库文件在data目录下,点击下载即可

    package 获取

    go get github.com/lionsoul2014/ip2region/binding/golang
    
    • 1

    完全基于文件的查询

    package main
    
    import (
    	"fmt"
    	"github.com/lionsoul2014/ip2region/binding/golang/xdb"
    	"time"
    )
    
    func main() {
    	//dbPath写入你下载的ip2region.xdb文件的路径,我这里放在了当前目录下
    	var dbPath = "ip2region.xdb"
    	searcher, err := xdb.NewWithFileOnly(dbPath)
    	if err != nil {
    		fmt.Printf("failed to create searcher: %s\n", err.Error())
    		return
    	}
    	defer searcher.Close()
    	// 查询218.63.140.248对应的地址
    	var ip = "218.63.140.248"
    	var tStart = time.Now()
    	region, err := searcher.SearchByStr(ip)
    	if err != nil {
    		fmt.Printf("failed to SearchIP(%s): %s\n", ip, err)
    		return
    	}
    	fmt.Printf("{region: %s, took: %s}\n", region, time.Since(tStart))
    	// 备注:并发使用,每个 goroutine 需要创建一个独立的 searcher 对象。
    }
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13
    • 14
    • 15
    • 16
    • 17
    • 18
    • 19
    • 20
    • 21
    • 22
    • 23
    • 24
    • 25
    • 26
    • 27
    • 28

    查询结果

    此ip的归属地为: 中国云南省昆明市电信

    缓存整个 xdb 数据

    可以预先加载整个 ip2region.xdb 到内存,完全基于内存查询,类似于之前的 memory search 查询。

    package main
    
    import (
    	"fmt"
    	"github.com/lionsoul2014/ip2region/binding/golang/xdb"
    	"time"
    )
    
    func main() {
    	//dbPath写入你下载的ip2region.xdb文件的路径,我这里放在了当前目录下
    	var dbPath = "ip2region.xdb"
    	// 1、从 dbPath 加载整个 xdb 到内存
    	cBuff, err := xdb.LoadContentFromFile(dbPath)
    	if err != nil {
    		fmt.Printf("failed to load content from `%s`: %s\n", dbPath, err)
    		return
    	}
    
    	// 2、用全局的 cBuff 创建完全基于内存的查询对象。
    	searcher, err := xdb.NewWithBuffer(cBuff)
    	if err != nil {
    		fmt.Printf("failed to create searcher with vector index: %s\n", err)
    		return
    	}
    	defer searcher.Close()
    	// 查询218.63.140.248对应的地址
    	var ip = "218.63.140.248"
    	var tStart = time.Now()
    	region, err := searcher.SearchByStr(ip)
    	if err != nil {
    		fmt.Printf("failed to SearchIP(%s): %s\n", ip, err)
    		return
    	}
    	fmt.Printf("{region: %s, took: %s}\n", region, time.Since(tStart))
    	// 备注:并发使用,每个 goroutine 需要创建一个独立的 searcher 对象。
    }
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13
    • 14
    • 15
    • 16
    • 17
    • 18
    • 19
    • 20
    • 21
    • 22
    • 23
    • 24
    • 25
    • 26
    • 27
    • 28
    • 29
    • 30
    • 31
    • 32
    • 33
    • 34
    • 35
    • 36

    查询结果:

    方案比对

    • 基于文件的查询,响应时间:38us
    • 基于缓存的查询,响应时间:10.29µs

    生成环境使用建议使用方式为:基于缓存的查询

    生产如何使用

    以上的演示,只是个demo,如果要放在线上如何使用呢?

    1. 以sdk的形式嵌入到项目,使用基于缓存的查询方式。
    2. ip查询的场景很多,可以单独构建一个ip查询的公共服务,提高给各个业务线使用

    sdk接入的方式,用到的业务线都需要对接一次,ip2region.xdb如果有更新,所有用到的项目都要自己去更新升级db文件,维护成本太高。如果你的项目比较单一,sdk接入也是不错的

    我们的方案:因为我业务线相对太多,如果各个业务线自己接,维护的成本太高。我们决定构建IP查询归属地公共服务,往外提供查询的能力。后续服务的升级、维护等,统一在公共服务里面来做。

  • 相关阅读:
    javacpp 映射
    Django重定向类HttpResponseRedirect、HttpResponsePermanentRedirect和重定向函数redirect
    1452_TC275 DataSheet阅读笔记13_供电
    【数据库原理及应用】——关系数据库的规范化理论(学习笔记)
    【MATLAB教程案例38】语音信号的去噪方法matlab仿真学习——LMS自适应滤波,谱减法去噪滤波及维纳滤波等
    Django DRF 分页
    ASEMI代理艾赛斯IGBT管IXYB82N120C3H1
    redis集群-主从复制
    2019年互联网高频Java面试题指南!互联网升职加薪方案!
    深圳外籍国际学校ib成绩如何?
  • 原文地址:https://blog.csdn.net/qq_33228984/article/details/136398136