WEB逆向—X-Bogus逆向分析(纯算+补环境)

声明

本文章中所有内容仅供学习交流，抓包内容、敏感网址、数据接口均已做脱敏处理，严禁用于商业用途和非法用途，否则由此产生的一切后果均与作者无关，若有侵权，请联系我立即删除！

前言

此平台本人仅限研究。只针对某些算法参数进行研究。网站链接自己去找。

流程分析

这里就不多说了

直接看接口。发现有两个字需要我们逆向

msToken:

X-Bogus:

msToken

这里msToken 跟断点走。往上追栈后发现是直接读取的cookie里的。然后看了一下。然后测试了一下这个有点像每次请求的token令牌。

这个应该可以模拟生成的。

不重要暂时写死都行。这里也提供一份代码。

import random

def get_ms_token(randomlength=107):

"""

根据传入长度产生随机字符串

"""

random_str = ''

base_str = 'ABCDEFGHIGKLMNOPQRSTUVWXYZabcdefghigklmnopqrstuvwxyz0123456789='

length = len(base_str) - 1

for _ in range(randomlength):

random_str += base_str[random.randint(0, length)]

return random_str

xb

这里话也不多说了。

直接讲流程。

首先如下图所示

然后跳到断点之后往上找断点。

到达如图所示位置之后

这个apply啥意思就不多说了直接插桩

1	`_0x2458f0['apply'](_0xc26b5e, _0x1f1790)==28(xb的长度)`

然后单点调试下一步 ok 到达了一个JSVMP的方法。然后传的值都是字节码然后把这些汇编代码转换为JS代码

这里就考虑两种方法了。要不插桩纯算。要不补环境。

补环境

先说补环境。

直接全扣下来。

然后在下图位置赋值。

然后著名语录：缺啥补啥。

这里已经补完了就这么点。

window = global

document = {}

document.addEventListener = function () {}

navigator = {

"userAgent": 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/120.0.0.0 Safari/537.366'

}

然后直接得到答案

至于这个警告。是一个弃用警告。代表这个Buffer这个方法已经不用了。可以通过修改代码

然后看看传参是什么

然后给他封装成参数去调用就可以了。

算法

这里我们看到这个文件里其实是经过混淆的非常不利于我们分析加密参数。

所以我们需要使用到ast等工具对他进行解混淆。

然后通过解混淆完了的JS 进行文件重写覆盖。

这里简单讲讲流程。

选择替换内容。浏览器会自动帮我们把js保存到替换的文件夹中。非常方便。

然后就能看到我们的文件了。然后复制文件。到v-tools中

然后继续往上找栈。发现下图就是JSVMP初始化的地方。并且通过执行了W方法最终获得返回值。

我们这里就直接进入文中这个W方法。

这里进去看可以看到一堆的流程控制语句。

把这个方法复制下来。可以看到。这个方法的走向就是靠判断语句执行的。然后判断语句中又有一堆的流程控制语句。

而且这个判断条件也是由传参的最后一个参数控制的。那这个就很有意思了。

里在这两短流程语句中分别打上日志断点。然后来分析其中的参数。

第一处断点

1	`"1",` `"j>>>", j,` `"A>>>>", A,` `"O>>>>>", JSON.stringify(O,` `function(key, value) {if` `(value == window) {return` `undefined}` `return` `value})`

第二处断点

1	`"2","j>>>", j,` `"A>>>>", A,` `"O>>>>>", JSON.stringify(O,` `function(key, value) {if` `(value == window) {return` `undefined}` `return` `value})`

这里一定要注意debugger不要乱删不然很容易卡死。打出来的数据非常之大。

如下图。把所有的日志断点保存然后往上找第一个X-Bogus 生成的地方。

可以看到如下图所示。是赋值值给 X-Bogus的地方。那我们去搜索这个值

这里就可以看到。越往上这个X-Bogus的值就越少。那我们大概就明白了。

这就意味着xb是一个字一个字的根据算法生成。

这里在浏览器看不是很方便。我们把控制台另存为到文件中方便我们调试。

（这里浏览器卡死了。xb的值可能不固定，不要在意细节）

首先分析下这个3 是如何生成的。

2 j>>> 16 A>>>> 716 O>>>>> [null,[null,{},null,null,"\u0002ÿ-%.*¯Ë^9õ²\u000b&7\u0012","s2","=",{"s0":"ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz0123456789+/=","s1":"Dkdpgh4ZKsQB80/Mfvw36XI1R25+WUAlEi7NLboqYTOPuzmFjJnryx9HVGcaStCe=","s2":"Dkdpgh4ZKsQB80/Mfvw36XI1R25-WUAlEi7NLboqYTOPuzmFjJnryx9HVGcaStCe="},"Dkdpgh4ZKsQB80/Mfvw36XI1R25-WUAlEi7NLboqYTOPuzmFjJnryx9HVGcaStCe=","DFSzswVOPSzANro1t-KBsNAwgYo",1214867,21],"DFSzswVOPSzANro1t-KBsNAwgYo","3","Dkdpgh4ZKsQB80/Mfvw36XI1R25-WUAlEi7NLboqYTOPuzmFjJnryx9HVGcaStCe=",[19],63,21]

也就是代表要通过上面这些值拿到 3

我们打个条件断点。去看看最后一个的生成逻辑

打断点继续往下走。

这里注意要注意我们的O 里是否会有如上值。如下图才能正确单步调试。

我们的xb值为 DFSzswVOPSzANro1t-KBsNAwgYo3

由于我们目标是获得数值3。用以下代码可以做到

1 2	`"Dkdpgh4ZKsQB80/Mfvw36XI1R25-WUAlEi7NLboqYTOPuzmFjJnryx9HVGcaStCe=".charAt(19)` `>> 3`

同理获得倒数第二位。继续看我们的日志

这里是 o，38位

根据断点可知 xb4个为一组。

charAt后面的值就是我们所需要的值。

这里就不废话太多了

str1 = "Dkdpgh4ZKsQB80/Mfvw36XI1R25-WUAlEi7NLboqYTOPuzmFjJnryx9HVGcaStCe="

// 19 = (1214867 & 63) >> 0

str1.charAt((1214867 & 63) >> 0)

//结果:3

// 38 = (1214867 & 4032) >> 6

str1.charAt((1214867 & 4032) >> 6)

// 结果:o

// 40 = (1214867 & 258048) >> 12

str1.charAt((1214867 & 258048) >> 12)

// 结果:Y

// 4 = (1214867 & 16515072) >> 18

str1.charAt((1214867 & 16515072) >> 18)

// 结果:g

上述刚好对应了 xb的最后四位

DFSz swVO PSzA Nro1t-KB sNAw gYo3

其余算法也一样。

数字算法逻辑

现在唯一可能要注意的就是这个1214867的算法是什么？

这里篇幅原因不展开搞了。反正概念都是一样。根据索引找方法。

这里 1214867 是通过位运算符的 1214720 | 147 最终得到1214867

这里又牵扯到了两个值

1214720
- 通过位运算 1179648 | 35072 移位得到1214720 那又有两个值出现了
  - 1179648 通过 18<< 16 左移得来（这里16为定值）

137 通过乱码charCodeAt得来

- 而147 则是通过乱码 charCodeAt 获取到的

有点乱梳理一下

通过乱码 charCodeAt(20)获得147
通过乱码 charCodeAt(19)获得137
通过乱码 charCodeAt(18)获得18
通过147 << 0 获得了 147（找规律得来）
通过 137 << 8 获得 35072
通过 18<< 16 获得 1179648
通过位运算 1179648 | 35072 获得1214720
位运算符的 1214720 | 147 最终得到1214867

那这个只是最后一组的。根据这四组找规律获取其他组的信息可得以下代码

const encodedString = "\u0002ÿ-%.*¯Ë^9õ²\u000b&7\u0012";

const decodingMap = "Dkdpgh4ZKsQB80/Mfvw36XI1R25-WUAlEi7NLboqYTOPuzmFjJnryx9HVGcaStCe=";

let xb = "";

for (let index = 0; index <= 20; index += 3) {

const charCode1 = encodedString.charCodeAt(index);

const charCode2 = encodedString.charCodeAt(index + 1);

const charCode3 = encodedString.charCodeAt(index + 2);

const combinedCode = charCode3 | (charCode2 << 8) | (charCode1 << 16);

const codePart1 = (combinedCode & 16515072) >> 18;

const codePart2 = (combinedCode & 258048) >> 12;

const codePart3 = (combinedCode & 4032) >> 6;

const codePart4 = combinedCode & 63;

xb += decodingMap[codePart1] + decodingMap[codePart2] + decodingMap[codePart3] + decodingMap[codePart4];

}

console.log(xb);

乱码生成分析

然后就是获取这个乱码的生成处了。可以看到如下图所示。

如上图所示。这个b的生成还是没有还原出来。我们继续来找b。

下图是生成b的地方。所以我们把这个函数也扣下来。

事实证明和上文一样。没问题。

部分代码如下

function _0x86cb82(a) {

return String.fromCharCode(a);

}

function _0x94582(a, b, c) {

return _0x86cb82(a) + _0x86cb82(b) + c;

}

function _0x25788b(a, b) {

for (var c, e = [], d = 0, t = "", f = 0; f < 256; f++) {

e[f] = f;

}

for (var r = 0; r < 256; r++) {

d = (d + e[r] + a.charCodeAt(r % a.length)) % 256, c = e[r], e[r] = e[d], e[d] = c;

}

var n = 0;

d = 0;

for (var o = 0; o < b.length; o++) {

d = (d + e[n = (n + 1) % 256]) % 256, c = e[n], e[n] = e[d], e[d] = c, t += String.fromCharCode(b.charCodeAt(o) ^ e[(e[n] + e[d]) % 256]);

}

return t;

}

function _0x398111(a, b, c, e, d, t, f, r, n, o, i, _, x, u, s, l, v, h, p) {

var y = new Uint8Array(19);

return y[0] = a, y[1] = i, y[2] = b, y[3] = _, y[4] = c, y[5] = x, y[6] = e, y[7] = u,

y[8] = d, y[9] = s, y[10] = t, y[11] = l, y[12] = f, y[13] = v, y[14] = r, y[15] = h,

y[16] = n, y[17] = p, y[18] = o, String.fromCharCode.apply(null, y);

};

这个已经弄完了。还差最后一个就是这个数组。arr其实不是一个完整的数组，而是一个个数字。

arr 共有19位。

这里说下大概。我也没有每个都去研究。

前4位是固定值

第5位到第10位通过md5 hex_md5 以及转码得到数组然后切片取其中的值。

第11位到第18位是通过时间戳还有个canvas固定值拼接而来。

最后一位通过前面的签名最终得到最后一位数组

最后通过19位数字然后编码得到乱码。

最终结果

相关阅读:
Leetcode 75.颜色分类
 连阿里P8都赞不绝口的“分布式架构原理设计笔记”到底有多牛
 苹果新专利：用AR眼镜来控制iPhone屏幕输出，保护隐私
 JavaScript高级编程
 NFT 泡沫是否已经被挤破
 电压放大器在铁电材料表征中的应用有哪些
 MSPM0G3507 ——GPIO例程讲解2——simultaneous_interrupts
本地知识库开源框架Fastgpt、MaxKB产品体验
 6.DApp-用Web3实现前端与智能合约的交互
 【brpc学习案例实践一】rpc服务构造基本流程
原文地址：https://blog.csdn.net/q2919761440/article/details/138173289