关注它,不迷路。
本文章中所有内容仅供学习交流,不可用于任何商业用途和非法用途,否则后果自负,如有侵权,请联系作者立即删除!
我相信做币圈爬虫的兄弟,或多或少的见过类似下面的混淆js:
大部分的变量名,主要以 "__p_" 开头,分析下来,其实是ob混淆上面再套了一层壳。
再去掉第一层壳以后,发现还套了一层,它的函数如下:
- function __p_1295650017_calc(__p_0552970006, __p_6576181459) {
- switch (__p_3757655876) {
- case 12:
- return !__p_0552970006;
- case 26:
- return -__p_0552970006;
- case -29:
- return __p_0552970006 + __p_6576181459;
- case -6:
- return __p_0552970006 - __p_6576181459;
- case 57:
- return ~__p_0552970006;
- case 35:
- return __p_0552970006 / __p_6576181459;
- case 3:
- return __p_0552970006 * __p_6576181459;
- case 2:
- return typeof __p_0552970006;
- case 6:
- return void __p_0552970006;
- }
- }
这个混淆函数很有意思,它有两个形参,函数里面有包含一个全局变量
__p_3757655876,而这个全局变量,又由下面的函数来控制:
- function __p_2245858992(a) {
- a = __p_3757655876 + (__p_3757655876 = a, 0);
- return a;
- }
而上面的 混淆函数,它的函数调用有这样的:
__p_1295650017_calc(1940, __p_3757655876 = 26)
函数的结果很明显是 -26;
也有这样的:
__p_1295650017_calc(_0x10e09f(746), "e", __p_2245858992(-29))
函数的结果很明显是 _0x10e09f(746) + "e";
还有一个,就是,对于不同版本的混淆文件,它的这个函数定义是变化着的,如:
- function __p_0807818337_calc(__p_9916442306, __p_4970943498) {
- switch (__p_3679524284) {
- case 13:
- return !__p_9916442306;
- case 7:
- return -__p_9916442306;
- case 31:
- return __p_9916442306 + __p_4970943498;
- case 3:
- return __p_9916442306 - __p_4970943498;
- case 21:
- return ~__p_9916442306;
- case 50:
- return __p_9916442306 / __p_4970943498;
- case -47:
- return __p_9916442306 * __p_4970943498;
- case 18:
- return typeof __p_9916442306;
- case 55:
- return void __p_9916442306;
- }
- }
如果想要写出通用的插件,就得找出它的共同点。先来看看有哪些共同点:
函数名不一样,但都以 _calc 结尾
函数体结构是一样的,但是 每个case 后面的值不一样。
case体是一样的,都是 return 语句。
很快写出代码:
- const getCalcFunction =
- {
- FunctionDeclaration(path)
- {
- let {scope,node} = path;
-
- let {id,body,params} = node;
-
- let name = id.name;
-
- if (!name.endsWith('calc'))
- {
- return;
- }
-
- }
- }
因为整个混淆js,只有它是以 "calc" 结尾的,因此,只需简单的判断一下就可以了。
接下来怎么写呢?
根据每个case 里的return语句来写?
观察 每个case里的return语句,拿到在线解析网站上观察,只有两种类型:
BinaryExpression 和 UnaryExpression 类型,而它们有个共同点,都有 operator 这个子节点,即操作符。因此,我们可以使用 一个 Object类型的变量来保存它.即通过每个 case的值 和 operator 来注册一个键值对,保存起来。遍历的时候去取就可以了。
- const getCalcFunction =
- {
- FunctionDeclaration(path)
- {
- let {scope,node} = path;
-
- let {id,body,params} = node;
-
- let name = id.name;
-
- if (!name.endsWith('calc'))
- {
- return;
- }
- let newMap = new Object();
- let cases = body.body[0].cases;
-
- for (let eachCase of cases)
- {
- let {test,consequent} = eachCase;
-
- let value = test.value || -test.argument.value;
-
- let operator = consequent[0].argument.operator;
-
- newMap[value] = operator;
- }
-
-
- console.log(newMap);
-
- }
- }
打印结果:
拿到了 case 的值和 它的操作符,再去构造节点就简单了。
这里也许你有个疑问,就是 BinaryExpression 和 UnaryExpression 它们有个共同的操作符: "-",如何区分呢?
当然是根据它函数调用的实参个数来区分了。实参是2个的时候,它肯定是UnaryExpression 类型;实参是3个的时候,它肯定是 BinaryExpression 类型。
文件demo在星球里,请星友们完成后续的还原工作:
https://t.zsxq.com/13Sv5Igr1
今天的文章就分享到这里,后续分享更多的技巧,敬请期待。
欢迎加入知识星球,学习更多AST和爬虫技巧。