Python爬虫eval混淆，爬虫进阶实战系列

文章目录

⛳️ 前置知识

历经 10 篇左右的 Python 字体反爬系列文章，我们又进入了一个新的主题，常见混淆加密原理与实践。

本篇博客从 eval 混淆开始，逐层为大家拆解 JS 逆向中混淆相关知识。

eval 函数可以将 JS 字符串解析成源码执行

在搜索引擎随机选择可进行加密 JS 代码的页面，然后加密下述内容。

加密前

var name = "橡皮擦";
1

加密后

eval(
  (function (p, a, c, k, e, d) {
    e = function (c) {
      return (
        (c < a ? "" : e(parseInt(c / a))) +
        ((c = c % a) > 35 ? String.fromCharCode(c + 29) : c.toString(36))
      );
    };
    if (!"".replace(/^/, String)) {
      while (c--) d[e(c)] = k[c] || e(c);
      k = [
        function (e) {
          return d[e];
        },
      ];
      e = function () {
        return "\\w+";
      };
      c = 1;
    }
    while (c--)
      if (k[c]) p = p.replace(new RegExp("\\b" + e(c) + "\\b", "g"), k[c]);
    return p;
  })('1 0 = "橡皮擦"', 62, 2, "name|var".split("|"), 0, {})
);
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25

可以看到加密之后的代码变得更加复杂，并且可读性变弱。

在 JS 中，eval 函数本身就是一个 JS 代码执行器，它可以将传入的字符串按照 JS 语法进行解析并执行。

解密 eval 函数的方式比较简单，直接找工具。

该形式代码最常见的场景就是百度的统计代码，具体案例你可以寻找一下。

本次我们要采集的站点是电视猫，目标地址为：https://www.tvmao.com/program/BTV1。

在该页面点击更多之后，会加载节目列表数据，得到的接口与参数如下所示。

请求网址: https://www.tvmao.com/api/pg?p=加密字符串
请求形式：GET

通过查看更多，我们可以抓取到数据请求位置。

Python爬虫eval混淆，爬虫进阶实战系列

⛳️ 电视猫实战场景

伴随断点，我们进入到 JS 逆向环节，得到的第一段代码如下所示。

$(".more-epg").click(function () {
  var b = "src";
  var a = A.d("a", b);
  ajaxVerify(
    "/api/pg",
    "GET",
    {
      p: a,
    },
    function (c, d) {
      $("#noon").after(d[1]);
      $(".more-epg").remove();
    }
  );
});
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15