• JavaScript提取html页面的链接和标题


    给定如下html代码,从代码中提取pathname的值和标题,返回由标题title和链接link组成的集合。

    let str = `
    
      订单管理
    
    
      
        { pathname: '/delete/order' }} test='1'>
          删除订单
        
      
      
        { pathname: '/add/order' }}>
          新增订单
        
      
    
    
    
    
      商家管理
    
    
      
        { pathname: '/delete/vendoer' }} test='1'>
          删除商家
        
      
      
        { pathname: '/add/vendoer' }}>
          新增商家
        
      
    
    
    `
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13
    • 14
    • 15
    • 16
    • 17
    • 18
    • 19
    • 20
    • 21
    • 22
    • 23
    • 24
    • 25
    • 26
    • 27
    • 28
    • 29
    • 30
    • 31
    • 32
    • 33
    • 34
    • 35

    实现

    function parser(str) {
      let i = 0;
      let list = []
      while (i < str.length) {
        let space = /\s/
        let char = str[i]
        if (space.test(char)) {
          i++;
          continue
        }
        if (char === '<') {
          let name = ''
          let props = ''
          let isFirst = true
          i++
          if (str[i] == '/') {
            while (str[i] !== '>') {
              i++;
            }
            i++;
            continue
          }
          while (i < str.length && str[i] !== '>') {
            if (space.test(str[i])) {
              isFirst = false
              i++
              continue
            }
            if (isFirst) {
              name += str[i++];
            }
            else {
              while (str[i] != '>') {
                props += str[i]
                i++
              }
            }
    
          }
          i++;
          let label = ''
          while (i < str.length && str[i] != '<') {
            if (space.test(str[i])) {
              i++
              continue;
            }
            label += str[i];
            i++;
          }
          list.push({
            name,
            props,
            label
          })
          continue
        }
      }
      return list
    }
    let result = parser(str)
    function transfer(list = []){
      let res = []
      list.forEach((item)=>{
        if(item.name == 'Link'){
          let title = item.label
          let prop = item.props
          let linkReg = /pathname:\s?'([\w\/]+)'/
          let link = prop.match(linkReg)
          res.push({
            title,
            link:link[1]
          })
        }
      })
      return res;
    }
    let transofrm = transfer(result)
    console.log(JSON.stringify(transofrm),null,2);
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13
    • 14
    • 15
    • 16
    • 17
    • 18
    • 19
    • 20
    • 21
    • 22
    • 23
    • 24
    • 25
    • 26
    • 27
    • 28
    • 29
    • 30
    • 31
    • 32
    • 33
    • 34
    • 35
    • 36
    • 37
    • 38
    • 39
    • 40
    • 41
    • 42
    • 43
    • 44
    • 45
    • 46
    • 47
    • 48
    • 49
    • 50
    • 51
    • 52
    • 53
    • 54
    • 55
    • 56
    • 57
    • 58
    • 59
    • 60
    • 61
    • 62
    • 63
    • 64
    • 65
    • 66
    • 67
    • 68
    • 69
    • 70
    • 71
    • 72
    • 73
    • 74
    • 75
    • 76
    • 77
    • 78

    结果

    [
      {
        "title": "删除订单",
        "link": "/delete/order"
      },
      {
        "title": "新增订单",
        "link": "/add/order"
      }
    ]
    
    [Done] exited with code=0 in 0.417 seconds
    
    [Running] node "/Users/sundingjia/Downloads/debug-react-source-code-16.14.0/p.js"
    [
      {
        "title": "删除订单",
        "link": "/delete/order"
      },
      {
        "title": "新增订单",
        "link": "/add/order"
      },
      {
        "title": "删除商家",
        "link": "/delete/vendoer"
      },
      {
        "title": "新增商家",
        "link": "/add/vendoer"
      }
    ]
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13
    • 14
    • 15
    • 16
    • 17
    • 18
    • 19
    • 20
    • 21
    • 22
    • 23
    • 24
    • 25
    • 26
    • 27
    • 28
    • 29
    • 30
    • 31
    • 32
  • 相关阅读:
    XP电源维修fleXPower电源X7-2J2J2P-120018系列详解
    ElasticSearch安装步骤及密码重置
    给图片添加图片水印
    Python解释器与Python编辑器的详细下载与安装过程
    一键AI去除视频水印和字幕!
    实战演练 | 使用 Navicat Premium 自动运行数据库复制
    “U锂融合”——双碳新标兵
    Golang爬虫封装
    Seata的这些安保机制是否会让你更放心
    搜索EE场景排序链路升级
  • 原文地址:https://blog.csdn.net/qq_37524886/article/details/126708508