• 某省大学排名网络爬虫应该怎么做


    关注 码龄 粉丝数 原力等级 -- 被采纳 被点赞 采纳率 等月亮 2024-06-01 14:50 采纳率: 50% 浏览 2 首页/ 前沿技术 / 某省大学排名网络爬虫应该怎么做 python3.11 为什么无法输出只有湖北省的大学排名??湖北省份的CSS无法选择 收起 写回答 好问题 0 提建议 追加酬金 关注问题 微信扫一扫 点击复制链接 分享 邀请回答 编辑 收藏 删除 结题 收藏 举报 追加酬金 (90%的用户在追加酬金后获得了解决方案) 当前问题酬金 ¥ 0 (可追加 ¥500) ¥ 15¥ 20¥ 50¥ 100¥ 200 支付方式 扫码支付 二维码出错 点击刷新 支付金额 15 元 提供问题酬金的用户不参与问题酬金结算和分配 支付即为同意 《付费问题酬金结算规则》 结题 再想想 删除 再等等

    3条回答 默认 最新

    • Kwan的解忧杂货铺 2024-06-01 14:50
      关注

      下午好🌅🌅🌅
      本答案参考ChatGPT-3.5

      你遇到的问题在于CSS选择器无法正确地定位到湖北省的大学列表。CSS选择器location_selector='.options li'可能没有正确地匹配到包含湖北省信息的部分。在HTML结构中,

    • 标签通常用于列表项,但可能并不是所有包含地点信息的地方都使用了这个标签。

      解决方案

      1. 检查HTML结构: 首先,你需要查看HTML源代码,找出包含湖北省大学信息的正确部分。通常,这些信息可能会在不同的类名、ID或属性中,而不是直接在li标签下。

      2. 修改CSS选择器: 根据HTML结构,尝试使用更精确的选择器。例如,如果湖北省的大学信息在一个特定的

        标签内,你可以选择这个标签作为新的选择器。例如:

        location_selector='.specific-class-for-location'
        
      3. 异常处理: 如果多个元素都有相同的CSS选择器,可以添加一个额外的条件来确保只选择湖北省的大学,比如通过文本搜索或查找特定的子元素,如湖北

      4. 测试与调试: 在修改后,重新运行爬虫,并检查输出结果,确认是否正确选择了湖北省的大学。

      # 修改后的代码可能如下:
      location_selector = '.specific-class-for-location span'  # 以`.specific-class-for-location`为例,替换为实际选择器
      
      for rank_item, name_item, location_item in zip(
          soup.select(rank_selector),
          soup.select(name_selector),
          soup.select(location_selector)
      ):
          # ...其他代码保持不变...
          if '湖北' in location_item.get_text():  # 检查是否包含“湖北”
              print(f"{rank}\t{name}")
      

      记得替换.specific-class-for-location为实际找到的湖北省大学位置对应的CSS选择器。

评论 编辑记录
等月亮 2024-06-01 15:37

这个结果还是不显示

img

回复
编辑
预览

报告相同问题?

  • 相关阅读:
    周志华机器学习——聚类算法。
    嵌入式分享合集93
    MySQL数据库的增删改查(进阶)
    【考研复习】《操作系统原理》孟庆昌等编著课后习题+答案——第三章
    网络爬虫技术及应用
    日本地产咨询公司【Metros】申请1700万美元纳斯达克IPO上市
    Java--for循环
    axios的安装使用
    左孩子右兄弟(2023寒假每日一题 18)
    JavaScript基础语法(流程控制语句)
  • 原文地址:https://ask.csdn.net/questions/8112535