提取标题和正文
input输入一段文字,就从提取的网页文字开始向下删除文字
根据提供的网址,我将提取标题和正文,并根据您输入的文字,从提取的网页文字开始向下删除。
import requests
from bs4 import BeautifulSoup
def remove_text_from_start(text, input_text):
start_index = text.find(input_text)
if start_index != -1:
return text[start_index + len(input_text):]
else:
return text
# 输入网址
url = "https://m.51cmm.com/wz/WZnKubw1.html?share_token=715beaff-33ef-466b-8b6c-092880b9a716&tt_from=copy_link&utm_source=copy_link&utm_medium=toutiao_android&utm_campaign=client_share"
# 发送HTTP GET请求获取网页内容
response = requests.get(url)
html_content = response.text
# 使用BeautifulSoup解析网页内容
soup = BeautifulSoup(html_content, 'html.parser')
# 提取标题
title = soup.title.string.strip()
# 提取正文
body = soup.body.get_text().strip()
# 输入要删除的文字
input_text = input("请输入要删除的文字:")
# 从提取的网页文字开始向下删除
body = remove_text_from_start(body, input_text)
# 打印标题和正文
print("标题:", title)
print("正文:\n", body)
请在代码中的input_text = input("请输入要删除的文字:")
行输入要删除的文字。程序将会从提取的网页文字开始向下删除该文字,并打印标题和处理后的正文。