• 如何用 Java 爬取表单数据?


    要爬取表单数据,需要模拟HTTP请求,并将表单数据作为请求参数发送到网站服务器。Java中有许多库可以用来发送HTTP请求,例如Apache HttpClient、OkHttp等。

    以下是使用Apache HttpClient库发送POST请求并带有表单数据的示例代码:

    1. import org.apache.http.HttpEntity;
    2. import org.apache.http.HttpResponse;
    3. import org.apache.http.NameValuePair;
    4. import org.apache.http.client.HttpClient;
    5. import org.apache.http.client.entity.UrlEncodedFormEntity;
    6. import org.apache.http.client.methods.HttpPost;
    7. import org.apache.http.impl.client.HttpClientBuilder;
    8. import org.apache.http.message.BasicNameValuePair;
    9. import org.apache.http.util.EntityUtils;
    10. import java.io.IOException;
    11. import java.util.ArrayList;
    12. import java.util.List;
    13. public class FormSubmitExample {
    14. public static void main(String[] args) throws IOException {
    15. HttpClient httpClient = HttpClientBuilder.create().build();
    16. HttpPost httpPost = new HttpPost("http://example.com/submit-form");
    17. // Add form data
    18. List params = new ArrayList<>();
    19. params.add(new BasicNameValuePair("name", "John Doe"));
    20. params.add(new BasicNameValuePair("email", "johndoe@example.com"));
    21. params.add(new BasicNameValuePair("message", "Hello, world!"));
    22. httpPost.setEntity(new UrlEncodedFormEntity(params));
    23. // Execute the request and get the response
    24. HttpResponse response = httpClient.execute(httpPost);
    25. HttpEntity entity = response.getEntity();
    26. String responseString = EntityUtils.toString(entity, "UTF-8");
    27. System.out.println(responseString);
    28. }
    29. }

    在上面的示例中,我们首先创建了一个HttpClient对象,然后创建了一个HttpPost对象并设置了要提交表单数据的URL。然后,我们创建了一个List对象并向其添加了表单字段和值。接下来,我们将这个List对象编码为URL编码的表单实体,并将其设置为HttpPost对象的实体。最后,我们执行请求并获取响应,并从响应实体中提取响应字符串。

    你需要根据具体的网站和表单字段进行修改。可以在请求头中查找有关表单字段和值的信息,然后使用上述示例代码将其提交到服务器。

  • 相关阅读:
    OpenResty使用漏桶算法实现限流
    制作电子签名
    NeRF项目LLFF 解决新场景pose生成的问题
    【第51篇】用于交通预测的时空交互动态图卷积网络
    portswigger 目录遍历&文件上传
    【Java进阶】多线程(一)
    JAVA开发(分布式SpringCloud全家桶一些组件读法)
    Maven编译报错:javacTask: 源发行版 1.8 需要目标发行版 1.8
    JavaScript日期库之date-fn.js
    量子笔记:量子纠缠祛魅,贝尔纠缠态
  • 原文地址:https://blog.csdn.net/Itmastergo/article/details/133018405