Java 爬取网页

Dear 丶 2023-05-21 11:47 319阅读 0赞
我们使用 net.URL 类的 URL() 构造函数来抓取网页

代码如下

  1. import java.io.BufferedReader;
  2. import java.io.BufferedWriter;
  3. import java.io.FileWriter;
  4. import java.io.InputStreamReader;
  5. import java.net.URL;
  6. public class Main {
  7. public static void main(String[] args)
  8. throws Exception {
  9. URL url = new URL("http://www.baidu.com");
  10. BufferedReader reader = new BufferedReader
  11. (new InputStreamReader(url.openStream()));
  12. BufferedWriter writer = new BufferedWriter
  13. (new FileWriter("test.html"));
  14. String line;
  15. while ((line = reader.readLine()) != null) {
  16. System.out.println(line);
  17. writer.write(line);
  18. writer.newLine();
  19. }
  20. reader.close();
  21. writer.close();
  22. }
  23. }

结果输出

  1. <!DOCTYPE html> <html> <head> <meta charset="UTF-8"/> <meta http-equiv="X-UA-Compatible" content="IE=11,IE=10,IE=9,IE=8"/>……

在这里插入图片描述

发表评论

表情:
评论列表 (有 0 条评论,319人围观)

还没有评论,来说两句吧...

相关阅读