Java 爬取网页

Dear 丶 2023-05-21 11:47 319阅读 0赞

我们使用 net.URL 类的 URL() 构造函数来抓取网页

代码如下

import java.io.BufferedReader;
import java.io.BufferedWriter;
import java.io.FileWriter;
import java.io.InputStreamReader;
import java.net.URL;
public class Main { 
   public static void main(String[] args) 
   throws Exception { 
      URL url = new URL("http://www.baidu.com");
      BufferedReader reader = new BufferedReader
      (new InputStreamReader(url.openStream()));
      BufferedWriter writer = new BufferedWriter
      (new FileWriter("test.html"));
      String line;
      while ((line = reader.readLine()) != null) { 
         System.out.println(line);
         writer.write(line);
         writer.newLine();
      }
      reader.close();
      writer.close();
   }
}

结果输出

<!DOCTYPE html> <html> <head> <meta charset="UTF-8"/> <meta http-equiv="X-UA-Compatible" content="IE=11,IE=10,IE=9,IE=8"/>……

在这里插入图片描述

发表评论取消回复

表情：

评论列表（有 0 条评论，319人围观）

Java 爬取网页

我们使用 net.URL 类的 URL() 构造函数来抓取网页

发表评论取消回复

还没有评论，来说两句吧...

相关阅读

相关 Python爬取网页内容

相关 Java 爬取网页

相关 Java爬取网页数据

相关 java 爬取网页代码

相关 Java代码实现网页数据爬取-HttpClient

相关 java 爬取网页内容。标题、图片等

相关学习python爬取网页

相关 Java爬取网页内容的简单例子

相关网页源码爬取

相关爬取网页图片

随便看看

Linux之IO模型/IO复用模型

算法笔记【4】存图

Python序列复习

3D可视化（互联网）

Leetcode No.9

常见电路分析十一：y型连接和三角形连接

教程文章

热评文章

1江湖小白之一起学Python （二）爬取数据的保存

2Java Shiro：简化身份验证和授权的安全框架

3Java中try()catch{}的使用方法

4Swagger注解-@ApiModel 和 @ApiModelProperty

5windows下强制杀死tomcat进程

6uni-app 条形码(一维码)/二维码生成实现

标签列表