爬取网页-CFANZ编程社区

爬取网页

下面以爬取360浏览器网页为例，代码具有通用性，改变网页路径即可

代码如下

import java.io.BufferedReader;
import java.io.BufferedWriter;
import java.io.FileOutputStream;
import java.io.InputStreamReader;
import java.io.OutputStreamWriter;
import java.net.MalformedURLException;
import java.net.URL;public class Main {
public static void main(String[] args) throws Exception {
  URL url=new URL("https://hao.360.cn/?h_lnk");//获取网址
  BufferedReader bufferedReader=new BufferedReader(new InputStreamReader(url.openStream(),"utf-8"));//根据网页编码方式
  String msg=null;
  BufferedWriter bufferedWriter=new BufferedWriter(new OutputStreamWriter(new FileOutputStream("C:/a/360.html"),"utf-8"));

  while((msg=bufferedReader.readLine())!=null) {
    //System.out.println(msg);
    bufferedWriter.append(msg);
    bufferedWriter.newLine();
  }
  bufferedWriter.flush();
  bufferedReader.close();
  bufferedWriter.close();
}
}