Java教程

Java爬取网页指定内容

本文主要是介绍Java爬取网页指定内容,对大家解决编程问题具有一定的参考价值,需要的程序猿们随着小编来一起学习吧!
  • 爬取网页文字:
  • import org.jsoup.Jsoup;
    import org.junit.Test;
    
    import java.io.IOException;
    
    public class Crawling {
    
    
        public static void Test() throws IOException {
            Jsoup.connect("https://soccer.hupu.com/").get().body().
                    getElementsByClass("list-item"). //class="list-item-title"
                    forEach(e->{
                System.out.println(e.text());
            });
    
        }
    
        public static void main(String[] args) {
            try {
                Test();
            } catch (IOException e) {
                e.printStackTrace();
            }
        }
    
    }
  • 爬取网页图片地址:
  • import org.jsoup.Jsoup;
    import org.junit.Test;
    
    import java.io.IOException;
    
    public class Crawling {
    
        public static void Test() throws IOException {
            Jsoup.connect("https://soccer.hupu.com/").get().body().
                    getElementsByClass("list-item-img").
                    forEach(e->{
                System.out.println(e.attr("src")); //src标签图片地址
            });
        }
    
        public static void main(String[] args) {
            try {
                Test();
            } catch (IOException e) {
                e.printStackTrace();
            }
        }
    
    }
这篇关于Java爬取网页指定内容的文章就介绍到这儿,希望我们推荐的文章对大家有所帮助,也希望大家多多支持为之网!