91av视频/亚洲h视频/操亚洲美女/外国一级黄色毛片 - 国产三级三级三级三级

  • 大小: 749KB
    文件類型: .zip
    金幣: 2
    下載: 1 次
    發(fā)布日期: 2021-06-17
  • 語言: Java
  • 標(biāo)簽: java??

資源簡介

最近,由于一些需要,用到了java和正則,做了個的足球網(wǎng)站的數(shù)據(jù)采集程序,由于是第一次做關(guān)于java的html頁面數(shù)據(jù)采集,必然在網(wǎng)上查找了很多資料,但是發(fā)現(xiàn)運(yùn)用如此廣泛的java在使用正則做html采集方面的(中文)文章是少之又少,都是簡單的談了下java正則的概念,沒有真正用在實際網(wǎng)頁html采集,所以實例教程更是寥寥無幾(雖然java有它自己的Html Parser,而且十分強(qiáng)大),但個人覺得作為如此深入人心的正則表達(dá)式,理應(yīng)有其相關(guān)的java實例教程,而且應(yīng)該很多很全.于是在完成java版的html數(shù)據(jù)采集程序之后,本人便打算寫個關(guān)于正則表達(dá)式在java上的html頁面采集,以便有相關(guān)興趣的讀者更好的學(xué)習(xí).

資源截圖

代碼片段和文件信息

import?java.io.BufferedReader;
import?java.io.IOException;
import?java.io.InputStreamReader;
import?java.net.URL;
/**
?*?DataStorage類?用于數(shù)據(jù)的收集和存儲
?*?@author?SoFlash?-?博客園??http://www.cnblogs.com/longwu
?*/
public?class?DataStorage?{

public?void?dataStore()?{
//?首先用一個字符串?來裝載網(wǎng)頁鏈接
String?strUrl?=?“http://www.footballresults.org/league.php?all=1&league=EngPrem“;

String?sqlLeagues?=?““;
try?{
//?創(chuàng)建一個url對象來指向?該網(wǎng)站鏈接?括號里()裝載的是該網(wǎng)站鏈接的路徑
//?更多可以看看?http://wenku.baidu.com/view/8186caf4f61fb7360b4c6547.html
URL?url?=?new?URL(strUrl);
//?InputStreamReader?是一個輸入流讀取器?用于將讀取的字節(jié)轉(zhuǎn)換成字符
//?更多可以看看?http://blog.sina.com.cn/s/blog_44a05959010004il.html
InputStreamReader?isr?=?new?InputStreamReader(url.openStream()
“utf-8“);?//?統(tǒng)一使用utf-8?編碼模式
//?使用?BufferedReader?來讀取?InputStreamReader?轉(zhuǎn)換成的字符
BufferedReader?br?=?new?BufferedReader(isr);
String?strRead?=?““;?//?new?一個字符串來裝載?BufferedReader?讀取到的內(nèi)容

//?定義3個正則?用于獲取我們需要的數(shù)據(jù)
String?regularDate?=?“(\\d{12}\\.\\d{12}\\.\\d{4})“;
String?regularTwoTeam?=?“>[^<>]*“;
String?regularResult?=?“>(\\d{12}-\\d{12})“;

//創(chuàng)建?GroupMethod類的對象?gMethod?方便后期調(diào)用其類里的?regularGroup方法
GroupMethod?gMethod?=?new?GroupMethod();
????????????//創(chuàng)建DataStructure數(shù)據(jù)結(jié)構(gòu)?類的對象???用于數(shù)據(jù)下面的數(shù)據(jù)存儲
DataStructure?ds?=?new?DataStructure();
//創(chuàng)建MySql類的對象?用于執(zhí)行MySql語句
MySql?ms?=?new?MySql();
int?i?=?0;?//?定義一個i來記錄循環(huán)次數(shù)?即收集到的球隊比賽結(jié)果數(shù)
int?index?=?0;?//?定義一個索引?用于獲取分離?2個球隊的數(shù)據(jù)?因為2個球隊正則是相同的
//?開始讀取數(shù)據(jù)?如果讀到的數(shù)據(jù)不為空?則往里面讀
while?((strRead?=?br.readLine())?!=?null)?{
/**
?*?用于捕獲日期數(shù)據(jù)
?*/
String?strGet?=?gMethod.regularGroup(regularDate?strRead);
//?如果捕獲到了符合條件的?日期數(shù)據(jù)?則打印出來

if?(!strGet.equals(““))?{
//System.out.println(“Date:“?+?strGet);
//將收集到的日期存在數(shù)據(jù)結(jié)構(gòu)里
ds.date?=?strGet;
//?這里索引+1?是用于獲取后期的球隊數(shù)據(jù)
++index;?//?因為在html頁面里?源代碼里?球隊數(shù)據(jù)是在剛好在日期之后
}
/**
?*?用于獲取2個球隊的數(shù)據(jù)
?*/
strGet?=?gMethod.regularGroup(regularTwoTeam?strRead);
if?(!strGet.equals(““)?&&?index?==?1)?{?//?索引為1的是主隊數(shù)據(jù)
//?通過subtring方法?分離出?主隊數(shù)據(jù)
strGet?=?strGet.substring(1?strGet.indexOf(““));
//System.out.println(“HomeTeam:“?+?strGet);?//?打印出主隊
//將收集到的主隊名稱?存到?數(shù)據(jù)結(jié)構(gòu)里
ds.homeTeam?=?strGet;
index++;?//?索引+1之后?為2了
//?通過subtring方法?分離出?客隊
}?else?if?(!strGet.equals(““)?&&?index?==?2)?{?//?這里索引為2的是客隊數(shù)據(jù)
strGet?=?strGet.substring(1?strGet.indexOf(““));
//System.out.println(“AwayTeam:“?+?strGet);?//?打印出客隊
//將收集到的客隊名稱?存到數(shù)據(jù)結(jié)構(gòu)里
ds.awayTeam?=?strGet;
index?=?0;??//收集完客隊名稱后?需要將索引還原?用于收集下一條數(shù)據(jù)的主隊名稱
}
/**
?*?用于獲取比賽結(jié)果
?*/
strGet?=?gMethod.regularGroup(regularResult?strRead);
if?(!strGet.equals(““))?{
//?這里同樣用到了substring方法?來剔除‘<‘?和?““?標(biāo)簽?來獲取我們想要的比賽結(jié)果
strGet?=?strGet.substring(1?strGet.indexOf(““));
//System.out.println(“Result:“?+?strGet);
ds.result?=?strGet;?//將收集到的比賽結(jié)果存到數(shù)據(jù)結(jié)構(gòu)里
//System.o

?屬性????????????大小?????日期????時間???名稱
-----------?---------??----------?-----??----
?????目錄???????????0??2012-01-23?06:04??htmlDataStorage\
?????文件?????????375??2012-01-03?01:29??htmlDataStorage\.classpath
?????文件?????????403??2011-12-22?23:32??htmlDataStorage\.project
?????目錄???????????0??2012-01-23?06:04??htmlDataStorage\.settings\
?????文件?????????629??2011-12-22?23:32??htmlDataStorage\.settings\org.eclipse.jdt.core.prefs
?????目錄???????????0??2012-01-23?06:04??htmlDataStorage\bin\
?????文件????????2896??2012-01-23?06:02??htmlDataStorage\bin\DataStorage.class
?????文件?????????355??2012-01-23?06:02??htmlDataStorage\bin\DataStructure.class
?????文件?????????873??2012-01-23?06:02??htmlDataStorage\bin\GroupMethod.class
?????文件?????????450??2012-01-23?06:03??htmlDataStorage\bin\Main.class
?????文件????????1739??2012-01-23?06:02??htmlDataStorage\bin\MySql.class
?????文件??????789885??2011-11-10?18:31??htmlDataStorage\mysql-connector-java-5.1.18-bin.jar
?????目錄???????????0??2012-01-23?06:04??htmlDataStorage\src\
?????文件????????4267??2012-01-23?06:02??htmlDataStorage\src\DataStorage.java
?????文件?????????259??2012-01-23?06:02??htmlDataStorage\src\DataStructure.java
?????文件?????????586??2012-01-23?06:02??htmlDataStorage\src\GroupMethod.java
?????文件?????????281??2012-01-23?06:03??htmlDataStorage\src\Main.java
?????文件????????1360??2012-01-23?06:02??htmlDataStorage\src\MySql.java

評論

共有 條評論

相關(guān)資源