国产乱人视频免费观看网站,九九精品视频在线观看,九九久re8在线精品视频,日韩久久精品五月综合

<menu id="zjelp"></menu>

    <th id="zjelp"><tbody id="zjelp"><form id="zjelp"></form></tbody></th>
    <small id="zjelp"><menuitem id="zjelp"></menuitem></small>
  • <small id="zjelp"></small>

    <address id="zjelp"></address>
    <address id="zjelp"></address>
    java網(wǎng)絡爬蟲簡單實現(xiàn)

    java網(wǎng)絡爬蟲簡單實現(xiàn)

    ID:6075477

    大小:82.50 KB

    頁數(shù):14頁

    時間:2018-01-02

    java網(wǎng)絡爬蟲簡單實現(xiàn)_第1頁
    java網(wǎng)絡爬蟲簡單實現(xiàn)_第2頁
    java網(wǎng)絡爬蟲簡單實現(xiàn)_第3頁
    java網(wǎng)絡爬蟲簡單實現(xiàn)_第4頁
    java網(wǎng)絡爬蟲簡單實現(xiàn)_第5頁
    資源描述:

    《java網(wǎng)絡爬蟲簡單實現(xiàn)》由會員上傳分享,免費在線閱讀,更多相關內(nèi)容在行業(yè)資料-天天文庫

    1、首先介紹每個類的功能:DownloadPage.java的功能是下載此超鏈接的頁面源代碼.FunctionUtils.java的功能是提供不同的靜態(tài)方法,包括:頁面鏈接正則表達式匹配,獲取URL鏈接的元素,判斷是否創(chuàng)建文件,獲取頁面的Url并將其轉換為規(guī)范的Url,截取網(wǎng)頁網(wǎng)頁源文件的目標內(nèi)容。HrefOfPage.java的功能是獲取頁面源代碼的超鏈接。UrlDataHanding.java的功能是整合各個給類,實現(xiàn)url到獲取數(shù)據(jù)到數(shù)據(jù)處理類。UrlQueue.java的未訪問Url隊列。Vis

    2、itedUrlQueue.java已訪問過的URL隊列。下面介紹一下每個類的源代碼:DownloadPage.java此類要用到HttpClient組件。?1.packagecom.sreach.spider;2.3.importjava.io.IOException;4.importorg.apache.http.HttpEntity;5.importorg.apache.http.HttpResponse;6.importorg.apache.http.client.ClientProtocol

    3、Exception;7.importorg.apache.http.client.HttpClient;8.importorg.apache.http.client.methods.HttpGet;9.importorg.apache.http.impl.client.DefaultHttpClient;10.importorg.apache.http.util.EntityUtils;11.12.publicclassDownloadPage13.{14.15.????/**16.??????*根

    4、據(jù)URL抓取網(wǎng)頁內(nèi)容17.??????*?18.??????*@paramurl19.??????*@return20.??????*/21.????publicstaticStringgetContentFormUrl(Stringurl)1.????{2.????????/*實例化一個HttpClient客戶端*/3.????????HttpClientclient=newDefaultHttpClient();4.????????HttpGetgetHttp=newHttpGet(url);5

    5、.6.????????Stringcontent=null;7.8.????????HttpResponseresponse;9.????????try10.????????{11.????????????/*獲得信息載體*/12.????????????response=client.execute(getHttp);13.????????????HttpEntityentity=response.getEntity();14.15.????????????VisitedUrlQueue.addE

    6、lem(url);16.17.????????????if(entity!=null)18.????????????{19.????????????????/*轉化為文本信息*/20.????????????????content=EntityUtils.toString(entity);21.22.????????????????/*判斷是否符合下載網(wǎng)頁源代碼到本地的條件*/23.????????????????if(FunctionUtils.isCreateFile(url)24.??????

    7、??????????????????&&FunctionUtils.isHasGoalContent(content)!=-1)25.????????????????{26.????????????????????FunctionUtils.createFile(FunctionUtils27.????????????????????????????.getGoalContent(content),url);28.????????????????}29.????????????}30.31.????

    8、????}catch(ClientProtocolExceptione)1.????????{2.????????????e.printStackTrace();3.????????}catch(IOExceptione)4.????????{5.????????????e.printStackTrace();6.????????}finally7.????????{8.????????????client.getConnectionManager().shutdow

    當前文檔最多預覽五頁,下載文檔查看全文

    此文檔下載收益歸作者所有

    當前文檔最多預覽五頁,下載文檔查看全文
    溫馨提示:
    1. 部分包含數(shù)學公式或PPT動畫的文件,查看預覽時可能會顯示錯亂或異常,文件下載后無此問題,請放心下載。
    2. 本文檔由用戶上傳,版權歸屬用戶,天天文庫負責整理代發(fā)布。如果您對本文檔版權有爭議請及時聯(lián)系客服。
    3. 下載前請仔細閱讀文檔內(nèi)容,確認文檔內(nèi)容符合您的需求后進行下載,若出現(xiàn)內(nèi)容與標題不符可向本站投訴處理。
    4. 下載文檔時可能由于網(wǎng)絡波動等原因無法下載或下載錯誤,付費完成后未能成功下載的用戶請聯(lián)系客服處理。