动网论坛,站长建站首选,国内使用量最多的论坛软件 动网论坛官方技术讨论区 站长工具 申请属于您自己的免费论坛
首页 | 新闻资讯 | 网站运营 | 网络编程 | 数据库 | 服务器 | 网页设计 | 图像媒体 | 网络应用 | 搜索优化 | 资源下载 | 动网主机 | DVBOX
    本站内  互联网 ASP论坛  ASP.Net论坛  PHP论坛
  
   Asp → 阅读文章

 JSP抓取网页代码的程序

作者来源: 
阅读 1430 人次 , 2006-3-29 4:22:00 


<%@ page contenttype="text/html;charset=gb2312"%>
<%

string scurrentline;

string stotalstring;

scurrentline="";

stotalstring="";

java.io.inputstream l_urlstream;

java.net.url l_url = new java.net.url("http://www.163.net/");

java.net.httpurlconnection l_connection = (java.net.httpurlconnection) l_url.openconnection();

l_connection.connect();

l_urlstream = l_connection.getinputstream();

java.io.bufferedreader l_reader = new java.io.bufferedreader(new java.io.inputstreamreader(l_urlstream));

while ((scurrentline = l_reader.readline()) != null)

{

stotalstring+=scurrentline;

}

out.println(stotalstring);

%>

后记

  虽然代码比较简单,但是,我认为根据这个,可以实现“网络爬虫”的功能,比如从页面找href连接,然后再得到那个连接,然后再“抓”,不停止地(当然可以限定层数),这样,可以实现“网页搜索”功能。

 
 收藏本文  打印本文  论坛讨论  关闭窗口
· 上一篇:也谈用JSP实现新浪、sohu新闻系统的技术
· 下一篇:基于EJB技术的商务预订系统的开发
· ASP+ACCESS实现的无限级目录树
· 解决在执行数据库查询中的特殊字符的问题
· 将VB中的CLASS结合到VBscript中来
· 排序方式解决“上下主题”问题(一)
· 利 用 ISAPI 实 现 向 数 据 库 中 添 加 记 录 (六)


关于本站 | 联系我们 | 业务合作 | 客户案例 | 诚聘英才 | 广告合作 | 收藏本站
海口动网先锋网络科技有限公司版权所有
Copyright © 2000 - 2006 Cndw.Com
中华人民共和国电信与信息服务业务经营许可证编号 琼 ICP 020077