这是一个简单的示意图,告诉我们,数据是由网页从数据库中取出,我们要为这个系统做客户端,我们就应该这样去改造它。
所以我继续找,经过短暂的观察,发现入口在这里
我们先看Summary选项卡,我们可以初步了解,这是一个POST请求(Http请求中的一种,另一种是GET),POST到的网址是http://coin.lib.scuec.edu.cn/cgi-bin/IlaswebBib。
这样我们的思路就清晰了,我们的客户端需要模拟浏览器,向上述地址POST一个包,那个地址肯定会返回一个Content给我们,不出意外的话,Content里面就是我们要的书目信息。那么,浏览器POST上去的内容是什么呢?我们点击这条POST请求,看详细信息,
由于是POST请求,我们先看POST DATA,里面是以键值对的形式存储的,这里显示了我们浏览器在我们搜索”android”时,POST的所有数据。那这些键值对又代表了什么呢,我们打开这个网页的源码来一探究竟。
从这段可以看出v_index是表示查找途径的它有TITLE,AUTHOR,SUBJECT,CLASSNO,ISBN,CALLNO六种值
FLD_DAT_BEG和FLD_DAT_END分别是开始和结束年份
v_value表示用户在搜索框中输入的内容
v_paggnum表示每页显示的书目条数,有10 15 20三种
v_seldatabases是检索库 有0 1 2三种值v_LogicSrch是检索方式 有0 1两种值
Submit是查询或重填,有 查 询 和 重 填 两种值
至此,我们弄清楚了POST Data里所有内容的含义和取值可能。但我们模拟POST请求为什么,其实就是为了得到搜索的书目信息,所以我们看一下返回的Content是不是我们要的东西
果然,就是我们搜到的书目信息,就以String的形式放在Content里面。最后我们查看一下Stream,截图,以防等下我们需要这里面的东西
好了,这个页面的工作原理我们已经弄清楚了:用户在网页中输入搜索内容后,点击查询,浏览器会POST一个Data到目标网址,该网址的返回信息就是搜到的书目。
我们开始编写代码,模拟这个过程,先打开eclipse建立一个Java项目(注意是Java项目,因为Java项目可以完美移植到Android项目中且调试方便,并且模拟Http请求这一过程没有用到任何Android功能)。
导入HttpClient的4个包commons-codec、commons-httpclient、commons-logging、log4j。
//实例化HttpClient HttpClient client = new HttpClient(); //Stream页面里面有Host地址 端口是80 client.getHostConfiguration().setHost("http://coin.lib.scuec.edu.cn", 80); //用目标地址 实例一个POST方法 PostMethod post = new PostMethod("http://coin.lib.scuec.edu.cn/cgi-bin/IlaswebBib"); //将需要的键值对写出来 NameValuePair beg = new NameValuePair("FLD_DAT_BEG" , “”); NameValuePair end = new NameValuePair("FLD_DAT_END" , “”); NameValuePair submit = new NameValuePair("submit" , "查 询")); NameValuePair vIndex = new NameValuePair("v_index" , “TITLE”); NameValuePair vLogicSrch = new NameValuePair("v_LogicSrch" , "0"); NameValuePair vPagenum = new NameValuePair("v_pagenum" , "10"); NameValuePair vSeldatabase = new NameValuePair("v_seldatabase" , "0"); NameValuePair vValue = new NameValuePair("v_value" ,”android”); //给POST方法加入上述键值对 post.setRequestBody(new NameValuePair[] {beg , end , submit , vIndex , vLogicSrch , vPagenum , vSeldatabase , vValue}); //执行POST方法 client.executeMethod(post); //将POST返回的数据以流的形式读入,再把输入流流至一个buff缓冲字节数组 //StreamTool类是我自己写的一个工具类,其内容将在下文附出 byte[] buff = StreamTool.readInputStream(post.getResponseBodyAsStream()); //将返回的内容格式化为String存在html中 String html = new String(buff); //任务完成了,释放连接 post.releaseConnection();
//StreamTool类如下 public class StreamTool { /** * 从输入流中获取数据 * @param inputStream 输入流 * @return 字节数组 * @throws Exception */ public static byte[] readInputStream(InputStream inputStream) throws Exception { //实例化一个输出流 ByteArrayOutputStream outputStream = new ByteArrayOutputStream(); //一个1024字节的缓冲字节数组 byte[] buffer = new byte[1024]; int len = 0; //读流的基本知识 while ((len=inputStream.read(buffer)) != -1) { outputStream.write(buffer, 0, len); } //用完要关,大家都懂的 inputStream.close(); return outputStream.toByteArray(); } }
现在,我们得到了POST方法返回的String,我们输出到控制台看看是什么
System.out.println(html);
没错,就是我们上文看到的HttpWatch 抓到的返回Content,也就是一段HTML代码,这说明,我们模拟浏览器POST请求成功了!
我们再试试别的搜索内容,来一个”Android开发”(即将v_value键值对的值改成”android开发”),这时运行后,我们却从控制台得到了这样的结果:
经过几次试验后,发现一个规律,只要搜索内容中包括中文,就搜不到。
所以可以判定是中文编码的问题,(在开发这类客户端时候,中文编码往往是个很具困难的问题。安卓巴士开发3群的某群友提到:服务器交流用的编码是”ISO-8859-1”,跟我起初用到的编码一致,但真实性仍需考证)所以我们修改上面的代码,将代表搜索内容的v_value对应的值编码为”ISO-8859-1”
就将上段代码中的
NameValuePair vValue = new NameValuePair("v_value" ,”android”);
改为
NameValuePair vValue = new NameValuePair("v_value" , new String(“android开发”.getBytes(),"ISO-8859-1"));
这时再运行,控制台成功输出以” android开发”为关键字的Content。
至此,我们POST请求才真正完成。 观察控制台的HTML后发现,我们需要的书目信息就在里面,只不过被一些HTML标签包裹住了,下一步我们就要解放这些信息,存储到容器里。
这里我们要用到Jsoup,一个Java开源HTML解析器(来自org.jsoup包)。
我们直接上代码,逐行解释(大家最好对应上面的HTML代码来理解)
首先我们建一个容器来装这些解析到的数据,由于我的项目是将这些数据以ListView呈现给用户,而ListView的数据是由Adapter提供,Adapter需要传一个特殊容器-包含HashMap的ArrayList(Android基础知识)
//所以有 List<Map<String,Object>> list = new ArrayList<Map<String,Object>>(); //开始使用Jsoup //Jsoup支援一个Document类 将刚才的html转化成Document Document document = Jsoup.parse(html); //一个Document又由elements组成 我们选择”tr”开头的标签,存入 trs元素群中 Elements trs = document.select("tr"); //得到整个HTML中包含tr的标签的个数 int totalTrs = trs.size(); //我们可以观察上面没有搜索结果的那个HTML。发现,如果totalTrs<=3就表示没结果。 //只要有书目结果totalTrs必定大于3,于是 if(totalTrs > 3) for(int i = 0;i < totalTrs - 3;i++) { //观察HTML,从第i+2个tr开始,包含的才是我们要的书目信息 //我们从每个tr中选出td标签元素群 Elements tds = trs.get(i + 2).select("td"); //得到每个tr中td的个数 int totalTds = tds.size(); //一个临时的HashMap,里面是String-Object键值对 Map<String,Object> map = new HashMap<String,Object>(); //j是一个标识数 for(int j =0;j < totalTds ;j++) { switch (j) { //0表示第一个,即书名 //put方法即向map加入一条键值对 //html()方法就得到标签括起来的内容 case 0: map.put("book_title", tds.get(j).html().toString()); break; case 1: //1表示第二个,即作者 map.put("book_author", tds.get(j).html().toString()); break; case 2: //2表示第三个,即出版信息 map.put("book_press", tds.get(j).html().toString()); break; case 3: //3表示第四个,即页数 map.put("book_page", tds.get(j).html().toString()); break; case 4: //4表示第五个,即价格 map.put("book_price", tds.get(j).html().toString()); break; case 5: //5表示第六个,即索取号 map.put("book_noFor", tds.get(j).html().toString()); break; case 6: //6表示第七个,即那段网址 //那段网址td中又包含一个a标签,a标签的href属性的值就是网址 //attr(“href”)可以返回href属性的值 map.put("book_detail", tds.get(j).select("a").attr("href").toString()); break; default: break; } } list.add(map); }
list就是我们需要的ArrayList啦
上面所有代码调通后,我们只需一些简单的复制粘贴,就可以放在我们的Android工程中,加上一段简单的代码就可以让ListView显示这个ArrayList。(由于没有任何技术含量,以及该项目暂未上线,此段代码不予以展示,敬请谅解)
接下来,我们一个页面最多只包含10个书目信息,而我们校图书馆,光以”Java”为关键字的书就超过1000本,怎么来显示完全呢,一次显示所有的书肯定不现实。首先数据量太大,手机无法承受;消耗流量过大,用户体验极差。所以,我们就需要ListView能够动态加载数据,即一开始显示十项,如果用户此时拉动ListView显示完十项之后,自动联网,再加载十项(如果还有十项的话),这样的用户体验会非常顺畅。
这个功能的核心是,我们的ListView需要实现OnScrollListener接口。
如果你的ListView所在的Activity继承的是ListActivity的话,只需在extends ListActivity后面加上implements OnScrollListener,这时你需要复写onScroll和onScrollStateChanged。如果你的ListView是从XMLgetView 得到的,你只需为它setOnScrollListener,也会需要你复写onScroll和onScrollStateChanged。
不管你用哪种方法,我们只用修改onScroll方法
@Override public void onScroll(AbsListView view, int firstVisibleItem, int visibleItemCount, int totalItemCount) { // TODO Auto-generated method stub //关键的判断代码,这句话表示用户将ListView拉至最底部 if(firstVisibleItem + visibleItemCount == totalItemCount) //你只需要把继续得到下面十项的代码写在这里,就可以实现上述功能了。 //同样再使用一次POST方法,不再赘述 //代码由于同样原因不予以展示,敬请谅解
至此,文章开头的几个知识点已经全部讲解完毕,时间仓促,事物繁忙,可能会影响文章质量,还请大家多多包涵。 如果有问题,可以直接回帖、发论坛信息或通过Email:anliupeinye@gmail.com联系我。
项目成品展示:
看看这些信息是不是就是上面用网页以"android"为关键字搜索到的?
----------------------------------------------------------------------------
安卓开发广州群252743081
安卓开发南京群220818530
安卓开发上海群252742977
安卓开发深圳群252742753
安卓开发成都群252743807
安卓开发北京群111059554
安卓开发西安群252746034
安卓开发武汉群121592153
安卓开发杭州群253603803
安卓开发厦门群253604146
安卓开发湖南群217494504
安卓开发大连群253672904
大家加了这个群,相信就再也不用加别的群了。统一进群暗号,安卓开发
注意了,希望大家加自己所在城市的群,不要多加!!如果没有你所在城市的交流群,请大家留言,我们稍后会建立的。