Jsoup模拟登陆小例子,不同的网站,需要不同的模拟策略,散仙在这里仅仅作为一个引导学习。
package com.jsouplogin;
import java.util.HashMap;
import java.util.List;
import java.util.Map;
import org.jsoup.Connection;
import org.jsoup.Jsoup;
import org.jsoup.Connection.Method;
import org.jsoup.Connection.Response;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
/**
* 使用Jsoup模拟登陆Iteye
*
*
* 大体思路如下:
*
* 第一次请求登陆页面,获取页面信息,包含表单信息,和cookie(这个很重要),拿不到,会模拟登陆不上
*
*
* 第二次登陆,设置用户名,密码,把第一次的cooking,放进去,即可
*
* 怎么确定是否登陆成功?
*
* 登陆后,打印页面,会看见欢迎xxx,即可证明
*
*
* @date 2014年6月27日
* @author qindongliang
*
*
* **/
public class JsoupLoginIteye {
public static void main(String[] args)throws Exception {
JsoupLoginIteye jli=new JsoupLoginIteye();
jli.login("xxxxx", "xxxxx");//输入Iteye的用户名,和密码
}
/**
* 模拟登陆Iteye
*
* @param userName 用户名
* @param pwd 密码
*
* **/
public void login(String userName,String pwd)throws Exception{
//第一次请求
Connection con=Jsoup.connect("http://www.iteye.com/login");//获取连接
con.header("User-Agent", "Mozilla/5.0 (Windows NT 6.1; WOW64; rv:29.0) Gecko/20100101 Firefox/29.0");//配置模拟浏览器
Response rs= con.execute();//获取响应
Document d1=Jsoup.parse(rs.body());//转换为Dom树
List<Element> et= d1.select("#login_form");//获取form表单,可以通过查看页面源码代码得知
//获取,cooking和表单属性,下面map存放post时的数据
Map<String, String> datas=new HashMap<>();
for(Element e:et.get(0).getAllElements()){
if(e.attr("name").equals("name")){
e.attr("value", userName);//设置用户名
}
if(e.attr("name").equals("password")){
e.attr("value",pwd); //设置用户密码
}
if(e.attr("name").length()>0){//排除空值表单属性
datas.put(e.attr("name"), e.attr("value"));
}
}
/**
* 第二次请求,post表单数据,以及cookie信息
*
* **/
Connection con2=Jsoup.connect("http://www.iteye.com/login");
con2.header("User-Agent", "Mozilla/5.0 (Windows NT 6.1; WOW64; rv:29.0) Gecko/20100101 Firefox/29.0");
//设置cookie和post上面的map数据
Response login=con2.ignoreContentType(true).method(Method.POST).data(datas).cookies(rs.cookies()).execute();
//打印,登陆成功后的信息
System.out.println(login.body());
//登陆成功后的cookie信息,可以保存到本地,以后登陆时,只需一次登陆即可
Map<String, String> map=login.cookies();
for(String s:map.keySet()){
System.out.println(s+" "+map.get(s));
}
}
}
分享到:
相关推荐
Jsoup+httpclient模拟登陆和抓取页面.pdf
jsoup 爬虫 模拟登陆 step to step 模拟登陆
NULL 博文链接:https://chenchuangfeng.iteye.com/blog/1821861
httpclient-4.3.3+jsoup-1.7.3模拟登陆csdn成功后;然后再抓取用户登录主页的内容http://my.csdn.net/my/mycsdn
如何使用jsoup
jsoupjar包,附带例子,有jsoup的使用说明
Android OkHttp3 Jsoup】 模拟登录教务系统 抓取课表和成绩(Eclipse版.rar,太多无法一一验证是否可用,程序如果跑不起来需要自调,部分代码功能进行参考学习。
Jsoup+httpclient 模拟登陆和抓取页面 package com.app.html; import java.io.BufferedReader; import java.io.BufferedWriter; import java.io.File; import java.io.FileOutputStream; import java.io.FileReader...
jsoup-1.15.3.jar,jsoup-1.15.3.jar,jsoup-1.15.3.jar,jsoup-1.15.3.jar,jsoup-1.15.3.jar,jsoup-1.15.3.jar,jsoup-1.15.3.jar,jsoup-1.15.3.jar,jsoup-1.15.3.jar,jsoup-1.15.3.jar,jsoup-1.15.3.jarjsoup-...
遵守规则: 为避免对网站造成过大负担或触发反爬虫机制,爬虫需要遵守网站的robots.txt协议,限制访问频率和深度,并模拟人类访问行为,如设置User-Agent。 反爬虫应对: 由于爬虫的存在,一些网站采取了反爬虫措施...
Jsoup
该资源包含了一个利用jsoup实现的网页解析,读取搜狐新闻上自己想要的数据,简单易懂。
基于Java+Jsoup的手机信息爬虫源码.zip
Java解析html的实用工具jsoup和它一个简单的例子,方便使用jsoup进行html的解析
Jsoup 1.5.2 和jsoup 1.6 开发包jar包,开发文档,源码包
赠送jar包:jsoup-1.14.3.jar; 赠送原API文档:jsoup-1.14.3-javadoc.jar; 赠送源代码:jsoup-1.14.3-sources.jar; 赠送Maven依赖信息文件:jsoup-1.14.3.pom; 包含翻译后的API文档:jsoup-1.14.3-javadoc-API...
JsoupAPI jsoup最新版帮助文档(1.10.2)
Jsoup库文件;Jsoup解析Java包
里面的JsoupDemo是关于Jsoup使用的一个简单例子,sinaweather是关于Json数据解析的一个简单例子
最新jsoup1.10.3和jsoupApi帮助文档