① 关于jsoup的Connection问题求助
However, to be a model student is by no means an easy thing. First, he must do his best to obtain knowledge. A man without sufficient knowledge will not succeed. Secondly,
② jsoup的使用求解:
http://download.csdn.net/detail/idoldog/2829541
http://www.oschina.net/p/jsoup/
请采纳。
③ 请问java爬虫里WebMagic和Jsoup的关系是什么
爬虫基本流程是 请求,解析,存储。
WebMagic主要用来请求网络并且提取相应的地址,而Jsoup用来解析html,他们是相辅相成的关系。
④ 不用jsoup之类的工具包可以写java爬虫么,如果只想要java里的类
简单的页面?
使用 java.net.HttpURLConnection获得内容,再自己解析想要的片段
~
~
~
⑤ linux下使用maven-assembly打一个可运行的jar包
用Java写了一个小工具,使用maven java 工程。写完后,想打包成一个可执行的jar包。
使用maven的插件maven-assembly-plugin
pom.xml里添加
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
<build>
<plugins>
<plugin>
<groupId>org.apache.maven.plugins</groupId>
<artifactId>maven-assembly-plugin</artifactId>
<version>3.0.0</version>
<configuration>
<archive>
<manifest>
<mainClass>com.geostack.JsoupTest</mainClass>
</manifest>
</archive>
<descriptorRefs>
<descriptorRef>jar-with-dependencies</descriptorRef>
</descriptorRefs>
</configuration>
</plugin>
</plugins>
</build>
在工程根目录执行 mvn clean compile assembly:single
在target文件夹里生成 jsoup-jar-with-dependencies.jar
这个jar包便是可执行的jar了,用命令java -jar path\jarfile便可以执行。
注意:compile必须再assembly:single之前,要不然你工程的代码(class文件)就不会被打包进去
⑥ jsoup.jar在哪里下载啊
最新的1.8.1
官网版
http://jsoup.org/packages/jsoup-1.8.1.jar
或者权Maven Central
http://central.maven.org/maven2/org/jsoup/jsoup/1.8.1/jsoup-1.8.1.jar
⑦ 用JSOUP解析HTML,怎样删除掉其中的一段DIV标签及内容
用JSOUP解析HTML删除掉其中的一段DIV标签及内容的方法是根据id删除。
使用核心方法如下:
doc.getElementById("detail_question").remove()
举例如下:
从baseHtml这断代码中删除指定id的标签:
String baseHtml = "<div id='stylized' class='myform'>"
+ "<input id='txt_question' name='preg' type='text' disabled='disabled' style='width:150px;'>"
+ "<div id='detail_question'>Rock</div></div>";
Document doc = Jsoup.parse(baseHtml);
doc.getElementById("detail_question").remove();
Elements elements = doc.select("div");
System.out.println(elements);
输出的结果中没有detail_question这个div节点了:
<div id='stylized' class='myform'>
+ "<input id='txt_question' name='preg' type='text' disabled='disabled' style='width:150px;'>
⑧ jsoup 安装到哪 下载下来之后是不是要放到哪里
不知道楼主用的是什么软件管理jar包。
如果你用的是maven,那么你只需要在pom文件里面写入,在本地的package仓库放入这个jar包
如果你用的是eclipse,方法如下
右击你的java project项目名--选择Build Path(中译:设置路径)--Configure Build Path(中译:配置路径)--libraries(中译:库)--Add External Jars(添加外部库)
选择指定的文件,到此,你的项目就可以调用jsoup.jar包里面的类了
⑨ Jsoup选择器选择的class有多个属性的写法
Documentdoc=Jsoup.connect("your_url").get();//通过url获取html页面ElementsListClass=doc.getElementsByAttributeValue("class","your_class_name");//通过class属性获取元素集合for(Elementelement:ListClass){Elementsdivs=element.getElementsByTag("div");//获取divfor(Elementdiv:divs){StringdivText=div.text().trim();System.out.println(divText);}}
⑩ 利用Jsoup获取具体标签属性值
doc.select("meta[name=description]"),来get(0).attr("content")
大致是这么自写的,你可以研究一下JSOUP的选择器,
chenying99/archive/2013/01/04/2844615,html" target="_blank">http://www.cnblogs.com/chenying99/archive/2013/01/04/2844615.html