相比与其他静态编程语言,如C#、C++,Python抓取网页文档的接口更简洁;相比其他动态脚本语言,如Perl、shell,Python的urllib2包提供了较为完整的访问网页文档的。
首先声明一点,业界一般都是用pyhon去做爬虫。当然用java语言开发的很有很多 一、nutch 大名鼎鼎的Doug Cutting发起的爬虫项目,Apache下顶级的项目,是一个开源。
如果你是java程序员,把python也掌握了不就得了。python简单易学,你如果掌握了再学而Python非常容易。 站在大环境来说,光有爬虫不行,如果是大数据项目,爬到的。
很漂亮), 3d: Mayavi2 复杂... 跨平台,对Linux和windows都有不错的支持。 科学计算,数值拟合:Numpy,Scipy 可视化:2d:Matplotlib(做图很漂亮), 3。
对于爬虫来说,py确实比Java方便太多。但本质上py包可以实现的功能,Java都可以做,只不过要写很多代码。我曾用Java爬过汽车之家,也用py爬过discuz论坛,且需要。
回顶部 |