五款国内用的最多的网页采集器,各有各的特点

作者:魔道寒武纪     信息来源:魔道笔记     发布时间:2024-10-17     点击数:0    

在目前的站长圈内,比较流行的采集工具有很多,但是总结起来,比较出名的免费的就这么几个:火车头,海纳,ET,三人行,狂人。

下面我们对这几款采集工具作一个简单的评比。


1.火车头 

基本上人人都知道,那就放第一位,要多说两句。

火车头应该是国内采集软件最成功的典型之一,使用人数包括收费用户数量上应该是最多的

特色:简单,功能强大,速度快,支持的网站最丰富,支持丰富扩展

优点:功能比较齐全,采集速度比较快,主要针对cms,短时间可以采集很多,过滤,替换都不错,比较详细;很多人写接口、规则和发布模块,接口比较齐全,其中有个叫尘缘的人,几乎开发目前所有PHP类CMS的接口;支持的扩展非常好用,如果你是一位懂技术的站,可以使用PHP或者C#开发任意功能的扩展,实再令人好生难忘;附件采集功能完善。

技术:技术主要是论坛支持,帮助文件多,上手容易。有收费、免费版本

缺点:功能增多,软件越来越大,比较占用内存和CPU资源,资源回收控制得不好


2.三人行(狂人) 

主要针对论坛的采集,功能比较完善

先申明,不知道三人行和狂人是什么关系,但界面和功能都是一个模子出来的。

特色:针对各大论坛,搬家,移动,速度快,准确度高

优点:还是针对论坛,适合开论坛的

技术:收费技术,免费有广告

缺点:超级复杂,上手难,对cms支持比较差


3.ET工具

特色:无人值守,稳定,资源占用最低,基本上可以叫安静

优点:无人值守,自动更新,适合长期做站,用户群主要集中在长期做站潜水站长。软件清晰,必备功能也很齐全,关键是软件免费,听说已经增加采集中英文翻译功能。

技术:论坛支持,软件本身免费,但是也提供收费服务。帮助文件较少,上手不容易

缺点:对论坛和CMS的支持一般


4.海纳

特色:海量,关键词抓取,可以预览采集内容,不用写规则

优点:海量,可以抓取网站很多一个关键词文章,似乎适合做网站的专题,特别是文章类、博客类

技术:无论坛 收费,免费有功能限制

缺点:分类不方便,也就说采集文章归类不方便,要手动(自动容易混淆),特定接口,采集的内容有限


5.狂人

特色:可以让你的新论坛一开始就会有大量的会员.

优点:非常适合采集discuz论坛

缺点:过于专一,兼容性不好。


总结:追求功能齐全的,似乎应该选择火车头,火车头被称之为“无所不能”,初期作站,可以迅速采集很多的资源,充实网站内容。如果做论坛,那选 择三人行,没错了,可以实现采集论坛,回复,搬家等多项论坛功能。长期做站,当然选择ET了,花点时间,弄懂,是个长期受益的事情。写好规则,设置好过滤 替换,然后可以像开QQ一样,长期运行,不费内存,自动采集更新,分类明确,采集内容完整,可是说,一个站,一个站长+ET足够了。至于海纳,似乎不写规 则,上手容易,但是对文章的发布上,不能如ET一劳