bizearch外贸网站数据源质量到底如何,外贸客户开发2022

外贸实战笔记主图横屏裁剪
近期
近期 文章
热门
热门 文章

bizearch网站信息源质量到底如何,外贸客户开发渠道,以测试产品为例,每页30家公司,1980页为59400家公司信息,此站到底可不可用,一探究竟。外贸实战笔记,转载注明出处。

bizearch

http://bizearch.com如何使用

进入网站后,查看company database,非常多产品种类,点击自己产品,进入后,又可以细分

以agriculture为例,有5万多家公司。

站点结构分析

每一家公司页面都有这些信息,来分析后抓取。product services,需要抓取,后续通过Excel筛选出与自己产品更符合的。

公司名,一般我自己不抓,这里也将Web Scraper设置出来了。网站website是最需要的。地址,需要,后续排除掉国内。再比如business type,甚至可以将manufacturer排掉。

Web Scraper

这串代码graph模仿官网思路,非常优秀,减少页面结构复杂程度,避免不必要运行。

				
					{"_id":"from1980","startUrl":["http://bizearch.com/company/Chemicals.5-[2-1980].htm"],"selectors":[{"id":"1allcompany","parentSelectors":["_root"],"type":"SelectorLink","selector":".ls a","multiple":true},{"id":"companyname","parentSelectors":["_root","1allcompany"],"type":"SelectorText","selector":"strong","multiple":false,"regex":""},{"id":"contactperson","parentSelectors":["_root","1allcompany"],"type":"SelectorText","selector":"tr:contains('Contact Person') td","multiple":false,"regex":""},{"id":"address","parentSelectors":["_root","1allcompany"],"type":"SelectorText","selector":"tr:contains('Company Address') td","multiple":false,"regex":""},{"id":"web","parentSelectors":["_root","1allcompany"],"type":"SelectorText","selector":"tr:contains('Website') td","multiple":false,"regex":""},{"id":"businesstype","parentSelectors":["_root","1allcompany"],"type":"SelectorText","selector":"tr:contains('Business Type') td","multiple":true,"regex":""},{"id":"industryfocus","parentSelectors":["_root","1allcompany"],"type":"SelectorText","selector":"tr:contains('Industry Focus') td","multiple":false,"regex":""}]}
				
			

上述Web Scraper代码可爬取公司名,联系人名称,网站,公司类型,主营业务。你也可以将此站代码复制进自己的web scraper进行修改。

仔细研究下页面selector的结构顺序。

若不晓得这些代码如何使用,请参见文章Web Scraper外贸客户开发,爬取任何网站信息2022

不可能每个站点的使用情况都来叙述,此后,用过Web Scraper采集成功过,证明可用的优秀站点Sitemap Codes都可自己在Tips页面查找。

数据质量表现

将地址栏中,address带有China的全删掉。

4111家剩下3340家。

将manufacturer排除掉,剩下1961家。比如某些产品,manufacturer也是客户,不排除。

manufacturer不要排除来看,毕竟每家公司都说自己是manufacturer,就连本站做的产品独立站也是这样表述。

加上manufacturer后,再用product services筛选,只剩下100多家,还不如用谷歌搜索指令来的快。

其实,产品大可不必再去排除,对行业认知不深,并不能很好选择对应的词。干脆直接选上。

即使不用product services去排除,manufacturer也不排除,4111个结果,也仅存905个,存活率22%。

值不值得浪费电脑性能,留给各位判断。

这两篇文章中,表达过Web Scraper这种工具,爬取大量目标网址信息,会被后台识别IP,进而限制的担忧。

这种情况存在吗?当然存在,每个网站都可以设置后台监控,对于大量爬取网站信息的bot IP可以直接封锁。

比如本站后台,主要是谷歌,还有bing和Yandex,如果有其它乱七八糟的bot,可直接拦截。

不要道听途说,自己上手。比如之前设置的Europages Sitemap总是断程,非常怀疑是IP被识别进而采取措施,但又不甘心也不确信,经过不断尝试,毕竟这个站点很有名气,数据源头也质量高,才得以成功运行。

某些爬虫工具,甚至像邮件群发一样,有专门大量的IP给客户准备跳转使用。

5/5 - (1/投票总数)

相关文章

本站产品

FAQ

公众号主页对话框,输入微信群(3个汉字)。

所有内容皆为作者亲身实战,拒绝空谈,主张实战。希望每一位外贸人都将自己的疑惑付诸实战,拒绝道听途说。外贸实战,从你我做起。

宗旨是实战,免费是追求,核心思想是扶正自我。行业不同,观点不同,立场不同,憧憬亦不同。人各有志。全网良心巨匠,等同于免费(无任何水分,毫不夸张)。

此站作者,普普通通外贸从业人员,无培训。远离大神,少听课。 

此站不获客。来到此站,即缘分,无需相识,去留皆可。挂羊头卖狗肉,非我。带走一丝灵感,足矣。

外贸笔记不以盈利为目的,也不做慈善。免费问题免费答。付费QQ群有一些软件与工具可免费下载,永久更新中。冷静思考,独立分析,善于钻研者入。此站不灭,Q群不亡,终身保修。不进付费Q群工具如何获取?公众号后台输入灵兽二字查看。

记录外贸工作,总结经验,实验站,试错站,借此心得,希望产品独立站能成功起流量。SEO流量。实战纠错中。

2017年从事外贸工作,2022年建立此站,停更,代表此站作者已退出深爱的挚爱的引以为傲的外贸江湖。也会彻底删除此站,绝不以外贸名义行培训之事。

产品独立站SEO起流量。希望每一位深入阅读此站外贸从业者,皆能抱以此志。Improve Marketing Ability.

教程不敢言,此站详尽地记录了外贸笔记从无到有几乎每一步。与以有心者。

此站作者究其所能分享了外贸路上学会的几乎所有技能,每一页,每一篇文章都会在日常中不断精进,记得时常翻阅。取其精华,去其糟粕。愿技能不仅是技能,可为生产力。世界上最遥远的距离,是知道与践行。愿助各位一臂之力,愿外贸路上的你顺风顺水,一路长虹。

不太清楚。这只是我的工作,勉强饿不死。祝你暴富。

可能一周、一个月、一年、一辈子。热爱永不败。

通过文字、图片、声音、视频、面谈,获得对方认可。就像我通过网站与公众号在获得你的认可一样。

本站不提供任何翻墙工具及咨询服务,翻墙属违法行为。所有被采集信息皆为互联网公开的前端信息。所有信息采集类工具,仅为提升工作效率,勿传播,勿作非法用途。爱国守法,明礼诚信,团结友善,敬业奉献,勿违法乱纪。

不提供私聊服务。付费Q群,认真阅读研习网站后,自行决定是否进入,勿盲目从众。此站不陪聊,无客服服务(Unlimited Questions)。本站内容说简单也简单,说复杂也复杂,适合心静钻研性人群。勿依赖作者,去除平台个人主义色彩,去中心化。此站分享的不是工具,不是技巧,是思路,是系统,形而上者谓之道,形而下者谓之器,驭器为道。举一反三,以一敌百,无招胜有招。

  • 1.售卖盗版软件属违法行为,本站不售卖盗版软件,拒绝盗版,从我做起。
  • 2.Q群付费进群,是且仅仅是因为付费者想获取QQ群其它技能,比如关键词指令、客户开发思路等等(价值远超1000万元人民币)。
  • 3.QQ群内技术版软件免费分享只是为了好玩,纯属炫技,毫无价值,一文不值,全都没用,此站无任何售卖行为。若正版版权拥有者发现此站,请马上联系,将立即删除。
  • 4.破解版是否真正是相对应官网的正版破解版,需要专业机构从长计议(不能仅从几张图片认定为正版破解版)。
  • 5.此站所有收益皆通过微信公众号:外贸业务员,并依法纳税。

外贸盗版大王称号是对此站严重污蔑,与此站宗旨完全不符,请慎言慎行。爱国守法,明礼诚信,敬业奉献。

外贸实战笔记官网公告
0%