Name to URL

Name to URL/Website公司名批量生成对应网址,外贸客户开发2022

Name to URL/Website外贸客户开发,公司名批量生成对应网址。外贸实战笔记全网首发,独家原创,版权所有,转载注明出处。-外贸实战笔记

在工具页面中,讲述过Google Sheets怎么使公司名称批量生成对应网址,不怎么好用。

经过不断尝试,研发出一种新方式。

Name to URL公司名批量生成对应网址

谷歌插件Web Scraper

有关于谷歌插件Web Scraper的强大与实战举例,相关文章直达链接点击

这篇文章以Europages网站为例,尝试了非常多次流程,如果觉得不想自己研究,可查看文章,获取现成代码Sitemap使用方法。

2GU1ART3KGV1O3I7PFJF8 1
184A4 OQWIWCF7Q3EY 1
good 1

在实际使用过程中,你会发现,如果非常多公司,比如1000多家公司,尝试了几次,没有一次是全部爬取完成的。请看下面这个回答,Web Scraper论坛中的答复。一方面与有的网站确实装了工具来监视爬取信息的IP(但感觉不至于这么严重,才1000多家都不能一次性抓完),进而采取措施;另一方面,是与graph思路有关,比如在爬取Europages中,多次尝试,都会中断,最后借鉴了别人graph思路。

20220926203545

Web Scraper号称可以爬取任何网页任何内容

于是有了初步设想,假如手头有100家公司名称,甚至更多,有可能你是从海关数据中整理出来的,上千上万。

既然可以爬取任何网页内容,那,就把公司名称变成网页的形式。然后把公司名称一个一个去搜索引擎中搜,再去搜索引擎中复制对应的地址。整体思路,感觉能成,应该会有一些点卡住。问题不大。

网页html

如何将公司名称列表,变成网页形式呢?以前用过strikingly做过个人网站,很久没用,没想到最近3个月还有浏览量。找过好几个尝试把链接直接复制进去的都失败了,strikingly开始也失败,后来成功了。所以,如果有哪些字眼是否定了strikingly的,都是之前失败尝试的截图,略过即可。

用strikingly去做也行,用下面推荐的网页html工具,也行。

有的更离谱,把链接文本形式变成真正链接,要收费。

计算机课好像说note什么pad也能做html形式,忘了一干二净,不想折腾,就想找个现成的。

搜索引擎

谷歌

NC7PO8EZ09I2@H1LVJ
  1. 搜任何词,它的链接千变万化,想在链接上做文章,自己技术不行,也问过做代码的,好像比较难实现
  2. 谷歌验证
  3. 搜索结果被扰乱(这在下面的浏览器里,去搜索后,就能体会)

DuckDuckGo

a3fdc342fc2f448a3794e2b5d57d37e

这里不推荐它的谷歌插件形式,是因为它破坏了几乎所有在用工具。

你可能听都没听过,我也第一次看到。

https://duckduckgo.com/?q=abc&t=h_&ia=web

https://duckduckgo.com/?q=fg&t=h_&ia=web

在它的搜索框输入abc和fg后,这是它们的搜索框链接形式。

现,隆重介绍一下duckduckgo.com,这家公司创立之初,直接对标谷歌泄露信息,一路高歌猛进,虽然在使用量上远远不如,九牛一毛,但使用体验上,一点不输。获得一众大佬加持。

不追踪客户信息,没有广告

给搜索内容最直接的结果,在最顶部,不绕弯子,准,直接

阻止网上任何工具追踪客户信息,包括客户IP

这是它的搜索结果页面,手工搜索了十几个,简直不要太完美。

Advantages

  • 结果非常精准
  • 公司名称越全越好
  • 不像Google sheets的用法,只能生成那些大佬网址出来,什么limited这些字眼,有时候删除才出来

这是它公司对于它搜索指令的一些解释与表达,来细细研究下。https://duckduckgo.com/params

外贸实战笔记全网独创DuckDuckGo公司名搜索网址专用指令,转载注明出处。

ALTREJ22F4VIFEGW2D

通过分析发现,所有搜索结果,再结合DuckDuckGo自定义url搜索指令,搜索词前面是这样的

				
					https://duckduckgo.com/?q=
				
			

后面可以是这样的

				
					&kau=-1&kap=-1&kaq=-1&kax=-1&kak=-1&k1=-1&kav=1&kv=-1&kz=-1&kp=1&kl=wt-wt&kah=wt-wt&t=h_&ia=web
				
			

Google Sheets

https://duckduckgo.com/?q=shenzhen+battery&t=h_&ia=web

在DuckDcukGo中搜索两个词或以上时,发现,链接里都自动加了个加号+,于是我们的公司列表名可以是这样

于是,谷歌sheets中可以有这样的内容,当然,Excel也可以。

20220926223727

strikingly最近一两年专门针对国内出了一款叫上线了的免费网站工具,使用体验不好,说是为了中国用户登录更快。但是你把这些链接复制进去,要在博客发布,发表了就变成你个人免费的strikingly的网站博客文章了,也就相当于这些链接变成了网站上的内容,就可以用Web Scraper来处理。但是国内上线了,发布的时候,还要去审核你,动不动就24小时,这谁受得了,等下还拒绝发布。

国外站点,记得开airport,链接直达https://cn.strikingly.com/s/#/

你自己去搜,可能搜不到登陆链接,有的节点质量不行,会被strikingly识别出来的。会自动转到国内上线了。

当然了,只要找到别的能替代的也行,主要是让它变成网页里面的链接

本来我自己,可以直接将Google Sheet里的嵌入自己网站,就可以操作,如果你有自己网站,也可以这么做。

这个东西很简单,就是个傻瓜式建站的模板,随便注册个账号就行。

20220927124431

tablesgenerator.com

但你也可以用这个,会比strikingly更便捷,不用编辑来编辑去的。更推荐。直接将Google sheets中做好的链接复制进去即可。链接直达。

正式开始抓取之前,可以用Macro Recorder工具先模拟人工自动搜索一遍,看看页面结果,整体观察下来,可以说,95%的结果满意,几近完美。

20220927092701

还有小部分不满意的结果?

TACV5WZ HA9 PR31V

但如果去仔细分析,这并不是结果不准,只是搜索词不准,结果,基本可以说是非常非常非常准的。可以打开上面这个例子,去用他们公司名字来搜。

打开Web Scraper

本文开头的文章里,和大家说过,Web Scraper是一通万通的。只要是网页的内容,都可以爬取。将Google Sheets做好的链接放在table generator的html中。

20220927094645
C7X1L5H3RBQAXM3J76ER
14c6fe9387857faac5017c849f36bfa0
b44459c0b5401fa1ecf6f8e66d2843d8
04EA6R 74C5XUZTXF
HB1S70IOBERQJFD75RG