Clean Customer Website List客户网址清洗,外贸实战笔记,如何批量去除目标客户网址池https,http及www.,如何批量剔除客户池与LinkedIn,Facebook,Instagram等不相干的平台。减少冗余数据,提高效率,减少能耗,做到极致。
Clean Customer Website List客户网址清洗
去除不相干平台
这个文件,QQ群下载,公式很简单,但如果你不是很会Excel,应该会摸索到死。
此清洗文件,感谢微信群铁匠技术支持。
去除https、http、www.
比如暂时有7万多网址,有带www.的,有http和https的,这样在Excel里,即使去重也去不了。如果数据过大,再去Extract Emails from Websites,也会损耗电脑或云服务器的相当一些资源,也浪费时间。既然要做,就做到极致。
这还不简单?分列不就行了。要是这么low的水平的话,就不专门写个文章了。
添加表头、设置筛选
请按步骤来,不要等下搞不定又说这么难。
公式
B列第2行,复制以下公式,粘贴进去,确定。
去除http和https
=mid(A2,search(":",A2)+3,search("/",A2,9)-search(":",A2)-3)
去除http和https,以及www.
=MID(SUBSTITUTE(A2,"www.",""),SEARCH(":",A2)+3,SEARCH("/",SUBSTITUTE(A2,"www.",""),9)-SEARCH(":",A2)-3)
保留http、https、www.至主域名
=LEFT(A1,SEARCH("/",A1,9))
处理前请备份文件。
快速填充
- 鼠标点击A列任一框,不要点进去
- ctrl+shift+↓
- 会到A列最后一行
- 鼠标点击A列最后一行挨着的B列,不要点进去
- ctrl+shift+↑
- 然后ctrl+D
原本没有https、http或者www.的会显示#VALUE!
B列进行筛选,点击全选,#VALUE!留空不选。
筛选后的结果复制到txt保存备用。
B列再次进行筛选,这次把#VALUE!选择,其它不选,出来的A列结果全部复制到txt,将两次的结果再次一起复制到Excel进行去重。
TXT更轻便,数据过大不会卡顿。
Conclusion
如果实在觉得麻烦,这篇文章可忽略。毕竟7万多也只有3千多重复。至于你自己的数据,可能还得自己亲自操刀一下才能下定论。
请打分
浏览量: 24

