【教程】搜集知乎高浏览、蓝海问题
生财有术 ·
搜集知乎高浏览、蓝海问题
以“医美”为例,只需10分钟,用采集器自动搜集、导出下面的高分、蓝海问题列表
步骤1:下载,安装后羿采集器,进入官网直接下载。
步骤2:在电脑的浏览器进入知乎,搜索主题名称,这次我们以为“医美”例:
复制搜索结果地址,如图
步骤3:打开后羿采集器,地址粘贴到首页,如下图,点击“智能采集”,软件会自动抓取部分内容。
步骤4:数秒后,软件会出现预览页面,如下图1。
点击一个问题(注意是问题,不是文章),会进入下一个页面
依次点击:添加字段、被浏览数、添加字段、回答数
点击回答数,会出现下图2,选择取消(只抓取数据)
然后点击右下角“保存”,“开始采集”(记得先点保存),弹窗点“启动”
软件就会开始自动运行,可以去喝杯咖啡了。
步骤5:打开导出的文件,接下来我们整理数据:
(1)删除重复问题
依次点击菜单栏的:数据,删除重复值,删除重复项,取消全选,只选列A,确认。
(2)问题排序
在字段1下,如图,拉取所有数字,旁边出现“!”(如图),点击“!”,选择“转换为数字“
排序后,上面的数据是文章,下面是问题。
在你删除文章数据之前,建议阅读学习高赞的文章,学习别人的写法、结构。
在筛选文章后,下面就是问题排序的,这基本就是我们想要的数据:
进阶:计算问题分数,筛选蓝海问题。
把最高浏览的问题回答完,我们开始关注新问题和分数高的问题,下面教如计算问题分数
步骤如下:
(1)“查找与替换”(bigl(Ctr|+Fbigr)),“替换”
分别把“查看全部”和“个回答”取代(就是删除)
(2)在新的一栏输入公式:=!H2/|2!,回车(或者输入“"=",点击左边字段1数字,输入“/”,点击字段2的数字,点回车)
得到问题的分数,下拉所有问题的分数都出来了。
一般来说,分数大于5000的为优质问题(也要看发布时间,自行鉴别)
最后整理一下得出数据如下图,怎么样,是不是很简单?
注意:一天不要搜集超过10个品类,被系统发现这个IP地址一直在爬数据就不好了。
软件是免费的,目前我们每天搜集5个品类问题都没出过事。
我曾经付费成为会员,也付费买了多IP地址同时抓取,反而经常断线,结果不完整,免费版反而一直稳定。
所以使用免费版就好了。