这是网络爬虫最通常的的挣钱方式,通过外包网站,熟人关系接一个个中小规模的爬虫项目,一般向甲方提供数据抓取,数据结构化,数据清洗等服务。
各位新入行的猿人看官大多都会先尝试这个方向,直接靠技术手段挣钱,这是我们技术人最擅长的方式,但是竞争也是最激烈的,外包接单网站上的爬虫项目已经被砍到了白菜价,因为项目竞价的人太多。接外包的地方在国内有猪八戒网,a5外包等,国外有freelancer,freelancer上挣的是美刀,看官要接外包可以试试,不过要跟印度阿三竞争。美国学生也懒,老猿09年接触freelancer时,上面还有美国学生python作业没完成,在freelancer上花60美刀找人帮忙做作业。
做外包越来越难,做的人太多,网上能接爬虫外包的人从在校大学生、两鬓白发的老猿,到几个人团队作战都在抢几千米一个的项目,交付时间又很紧,你如果没有客户资源,现成的解决方案,和稳定,高效率的爬虫技术来支撑,是抢不到好单的。
不过有一个方向从老猿10年前知道开始,到现在的观察来看都还有钱途,就是写发贴机。老猿对发贴机一直记忆犹新的原因是刚工作那会在freelancer上了解到一个老外靠写发贴机,一年挣了50万。
什么是发贴机?就是自动往论坛,社交媒体自动发帖子,发评论等,甲方通常使用发贴机在大量的网站上使用大量的账号灌水,去达到甲方的商业目的。这是一个体力活,你要研究大量网站的登陆流程,发帖流程,网站一改版,你就又要重写流程,现在发贴机任然有市场,不过现在对登陆限制,发帖限制等反爬措施都比以前先进很多, 写一个好的稳定的发帖机很难。
简单说就是抓取分散在各个角落的信息,整合后用网站或微信或APP呈现出来,以通过网盟广告,电商佣金,直接售卖电商产品或知识付费来变现。
别被产品这个词吓到,一个技术人员通过自学开发一个简单的网站,APP,小程序,直接使用wordpress,或者接入别人的电商系统不是难事。关键是需要一些运营技巧,这方面个人站长是做得最好的,自己摸索运营方法,自己还学习技术开发。咱们技术人员也要了解运营和产品知识。
有句话叫着:流氓不可怕,就怕流氓有文化。 我想说的是:技术不可怕,就怕技术懂运营。(哎,不押韵啊!)
在当下互联网和移动互联网盛行的时代,作为技术人也要去了解和明白运营技巧,在公司里你能更好跟产品和运营沟通,也会有更多的晋升空间;作为自由职业者和创业者就更加需要。(跑题了)
关于信息整合,数据整合老猿在《爬虫是如何成就了这些商业公司的》中提到的去哪儿和天眼查这两家公司是比较典型的,去哪儿是整合各家航空公司的机票价格,方便用户比对哪个航班的价格便宜;天眼查是整合各个省市的企业工商信息,提供多纬度的企业信息,股东信息查询,节省了用户不少时间。
机票信息和工商信息在没有这两家公司之前也都是存在的,但是都散落在不同的网站上,用户查询时就比较费劲,这两家就是把这些信息抓取,处理,聚合到一块来提供查询服务。你整合后的信息要能提高用户的使用效率才有价值。
类似的还有商标查询,专利查询这些,现有的都很难用,你可以从商标局中把几千万个商标抓取出来,提供一个更好的查询网站或者小程序,每天都会有不错的流量。
别以为这些没有机会了,告诉你,老猿在17年还抓了几千万家企业工商信息做成一个网站薅SEO流量,每个月还能带来小几千米的网盟收入。当然这些你要去了解一些流量技巧,社群运营技巧等,我相信猿们周末少花些时间去研究片子,研究妹子,用点时间在学习上肯定手到擒来。
提醒:抓取的数据如果要商业化,要小心知识产权问题噢。还要提醒一点:抓取和处理这些数据的代价要小于人工处理的代价,使用爬虫代替人工才有价值。
这是随着微信兴起,移动支付兴起后的一个方向。当你具备了扎实的编程功底和实战经验后,无论是想塑造个人品牌还是做自媒体谋生,对外输出技术文章,这是当下一个不错的选择,比如老猿就在尝试做猿人学,呵呵。做自媒体写文章贵在坚持,不要担心笔杆子功夫不行,老猿这篇文章写到这里花了两天8小时,见笑了。做自媒体不敢写得太多,因为鄙人也是在学习中,但是我相信做永远比不做好。
首先,买卖股票有风险,这里不提倡噢。老猿在17年买美股,用8万本金,半年后翻到24万,操作太激进后来在2周内本金只剩3万,哭到在厕所。
针对C端用户的互联网公司的产品在社交媒体上大都会被热烈讨论,这些产品卖的好还是不好,可以通过抓取社交媒体上的用户讨论来分析。比如苹果最近发布的iPhone XS,iPhone XR(写这篇文章的时间点是2018年10月30日),可以通过抓取微博上最近发微博的用户设备情况来观察新款iPhone在中国的销售情况,还可以跟iPhone以前每款新品上市时,那时的用户发微博设备情况来对比,是比以前卖的好还是差。一点浅见,不要轻易入市,风险较大。