第1501章 您知道但还是要这么做? 梅菜干扣肉
宝剑把那个时间截下来,发给刘浩,附了一行字,“不是人工在盯,是程序,实时爬的。”
刘浩回,“知道了。”
——
刘浩那天下午找了龙芯微借来的那两个工程师,把情况说了一遍。
一个工程师把笔趣阁的爬虫请求日志调出来看,看了一会儿,说了一句。
“高频轮询,间隔是零点三秒,一直在盯着起点的新章节接口,一旦检测到有新内容,立刻抓,一次抓完整章节,推送到自己服务器,整个流程全自动的,比人快。”
刘浩问,“能不能拦?”
“能,加请求频率限制,同一个ip超过阈值就封,或者把接口地址动态混淆,每次地址不一样,程序找不到。”
“上。”
当天晚上,宝剑那边加了防爬措施,ip封禁加接口混淆,两套一起用。
第二天早上,宝剑刷起点新章节,打开后台日志,笔趣阁的抓取请求,换了几十个ip,绕过了封禁,新的接口地址,对方爬虫绕了一圈,半分钟之内重新找到了。
抓取时间,两点零一分。
多了一分钟,仅此而已。
宝剑给刘浩发消息,“拦不住。”
——
宝剑的第二个办法,是加水印。
文字章节里嵌入图片,图片上是文字内容,爬虫抓的是纯文本,图片抓过去是乱码。
工程师花了一天,把图片水印做好,嵌进新发的章节里。
当天下午两点,章节上线。
两点零三分,笔趣阁那边的同步内容,是完整文字,没有一个字缺失。
宝剑把两边的内容对照了一下,一模一样。
工程师把笔趣阁那边的请求记录拉出来,找了半天,找到了,对方的爬虫在抓图片的时候,接了一个ocr的接口,图片进去,文字出来,再拼进章节里,整个过程,不到十秒。
宝剑把那段日志截下来,盯着看了很久,没说话。
他去找了刘浩。
“图片转文字,对方用光学识别,实时的。”
刘浩听完,把手边的茶放下。
“还有什么办法没有?”
宝剑摇头。
——
评论区那天晚上崩了一次。
读者发现起点的章节在笔趣阁白看,评论里第一条,是一个充了三十块钱的用户,说的很直接。
“我今天充的钱,退。”
下面跟了几百条,说的都是这件事。
宝剑把评论截图,一张一张发给张红旗。
张红旗那边没有立刻回,过了半个小时,回了一条,“流水今天多少?”
宝剑把数字发过去,一万二。
高峰是十一万,现在是一万二。
——
刘浩当晚去了后海院子。
进门,张红旗在槐树下,茶在桌上,这次是热的。
刘浩把整个情况说了一遍,从流水跌到现在,从律师函发出去收到乱码,从拦爬虫到ocr破水印,说完,停了一下。
“李建国那边,一个电话,让文化部出面,走行政渠道,把笔趣阁
章节内容不完整,请退出阅读模式查看完整内容!