投稿    登录
欢迎来访~
发表我的评论
取消评论

表情

Hi,您需要填写昵称和邮箱!

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址
(413)个小伙伴在吐槽
  1. 每次都有新变化,赞一个
    老张2020-05-08 17:56 回复
  2. 书中P82原话“GET请求提交的数据最多只有1024字节,POST方式没有限制”,但是在搜索后发现很多博客说这是错误的,只是URL/URI有长度限制,所以这个说法是错误的吗
    2020-05-06 10:45 回复
  3. 哈士奇社区(https://www.4nmb.com/)我的个人社区小站!
    哈士奇社区2020-05-05 13:40 回复
  4. 崔老师,我正在学您的教材《Python3 网络爬虫开发实战》,在第480页给出的源码地址,显示无法打开。这是我想学习的scrapy存储mongodb的重要例子,请问可否有别的链接。这个例子我按照您书上说的敲了一遍,但执行时出现 mongo_db=crawler.settings.get('MONGO_DB') builtins.TypeError: MongoPipeline() takes no arguments,所以我非常需要看下您的源码。如果可能的话请回复到我的QQ邮箱2862669213@qq.com,非常感谢。
    2020-05-02 15:25 回复
    • 百度谷歌都能搜到的结果
      钢铁2020-05-07 10:27 回复
  5. 师范
    你好2020-04-26 16:42 回复
    • ;下次vv下次
      sdfds 上到处都是扯淡2020-05-04 15:38 回复
  6. 崔老师请问您有付费社群吗?就是那种能向您请教一些爬虫进阶问题的群。
    Ruby2020-04-23 16:05 回复
  7. 崔老师您好,正在学习您的《python3 网络爬虫实战》,第六章AJax数据爬取的第三节爬取微博内容(教材241页) get_page()方法中 items =json.get('data').get('cards') 运行时提示AttributeError: 'NoneType' object has no attribute 'get' 请问这是为什么,是python版本的问题吗,我的系统环境是:win7 64位 python 3.7.4 另外get_page方法中params字典中page参数,现在的微博变成了since_id,而且这个数字好像没有规律,请问代码该如何修改,请给予帮助,谢谢。
    自学python2020-04-20 22:00 回复
  8. 测试测试测试测试测试 document.write('');
    112020-04-19 23:07 回复
  9. 老师,你scrapy框架那块有得地方将的太难理解,希望能把底层原理讲的通俗一点
    战九幽2020-04-18 16:29 回复
  10. 老师,您好,你在拉勾教育里的爬虫52讲代码怎么获取,关注公众号留言没人回复,客服也加不到。
    2020-04-16 00:01 回复
  11. 大佬,请教一下,我使用了你的scrapy-redis-bloomfilter,能不能指定只过滤部分url。例如http://xxxxx.com/movie/123456,我只过滤123456这个部分的url,因为有些时候,网站的域名会换,下次再爬取123456的时候(这个时候url:http://yyyyyyyyy.com/movie/123456)。目前的模块能做到吗?
    菜鸟先摔2020-04-15 20:33 回复
  12. 老师你好,我买了一本您的大作,爬虫学的最近也应用了一些了,现在有个问题,麻烦问一下您,比如网页请求cookie里需要js生成的内容,这个怎么解决
    天傲2020-04-15 10:33 回复
    • execjs吗?
      mac_yj2020-05-07 14:38 回复
  13. 能不能交换链接啊? http://thinkinlife.org/
    omar2020-04-10 20:16 回复
  14. 我的tesserocr一直下载不了,请问您知道有什么解决方案吗?
    jiang2020-04-10 11:24 回复
1 20 21 22