Scrapy

基础知识

scrapy vs requests+beautifulsoup

静态网页 动态网页 webservice(restapi)

爬虫作用 1.搜索引擎--百度、google、垂直领域搜索引擎 2.推荐引擎 3.机器学习

正则表达时

1.特殊字符 ^ 开始字符 $ 结尾字符

  • 重复出现0次或多次

    ?非贪婪匹配(从左边开始匹配)

    import re
    line="bobby123"
    regex_str="^b.*"
    if re.match(regex_str,line);
      print("yes")

Last updated

Was this helpful?