xcf_crawler

爬取下厨房首页全部分类下的所有菜品

$ git clone https://github.com/sam408130/xcf_crawler.git

进入目录

cd cook

修改数据库配置(打开本地数据库mysql.server start)

$ vim config.py
------------
database_config = {
    'host': 'localhost',
    'port': 3306,
    'user': 'root',
    'password': '123456',
}

编辑 main.py 先抓取所有分类url

$ vim main.py
---------
cmdline.execute('scrapy crawl category_urls'.split())
# cmdline.execute('scrapy crawl item_list'.split())

待 urls 抓取完成后再抓取菜品信息

$ vim main.py
---------
# cmdline.execute('scrapy crawl category_urls'.split())
cmdline.execute('scrapy crawl item_list'.split())

运行爬虫抓取菜品信息

$ python main.py

####仅用于交流学习，请勿用于任何商业用途

Name		Name	Last commit message	Last commit date
Latest commit History 3 Commits
cook		cook
README.md		README.md
config.py		config.py
main.py		main.py
scrapy.cfg		scrapy.cfg
singleton.py		singleton.py
sqlhelper.py		sqlhelper.py
utils.py		utils.py

Provide feedback