Scrapy支持多种输出格式,包括:
JSON:可以通过在settings.py文件中设置FEED_FORMAT为"json"来输出JSON格式的数据。默认情况下,Scrapy将数据保存为一个items.json文件。
CSV:可以通过在settings.py文件中设置FEED_FORMAT为"csv"来输出CSV格式的数据。默认情况下,Scrapy将数据保存为一个items.csv文件。
XML:可以通过在settings.py文件中设置FEED_FORMAT为"xml"来输出XML格式的数据。默认情况下,Scrapy将数据保存为一个items.xml文件。
JSON Lines:可以通过在settings.py文件中设置FEED_FORMAT为"jsonlines"来输出JSON Lines格式的数据。默认情况下,Scrapy将数据保存为一个items.jl文件。
Pickle:可以通过在settings.py文件中设置FEED_FORMAT为"pickle"来输出Pickle格式的数据。默认情况下,Scrapy将数据保存为一个items.pickle文件。
要设置输出格式,可以在settings.py文件中设置FEED_FORMAT和FEED_URI。例如:
FEED_FORMAT = “json” FEED_URI = “output.json”
辰迅云「云服务器」,即开即用、新一代英特尔至强铂金CPU、三副本存储NVMe SSD云盘,价格低至29元/月。点击查看>>
推荐阅读: 如何使用Scrapy的插件系统