Ответ 1
Вам нужно установить входной или выходной процессор. TakeFirst
будет отлично работать в вашем случае.
Существует несколько мест, где вы можете определить его, например. в определении Item
:
from scrapy.item import Item, Field
from scrapy.loader.processors import TakeFirst
class MyItem(Item):
url = Field(output_processor=TakeFirst())
title = Field(output_processor=TakeFirst())
developer = Field(output_processor=TakeFirst())
Или, установите default_output_processor
в экземпляре XpathItemLoader()
:
l.default_output_processor = TakeFirst()