我希望最终结果是一系列列表或集合,其中包含 craigslist 列表中所需的信息。当涉及到遍历列表中的每个数据点时,我会通过抓取包含我需要的数据的众多列表来绊倒结果。
示例 URL:Sand Diego Somewhere 列出的待售计算机
每个listing所需的数据格式:价格、日期、标题、距离
所需的结果是每行一个列表,采用所需的格式,但它要么只返回一个列表而没有其他列表,要么只返回从所有数据的多个列表中检索到的第一个数据点。所以,我很茫然。
我曾涉足数组,但相信不用数组也能做到。我尝试过使用字典、列表、集合、元组和列表推导。目前,我没有得到任何输出,也无法找出原因。
这是我的代码:
from requests_html import HTMLSession
########################################
# __ __ _ _ _ #
# / /_ _ _ _(_)__ _| |__| |___ ___ #
# V / _` | '_| / _` | '_ / -_|_-
session = HTMLSession()
url = "https://sandiego.craigslist.org/search/nsd/sss?query=computer"
r = session.get(url)
########################
# ___ _ #
# / __|___ __| |___ #
# | (__/ _ / _` / -_) #
# ______/__,____| #
########################
def get_price():
list_price = r.html.find("ul#search-results.rows > li.result-row > a.result-image.gallery > span.result-price")
prices = []
for a in list_price:
price = a.text
prices.append(price)
return prices
def get_date():
list_date = r.html.find("ul#search-results.rows > li.result-row > div.result-info > time.result-date")
dates = []
for b in list_date:
date = b.text
dates.append(date)
return dates
© 版权声明
本站下载的源码均来自公开网络收集转发二次开发而来,
若侵犯了您的合法权益,请来信通知我们1413333033@qq.com,
我们会及时删除,给您带来的不便,我们深表歉意。
下载用户仅供学习交流,若使用商业用途,请购买正版授权,否则产生的一切后果将由下载用户自行承担,访问及下载者下载默认同意本站声明的免责申明,请合理使用切勿商用。
THE END
暂无评论内容