¿Por qué el rastreador de Python sigue rastreando las mismas cosas? ¿Cómo debo rastrear contenido bajo otras etiquetas td?
¿De dónde? bs4? ¿importar? Hermosa voz
¿Importada? Acerca de
headers = { ' User-Agent ': ' Mozilla/5.0? (¿Windows?NT?6.1;?WOW64)? AppleWebKit/537.36? (KHTML, por ejemplo, Gecko)? ¿Cromo/49.0.2623.221? Safari/537.36? SE? 2.x? ¿MetaSr? 1.0'}
ALL=[]
def? Obtener URL:
url='/position.php? keywires = Prueba amp; tid = 0 amp start = s # a" s
req=requests.get(url, headers=headers, timeout=3)
res=req. contenido
sopa=BeautifulSoup(res, ' lxml ')
s=soup.select('table.tablelist?tr')
Text=s[ 1:-1]
¿Para qué? Texto:
Trabajo={'nombre del trabajo': Ninguno,
'Categoría de ubicación': Ninguno,
'Número de personas': Ninguna,
'Ubicación': Ninguna,
'Tiempo de liberación': Ninguna}
L =i.text.strip('?')).Split('?')
Posición['Nombre de la posición']=L[0]
Posición['Categoría de posición ']=L[1]
Trabajo['número de personas']=L[2]
Trabajo['ubicación']=L[3]
Trabajo['PublishedTime']=L[4]
ALL.append(Trabajo)
¿Para qué? Rango(0,101,10):
Obtener URL (1)
Imprimir(TODOS) Su pregunta debe ser sobre la clave de campo, que es única. Se sobrescribirán varios resultados. Agregar una lista para expresar puede evitar esto.