Asegúrese de consultar la biblioteca de rastreadores de Ph más completa en Internet durante las vacaciones.
Recomendación de la biblioteca de rastreadores de Python
General:
1.biblioteca urllib-network (stdlib).
2. Solicitud - Biblioteca en línea.
3.Biblioteca grab-network (basada en py curl).
4.py biblioteca curl-network (libcurl vinculante).
5.urllib Biblioteca HTTP de 3 Python, grupo de conexiones seguras, admite publicación de archivos.
Y alta disponibilidad.
6.-Ejecutar código R, Python y matlab en la nube.
Extracción de contenidos de páginas web
Extraer biblioteca de contenidos de páginas web.
Texto y metadatos de páginas HTML
Utilice Python para implementar la extracción de noticias de periódicos, extracción de artículos y estrategia de contenido
Exposición.
Convierte HTML a texto en formato Markdown.
Extractor de contenidos/artículos Python-Goose-HTML.
lassie: una herramienta de recuperación de contenido de red fácil de usar
Web Sockets
Una biblioteca de sockets web.
barra transversal: un enrutador de mensajes de aplicación de código abierto (implementado en Python)
Network Sockets y WAMP en la carretera).
Se proporcionan el protocolo Autobahn python-Web Socket y WAMP.
Implementación del protocolo Python y código abierto.
WebSocket-for-Python - Python 2 y 3 y PyPy
Biblioteca de servidor y cliente de socket web.