Método de Python para extraer enlaces de página web

La siguiente es la implementación más simple, primero captura la página de destino, luego obtiene los enlaces mediante la coincidencia de patrones del atributo href de las etiquetas a

El código siguiente es:

import urllib2
import re
url = 'http://www.sunbloger.com/'
req = urllib2.Request(url)
con = urllib2.urlopen(req)
doc = con.read()
con.close()
links = re.findall(r'href\=\"(http\:\/\/[a-zA-Z0-9\./]+)
para a en links:
  imprimir a

Resumen

Este es el contenido completo del artículo, espero que el contenido de este artículo pueda ayudarles en su aprendizaje o trabajo, si tienen alguna pregunta, pueden dejar un mensaje para la comunicación.

Tutoriales básicos

Tutorial básico de HTML
HTML5Tutoriales básicos
Manual de referencia de HTML
Tutorial de SVG
Tutorial de CSS
Manual de referencia de CSS
CSS3Tutorial
Bootstrap3 Tutorial
Bootstrap4 Tutorial
Iconos de Font Awesome
Tutorial de JavaScript
Manual de referencia de JavaScript
Tutorial de jQuery
Tutorial de AJAX
Tutorial de JSON
Tutorial de AngularJS
Tutorial de ReactJS
Tutorial de NodeJS
Tutorial de Python
C++ Tutorial
Tutorial de Golang
Tutorial de C
Tutorial de PHP
Tutorial de C#
Tutorial de LINQ
Tutorial de Lua
Tutorial de Ruby
Tutorial de Rust
Tutorial de Linux
Tutorial de R
Tutorial de Docker
Tutorial de Scala
Tutorial de MatLab
Tutorial de Erlang
Tutorial de Pandas
Tutorial de Numpy
Tutorial de Matplotlib
Tutorial de Flask
Tutorial de Java
Tutorial de SpringBoot
Tutorial de JDBC
Tutorial de JSP
Tutorial de Servlet
Tutorial de Maven
Tutorial de Spring
Tutorial de Django
Tutorial de Swift
Tutorial de Kotlin
Tutorial de SQL
Tutorial de MongoDB
Tutorial de SQLite
Tutorial de PostgreSQL
Tutorial de MySql
Tutorial de Redis
Tutorial de Elasticsearch

Te gustará también

Resumen de métodos comunes de formateo de cadenas en Python [porcentaje y método format]
Ejemplo de código de ejemplo de estructura de árbol (ztree) en AngularJS
Implementación de la cascada de jQuery3Casos
Python3Resumen de las funciones comunes de urllib.parse (urlencode, quote, quote_plus, unquote, unquote_plus, etc.)
Método de jQuery para recorrer ascendentes y ascendientes de elementos
Método de Python para determinar la integridad de la imagen basado en pillow
Descripción detallada de eventos táctiles en dispositivos móviles
Resumen de la diferencia entre $scope y $rootScope en AnjularJS
Descripción detallada y código de ejemplo de tecnología de reconocimiento de voz en Android
Ejemplo de uso de la función de retorno de json en Django
ASP.NET MVC4 Efecto de paginación simple de Razor
Método simple de jQuery para recorrer hacia arriba
Descripción detallada de la versión Android studio de reconocimiento de voz Baidu (Baidu Voice)
Descripción detallada y código de ejemplo de reconocimiento de voz fácil en Android
Ejemplo de inicialización de lista en Python
Método de Python para extraer enlaces de página web
Método de manipulación de bases de datos mysqli en php
Dos formas de citar cadenas de js (recomendado ver)
Los primeros cinco pozos de desarrollo de la cuenta deWeChat pública en php (parte uno)
Modifique el conjunto de caracteres predeterminado de mysql a utf a través de my.cnf-8Métodos y consideraciones
Método de jQuery para obtener el valor de índice de elemento
Breve explicación de referencias y copias en js (valor y referencia)
Desarrollo de Android OpenGL ES dibujado3D Descripción detallada de ejemplos gráficos
Método de solución de problemas de mal código de caracteres chinos en la descomprimida de Fedora con python
jQuery realiza el efecto de resaltado al pasar el ratón y oscurecer otros elementos del mismo nivel