English | 简体中文 | 繁體中文 | Русский язык | Français | Español | Português | Deutsch | 日本語 | 한국어 | Italiano | بالعربية

Métodos simples para detectar tipos de texto en Python2Métodos【Basado en la cabecera de archivo y la biblioteca cchardet】

Este ejemplo ilustra cómo detectar el tipo de texto simple en Python. Compartimos con todos, como se muestra a continuación:

1、basado en la cabecera del archivo.

#¿Es UTF con encabezado BOM?8archivo
def IsUtf8BomFile(pathfile):
  if b'\xef\xbb\xbf' == open(pathfile, mode='rb').read(3)):
    return True
  return False

2、usando la biblioteca cchardet.

>>> import cchardet
>>> cchardet.detect(open(pathfile, 'rb').read())
{'encoding': 'UTF-8', 'confianza': 0.9900000095367432{}

Los lectores interesados en más contenido relacionado con Python pueden consultar las secciones especiales de este sitio: 'Resumen de técnicas de manejo de archivos y directorios de Python', 'Resumen de técnicas de manejo de archivos de texto de Python', 'Resumen de técnicas de manejo de URL de Python', 'Resumen de técnicas de manejo de imágenes de Python', 'Tutorial de estructuras de datos y algoritmos de Python', 'Resumen de técnicas de programación de Socket de Python', 'Resumen de técnicas de uso de funciones de Python', 'Resumen de técnicas de manejo de cadenas de Python' y 'Tutorial clásica de introducción y avanzado de Python'.

Espero que lo dicho en este artículo sea útil para todos en la programación de Python.

Declaración: El contenido de este artículo se obtiene de la red, es propiedad del autor original, el contenido se contribuye y carga de manera autónoma por los usuarios de Internet, este sitio no posee los derechos de propiedad, no ha sido editado artificialmente y no asume responsabilidad por responsabilidades legales relacionadas. Si encuentra contenido sospechoso de copyright, le invitamos a enviar un correo electrónico a: notice#oldtoolbag.com (al enviar un correo electrónico, reemplace # con @) para denunciar, y proporcione evidencia relevante. Una vez verificada, este sitio eliminará inmediatamente el contenido sospechoso de infracción.

Te gustaría que te gustara