Generador de Sitemap

Descripción

El Sitemap Generator utiliza un servicio externo para rastrear su sitio web y crear un sitemap XML de su sitio web. El generador funciona así para cada complemento de fábrica. Los costos de computación para su sitio web también son muy bajos porque el rastreador actúa como un visitante normal, que visita todas las páginas de su sitio una vez.

Si aloja su sitio web en un servidor dedicado, es posible que no necesite este plugin, ya que debe tener suficientes recursos para generar su sitemap en su servidor. Pero si aloja su sitio web en un entorno compartido (como lo hacen la mayoría de los usuarios de WordPress), sería conveniente externalizar la generación de su sitemap a un servicio externo como este plugin utiliza para generar el sitemap. De esta manera, se garantiza que la velocidad de su sitio web no se vea afectada por sus visitantes durante la generación del sitemap.

Funcionalidades

  • Configuración simple.
  • Funciona afuera de la caja con todos los plugins de WordPress.
  • Bajos costos de computación para su servidor web.

Características técnicas

  • Respects your robots.txt file (also the crawl-delay directive).
    • You could use the user-agent MB-SiteCrawler to control the crawler.
  • Soporte para meta elementos de robots (noindex).
  • Adds nearly all indexable filetypes (for example .pdf, .xls, .doc) to the sitemap.

Características técnicas adicionales de la versión profesional

  • Generación de sitemaps de imágenes.
  • Generación de sitemaps de video
    • Actualmente, se admiten elementos de video HTML5 y videos de YouTube incrustados.

Próximas características técnicas

  • Soporte para videos de Vimeo en sitemaps de video.
  • Soporte para elementos de imagen HTML5 en sitemaps de imágenes.
  • Creación diaria automática de sitemaps.

Requerimientos técnicos

  • cURL 7.18.1 or higher.
    • PHP 5.3 should be compiled against a compatible cURL version in the most cases. PHP 5.4 or higher should by default provide a compatible cURL version.
  • OpenSSL 0.9.8f o superior.

Agregación de datos y Tipos de Archivos Indexables

He publicado un documento detallado sobre cómo Sitemap Generator agrega los datos para la generación de sitemaps y qué tipos de archivos se indexan en mi sitio web.

Datos del generador del Sitemap

Es el servicio gratuito?

El servicio Sitemap Generator le permite crear un mapa del sitio con hasta 500 URL de forma gratuita. Si su sitio web tiene más URL o si desea integrar un mapa del sitio de imágenes o videos, puede comprar la versión profesional para crear un mapa del sitio con hasta 50000 URL en el siguiente sitio web. El plugin wordpress en sí mismo es gratuito, pero casi inútil sin el servicio externo. Tenga en cuenta que las URL no indexables (por ejemplo, archivos .zip) cuentan para la cuota.

Sitemap Generator Professional

Limitaciones

Por defecto, Sitemap Generator indexa las primeras 500 URL de su sitio web. Si su sitio web tiene más URL, consulte la sección “¿Es gratis el servicio?”

Avisos

Si ya tiene un sitemap.xml existente en su directorio raíz de WordPress, este archivo se sobrescribirá. Por lo tanto, se recomienda realizar una copia de seguridad de su archivo sitemap.xml existente antes de usar Sitemap Generator. Tampoco he probado el generador en el espacio web de Windows. También debe acceder al sitemap.xml después de que termine la generación y verificar si todo está bien.

Prueba de verificación previa a la instalación

Si desea probar si Sitemap Generator funciona correctamente con su sitio web antes de instalar el complemento, puede utilizar el Online Sitemap Generator en mi sitio web, que utiliza la misma tecnología que el plugin para generar los sitemaps.

Uso de un servidor externo

Sitemap Generator utiliza un servidor externo, operado por el desarrollador del plugin, para rastrear su sitio web y detectar enlaces rotos. Esto significa que hay cierta comunicación entre su sitio web y el servidor. La única información que su sitio web comunica al servidor externo es la URL de su sitio web y el hecho de que esté usando WordPress. El servidor rastreará su sitio web (como lo hace un visitante normal) y responderá con el mapa del sitio generado.

Capturas

  • La interfaz de usuario de Sitemap Generator.

Instalación

  1. Suba la carpeta ‘mb-sitemap-generator’ al directorio ‘/ wp-content / plugins /’.
  2. Activa el plugin desde el menú ‘Plugins’ de WordPress.
  3. Acceda al generador con el botón “Sitemap Generator” en la barra lateral y use el botón “Generar su sitemap” para comenzar el proceso de generación. El sitemap se guardará como sitemap.xml en su directorio raíz de WordPress. Tenga en cuenta que un archivo sitemap.xml existente se sobrescribirá sin preguntar.
  4. Utilice el botón “Mostrar el Sitemap” para descargar su sitemap y comprobar si el sitemap generado está completo

Preguntas frecuentes

Installation Instructions
  1. Suba la carpeta ‘mb-sitemap-generator’ al directorio ‘/ wp-content / plugins /’.
  2. Activa el plugin desde el menú ‘Plugins’ de WordPress.
  3. Acceda al generador con el botón “Sitemap Generator” en la barra lateral y use el botón “Generar su sitemap” para comenzar el proceso de generación. El sitemap se guardará como sitemap.xml en su directorio raíz de WordPress. Tenga en cuenta que un archivo sitemap.xml existente se sobrescribirá sin preguntar.
  4. Utilice el botón “Mostrar el Sitemap” para descargar su sitemap y comprobar si el sitemap generado está completo
¿Por qué Sitemap Generator no indexa ninguna URL de mi sitio?

Noindex establecido para todas las páginas

Sitemap Generator es consciente de los meta elementos de los robots (noindex) y no enumera las páginas que están marcadas con el atributo noindex. He observado algunos sitios web en la naturaleza, que han agregado el atributo noindex en cada página. Por favor, asegúrese de que este no sea el caso para su sitio web. Ni Sitemap Generator ni ningún motor de búsqueda indexarán su sitio si el atributo noindex se establece globalmente.

Rastreador del sitio bloqueado

Otra razón para un sitemap sin URL podría ser que el rastreador de Sitemap generator esté bloqueado por su proveedor de alojamiento. He observado este problema especialmente con proveedores de hosting gratuitos y realmente baratos. Algunos bloquean a los rastreadores (y visitantes regulares) después de cinco solicitudes secuenciales rápidas. El problema podría solucionarse al incluir en la lista blanca la IP del rastreador. Sin embargo, creo que esta opción no está disponible para los servicios de alojamiento afectados. Alternativamente, es posible utilizar la directiva de retraso de rastreo en su robots.txt para establecer la demora entre dos solicitudes.

¿Es posible filtrar las URL que figuran en el Sitemap?

Sitemap Generator reconoce el atributo noindex si se establece en una página y respeta su archivo robots.txt. Por lo tanto, es posible filtrar los resultados con estos dos mecanismos. Una función de filtro en el plugin no está disponible, porque no tiene sentido en mi opinión. Si una página no aparece en un archivo de mapa de sitio XML, eso significa que un motor de búsqueda no lo encontrará. Tarde o temprano, el motor de búsqueda encuentra e indexa la página. Entonces, el uso del atributo noindex y del robots.txt son soluciones limpias que también son respetadas por todos los motores de búsqueda serios.

¿Qué agente de usuario debería usar en el archivo robots.txt?

Sitemap generator utiliza un grupo de agente de usuario personalizado llamado MB-SiteCrawler. Esto le permitirá tener un control detallado de qué páginas se analizan y se agregan al sitemap. Si no define un grupo para el agente de usuario personalizado en su archivo robots.txt, se aplicará el conjunto predeterminado del * grupo.

¿Cómo se manejan las imágenes que no están incrustadas en una página?

Las imágenes que solo están vinculadas directamente y no incrustadas en una página HTML se enumeran en el sitemap de imagen y no como las URL normales. Por desgracia, no hay especificaciones sobre cómo manejar esas imágenes, pero debido a que las imágenes necesitan un contexto para ser evaluadas correctamente en este día y edad, creo que el sitemap de imagen es el mejor lugar para ponerlas.

¿Cómo se manejan las imágenes incrustadas de los dominios externos?

Si incrustó imágenes de dominios externos en su sitio web, estas se enumeraran en el sitemap de imagen. Así que no hay problema si entrega sus imágenes, por ejemplo, a través de un servicio CDN que está disponible en otro dominio. Tenga en cuenta que esto solo es cierto para las imágenes incrustadas y no si se vincula directamente a imágenes en otros dominios.

¿Funcionará Sitemap Generator en mi entorno de desarrollo local?

No, Sitemap Generator necesita rastrear su sitio web y el generador no tiene acceso a su red local.

Sitemap Generator está muy lento. ¿Qué puedo hacer?

En la mayoría de los casos esto se debe al hecho de que ha establecido un valor grande para la directiva de retraso de rastreo en su archivo robots.txt. Algunos proveedores de servicios de hosting también agregan la directiva de retraso de rastreo automáticamente a su archivo robots.txt. El rastreo-demora define el tiempo en segundos entre las solicitudes del rastreador.

Reseñas

Leer todas las 15 reseñas

Colaboradores y desarrolladores

“Generador de Sitemap” es un software de código abierto. Las siguientes personas han colaborado con este plugin.

Colaboradores

Traduce “Generador de Sitemap” a tu idioma.

¿Interesado en el desarrollo?

Revisa el código , echa un vistazo al repositorio SVN , o suscríbete al log de desarrollo por RSS .

Registro de cambios

1.6.0

Release Date – 8th September, 2018

  • New option to disable cookie support.
  • New option to remove query params from URLs.

1.5.2

Release Date – 17th August, 2018

  • 1.5.1 used a debugging URL as default.

1.5.1

Release Date – 17th August, 2018

  • Made Ajax requests more robust by implementing 3 retries if requests fail due to temporary issues.
  • Removed a call to the error_log function.

1.5.0

Release Date – 17th August, 2018

  • Added a new option “Reference Count Threshold” to exclude images and videos that are embedded on multiple pages.
  • Fixed some error handling bugs in Ajax requests.
  • Small improvements of crawler.

1.4.3

Release Date – 14th April, 2018

  • Force the use of IPv4, because IPv6 does not work for all configurations, probably due to a bug in some curl versions or the PHP curl integration.
  • Multiple crawler improvements.
    • Added cookie support.

1.4.2

Fecha de lanzamiento: 11 de febrero de 2018

  • Información de compatibilidad actualizada (probada hasta WordPress 4.9)

1.4.1

Fecha de lanzamiento: 11 de febrero de 2018

  • Mejoras en el rastreador.
  • Corrección de errores
    • Estado de código corregido de las solicitudes de proxy fallidas.
    • llamada fija a wp_die ()

1.4.0

Fecha de lanzamiento: 12 de julio de 2016

  • Se agregó una opción para ignorar el contenido incrustado (por ejemplo, imágenes).
  • Se agregó una opción para definir el número máximo de conexiones simultáneas.
  • Bugfixes
    • Implemented Cache-Control for AJAX requests.
    • Se corrigió el problema de la etiqueta corta de PHP.
    • Mensaje de error específico si la escritura en el archivo falló.

1.3.1

Fecha de lanzamiento: 1 de febrero de 2016

  • Se han mejorado los mensajes de error de cURL.
  • Bugfix: Replaced get_site_url() with get_home_url(), which referes to the option “Site Address (URL)”.

1.3.0

Fecha de lanzamiento: 11 de noviembre de 2015

  • Estadísticas de rastreo y sitemaps han sido implementadas.
  • Mensaje de error implementado si administración está inactiva.
  • Se implementó mejores mensajes de error para detectar problemas al inicio.
  • Technical changes
    • Renamed global JS vars (namespacing).
    • Se eliminaron las cadenas de idioma alemanas.
    • Se movieron algunas variables a un archivo separado para usar el mismo archivo JS con múltiples CMS.

1.2.5

Fecha de lanzamiento: 27 de septiembre de 2015

  • Se implementó un mejor mensaje de error si el token no es válido o ha expirado.
  • Se implementó un mejor mensaje de error si se alcanza el límite.

1.2.4

Fecha de lanzamiento: 27 de septiembre de 2015

  • Otra versión de corrección de errores para un problema con PHP 5.3.

1.2.3

Fecha de lanzamiento: 27 de septiembre de 2015

  • Corrección de errores, faltaba un archivo en la versión anterior.

1.2.2

Fecha de lanzamiento: 27 de septiembre de 2015

  • Mejor informe de errores si el sitio web no es accesible.
  • Fixed bug that external files (for example pdf files) were added to the sitemap.
  • Se agregó un cheque para la versión de cURL correcta.
  • Se agregó un cheque si el complemento se usa en un entorno de desarrollo local.

1.2.1

Fecha de lanzamiento: 31 de agosto de 2015

  • Se agregó compatibilidad con el título y la leyenda en los sitemaps de imágenes.
  • Se agregó soporte para las etiquetas, el recuento de vistas y la restricción de región de los videos de YouTube en el sitemap de video.
  • Se eliminaron las secciones de CDATA y se escapó el contenido en lugar de en los sitemaps de imágenes y videos.
  • Se agregó un enlace a la página de información general de Sitemap Generator en el archivo léame.

1.2.0

Fecha de lanzamiento: 28 de agosto de 2015

  • Cambio innecesario introducido en 1.1.0: las páginas bloqueadas por el archivo robots.txt no se analizan de ahora en adelante como en las versiones anteriores a 1.1.0. He vuelto a pensar este punto y creo que los rastreadores deberían respetar el robots.txt, sin importar el propósito del rastreador.
  • Soporte para grupo de usuario-agente personalizado (MB-SiteCrawler) en robots.txt.
  • El sitemap de video es compatible con los videos de YouTube a partir de ahora. Los datos se obtienen a través de la API de datos de YouTube.
  • Algunos cambios de texto en los plugins de fondo.

1.1.0

Fecha de lanzamiento: 21 de agosto de 2015

Tenga en cuenta que el plugin no se modificó, solo el servicio de backend.

  • Las imágenes que están vinculadas, pero que no están incrustadas en una página, ahora se muestran en el mapa del sitio de la imagen para darles contexto. En versiones anteriores, estas imágenes se enumeraban como URL normales.
  • Las páginas bloqueadas por el archivo robots.txt no se analizaron en una versión anterior. Esto está arreglado ahora. Todavía no aparecen en el sitemap, pero se detectan los enlaces en estas páginas.
  • Se corrigió un problema con la evaluación de la etiqueta base HTML. Un valor href de etiqueta base con una barra inclinada no se evaluó correctamente antes.
  • Algunas correcciones de errores más pequeñas y mejoras de rendimiento.

1.0.4

Fecha de lanzamiento: 16 de agosto de 2015

  • Corrección de errores para el problema en 1.0.3.

1.0.3

Fecha de lanzamiento: 16 de agosto de 2015

  • Se cambió la posición del menú a una más única.
  • Se agregó un mensaje para indicar si se alcanzó el límite de URL.

1.0.2

Fecha de lanzamiento: 10 de agosto de 2015

  • Se agregó información sobre el uso de un servidor externo al archivo Léame.
  • Use las funciones nativas de WordPress para cargar los archivos de JavaScript.

1.0.1

Fecha de lanzamiento: 8 de agosto de 2015

  • Se modificó la licencia de AGPL a GPL.
  • Se agregó una sección de preguntas frecuentes.
  • Se agregó una nota a la interfaz del administrador del plugin.

1.0.0

Fecha de lanzamiento: 7 de agosto de 2015

  • Soporte adicional para sitemaps de videos.

1.0.0-beta.5

Fecha de lanzamiento: 7 de agosto de 2015

  • Soporte adicional para casi todos los tipos de archivos indexables.
  • Se agregó soporte para meta elementos de robots (noindex).

1.0.0-beta.4

Fecha de lanzamiento: 1 de agosto de 2015

  • Se agregó soporte para sitemaps de imágenes.

1.0.0-beta.3

Fecha de lanzamiento: 30 de mayo de 2015

  • Soporte implementado para tokens de autorización.

1.0.0-beta.2

Fecha de lanzamiento: 16 de mayo de 2015

  • Interfaz de usuario mejorada.

1.0.0-beta.1

Fecha de lanzamiento: 9 de mayo de 2015

  • Versión inicial.