John Mueller de Google dijo en un Hangout que es mejor tener un sitio web con HTML válido:
“Esto ocurrió hace poco con el cambio de las directrices, en lo que respecta a los cambios que se hicieron en las directrices para webmasters. Mencionamos ‘usa HTML válido’ La pregunta aquí es:.. ¿Es el validador del W3C (HTML broken) factor de clasificación o no debería importarnos eso?
No es directamente un factor de clasificación. No es que si tu sitio no está usando HTML válido vamos a sacarlo de él índice. Porque creo que vamos a tener espacios de resultados de búsqueda vacios.
Sin embargo, hay algunos aspectos que allí entran en juego. Por un lado, un sitio con HTML realmente roto, algo que vemos muy rara vez, es muy difícil para nosotros rastrear e indexar al contenido porque no podemos encontrarlo.
Los otros dos aspectos que son una más una especie de datos estructurados. A veces es muy difícil de recoger los datos estructurados cuando el HTML se ha roto por completo. Por lo tanto no se puede utilizar fácilmente un validador para los datos estructurados.
La otra cosa es en lo que respecta a los dispositivos móviles y el soporte a través de navegadores es si se ha roto el HTML, entonces esto es a veces muy difícil de hacer en los dispositivos más nuevos”.
Este video muestra una respuesta más detallada :
En pocas palabras:
No hay ninguna pena para el código HTML roto. Google puede manejar una gran cantidad de errores de HTML. Sin embargo, algunos errores HTML hacen que sea difícil para Google indexar las páginas web.
Otros errores HTML pueden causar problemas con el marcado de datos estructurados, otros errores que pueden causar problemas de visualización en dispositivos móviles.
Por esa razón, es mucho mejor para asegurarte de que tus páginas web utilizan HTML válido. El HTML válido es un signo de un sitio web es de alta calidad.