Spotify ha sufrido uno de los mayores actos de piratería en los últimos tiempos.. La aplicación de transmisión ha admitido el acceso no autorizado a los archivos de la plataforma para hacer una copia de todas las canciones en su servicio, siendo el grupo de activistas Anna’s Archive quien ha hackeado a Spotify.
Los responsables de Anna’s Archive consiguieron descargar hasta 86 millones de archivos de audio y metadatoslo que corresponde al 99,6% de la plataforma porque el volumen de datos asciende hasta 300 terabytes. Además, según este grupo de activistas, los datos robados se están distribuyendo mediante “torrents masivos” y cuentan con la mayoría de las canciones más reproducidas y populares de la plataforma de transmisión.
Por lo tanto, en este sentido, Anna’s Archive lo ha definido como el “primer archivo de preservación de música del mundo que es completamente abierto”ya que cualquier usuario puede descargarlo en sus dispositivos, como parte de su “misión” de preservar el conocimiento y la cultura. Además, la organización ha especificado que, de esta forma, se garantiza la preservación de toda la música, incluida la de artistas menos conocidos que recoge la plataforma, y no solo las canciones de los artistas más populares.
Pero, ¿cómo consiguieron robar el 99,6% del volumen de datos de Spotify? Anna’s Archive utilizó la técnica raspado para extraer datos de sitios web de forma automatizada para convertirla en información estructurada. Por fin, se trata de una extracción de archivos y posterior distribución ilegal, que va en contra de las condiciones de servicio de Spotify y la legislación de los derechos de autor.
Así lo afirma la plataforma de transmisión al diario Autoridad de Android: “Hemos identificado que un tercer extrajo metadatos públicos empleó tácticas ilícitas para evadir la Gestión de Derechos Digitales (DRM) y acceder a algunos archivos de audio de la plataforma”. Además, agrega que han identificado y desactivado las cuentas de los usuarios maliciosos que realizaban raspado: “Hemos implementado nuevas medidas de seguridad para este tipo de ataques anti-copyright y estamos monitoreando activamente cualquier comportamiento sospechoso”.
¿Qué es el raspado?
el raspado es una técnica de extracción de datos y contenidos de una página mediante un programa informáticoademás, se consigue la información por medio de procesos automatizados —como robots o rastreadores web—.
Respecto al proceso de extracción de datos, Cloudflare explica en su web que, en primer lugar, el fragmento de código utilizado para extraer la información —es decir, el bot— envía una solicitud HTTP GET a un sitio web específico y, cuando el sitio web responde, el programa informático analiza el documento HTML para buscar un patrón de datos específico. Por último, una vez extraídos los datos, se convierten a cualquier formato específico proyectado por el autor del bot Delaware raspador.
Cómo evitar el raspado
Los métodos para limitar la exposición a los esfuerzos de extracción de datos incluyen las solicitudes de limitación de velocidadla modificación del formato HTML de forma regular para recorrer el contenido del sitio web y analizar los datos de forma segura, la exigencia a los visitantes del sitio web para que respondan a una pregunta que sea dificil de contestar para un ordenadory la incrustación de contenido dentro de objetos multimedia.
Por otro lado, Cloudflare agrega que “la única forma de garantizar el fin del raspado de sitios web es dejar de poner contenidos en un sitio web por completo. Sin embargo, el uso de una solución avanzada de gestión de robots puede ayudar a los sitios web a eliminar el acceso de los robots de extracción”.
