Close Menu
LaVozTV
    What's Hot

    Nuevo pladeco 2026-2033 – Diario Digital El Calbucano

    February 26, 2026

    Cine: El director surcoreano Park Chan-wook presidirá el jurado del Festival de Cannes 2026

    February 26, 2026

    Por qué tantos colombianos piden asilo en Europa y qué significa que la UE haya designado a su país como “seguro”

    February 26, 2026
    Facebook X (Twitter) Instagram YouTube
    Facebook X (Twitter) Instagram
    LaVozTV
    Subscribe
    • Home
    • Chile
    • Cultura
    • Deportes
    • Economía
    • Noticias
    • Política
    • Sudamérica
    • Tecnología
    • Internacional
    LaVozTV
    Home»Tecnología»Un cofundador del campeón europeo de la IA ‘open source’ usó millones de libros con copyright cuando trabajaba en los modelos de Meta
    Tecnología

    Un cofundador del campeón europeo de la IA ‘open source’ usó millones de libros con copyright cuando trabajaba en los modelos de Meta

    adminBy adminDecember 26, 2025No Comments4 Mins Read
    Share Facebook Twitter Pinterest LinkedIn Tumblr Telegram Email Copy Link
    Follow Us
    Google News Flipboard
    Un cofundador del campeón europeo de la IA 'open source' usó millones de libros con copyright cuando trabajaba en los modelos de Meta
    Share
    Facebook Twitter LinkedIn Pinterest Email

    La IA nos ofrece modelos cada vez más potentes y capaces, pero ¿de dónde provienen los datos que hacen todo eso posible? Documentos judiciales, correos internos y testimonios de antiguos empleados, revelados recientemente por el medio francés Mediapart, arrojan nueva luz sobre una práctica ya conocida como el uso masivo de libros pirateados para entrenar modelos de lenguajepero también sobre la participación en la misma de quien hoy es una figura central de la IA europea.

    El corazón del escándalo: LibGen y los modelos LLaMA

    En el centro de las revelaciones se encuentra Biblioteca Génesisconocida como Biblioteca Génesis (LibGen)una ‘biblioteca no autorizada’ que reúne millones de libros protegidos por derechos de autoraccesibles sin autorización de los titulares legales.

    Según la investigación de MediaparteMeta habría recurrido de forma reiterada a LibGen para entrenar su familia de modelos Llamadestinados a competir con sistemas como ChatGPT. Los documentos analizados indican que las descargas comenzaron en octubre de 2022alcanzando un volumen estimado en 70 terabytes de datoses decir, decenas de millas de libros digitalizados.

    El uso de estas fuentes no habría sido marginal ni accidental. Correos electrónicos internos y fragmentos de código que sugieren la práctica fue conocida y discutida dentro de los equipospese a las dudas expresadas por algunos empleados sobre su legalidad.

    La responsabilidad de la dirección de Meta

    Las revelaciones no se limitan a iniciativas individuales. Según los documentos judiciales, la dirección de Meta estaba informada: algunos archivos sugieren incluso que Mark Zuckerberg respaldó el uso de estos conjuntos de datos, en un contexto donde adquirir licencias legales para millones de libros habría supuesto costes astronómicos y largos plazos de negociación.

    El laboratorio FAIR, dirigido entonces por el reconocido investigador Yann LeCun, aparece como el espacio donde se tomaron muchas de estas decisiones. Tras el lanzamiento de LLaMA, Meta habría sido considerada brevemente regularizar el acceso a contenidos licenciadosantes de volver a recurrir a fuentes ‘gratuitas’.

    Guillaume Lample, de Meta a Mistral AI

    Uno de los nombres que emergen con fuerza es el de Guillaume Lampeentonces investigador en el laboratorio FAIR (Fundamental AI Research) de Meta y hoy cofundador y director científico de Mistral AI.

    De acuerdo con los documentos revelados durante el juicio que enfrenta a Meta con varios autores, entre ellos el escritor Richard Kadrey, Guillaume Lample. Habría impulsado activamente el uso de LibGen. dentro de Meta. En intercambios internos, citados por Mediapart, se le atribuye la afirmación de que “todo el mundo usa LibGen”mencionando a OpenAI, Google y DeepMind como ejemplos.

    Cuando otros empleados plantearon la necesidad de consultar al departamento legal, Lample habría respondido que no habia hecho preguntasasumiendo que se trataba de una práctica común en el sector.

    Mistral AI y sus promesas de transparencia bajo sospecha

    El interés mediático por Guillaume Lample no se explica solo por su pasado en Meta: en 2023, fundó Mistral AI, una start-up francesa que se convirtió en tiempo récord en uno de los actores más influyentes del ecosistema europeo de la IA, con una valoración multimillonaria.

    Desde su creación, Mistral AI ha defendido una estrategia basada en datos ‘de alta calidad’ y acuerdos de licenciafirmando alianzas con instituciones como la AFP, el INA o la Biblioteca Nacional de Francia.

    Sin embargo, ex empleados de Meta citados por Mediapart sostienen que LibGen también pudo haber sido utilizado en las primeras fases de desarrollo. del modelo Mistral 7B, aunque No existe por ahora prueba documental que lo confirme. La empresa, tras ser contactada por Mediapart, asegura sus modelos con

    “Información públicamente disponible, conjuntos de datos licenciados y datos sintéticos generados internamente”.

    Un debate que va más allá de lo tecnológico

    Este caso se inscribe en un conflicto más amplio: tanto en Estados Unidos como en Europa, autores, editoriales y artistas multiplican las demandas judiciales contra empresas de IA, acusándolas de apropiarse de obras protegidas sin compensación.

    Las revelaciones sobre Meta y LibGen muestran que el problema no es marginal, sino estructural. Entrenar grandes modelos de lenguaje requiere cantidades colosales de datos, y el acceso legal a ese material choca con los intereses económicos y la velocidad del mercado.

    En última instancia, todo se resume a una pregunta: ¿Puede la innovación tecnológica justificarse a costa de los derechos de los creadores?

    Vía | Mediaparte

    Imagen | Marcos Merino mediante IA

    En Genbeta | Pidieron a ChatGPT que escribiera un libro de ‘Juego de Tronos’. El resultado fue tan bueno que acabará en los tribunales

    campeón cofundador con copyright cuándo del europeo libros los Meta millones modelos open source Trabajaba uso
    Share. Facebook Twitter Pinterest LinkedIn Tumblr Email
    admin
    • Website

    Related Posts

    Cine: El director surcoreano Park Chan-wook presidirá el jurado del Festival de Cannes 2026

    February 26, 2026

    Aena iguala al Planeta y convoca un premio de narrativa dotado con un millón de euros

    February 26, 2026

    Llegan nuevos emojis y una prueba de velocidad.

    February 26, 2026
    Add A Comment
    Leave A Reply Cancel Reply

    Nuevo pladeco 2026-2033 – Diario Digital El Calbucano

    By adminFebruary 26, 2026

    MAPOCHO CONSULTORES HACE ENTREGA DEL DOCUMENTO FINAL DEL NUEVO PLADECO 2026-2033 AL MUNICIPIO DE CHONCHI.En…

    Cine: El director surcoreano Park Chan-wook presidirá el jurado del Festival de Cannes 2026

    February 26, 2026

    Por qué tantos colombianos piden asilo en Europa y qué significa que la UE haya designado a su país como “seguro”

    February 26, 2026

    Vox no reprueba al alcalde de Alicante pero exige otra vez su dimisión por el escándalo de las viviendas

    February 26, 2026

    Lorenzo desmintió haberle prometido a Falcao ir al Mundial

    February 26, 2026

    Aena iguala al Planeta y convoca un premio de narrativa dotado con un millón de euros

    February 26, 2026
    Top Trending

    Plaza Ñuñoa se prepara para 4 días de la Feria del Libro 2025

    By adminDecember 3, 2025

    En esta cuarta edición el país invitado será México, que será representado…

    la propuesta de Jeannette Jara para reducir deudas y dar respiro a las familias

    By adminDecember 3, 2025

    En un contexto donde muchas familias viven con deudas que se vuelven…

    El jefe de defensa de Estados Unidos dice que no vio supervivientes antes del siguiente ataque del barco | Noticias militares

    By adminDecember 3, 2025

    El secretario de Defensa de Estados Unidos, Peter Hegseth, defiende el controvertido…

    Trump dice que los ataques militares contra Venezuela comenzarán “pronto”

    By adminDecember 3, 2025

    São Paulo, Brasil — El presidente de Estados Unidos, Donald Trump, dijo…

    Intercambio cultural y celebración: así fueron los 18 años del Confucio Santo Tomás

    By adminDecember 3, 2025

    el Instituto Confucio Santo Tomás (IC ST) celebró la conmemoración de su…

    Cómo postular o renovar tu beca Junaeb de residencia 2026 para educación básica, media o superior y hasta cuándo hay plazo

    By adminDecember 3, 2025

    La beca de residencia es un beneficio estatal que financia alojamiento a…

    Bienvenidos a LaVozTV, un medio digital independiente dedicado a informar con veracidad, rapidez y actualidad. Nuestro objetivo es ofrecer noticias claras, precisas y relevantes para nuestra audiencia en Chile, Sudamérica y el resto del mundo.

    Facebook X (Twitter) Instagram Pinterest YouTube

    Nuevo pladeco 2026-2033 – Diario Digital El Calbucano

    February 26, 2026

    Cine: El director surcoreano Park Chan-wook presidirá el jurado del Festival de Cannes 2026

    February 26, 2026

    Por qué tantos colombianos piden asilo en Europa y qué significa que la UE haya designado a su país como “seguro”

    February 26, 2026

    Nuevo pladeco 2026-2033 – Diario Digital El Calbucano

    By adminFebruary 26, 2026
    Facebook X (Twitter) Instagram Pinterest
    • Sobre Nosotros
    • Contáctanos
    • Descargo de Responsabilidad
    • Política de Privacidad
    • Términos y Condiciones
    © 2026 lavoztv. Designed by Pro.

    Type above and press Enter to search. Press Esc to cancel.