All’inizio di questa settimana, un’indagine ha rivelato che Apple e altri giganti della tecnologia avevano utilizzato i sottotitoli di YouTube per addestrare i loro modelli di intelligenza artificiale. Tra i 170.000 video utilizzati, vi erano contenuti di creator famosi come MKBHD e Mr. Beast. Apple ha quindi utilizzato questo dataset per addestrare i suoi modelli OpenELM open-source, rilasciati ad aprile.
La società ha ora confermato a 9to5Mac che OpenELM non alimenta nessuna delle sue funzionalità di intelligenza artificiale o machine learning, inclusa Apple Intelligence.
Secondo Apple, il modello OpenELM è stato creato per contribuire alla comunità di ricerca e per avanzare nello sviluppo di modelli linguistici open-source. In passato, i ricercatori dell’azienda hanno descritto OpenELM come un “modello linguistico open-source all’avanguardia.”
Apple ha chiarito che OpenELM è stato creato esclusivamente per scopi di ricerca e non per alimentare le funzionalità di Apple Intelligence. Il modello è stato pubblicato open-source ed è ampiamente disponibile, incluso sul sito web di Apple dedicato alla ricerca nel campo del machine learning.
Poiché OpenELM non è utilizzato come parte di Apple Intelligence, il dataset di “YouTube Subtitles” non alimenta Apple Intelligence. In passato, il colosso di Cupertino ha dichiarato che i modelli di Apple Intelligence sono stati addestrati “su dati con licenza, inclusi dati selezionati per migliorare funzionalità specifiche, così come dati pubblicamente disponibili raccolti dal nostro web-crawler.”
Infine, Apple ha anche affermato di non avere piani per costruire nuove versioni del modello OpenELM.
Come riportato da Wired, aziende come Apple, Anthropic e NVIDIA hanno utilizzato il dataset “YouTube Subtitles” per addestrare i loro modelli di intelligenza artificiale. Questo dataset fa parte di una collezione più ampia chiamata “The Pile“, della non-profit EleutherAI
Leggi o Aggiungi Commenti