Molte piattaforme addestano l’IA col webscraping, raccogliendo enormi quantità di informazioni, anche personali, pubblicate sul web
Il Garante per la privacy ha avviato un’indagine conoscitiva sui siti internet pubblici e privati per verificare l’adozione di misure di sicurezza adeguate a impedire la raccolta di dati personali per addestrare algoritmi di intelligenza artificiale. L’indagine riguarda tutti i titolari del trattamento, pubblici o privati, che operano in Italia o che offrono servizi in Italia, e che rendono disponibili online dati personali accessibili anche dagli “spider” delle piattaforme di IA. Molte piattaforme di IA usano il webscraping per raccogliere, per vari scopi, enormi quantità di dati, anche personali, pubblicati per finalità specifiche (cronaca, trasparenza amministrativa ecc.) su siti internet gestiti da soggetti pubblici e privati.
La Repubblica del 22 Novembre 2023 – link