Um estudo do Pew Research Center revela que quase 40% das páginas da internet ativas em 2013 desapareceram até 2023. Essa perda de conteúdo online, equivalente a 252 milhões de Páginas da internet perdidas, levanta preocupações sobre a preservação da memória digital. O estudo analisou uma amostra de um milhão de páginas do Common Crawl, organização que arquiva dados da web. A pesquisa utilizou códigos de erro do servidor, como o “404 Not Found”, para identificar páginas fora do ar.
Cerca de 25% das páginas ativas em 2013 sumiram da web em dez anos. Isso significa que, de 630 milhões de sites, 252 milhões deixaram de existir. A pesquisa, conduzida pelo Pew Research Center, foi publicada recentemente e analisou dados do Common Crawl. O Common Crawl é uma organização sem fins lucrativos dedicada à preservação de registros da internet.
Os pesquisadores usaram nove códigos de erro para identificar as Páginas da internet perdidas. Um dos códigos mais comuns foi o 404 Not Found. Esse código indica que a página solicitada não foi encontrada no servidor. Apesar da automação do processo, a pesquisa não detectou a substituição de conteúdo por anúncios. Isso ocorre quando uma página é comprada e seu conteúdo original é apagado para dar lugar à publicidade online.
Um exemplo citado é o blog “Morri de Sunga Branca”, que perdeu seu domínio após o encerramento das atividades em 2020. O endereço agora redireciona para um site de apostas. Thiago Pasqualotto, um dos criadores do blog, explica que o encerramento ocorreu devido à competição com novas plataformas como o Instagram. Ele conta que o foco do blog era humor, crítica e texto, formato que perdeu espaço para a rapidez das redes sociais.
A migração da web 1.0 para a web 2.0, marcada pela ascensão das plataformas sociais, agravou a perda de conteúdo online. Aaron Smith, coordenador do estudo, destaca a efemeridade das postagens em redes sociais como o X (antigo Twitter). Muitas vezes, as publicações desaparecem em questão de horas ou dias por decisão dos usuários.
Tamara Kneese, autora do livro Death Glitch, aborda como essa situação afeta a preservação de memórias pessoais. Ela lembra que nos anos 2000, havia um movimento para digitalizar memórias físicas. Agora, a preservação depende de grandes empresas de tecnologia, cujas decisões impactam o acesso a informações e lembranças.
Kneese aponta que empresas como a Meta restringem o arquivamento de conteúdo por plataformas como o Internet Archive. Páginas da internet perdidas representam um desafio para a memória histórica. O fechamento do Orkut no Brasil e as discussões sobre o futuro do TikTok nos EUA ilustram a fragilidade do conteúdo online. A preservação digital requer atenção contínua para evitar perdas significativas no futuro.
Via Folha de S.Paulo