Um quarto das páginas da internet perdidas: o cemitério digital de uma década

Páginas da internet perdidas: estudo revela que 25% dos sites ativos em 2013 desapareceram. Saiba mais sobre essa perda significativa de conteúdo online e os desafios da preservação digital.
04/02/2025 às 10:04 | Atualizado há 5 meses
Páginas da internet perdidas
Páginas da internet perdidas

Um estudo do Pew Research Center revela que quase 40% das páginas da internet ativas em 2013 desapareceram até 2023. Essa perda de conteúdo online, equivalente a 252 milhões de Páginas da internet perdidas, levanta preocupações sobre a preservação da memória digital. O estudo analisou uma amostra de um milhão de páginas do Common Crawl, organização que arquiva dados da web. A pesquisa utilizou códigos de erro do servidor, como o “404 Not Found”, para identificar páginas fora do ar.

Cerca de 25% das páginas ativas em 2013 sumiram da web em dez anos. Isso significa que, de 630 milhões de sites, 252 milhões deixaram de existir. A pesquisa, conduzida pelo Pew Research Center, foi publicada recentemente e analisou dados do Common Crawl. O Common Crawl é uma organização sem fins lucrativos dedicada à preservação de registros da internet.

Os pesquisadores usaram nove códigos de erro para identificar as Páginas da internet perdidas. Um dos códigos mais comuns foi o 404 Not Found. Esse código indica que a página solicitada não foi encontrada no servidor. Apesar da automação do processo, a pesquisa não detectou a substituição de conteúdo por anúncios. Isso ocorre quando uma página é comprada e seu conteúdo original é apagado para dar lugar à publicidade online.

Um exemplo citado é o blog “Morri de Sunga Branca”, que perdeu seu domínio após o encerramento das atividades em 2020. O endereço agora redireciona para um site de apostas. Thiago Pasqualotto, um dos criadores do blog, explica que o encerramento ocorreu devido à competição com novas plataformas como o Instagram. Ele conta que o foco do blog era humor, crítica e texto, formato que perdeu espaço para a rapidez das redes sociais.

A migração da web 1.0 para a web 2.0, marcada pela ascensão das plataformas sociais, agravou a perda de conteúdo online. Aaron Smith, coordenador do estudo, destaca a efemeridade das postagens em redes sociais como o X (antigo Twitter). Muitas vezes, as publicações desaparecem em questão de horas ou dias por decisão dos usuários.

Tamara Kneese, autora do livro Death Glitch, aborda como essa situação afeta a preservação de memórias pessoais. Ela lembra que nos anos 2000, havia um movimento para digitalizar memórias físicas. Agora, a preservação depende de grandes empresas de tecnologia, cujas decisões impactam o acesso a informações e lembranças.

Kneese aponta que empresas como a Meta restringem o arquivamento de conteúdo por plataformas como o Internet Archive. Páginas da internet perdidas representam um desafio para a memória histórica. O fechamento do Orkut no Brasil e as discussões sobre o futuro do TikTok nos EUA ilustram a fragilidade do conteúdo online. A preservação digital requer atenção contínua para evitar perdas significativas no futuro.

Via Folha de S.Paulo

Artigos colaborativos escritos por redatores e editores do portal Vitória Agora.