Início ESPECIAIS As capacidades de arquivamento da Wayback Machine sofreram um mergulho estranho.

As capacidades de arquivamento da Wayback Machine sofreram um mergulho estranho.

6
0

A Wayback Machine do Internet Archive é um recurso valioso que faz exatamente o que o nome da organização sem fins lucrativos diz. Em outras palavras, arquiva a Internet. O Internet Archive é responsável pelos seguintes arquivos: 500 milhões de páginas da web por dia.

No entanto, ocorreram mudanças preocupantes na plataforma nos últimos meses. De acordo com um novo relatório Instituto de Pesquisa NiemanA Wayback Machine do Internet Archive arquivou muito menos sites específicos atualmente. O que é ainda mais preocupante é que muitos desses sites são relacionados a notícias.

De acordo com um relatório do Neiman Lab, a Wayback Machine arquivou 1,2 milhão de instantâneos das páginas iniciais dos 100 principais sites de notícias de 1º de janeiro a 15 de maio de 2025. Mas em meados de maio, as coisas mudaram repentinamente.

A Wayback Machine tirou apenas 148.628 instantâneos das páginas iniciais dos mesmos 100 sites de notícias de 17 de maio a 1º de outubro de 2025. Isso representa um declínio colossal de 87% no número de páginas arquivadas entre os primeiros quatro meses deste ano e os cinco meses anteriores.

Por exemplo, a página inicial da CNN foi arquivada pela Wayback Machine 34.524 vezes entre 1º de janeiro e 15 de maio. Desde então, apenas 1.903 instantâneos da página inicial estão na Wayback Machine.

Velocidade da luz mashável

Veja também:

O Internet Archive tornou-se recentemente uma biblioteca federal oficial dos EUA.

Mashable relatou em julho: novo nome O Internet Archive, anunciado pelo senador da Califórnia Alex Padilla, se juntará a uma rede de mais de 1.000 bibliotecas em todo o país encarregadas de armazenar documentos governamentais para visualização pública.

Mark Graham, diretor da Wayback Machine, disse ao Nieman Lab que “a suspensão de alguns projetos de arquivamento específicos em maio… resultou na criação de menos arquivos para alguns sites”. De acordo com Graham, alguns dos snapshots perdidos ainda não tiveram uma estrutura de índice construída e em breve serão adicionados ao arquivo da Wayback Machine.

Como aponta o Nieman Lab, atrasos de cinco meses devido a problemas de índice não são incomuns. De acordo com Graham, o Internet Archive está enfrentando atrasos devido a “uma variedade de razões operacionais”, incluindo “alocações de recursos”. O Internet Archive não especificou nem forneceu mais informações ao Nieman Lab sobre este assunto.

Os jornais há muito são mantidos como registros históricos. Mas na era da Internet, a maioria dos jornais, fora dos gigantes da mídia tradicional, permanecem em grande parte desarquivados atualmente. Os sites de mídia noticiosa se estabeleceram como registros históricos. E desde 1996, o Internet Archive é responsável por armazenar esses arquivos de páginas web.

Mas a organização sem fins lucrativos tem enfrentado dificuldades nos últimos anos. Conforme relatado pelo Nieman Lab, os custos do Internet Archive em 2023 foram de US$ 32,7 milhões. São necessários muitos recursos não apenas para rastrear a Internet, mas também para armazenar os dados. A organização sem fins lucrativos gerou US$ 23 milhões em receitas no mesmo ano.

Além disso, o Internet Archive foi atingido em outubro passado. violação de dados em grande escala O site foi colocado offline junto com a Wayback Machine. Demorou várias semanas para que o site fosse totalmente restaurado.

Source link

DEIXE UMA RESPOSTA

Por favor digite seu comentário!
Por favor, digite seu nome aqui