Internet Archive es una biblioteca digital y un sitio de archivo dedicado a la documentación permanente y el acceso público gratuito a una amplia variedad de artefactos digitales, que van desde sitios web, música, vídeos y casi tres millones de libros registrados bajo el dominio público que se pueden encontrar en la Internet.
Historia[]

La web alrededor de 1997
Internet Archive fue fundado en 1996 por el ingeniero informático estadounidense y activista de Internet Brewster Kahle, quien también cofundó el servicio de rastreo web Alexa Internet casi al mismo tiempo. Inicialmente comenzó como un proyecto personal de Kahle para archivar la World Wide Web, el sistema de tablón de anuncios de Netnews, otro software y páginas web disponibles públicamente, pero a fines de 1999, su alcance se amplió para incluir otras colecciones de archivo valiosas como los Archivos Prelinger y las imágenes archivadas de la NASA.
La colección de Kahle se mantuvo en gran medida privada en cinta digital durante la década de 1990, lo que solo permitió a los investigadores y científicos acceder a la base de datos en ocasiones especiales. A pesar de su falta de acceso público, Internet Archives recibió cobertura de prensa de varias publicaciones de noticias de Estados Unidos en su lanzamiento, incluidos el New York Times, Washington Post, Wired Magazine y National Public Radio (NPR).
Acceso público[]

Página de Wayback Machine
La base de datos finalmente estuvo disponible para el acceso público en el quinto aniversario del proyecto en 2001 con el lanzamiento de The Wayback Machine, una cápsula del tiempo digital que permite a sus usuarios navegar por múltiples versiones de páginas web archivadas a lo largo del tiempo. Según Kahle, se inspiró para crear la Máquina después de visitar las oficinas del ya desaparecido servicio de motor de búsqueda Alta Vista y presenciar el ambicioso plan de la empresa para almacenar e indexar todo lo que estaba en la web. A lo largo de la década de 2000, Internet Archive continuó ampliando su colección mediante la fusión de bases de datos preexistentes y la creación de otras nuevas.
Protesta SOPA / PIPA[]

Protesta SOPA.png
El 18 de enero de 2012, Internet Archives bloqueó su sitio web durante doce horas en protesta por los controvertidos proyectos de ley de Internet de EE. UU. Ley para detener la piratería en línea y la Ley PROTECT IP, similar a muchos otros sitios web y bases de datos de recursos como Wikipedia.
Hito de 10 petabytes[]

Hito de 10 petabytes
A mediados de octubre de 2012, se anunció que el proyecto de Wayback Machine alcanzó un hito importante de 10 petabytes (10 000 000 000 000 000 bytes) de materiales digitales en preservación, incluidos millones de libros digitales, música, películas y páginas web.
Incendio en la oficina de San Francisco[]

Incendio en la sede de S.F.
El 5 de noviembre de 2013, la oficina de Internet Archive en San Francisco, California, se incendió, destruyendo equipos de escaneo digital por un valor aproximado de $600,000 y dañando un complejo de apartamentos adyacente. Según la publicación del blog oficial, no se reportaron heridos en la escena y el alcance de los daños se limitó principalmente a equipos, aunque costosos, con algunas pérdidas de "materiales físicos" que estaban siendo digitalizados en la sala de escaneo.
En otra publicación del blog, Brewster Kahle, el fundador de Internet Archive, también anunció sobre la creación de una campaña de fondos de emergencia para reconstruir sus capacidades de escaneo y solicitó servicios de digitalización para ayudar al grupo a continuar con su proceso de archivo durante la recuperación.
Características[]
Internet Archives se compone principalmente de sus servicios en línea gratuitos Wayback Machine y Archive-It, además de una serie de colecciones de medios especializados que se han adquirido con el tiempo, en particular Prelinger Archives, NASA Image Archives, Open Library y Live Music Archive.
The Wayback Machine[]

The Wayback Machine
The Wayback Machine es el servicio de "índice tridimensional" de Internet Archive que permite al usuario buscar, navegar y acceder a instantáneas de la World Wide Web archivadas a través de su base de datos a lo largo del tiempo. Desde su lanzamiento en 2001, el servicio ha archivado millones de sitios web, sus datos y medios asociados que se pueden usar para obtener más información sobre cómo eran las versiones anteriores de ciertos sitios web, para obtener el código fuente que ha desaparecido de los sitios web o para visitar sitios web que ya no existen en la web.
A menudo considerada una herramienta de investigación académica fundamental para estudiar la historia de Internet, su popularidad también ha llevado al uso de los términos "Wayback Machine" e "Internet Archive" como sinónimos en algunas comunidades en línea.
Archive-It[]

Archive-It
Archive-It es un servicio de archivo web parte y asociada a Internet Archive que permite a las personas y organizaciones recolectar, catalogar y preservar colecciones especializadas de contenido de medios digitales en formato de archivo. Todas las colecciones de los socios de Archive-It también están disponibles públicamente con búsqueda de texto completo y algunas de ellas pueden indexarse periódicamente en el archivo general de Internet Archive. A mediados de 2011, el servicio había llegado a más de 180 instituciones asociadas en 44 estados de Estados Unidos y 14 países con más de 2700 millones de URL y 1534 colecciones públicas.
Open Library[]

Open Library
Open Library es otro proyecto proyecto software de código abierto de Internet Archive que se puede utilizar para crear una base de datos basada en la web para cada libro publicado y archivado.
Open Library enfrenta objeciones de algunos autores y de la Sociedad de Autores, quienes sostienen que el proyecto está distribuyendo libros sin autorización y, por lo tanto, viola las leyes de derechos de autor, y cuatro editoriales importantes iniciaron una demanda por infracción de derechos de autor contra Internet Archive en junio de año 2020 para detener el proyecto.
The Console Living Room[]

The Console Living Room
El 26 de diciembre del 2013, Internet Archive lanzó el archivo The Console Living Room para videojuegos de varias consolas diferentes de las décadas de 1970 y 1980, incluidos los sistemas Atari 2600, ColecoVision, Magnavox Odyssey y Astrocade. En una publicación del blog oficial, el archivista Jason Scott reveló que se agregarían juegos clásicos adicionales a la biblioteca en los próximos meses.
Al día siguiente, el noticiero de la BBC publicó un artículo sobre la nueva biblioteca de juegos de consola, que posteriormente se publicó en el subreddit de /r/technology el mismo día. En los próximos días, varios otros sitios de noticias informaron sobre la colección.
The Audio Archive[]

The Audio Archive
The Audio Archive es un proyecto Internet Archive sobre archivo de audio que incluye música, audiolibros, transmisiones de noticias, programas de radio antiguos y una amplia variedad de otros archivos de audio. Las subcolecciones incluyen audiolibros y poesía, podcasts, audio que no está en inglés (el idioma principal de la empresa) y muchos otros. The Audio Archive también involucra otros semi-proyectos de Internet Archive como Live Music Archive, que se basa en archivar las grabaciones de conciertos musicales en vivo o como The Great 78 Project (El Gran Proyecto 78 en español), que pretende digitalizar 250.000 sencillos de 78 rpm (500.000 canciones) del período comprendido entre 1880 y 1960, donados por diversos coleccionistas e instituciones.