INTERNET, UNA GUÍA RÁPIDA

INTRODUCCIÓN ¿QUÉ ES INTERNET?
Internet es una red de redes, un servidor de información, un medio de comunicación, una tienda, un juego...

Internet es todo esto y mucho más: es el resultado de conectar entre sí muchas redes de ordenadores de todo el mundo, especialmente gubernamentales, de universidades y de grandes empresas. Gracias a estas conexiones podemos tener acceso a información que se encuentra en el otro extremo del mundo, hablar con gente de otros países, comprar libros en librerías de Estados Unidos, etc..

Sería un error, sin embargo, considerar Internet simplemente como una red de redes, como computadoras conectadas entre sí. Las redes y las computadoras son simplemente el medio que transporta la información: lo maravilloso de Internet es la información en sí misma.

Hoy en día estamos asistiendo a una nueva revolución que causará cambios importantes en el modo de tratar la información y que incidirá en nuestra vida cotidiana. Pensemos, por ejemplo, en la posibilidad de consultar los servicios bibliotecarios de distintos países, ver cuadros de los museos más conocidos, contemplar las últimas fotos enviadas por una sonda espacial o reservar mesa en nuestro restaurante favorito. Y no sólo eso, también es posible cartearse con una persona que viva en una ciudad alejada ahorrando tiempo y dinero, o participar en grupos de discusión sobre temas determinados con gente de los lugares más diversos.

La idea principal que subyace en el fondo es que información de todo tipo (imágenes, textos, programas, sonidos, etc.), que se encuentra en los distintos ordenadores de la red, pueda ser utilizada, sin excesivo coste, por todos los usuarios.

¿Quiénes serán los grandes beneficiados?. Cualquiera que esté necesitado de información en un momento dado: abogados en busca de legislación, periodistas en busca de datos, profesores que quieran obtener material didáctico, médicos para estar al día de las nuevas técnicas...

Hasta hace pocos años el uso de Internet estaba limitado a círculos técnicos, científicos y académicos; la gran mayoría de las personas nunca había oído hablar, ni podía suponer, que una red internacional de ordenadores significase algo para sus vidas.

Recientemente ha habido un cambio fundamental que podemos considerar un punto de inflexión en Internet: la aparición de World Wide Web o, como es más conocido, las páginas Web. Este cambio implica la posibilidad de que puedan utilizarse entornos gráficos para acceder a la información, de manera relativamente sencilla, con todo lo que supone de espectacularidad, imágenes atractivas, facilidad de uso, etc. Ello explica el considerable aumento en el número de usuarios y el hecho de que Internet esté cada día más implantada en nuestra sociedad. Es bien conocido que, en la actualidad, no pasa un solo día sin que aparezca en los medios de comunicación alguna noticia o referencia a Internet, sin mencionar las cada día más abundantes publicaciones temáticas sobre la red de redes, ya no restringidas al mundo informático sino dirigidas al gran público.

ORÍGENES DE INTERNET
Sobre el año 1969 nació una red llamada ARPANET (Advanced Research Projects Agency Net), perteneciente al Departamento de Defensa de los Estados Unidos de América (USA). Esta red ha sido el embrión de Internet: ARPANET creció y se consideró necesario dividirla en dos partes, una conservando el nombre y otra llamada MILNET. Las dos juntas constituían DARPANET (la D por Defense). El protocolo de comunicación desarrollado para intercambiar información entre ambas se llamó IP (Internet Protocol).

En esa época, IP sólo servía para comunicar dos redes, pero su diseño contemplaba la posibilidad de ocuparse de muchas más, miles de ellas.

A finales de la década de los 80, la National Science Foundation (NSF) creó una red (la NFSNet) para conectar sus cinco centros de supercomputación, aprovechando el protocolo IP, y uniéndose también a DARPANET. Otras redes ya existentes también se unieron. Era el nacimiento de Internet.

COMO FUNCIONA INTERNET
Es importante notar que Internet no es una red de ordenadores en el sentido usual, sino una red de redes, donde cada una de ellas es independiente y autónoma. Actualmente Internet es la red más grande del mundo y abarca más de 160 países.

Para que la comunicación entre ordenadores sea posible, es necesaria la existencia de un protocolo, que no es otra cosa que un conjunto de convenciones que determinan cómo se realiza el intercambio de datos entre dos ordenadores o programas. El protocolo usado en Internet se llama TCP/IP.

QUE ES UNA DIRECCIÓN
Cada máquina conectada a Internet tiene asignado un número binario de 32 bits que la identifica, o sea, una serie de 32 ceros y unos, como por ejemplo 10011110011011010000100000111110. Este número es la dirección de la máquina en Internet, llamada dirección IP, y es unívoco: dos máquinas no pueden tener el mismo número (aunque una misma máquina puede tener más de una dirección, es decir, más de un número binario diferente a la vez).

Para facilitar la comprensión se agrupan las cifras binarias en grupos de 8 bits y se cambian los números agrupados a base 10, separando cada grupo por un punto, por ejemplo : 204.152.190.70

Es posible asignar nombres a las máquinas, de manera que resulte más fácil la memorización de las direcciones. Internamente se utilizan unas tablas similares a las guías telefónicas para conocer las correspondencias entre los números y los nombres. Por ejemplo, la máquina 204.152.190.70 tiene asignado el nombre altavista.com, que es mucho más fácil de recordar.

NOMBRES Y DOMINIOS
Al principio cada máquina tenía un nombre propio único (por ejemplo empresa en vez de empresa.com), pero fue necesaria una estructuración de los nombres al ir aumentando el número de máquinas conectadas.

Así pues, los nombres de las máquinas constan del nombre de la máquina en cuestión y el dominio al que pertenece, separados por puntos. Los dominios están estructurados jerárquicamente, en un principio por estados y subdivisiones dentro de estos (y más subdivisiones si es necesario) que se corresponden a las redes de ordenadores. Así pues, el ordenador con el nombre ventas, y que pertenece al dominio de empresa.com, se llamaría del siguiente modo, ventas.empresa.com

Las dos o tres últimas letras del dominio nos indican el estado o zona. Por ejemplo, KE es Kenya y TZ Tanzania. De todas formas, como al principio Internet estaba circunscrita a los EEUU también se utilizan otros indicativos de zona:

.com organismos comerciales
.edu instituciones educativas de los EEUU (mayormente universidades)
.gov Gobierno de los EEUU
.int organizaciones internacionales (por ejemplo la OTAN)
.mil destacamentos militares de los EEUU
.net redes de grandes corporaciones
.org antes del uso estándar .us para los EEUU, cualquier cosa que no encajara en las anteriores. Actualmente organizaciones no gubernamentales, sin ánimo de lucro.

Muchas veces es necesario identificar además del ordenador, al usuario que se conecta a ese ordenador, ya sea mediante módem o mediante red local. La dirección del usuario se conoce como cuenta (de cuenta de acceso al sistema: una cuenta es como se designa al espacio que el usuario dispone en un ordenador y al derecho de utilizar sus recursos). La dirección completa de un usuario específico en un ordenador tiene el formato:

nombre_usuario@subdominio.dominio

La arroba (@ ) separa el nombre del usuario de la máquina a la cual está conectado, como puede ser ventas.empresa.com.

Como hemos visto, el sistema de nombres por dominio constituye una forma idónea de nombrar a los ordenadores. Sin embargo, internamente las máquinas trabajan con el número IP para establecer contacto entre sí. Para resolver este problema existe un servicio automático de equivalencia. Este servicio lo proveen unos ordenadores llamados servidores de nombres por dominio (Domain Name System servers).

DETERMINACIÓN DEL NÚMERO IP: SERVIDORES DNS
La misión de los servidores de nombres es traducir los nombres por dominio a sus correspondientes números IP (y viceversa, aunque no sea tan común de peticionar).

Generalmente, cuando se inicia una aplicación para acceder a algún servicio Internet, uno de los primeros datos que deben introducirse es la dirección del ordenador remoto que presta el servicio. Caben dos posibilidades:

  1. El usuario introduce el número IP correspondiente a la máquina que quiere acceder (204.152.190.70 = www.altavista.com). En este caso el ordenador local intentará entrar en contacto con el ordenador remoto de una forma directa sin acceder al servidor DNS, porque no lo necesita, ya que ha introducido directamente la IP.
  2. El usuario introduce el nombre de dominio del ordenador remoto. Éste es el caso más frecuente. El ordenador local deberá determinar cuál es el número IP correspondiente. Una vez conseguido el número IP el sistema procederá como en el punto 1.

Para conseguir el número IP, el ordenador local lo debe solicitar al servidor de nombres. Este servidor de nombres puede conocer la dirección IP del ordenador remoto (porque ya lo tiene definido en su tabla de direcciones o porque ya le ha sido peticionada previamente y la recuerda) o en caso contrario se dirige a otro servidor de nombres situado en el dominio adecuado, para efectuar la consulta.

Una vez que el servidor de nombres local dispone del número IP solicitado, transmite esta información al ordenador que ha efectuado la petición.

CÓMO SE TRANSMITE LA INFORMACIÓN EN INTERNET
Cuando se transfiere información de un ordenador a otro (por ejemplo un fichero), ésta no es transmitida de una sola vez, sino que se divide en paquetes pequeños. De esta forma la red es monopolizada por un solo usuario durante un intervalo de tiempo excesivo. Lo usual es que por los cables de la red viajen paquetes de información provenientes de diferentes ordenadores y con destinos también diferentes. Estos paquetes están formados por la información real que se quiere transmitir y algunos otros datos, como las direcciones del ordenador de salida y la del de destino.

Las distintas partes de Internet están conectadas por un conjunto de ordenadores llamados routers, cuya misión principal es redirigir los paquetes de información que reciben por el camino adecuado para que lleguen a destino.

El protocolo IP (Internet Protocol) se encarga de etiquetar cada paquete de información con la dirección IP apropiada. Todo programa o aplicación de Internet necesita conocer el número IP del ordenador con el que quiere comunicarse. Ya hemos visto que no es necesario que el usuario conozca este número IP, pues puede referirse al ordenador remoto por su nombre.

El otro ingrediente necesario para que dos ordenadores puedan hablar entre sí es el protocolo TCP (Transmission Control Protocol). Éste se encarga de dividir la información en paquetes del tamaño adecuado, numerar estos paquetes para que puedan volver a unirse en el orden correcto y añadir cierta información necesaria para la transmisión y posterior descodificación del paquete, y para detectar posibles errores de transmisión.

Veamos unos conceptos básicos para familiarizarnos con la terminología informática que usaremos.

HOSTS
La palabra host es un término muy utilizado en informática, sobre todo en relación con las redes de ordenadores. En Internet se llama host a cualquier ordenador conectado a la red.

SISTEMA CLIENTE/SERVIDOR
Una de las principales funciones de la red es compartir recursos. Generalmente este compartimiento de recursos se lleva a cabo por programas distintos, ejecutándose en máquinas diferentes. Uno de los programas, llamado servidor, proporciona un recurso en particular y el otro programa, llamado cliente, lo utiliza. Es habitual emplear la palabra servidor para referirse a la propia computadora que ejecuta el programa servidor, y lo mismo con el término cliente.

Lo bueno de este sistema es que los programas cliente y servidor no deben ejecutarse obligatoriamente en la misma máquina. Todos los servicios de Internet hacen uso de esta relación cliente/servidor. Aprender a navegar por Internet significa aprender a usar cada uno de los programas clientes disponibles. Por esta razón, para utilizar un servicio Internet hay que entender:

  1. Cómo ejecutar un programa cliente para ese servicio.
  2. Cómo decirle al programa cliente qué servidor se quiere utilizar.
  3. Qué instrucciones se pueden utilizar con cada tipo de cliente.

SERVICIOS Y APLICACIONES DE USO MÁS FRECUENTE
Día a día se suman nuevos usuarios y servidores de información a la Red. El software, los medios técnicos y la información contenida están en permanente cambio y evolución. Es por ello que el tipo de servicios que pueden obtenerse se está modificando permanentemente, apareciendo medios nuevos y más potentes y desapareciendo, o quedando en desuso, otros. Existen una serie de herramientas básicas que permiten realizar operaciones tales como enviar mensajes (e-mail), copiar ficheros (FTP) o establecer una conexión con un ordenador remoto (Telnet).

CORREO ELECTRÓNICO
El correo electrónico permite enviar mensajes escritos y también otro tipo de información (programas, imágenes, etc.) a otra u otras personas que tengan una dirección de e-mail.

Sin lugar a dudas, el correo electrónico es el recurso más utilizado de Internet (aunque el WWW sea el más publicitado). Así, el sistema de correo electrónico es el más importante de los recursos de Internet. Cada día se envían incontables mensajes de una parte de Internet a otra. Como es de esperar, muchos de estos mensajes son notas personales y privadas de un usuario a otro. Sin embargo, el sistema de correo es un servicio general que puede transportar cualquier tipo de información: documentos, publicaciones, programas de computadora y mucho más. El único requisito es que los datos deben almacenarse en modo texto. Es posible enviar datos no textuales (como imágenes, grabaciones de sonido, etc.) codificándolos a texto.

El uso más común del mail es interrelacionar a personas que se encuentran a gran distancia y trabajan juntas en un proyecto común, o simplemente mantienen una relación. Pero el correo electrónico también se utiliza cuando deben tomarse decisiones que afectan a Internet en sí misma: cuando se propone una nueva idea o un nuevo estándar, todos los usuarios que lo deseen pueden participar en un debate de ámbito global vía correo electrónico.

TERMINOLOGÍA BÁSICA
Para empezar, hay que recordar que cuando encontremos la palabra correo siempre significa correo electrónico, y la palabra dirección se refiere a una dirección Internet. En inglés los términos correspondientes son e-mail y e-mail address.

A las oficinas postales de correo tradicional se las conoce por snail mail, correo caracol en su traducción literal, refiriéndose a la lentitud comparada de servicio.

Es posible responder (reply) a un mensaje, incluyendo una cita opcional (quote) del mensaje original, para una mejor comprensión de la respuesta por parte del destinatario.

Es posible enviar el mismo mensaje a más de un usuario, sin tenerlo que escribir múltiples veces usando la opción de carbon-copy. Una versión más sutil del carbon-copy es lo que se conoce por hidden carbon-copy o blind carbon-copy: el resultado es el mismo, un mismo mensaje enviado a múltiples destinatarios, pero sin incluir la información de que se trata de una copia, dando la impresión de correo personalizado y sin que los destinatarios sepan a quién ha sido enviado ese mismo correo.

Una lista de correo, o mailing-list, no es más que una lista de usuarios que reciben correo, habitualmente mensajes temáticos, ya sea sobre informática o gastronomía. Cuando un usuario suscrito a una lista de correo escribe un mensaje, el resto de usuarios suscritos lo reciben, sin preocuparse el remitente de enviarlo a todos y cada uno de ellos (simplemente lo envía a la lista).

COMO ENTENDER LAS CABECERAS DE LOS MENSAJES
Los mensajes tienen un formato estándar que consta de dos partes: la cabecera header y el cuerpo del mensaje body. La cabecera consiste en una serie de líneas de información al principio del mensaje. Después de la primera línea en blanco empieza el cuerpo del mensaje.

La primera línea de la cabecera siempre empezará con From. Esta línea indica la dirección del usuario que envió el mensaje.

El resto de líneas no tienen un orden especificado, depende de la configuración de cada programa. Como mínimo siempre aparecerán las líneas Date (indicando la fecha y hora de envío) y Subject (título del mensaje).

La línea de Message-id contiene la etiqueta de identificación única asignada al mensaje. X-Mailer nos muestra el programa que utilizó el remitente. To nos indica la dirección a la que fue enviado el mensaje (nuestra dirección, si el mail lo hemos recibido nosotros).

La línea de Cc muestra el resto de destinatarios del mensaje (carbon-copy), si los hubiere.

USO DE MIME para enviar datos binarios por correo
Los archivos binarios (como imágenes, ficheros de sonido, programas, etc.) contienen datos que no son únicamente texto (se entiende por texto los caracteres imprimibles). Hay varias formas de enviar por correo estos archivos. Una de estas formas consiste en seguir el protocolo MIME que trata sobre el tema. MIME son las siglas de Multipurpose Internet Mail Extensions, que quiere decir Extensiones Multipropósito de Correo de Internet. Un sistema que utilice MIME puede incluir attach datos binarios en el correo electrónico.

Todo lo que se necesita es un cliente de correo que soporte MIME (tanto emisor como receptor, evidentemente). Hay otro estándar ampliamente difundido que realiza la misma función, el uuencode/uudecode, siendo ambos sistemas incompatibles entre sí.

CONEXIONES REMOTAS: TELNET
Telnet es un servicio que nos permite acceder remotamente al sistema operativo, o a una aplicación, de otro ordenador de la red.

Hay infinidad de versiones de clientes Telnet: una o más de una para prácticamente todos los sistemas operativos. Podemos agruparlas en dos grandes grupos: las versiones para entornos gráficos (como Windows o Macintosh) y las de comando.

Las versiones tradicionales son las de comando; las versiones para entornos gráficos funcionan exactamente igual, con la salvedad de que los parámetros se introducirán en las casillas situadas a tal efecto.

Para materializar una conexión Telnet no hay más que ejecutar el programa cliente pasándole los parámetros adecuados, siendo únicamente imprescindible el nombre o dirección IP de la máquina remota.

FTP (FILE TRANSFER PROTOCOL): TRANSFERENCIA DE FICHEROS
Los programas y protocolos diseñados para la transferencia de ficheros entre dos ordenadores reciben el nombre de FTP. Un fichero puede ser un documento, un texto, una imagen, un archivo de sonido, un programa ejecutable, un archivo comprimido, etc.

En Internet existen miles de ordenadores con infinidad de ficheros almacenados, de todo tipo (desde imágenes hasta utilidades para los diferentes sistemas) y de uso público. Éste es uno de los recursos que más llama la atención, ya que es posible conseguir programas de forma gratuita (los de dominio público).

Un servidor de FTP, recibe el nombre de FTP-site, no es más que un ordenador que almacena todos los archivos, clasificados por directorios temáticos, con un programa servidor de FTP ejecutándose en memoria y esperando las peticiones de los clientes.

Cuando pueden copiarse ficheros de un ordenador sin necesidad de contraseña concertada, se habla de FTP anónimo anonymous. Los servidores de FTP anónimo piden igualmente un login y un password, y hay que introducir ‘anonymous’ como login y nuestra dirección de mail (por ejemplo usuario@empresa.com) como password.

El mundo de FTP anónimo es inmenso. Existen miles de servidores FTP e incontables archivos que se pueden obtener de forma gratuita. Casi cualquier tipo de información y cualquier tipo de programa de computadora está disponible en algún lugar de Internet. Muchos usuarios y organizaciones comparten de forma generosa su espacio en disco y sus programas, así como su propio tiempo para poner a disposición de todo el mundo estos archivos: Internet es compartir.

Con tanta variedad de información y tantos hosts FTP anónimo, ¿cómo saber dónde se encuentra un archivo determinado?. Para ello se pueden utilizar páginas Web creadas con tal propósito, como pueden ser www.tucows.com, www.download.com, etc.. Estas páginas Web tienen una base de datos con los ficheros y sus correspondientes descripciones de cientos de FTPs anónimos, con lo que sólo hay que introducir una palabra clave y nos mostrará una lista con todos los programas que contengan esa palabra en la descripción así como un enlace directo para poder bajárnoslo a nuestro ordenador.

Al igual que para Telnet, para FTP existen clientes para entornos gráficos y también de modo texto. Los clientes gráficos son intuitivos y fáciles de usar, y no requieren conocer los nombres de los comandos necesarios para recoger, subir o listar ficheros.

El único parámetro imprescindible al ejecutar un cliente FTP para materializar una conexión es el nombre del servidor con el que deseamos conectar. Algunos clientes gráficos exigen también que se les introduzca el login y password que deberán enviar (o marcar la casilla de login anonymous).

FOROS DE DISCUSIÓN: USENET Newsgroups
Internet ofrece la posibilidad de intercambiar opiniones, experiencias, información, etc., entre personas interesadas en un tema específico. En este escenario electrónico se constituyen grupos de discusión, auténticos foros de debate mundiales en los que cada usuario tiene completa libertad (salvo en los grupos moderados) para emitir sus opiniones, en igualdad de derechos con todos los demás participantes, sin importar país, profesión, cultura, edad o sexo.

USENET, acrónimo de Users Network, es el término con el que se conoce al sistema que se encarga de gestionar el flujo de información generado por el envío, recepción y distribución de documentos (artículos), compartidos por un gran número de redes de ordenadores y personas en todo el mundo. Es, básicamente, una de las muchas redes (o subred de redes) que componen Internet (no todas las redes de Internet disponen de los grupos de Usenet). USENET marca un conjunto de reglas para administrar los grupos de noticias newsgroups.

Los newsgroups son foros de debate en los que las personas interesadas discuten acerca de diferentes temas. Cada grupo tiene un tema determinado; así es posible dedicarse a los temas que nos interesen sin necesidad (en teoría) de discriminar entre los mensajes, caso que estuvieran revueltos.

Se denomina genéricamente artículo a cada uno de los mensajes (documentos) existentes en un grupo.

Dada la gran cantidad de artículos que cada día envían los usuarios y las limitaciones de espacio en los ordenadores, éstos duran poco tiempo en los servidores (habitualmente no más de una semana).

Existen newsgroups sobre la mayoría de las disciplinas que uno pueda imaginar: técnicas, científicas, lúdicas, etc.. Para facilitar la localización de tales grupos, éstos se organizan jerárquicamente en categorías, de forma que distintos grupos referidos a temas relacionados se agrupan dentro de una jerarquía superior.

El nombre de cada newsgroup se compone de palabras separadas por puntos. La palabra situada más a la izquierda es la jerarquía principal (categoría) y las restantes corresponden a temas cada vez más específicos. Por ejemplo el grupo soc.culture.spain pertenece a la categoría soc (sociedad), cuyo tema es el ámbito cultural culture y específicamente a España. En la siguiente tabla aparecen algunas de las categorías que existen (las más importantes):

Categoría

Tema

Ejemplo

comp

informática

comp.os.os2.news

sci

investigación científica

sci.astro.hubble

soc

religión, cultura, sociedad...

soc.history.war

talk

discusiones varias

talk.abortion

news

temas propios de las news

news.answers

rec

recreativos

rec.games.go

misc

miscelánea

misc.taxes

alt

alternativos

alt.adoption

bionet

biología

bionet.celegans

es

españoles

es.alt.chistes

Para poder participar en los newsgroups es necesario que el ordenador local tenga permiso de acceso a un servidor de news. Estos servidores utilizan el protocolo NNTP Network News Transfer Protocol para transferir los artículos a los programas lectores (clientes).

En estas condiciones sólo es necesario ejecutar un programa lector de news newsreader, que se encarga de organizar toda la actividad: recoger la información del servidor de noticias, visualizar los grupos disponibles y los documentos que hay en ellos, enviar y contestar artículos, etc.

Suscribirse a un grupo no es otra cosa que indicar al programa lector que uno está interesado en participar en ese grupo. Consecuentemente, el lector llevará un registro, en un fichero, de todos los grupos a los que nos hemos suscrito (para saber así cuales pedir cada vez al servidor). Esto es una actividad que se lleva a cabo en el ordenador local, no en el servidor.

DIFERENCIA ENTRE MAILING LIST Y LOS NEWSGROUPS
La primera diferencia es el control de los documentos que se tiene en cada caso. En la lista de correo si hay un nuevo mensaje, tal mensaje se distribuye automáticamente a todos los miembros de la lista, generándose por tanto otras tantas copias del mensaje original, con la consiguiente sobrecarga de la red que esto significa. En el caso de los newsgroups el nuevo artículo se deposita en el servidor de news, que actúa a modo de buzón, y pueden retirarlo aquellos miembros del grupo que estén interesados en él.

Además, cuando alguien envía algo de interés a una lista de correo electrónico, sabe más o menos quienes son los destinatarios de su envío (puede pedir al administrador una lista de los suscriptores). Esto no ocurre en los newsgroups: por un lado no sabe quién leerá el artículo y tampoco se tiene una idea aproximada de cuántos lo harán (hasta es posible que no lo lea nadie).

WORDL WIDE WEB, ¿QUÉ ES?
El World Wide Web, también llamado Web o WWW, incluso W3 o W3 (para nosotros, Web) es una herramienta para Internet con la particularidad de que sirve para todo, ya que agrupa a otros protocolos de su estilo (como FTP o TELNET) y últimamente usa un interfaz gráfico para mostrar los datos al usuario.

La idea del Web es la de distribuir información por Internet en forma de páginas hipertexto. Como últimamente también permite incluir imágenes, sonido o animaciones, podríamos decir que se ha convertido en un sistema hipermedia más que hipertexto. Esto ha hecho que sea muy atractivo, lo que, unido a la sencillez de manejo de los nuevos intefaces gráficos, hace que muchos usuarios usen exclusivamente este sistema como forma de acceder a la información de Internet.

HIPERTEXTO HTML, Y HTTP
Hemos dicho que el Web distibuye la información por Internet en forma de páginas hipertexto, pero, ¿qué es un documento hipertexto?.

Los documentos hipertexto son documentos electrónicos que incluyen zonas activas que actúan como referencias a otros documentos (o recursos) o a otras partes del propio documento. Estas zonas activas se denominan hiperenlaces o enlaces links. Los documentos hipertexto que además integran imágenes, sonido o animaciones se denominan documentos hipermedia. A los documentos hipertexto o hipermedia en Internet se les llama páginas Web.

El HTML (Hypertext Markup Language) es el estándar que actualmente funciona en Internet para la edición/visualización de páginas Web. Esto nos permite acceder a cualquier documento y verlo de la forma que el autor lo creó, independientemente de quién, desde dónde o con qué lo esté leyendo. Bueno, esto no es del todo cierto, ya que últimamente Netscape y otros desarrolladores de software para Internet están añadiendo nuevas características no estándares al HTML, que no son soportadas por todos los programas lectores, lo que puede hacer que no podamos leer el documento creado con estas nuevas características no estandarizadas. De todas formas, cuando un programa lector encuentra alguna característica que no entiende, acostumbra a ignorarla, con lo que podremos leer el documento en su mayor parte.

Además del HTML como lenguaje hipertexto, necesitamos un protocolo que nos permita establecer la comunicación entre clientes y servidores de este tipo de información hipermedia. Este protocolo se denomina HTTP (HyperText Transport Protocol) y funciona sobre el protocolo TCP/IP, al igual que los otros protocolos de Internet que ya hemos visto. Así pues, gracias al HTTP, los programas que ofrecen los documentos en forma de páginas Web (en HTML) y los programas que buscan estas páginas se entienden.

URL
Hemos dicho que mediante los enlaces de las páginas Web podemos acceder a otros recursos, pero para que esto sea posible se hace indispensable que exista una forma homogénea de acceder a estos otros recursos de Internet, es decir, se necesita un estándar que identifique los diferentes recursos que existen en Internet. La información que se necesita para identificar de forma inequívoca un recurso de Internet es:

  1. El tipo de protocolo que se usará.
  2. La dirección IP o el nombre de dominio de la máquina donde se encuentra el servidor correspondiente.
  3. La ruta de acceso (path o camino) donde se encuentra el recurso que buscamos dentro de este servidor.

La URL (Uniform Resource Locator) es la forma sistemática de identificar los recursos que se utilizan en el Web, es como si fuesen las direcciones de los recursos Web en Internet.

ESTRUCTURA DE LOS IDENTIFICADORES URL
La estructura de una URL típica es:
protocolo://dirección del servidor/ruta de acceso

En esta estructura el ":// " no es más que el separador que distingue entre el protocolo y la dirección del servidor. La dirección del servidor puede ser tanto la dirección IP como el nombre del dominio.

Si la ruta de acceso tiene subdirectorios, estos deben estar separados con "/" independientemente del sistema operativo del que se trate, es decir, si la ruta de acceso en la máquina remota es: \personal\web\pagina.html deberemos escribir /personal/Web/pagina.html como si estuviéramos en una máquina UNIX.

Un ejemplo puede ser http://www.yahoo.com/ que nos conecta con la página principal (no hay ruta de acceso) del servidor de Web (por el protocolo http) de Yahoo (por http://www.yahoo.com/).

Como protocolo podemos utilizar los siguientes:

http: se usa cuando buscamos una página Web. Un ejemplo puede ser:

http://www.w3.org/hypertext/DataSources/bySubject/Overview.html
Identifica la página Web Overview.html del directorio hypertext/DataSources/bySubject del servidor www.w3.org. Como curiosidad decir que es un documento que contiene información sobre el lenguaje HTML.

Es muy importante respetar tanto mayúsculas como minúsculas en la URL, ya que el nombre exacto es imprescindible en muchos sistemas operativos, como por ejemplo los UNIX, que diferencian entre mayúsculas y minúsculas.

mailto: para enviar un mensaje privado o e-mail. La estructura es ligeramente diferente ya que debemos poner la dirección e-mail del destinatario en el apartado dirección del servidor. Ejemplos:

mailto://clinton@whitehouse.gov
Identifica la dirección de correo electrónico del presidente de los Estados Unidos.

mailto://comments@www.hq.nasa.gov
Identifica la dirección electrónica del buzón de comentarios sobre el servidor de Web de la NASA.

news : para leer news. Ejemplo:

news://tern.pppl.gov/
Accede a un servidor público de news.

ftp : para la transferencia de ficheros. La estructura de la URL varía dependiendo de si accedemos de forma anónima o no. Ejemplo:

ftp://ftp.netscape.com/pub/communicator/english/4.7/windows/windows95_or_nt/base_install/cb32e47.exe
Transfiere la versión 4.7 de Netscape para Windows 95/NT (el fichero cb32e47.exe) que se encuentra en el servidor de ficheros anónimo ftp.netscape.com

QUÉ ES UN NAVEGADOR
Un navegador (o browser) es el programa cliente Web que usamos para conectarnos a un servidor. Tal y como hemos explicado, para que el cliente realice la conexión al servidor necesita saber su dirección, es decir su URL. Mediante un navegador podemos acceder a servidores Web usando el protocolo HTTP, pero también a servidores de casi todos los demás servicios (FTP, News...) usando sus propios protocolos (FTP, NTTP...), con lo que es posible moverse por Internet prescindiendo de la mayoría de los clientes de estos servicios; o lo que es lo mismo, podemos acceder a la mayoría de servicios Internet a través de una sola aplicación y con un procedimiento unificado: el acceso a recursos mediante URL.

Los navegadores son los que han dado el empuje que actualmente tiene Internet. Un navegador permite acceder a documentos hipermedia sin limitaciones, pudiendo ver las imágenes, escuchar los sonidos, o reproducir las películas que contiene mediante programas externos o internos al navegador. La forma de moverse por Internet con un navegador es muy sencilla e intuitiva necesitando sólo un ratón y unos pocos conceptos. Este tipo de navegadores están disponibles para Windows 3, Windows 95, Windows NT, Windows, OS/2, XWindow, McOS... De entre los navegadores, los más conocidos son Netscape Navigator de Netscape e Internet Explorer de Microsoft. Otros menos conocidos son Mosaic de NCSA, WebExplorer de IBM y Opera de Opera Software.

CÓMO SE UTILIZA UN NAVEGADOR
Hemos dicho que un navegador nos permite conectar con un recurso ofrecido en algún servidor de Internet mediante su URL. Así pues, lo primero que debemos saber es la URL del recurso o página a la que queremos acceder. Si se trata de una página Web, una vez introducida la URL en el campo destinado a tal efecto, y si no hay errores, aparecerá en pantalla la página deseada; si se trata de otro tipo de recurso, se llevará a cabo de acuerdo a nuestras intenciones, es decir, enviaremos un e-mail o bajaremos un fichero a nuestro ordenador, si es eso lo que deseamos hacer.

Qué puede contener una página
Cuando se nos muestra en pantalla un página Web, debemos ser capaces de distinguir las cosas que vemos en ella para poder decidir las acciones a emprender, como seguir un enlace o reproducir la última canción de moda. De entre las cosas que podemos encontrar en una página podemos destacar:

Enlaces: acostumbran a estar con sus letras subrayadas, de todas formas la manera en que se visualizan puede cambiarse en la configuración de la mayoría de los navegadores, y si nos fijamos en la línea de estado del navegador (la que se encuentra en la parte inferior) veremos que aparece la URL del enlace cuando colocamos el puntero del ratón sobre él. Otra forma de distinguir un enlace es observar si el icono del puntero del ratón cambia de flecha a un dedo: si cambia es un enlace. Una imagen en una página Web puede actuar como simple adorno o como un enlace. Para distinguir una de otra debemos poner el cursor del ratón encima de la imagen y mirar si aparece una URL en la línea de estado del navegador, o si el icono del puntero del ratón cambia a un dedo; si esto sucede es una imagen enlace. Para seguir un enlace basta con pulsar la tecla flecha derecha en un texto y presionar con el ratón sobre un gráfico. Evidentemente, realizaremos la acción especificada en la URL de la línea de estado; es decir, nuestro navegador irá a la dirección especificada.

Java: es un lenguaje de programación cada vez más utilizado en internet para dar dinamismo a las páginas Web, pero para poder disfrutar de esta particularidad, necesitamos un navegador compatible Java, como el Internet Explorer 4.0 o el Netscape 4.0.

Un tipo de enlaces que merecen un comentario aparte son los siguientes:

Mailto: no es más que un enlace en el que se puede enviar un e-mail a alguien, normalmente el creador de la página, mediante un menú emergente que surge del propio navegador. No es necesario rellenar la cabecera, pues ya sabe quién lo envía y para quién es, y con escribir el texto del e-mail tenemos bastante. Se distingue porque en la URL de la línea de estado del navegador aparece la dirección electrónica del destinatario precedida de la palabra mailto.

Ftp: es otro tipo de enlace que nos transmite al ordenador local el fichero que seleccionemos como enlace. Es posible elegir en qué directorio se grabará gracias a un menú emergente que nos aparecerá en pantalla a la hora de transmitir el fichero.

Un tipo de página que aparece en muchos sitios es la llamada Home Page, que no es más que la página de presentación a partir de la cual podemos acceder a otras páginas del mismo propietario, siguiendo enlaces que en ella se encuentran. Acostumbra a ser la página principal de un servidor, de una corporación o de un individuo. Lo que distingue una Home Page de otra página Web normal es que se encuentra en la parte superior de la jerarquía de un subconjunto de páginas.

Por ejemplo, los proveedores Internet tienen Home Page, también las empresas que tienen sus páginas en esos proveedores, al igual que algunos empleados de estas empresas.

Volver al índice