H.323

Arquitectura de H.323 para VoIP

H.323 es un conjunto de protocolos que hace posible que se puedan establecer, desarrollar y dar por terminadas llamadas de voz y vídeo a través de redes IP.

La primera versión de H.323 se publicó en 1996 con el objetivo de permitir las comunicaciones multimedia (voz y vídeo) sobre redes de área local de tipo IP. El nombre original de H.323 era ‘Sistemas y equipos de telefonía visual para redes de área local’.

Debido a que esta versión no contaba con la funcionalidad necesaria para trabajar en entornos más amplios, la UIT-T sacó en 1998 la versión 2 con un nuevo título: ‘Sistemas de comunicación multimedia basados en paquetes’. A pesar de su buena aceptación inicial, han sido necesarias nuevas versiones para adaptarse a las continuas exigencias del mercado.

El estándar H.323 es completamente compatible con los sistemas de telefonía tradicional, permitiendo, incluso, la señalización extremo a extremo entre terminales conectados a redes distintas (recomendación H.320 y H.324). Otra de las principales ventajas de H.323 es que es bastante ligero y rápido al ocupar la red el tiempo imprescindible para establecer la comunicación.

La arquitectura de H.323

El sistema de señalización H.323 basa su funcionamiento en la existencia de cuatro elementos:

  • Terminal. Se trata del terminal telefónico que utiliza directamente el usuario para establecer la comunicación de voz o vídeo. Viene a ser lo que en la red telefónica tradicional es el teléfono. En el caso de H.323, este teléfono puede ser un software instalado en cualquier dispositivo (ordenador, smartphone o tablet) o un equipo hardware específico.
  • Gateway (pasarela). Este equipo hace posible que una red H.323 (por ejemplo, una red corporativa de VoIP) se interconecte con otro tipo de red de voz (por ejemplo, la red telefónica tradicional). Un lado del gateway se conecta a la red H.323 y el otro a la otra red. El gateway se encarga de interpretar cada una de las señalizaciones y de realizar las traducciones necesarias para que las comunicaciones iniciadas en una de las redes se pueda completar en la otra y viceversa.
  • Unidad de Control Multipunto o MCU (Multipoint Control Unit). Se trata de un equipo que gestiona conferencias en las que participan más de dos terminales. Estas multiconferencias se pueden organizar de forma centralizada o descentralizada. En el primer caso, todos los terminales se comunican con el MCU, quien se encarga, no sólo de controlar la comunicación, sino de distribuir la información de voz/vídeo. En el segundo caso, el MCU sólo realiza el control de la comunicación, utilizándose la tecnología multicast para el intercambio de la información multimedia (voz y vídeo).
Modelo H.323
Modelo H.323
  • Gatekeeper (aunque literalmente significa portero o recepcionista, sería más apropiado hablar de mediador o centralita IP). Es un equipo que realiza una labor equivalente a la de una centralita telefónica tradicional. De hecho, a veces se hace referencia al gatekeeper como centralita software, softswitch o softPBX. El gatekeeper se encarga de agrupar los terminales, gateway y MCU de una red de voz/vídeo para poder controlar y gestionar sus comunicaciones de una forma centralizada. A los equipos sobre los que opera el gatekeeper (terminales, gateway y MCU) se les conoce como equipos finales o endpoints. El conjunto de todos los equipos finales de un gatekeeper forma una zona.

Hay que tener en cuenta que, aunque éstos sean todos los elementos considerados en un sistema H.323, no siempre se necesita utilizarlos todos. De hecho, sería posible una comunicación directa entre terminales dentro de una misma red (Internet o red corporativa) sin que exista gateway, MCU ni gatekeeper. El gateway se utiliza sólo en el caso de que se desee interconectar la red H.323 con otro tipo de redes, el MCU exclusivamente para las multiconferencias y el gatekeeper si se desea disponer de la funcionalidad de centralita IP. Por otro lado, un mismo dispositivo podría incluir la funcionalidad de más de uno de los equipos anteriores. Por ejemplo, la funcionalidad de gateway, gatekeeper y MCU podría estar integrada en un mismo hardware.

Gatekeeper

El gatekeeper permite crear una red corporativa de telefonía IP. Este equipo gestiona de forma centralizada todas las comunicaciones de los equipos finales de su zona. Una de las diferencias fundamentales entre un gatekeeper y una centralita tradicional es que los equipos finales de la zona del gatekeeper pueden estar físicamente localizados en cualquier lugar. No es necesario que todos ellos estén agrupados en un mismo edificio o campus. Adicionalmente, al trabajar el gatekeeper en un entorno IP, la implantación de nuevos servicios de valor añadido es mucho más simple y económica que hacerlo en un entorno de telefonía tradicional.

Las funciones principales de un gatekeeper son las siguientes:

  • Registrar y autentificar los equipos finales de su zona.
  • Traducir las direcciones tipo alias utilizadas por sus equipos finales a direcciones IP o IPX.
  • Gestionar el ancho de banda de acuerdo a las especificaciones configuradas.
  • Opcionalmente, un gatekeeper puede encargarse también de enrutar las llamadas. Esta facilidad es interesante, por ejemplo, para realizar balanceo de cargas o gestionar el servicios de seguimiento de llamada (la llamada se enruta al terminal en el que se sabe que estará disponible el usuario). También puede ocuparse opcionalmente de gestionar las llamadas. Esto quiere decir que podría mantener una lista de las llamadas en curso para indicar, por ejemplo, si el terminal está ocupado o realizar una gestión más eficiente del ancho de banda.

Cada equipo final de una zona debe estar registrado en su gatekeeper correspondiente. Esto quiere decir que el gatekeeper debe conocer los datos de identificación y localización del mismo. El intercambio de información de registro y control que se produce entre el gatekeeper y los equipos finales de su zona se lleva a cabo con un protocolo específico conocido como RAS (Registration, Admission and Status, ‘Registro, admisión y estado’) que está recogido en la norma H.225.0.

Centralita de VoIP
Centralita de VoIP

El proceso de registro de un equipo final en su gatekeeper consta de dos pasos:

  1. El equipo final (terminal, gateway o MCU) le envía al gatekeeper un mensaje de petición de registro RRQ (Registration Request, ‘Petición de registro’). En este mensaje debe incluir su dirección IP y puerto, su número telefónico (de acuerdo al estándar E.164) y su alias.
  2. Si todo es correcto, el gatekeeper le envía al equipo final un mensaje RCF (Registration Request Confirm, ‘Confirmación de petición de registro’) de confirmación de registro.

Además de para el registro de equipos finales, el protocolo RAS se utiliza para la traducción de direcciones, control de admisión, control de ancho de banda y gestión de zonas.

La traducción de direcciones significa que los equipos finales de una zona cuentan con una dirección IP que los identifica dentro de la red IP y de un alias que los identifica dentro de la red H.323. Dado que para una persona es complicado recordar los números IP, la forma más práctica de identificar a los terminales es mediante su alias. El gatekeeper puede manejar alias con cualquier estructura: desde en forma de números telefónicos hasta en forma de caracteres alfanuméricos. La única restricción real es que el alias sea único dentro de la zona, aunque un mismo terminal puede contar con más de un alias. El gatekeeper es el responsable de convertir la identificación alias en una identificación de red IP (número IP/puerto).

Por su parte, control de admisión quiere decir que el gatekeeper puede controlar el registro de los terminales, así como las comunicaciones que se realizan.

Gateway

Un gateway o pasarela hace posible que puedan interconectarse dos redes de tecnología distinta y compartir, de esta forma, todo o parte de sus servicios. El equipo gateway tiene la capacidad de integrarse en cada una de las redes y de realizar las traducciones de protocolo necesarias para que los servicios de cada una sean extensibles a la otra.

En el caso de H.323, el gateway está especialmente pensado para interconectar la red H.323 (soportada sobre una red IP corporativa o Internet) con la red telefónica tradicional. Esto quiere decir que el gateway entenderá, tanto la señalización y codificación propia de H.323 como las de la red telefónica en sus distintas modalidades:

  • Líneas telefónicas analógicas conectadas a la red telefónica básica
  • Líneas telefónicas digitales de la red telefónica básica (circuitos digitales de 64 kbps que cumplen H.324 y G.711).
  • Líneas telefónicas digitales de la red digital de servicios integrados (RDSI o ISDN en su acrónimo en inglés) que cumple H.320.

Aunque, desde el punto de vista de la red H.323, el gateway es un terminal más, en realidad se trata de un equipo que proporciona muchos servicios distintos, entre los más importantes se encuentran los siguientes:

  • Traducción entre formatos de transmisión (por ejemplo, de H.225 a H.221)
  • Traducción entre procedimientos de comunicación (por ejemplo, de H.245 a H.242)
  • Traducción entre los codecs de audio y vídeo utilizado por ambas redes.
  • Procesa la configuración de la llamada en ambos lados de la comunicación.

En cualquier caso, no todos los equipos gateway son iguales, cada fabricante puede diseñar su equipo para, por ejemplo, atender un número distinto de llamadas simultáneas o incluir determinados codecs de audio, vídeo o datos.

Unidad de control multipunto

La unidad de control multipunto o MCU es un equipo especialmente pensado para el establecimiento de comunicaciones donde intervienen más de dos participantes. Es lo que se conoce generalmente como multiconferencias.

Configuración centralizada del MCU en H.323
Configuración centralizada del MCU en H.323

El MCU se compone de dos partes:

  • MP (Multipoint Processor, ‘Procesador multipunto’). Se encarga de mezclar, conmutar o combinar las informaciones multimedia (voz, vídeo o datos) que vienen de cada terminal, así como de convertir los codecs de forma que cada terminal reciba la información multimedia en el formato que puede entender.
  • MC (Multipoint Controller, ‘Controlador multipunto’). Se encarga de la señalización y control de los equipos finales involucrados. Para ello utiliza las recomendaciones H.225.0 y H.245.

Aunque lo normal es que estas dos unidades formen parte de un mismo equipo, también podrían estar integradas en equipos distintos. En cualquier caso, la comunicación entre MP y MC no está estandarizada, por lo que ambos tendrían que ser del mismo fabricante.

Configuración descentralizada del MCU en H.323
Configuración descentralizada del MCU en H.323

El MC puede gestionar tres tipos de configuraciones de multiconferencias:

  • Centralizada. En este caso, cada terminal se comunica con el MCU, quien se encarga, no sólo de controlar la comunicación, sino de distribuir la información multimedia a cada uno de ellos de forma independiente (punto a punto).
  • Descentralizada. En esta modalidad, cada terminal intercambia la señalización de control con el MC en una comunicación punto a punto, mientras que la información multimedia se intercambia directamente entre los distintos terminales participantes a través de multicast. En esta configuración, cada terminal recibe múltiples flujos de audio, vídeo o datos y es responsable de procesarlos. Mediante el canal de control, cada terminal le indica al MC cuántos flujos simultáneos de información multimedia puede manejar.
  • Mixta. En esta configuración, algunos participantes utilizan la modalidad centralizada (unicast) mientras que otros lo hacen de forma descentralizada (multicast).

Aunque la modalidad descentralizada supone un ahorro de ancho de banda al utilizar multicast, tiene el inconveniente de requerir terminales con mayor capacidad de proceso al tener que descodificar, mezclar y conmutar los distintos flujos de información multimedia que reciben. Por otro lado, los routers y switches de la red tienen que poder manejar la modalidad multicast; cosa que no ocurre en todos los casos. La modalidad centralizada no requiere ninguna capacidad de red especial y admite todo tipo de terminales. Una alternativa intermedia sería que el MCU recibiera la información multimedia punto a punto y transmitiera un flujo multicast.

Configuración mixta del MCU en H.323
Configuración mixta del MCU en H.323

Terminales

Los terminales son los dispositivos finales que utilizan los usuarios de la comunicación multimedia de voz, vídeo o datos. Para asegurarse de que todos los terminales pueden interoperar, H.323 define que todos tienen que admitir, como mínimo, el formato de voz con el codec G.711 (ley A y ley μ). De esta forma, en el caso de que no tengan ningún otro codec en común, al menos, podrán intercomunicarse utilizando G.711, aunque sea a base de utilizar mucho ancho de banda. Por otro lado, el soporte de vídeo y datos es opcional para H.323, pero si lo admite, al menos debe disponer del codec de vídeo H.261 (QCIF, Quarter Common Intermediate Format).

Conjunto de protocolos H.323 desde el punto de vista del terminal
Conjunto de protocolos H.323 desde el punto de vista del terminal

Por último, todos los terminales deben admitir los siguientes componentes:

  • H.245 para negociar el uso del canal y las características de la comunicación.
  • H.225.0 (Q.931) para la señalización y configuración de la llamada.
  • H.225.0 (RAS) para comunicarse con el gatekeeper.
  • RTP/RTCP para el envío de la información multimedia en tiempo real.
  • Codecs opcionales de audio y vídeo.
  • T.120 para poder utilizar aplicaciones interactivas (como la pizarra, por ejemplo)

Más información

Como sabemos, ha sido necesario desarrollar un amplio abanico de protocolos para hacer posible el establecimiento de comunicaciones de voz y video a través de Internet. En este blog se están tratando ampliamente este conjunto de tecnologías. Estos son algunos ejemplos:

REF: VOIP PG104

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *