La historia de las bases de datos – Los DBMS Relacionales más destacados (parte 1)
Como vimos en el primer artículo de "La Historia de las Bases de Datos", debido a las dificultades de manipular los datos al inicio de la informática hubo la necesidad de crear una abstracción para los datos y para la manera de cómo son tratados. De esta dificultad nació la idea de sistemas de gestión de bases de datos (DBMS).
En este artículo, retomando la historia "en el punto en que se dejó" en la primera parte de esta mini-serie, hoy voy a hablar de algunos de los más relevantes SGBDs relacionales de la historia a nivel empresarial.
IBM y sus Sucesivas Tentativas
Es sorprendente ver la cantidad de SGBDs relacionales diferentes que IBM desarrolló en la década del 70 y 80, siendo que muchos de ellos nunca tuvieron la representación pretendida acabando por fallar pocos años después de su creación.
El primer SGBD relacional de IBM fue el siguiente: IS / 1 implementado en el centro de IBM de Peterlee en el Reino Unido, no sólo pasando de un prototipo (1970 – 1972). El sucesor del IS / 1 fue PRTV – Peterlee Relational Test Vehicle, primer SGBD del mundo a implementar un optimizador para consultas y trabajar con tablas grandes con cerca de 10 millones de líneas, soportando hasta 1000 columnas en cada tabla. Como su precedente, el PRTV tampoco salió de los laboratorios de IBM.
Se le siguió el Sistema R, proyecto ya mencionado en el primer artículo de esta mini-serie, que implementó por primera vez el SQL (lenguaje que más tarde se convirtió en el estándar de la industria para gestionar bases de datos relacionales).
En 1978, más o menos en el momento en que System R estaba entrando en el mercado, un equipo de Holanda que trabajaba en una subsidiaria de IBM comenzó a trabajar en un proyecto, IBM Business System 12 (BS12). El equipo de este proyecto creyó que el SQL era un lenguaje inadecuado y difícil de usar y, por eso, decidió crear su propio lenguaje que, en el lanzamiento del BS12, era computacionalmente completa y presentaba ya triggers (que sólo aparecieron en el SQL al final de la década de los 80).
Como todos estos intentos no llegaron a vengarse en el mercado, IBM decidió continuar intentando. Así, surgió, en 1981, el SQL / DS (Structured Query Language / Data System), que llegó a estar disponible para los sistemas operativos de IBM DOS / VSE y VM / CMS.
En 1983, apareció entonces el muy famoso DB2 lanzado originalmente sólo para el sistema operativo MVS utilizado en los mainframes de IBM. Con el éxito del Db2, el SQL / DS acabó por aproximarse a esta solución, pasando a tener el nombre de Db2 para VSE y VM. El Db2 es el único SGBD relacional de IBM creado en estos años de atribulados años que aún hoy es ampliamente utilizado, encontrándose disponible para los sistemas operativos Linux, Unix, Windows y también z / OS (sistema operativo de IBM utilizado en sus mainframes).
La Aparición del Gigante
En 1977, Larry Ellison, con Bob Miner y Ed Oates, crearon Software Development Laboratories (SDL). Inicialmente el plan pasaba por hacer un DBMS que fuera compatible con el sistema R. Sin embargo, esa idea no fue posible de ejecutar, ya que IBM nunca hizo público los códigos de error de su sistema.
Esta imposibilidad tuvo como consecuencia el cambio de la visión de la empresa, así como su nombre que, en 1978, pasó a ser Relational Software, Inc (RSI). Al año siguiente, lanzar en el mercado su DBMS, Oracle Database, convirtiéndose en el primer DBMS basado en SQL disponible para la compra al público en general.
Curiosamente, con miedo de una posible visión negativa que pudiera ser creada por estar vendiendo un producto que estaba sólo en la "versión 1", decidieron lanzar su DBMS como si estuviera en la versión 2, Oracle v2.
Para alinear el nombre de la empresa con su producto core, cambiaron nuevamente el nombre de la empresa, esta vez para Oracle Systems Corporation, en 1982. Sus primeros clientes fueron la fuerza aérea de EE.UU. y la CIA.
Y así nació uno de los mayores colosos del mundo tecnológico, con un net rent de 3.82 mil millones de dólares (USD) en 2018.
La competencia a Oracle e IBM
En el mercado de los SGBDs relacionales empresariales a gran escala, hay más algunos "jugadores" que son capaces de "rivalizar" con las soluciones poderosas de Oracle e IBM. Y las historias de dos de esos casos empiezan en la misma persona, un estudiante de Berkeley y colaborador en el proyecto Ingres, Robert Epstein.
En 1984, Epstein fundó Sybase (inicialmente System Ware) en Berkeley con otros 3 colegas. Esta startup tuvo como producto inicial un SGBD que tuvo como base el Ingres, debido a la familiaridad de Epstein. Esta empresa vendría en 1988 a asociarse con Microsoft para lanzar su DBMS a la plataforma OS / 2. Los términos del acuerdo dan a Microsoft una licencia exclusiva para productos en la plataforma Intel x86 y pasaba a hacer marketing como SQL Server.
En 1993, la asociación fue disuelta y ambas partes quedaron con una copia del proyecto. La versión 4.2 de la Sybase SQL Server y el Microsoft SQL Server original eran idénticos. Después de esta división, Microsoft incluyó más funcionalidades orientadas al sistema Windows y Sybase añadió características más orientadas a las empresas, como rendimiento y escalabilidad. Sybase fue adquirida posteriormente por SAP.
Hoy en día, ambos son muy utilizados siendo que Microsoft es la tercera empresa que tiene más ingresos en SGBDs (datos de 2011), donde Microsoft SQL Server tiene una gran cuota, y SAP es la cuarta, donde se incluye en grande parte de Sybase.
Otro DBMS que surgió como competencia a Oracle, en este caso más en la década de 1990, Informix. Hoy, detenido por IBM y aún a la venta, llegó a ser el segundo más popular de todo el universo de SGBDs relacionales para empresas.
Este SGBD fue creado en 1980 por Roger Sippl. La parte de base de datos de Informix Corporation fue comprada por IBM en 2001, curiosamente por sugerencia de Walmart, que hasta entonces era el mayor cliente de Informix. En 2005, IBM compró el resto de la empresa.
Otros enfoques
En este grupo de grandes "jugadores" para empresas se encuentra también la Teradata. Esta no se posiciona en el mercado como competidor directo de los DBMS que ya fueron referidos, sino como especialista en análisis de datos. En su sitio podemos leer:
Sólo Teradata aprovecha el 100% de sus datos relevantes con velocidad, escalabilidad y flexibilidad para proporcionar respuestas a lo que más importa para el éxito de su negocio.
En 1992, construyeron un sistema que contenía 1 terabyte de información para Walmart, el mayor vendedor al por menor del mundo, siendo así los primeros en superar este marco. Walmart aún hoy es cliente de Teradata, siendo que en 2010 hubo una prolongación del contrato entre ambas empresas por otros 21 años.
Ahora, hablando de un enfoque aún más diferente de los clásicos SGBDs, el Paradox fue lanzado en 1985 por Ansa Software para el MS-DOS, sistema operativo de Microsoft para ordenadores personales. Se permitió usar Query By Example (QBE), que fue el primer lenguaje de consulta gráfica para bases de datos relacionales, usando tablas visuales donde el usuario podía usar comandos, ejemplos y condiciones. La implementación por parte del Paradox del QBE fue hecha con soporte a un mecanismo de inteligencia artificial.
Dado que los ordenadores personales eran su target, es decir, ordenadores con débil poder de procesamiento, Paradox añadía un uso de memoria por encima de los competidores, haciendo caching de tablas e índices, lo que le permitía en ese momento ejecutar instrucciones mucho más rápido que sus competidores.
Paradox se comparó en parte con Lotus 1-2-3 (una aplicación de Lotus Software que era idéntica a Excel) en términos de menús y ventanas, pero con un lenguaje de programación mucho más desarrollado y más fácil de percibir que las macros de Lotus 1-2-3.
Más recetas
Un estudio hecho en 2011 por la empresa Gartner permitió medir que los 5 mayores propietarios de DBMS por receta son:
- Oracle (48,8%)
- IBM (20,2%)
- Microsoft (17,0%)
- SAP incluyendo Sybase (4,6%)
- Teradata (3,7%)
Otras curiosidades
- Acerca del nombre de Oracle: el nombre fue elegido por Larry Ellison, co-fundador y actualmente presidente de la empresa, debido a un proyecto en el que él mismo trabajó durante su paso por la CIA con el nombre de código Oracle.
- El Informix en 1997, compró una cartelera en la autopista frente a la sede de Oracle en Redwood City, CA dijo que "Cruce de dinosaurio" (o portugués, "dinosaurio pasado"), un ataque irónico sobre el estado de Oracle en supuesta industria.
- IBM Business System 12, como no usaba SQL, tenía algunas funcionalidades que este lenguaje de consulta no tiene, como por ejemplo la división prevista por Codd en el modelo relacional.
- Una curiosidad fuera de este contexto, pero igualmente interesante. El primer SGBD relacional de la historia fue el MICRO Relational Database Management System (MICRO). Se comenzó a desarrollar en 1970 como parte del proyecto Labor Market Information System (LMIS) en el Instituto de las Industrias e Industrias Industriales (ILIR) en la Universidad de Michigan y probablemente no se apoyó propiamente en el modelo relacional de Codd. Lo curioso es que, aunque inicialmente no se consideró un DBMS relacional, el MICRO poseía todas las capacidades necesarias para ser uno (incluyendo el hecho de estar basado en la teoría de las estructuras de datos conjuntos o sets), convirtiéndose así en el primero de la historia a utilizar este modelo.
Probablemente muchos SGBD importantes fueron dejados fuera, pero éstos tuvieron papeles fundamentales en el panorama que conocemos hoy. En el próximo artículo de "La historia de las bases de datos", para complementar esta lista, voy a hablar de los SGBDs relacionales más marcados a nivel open-source.