Mapeo objeto-relacional

En el software orientado a objetos, la información se representa como clases y objetos. En las bases de datos relacionales, como tablas y sus restricciones. Por tanto, para almacenar la información tratada en un programa orientado a objetos en una base de datos relacional es necesaria una traducción entre ambas formas.

Una aproximación ampliamente usada es el mapeo objeto-relacional (ORM). Tanto en la forma de Table gateway como de Table-row gateway, se hace una correspondencia entre los siguientes elementos:

Programa OO	BD relacional
Clase	Tabla
Propiedad	Campo
Objeto	Fila
Identificador	Clave primaria
Puntero a otro objeto	Clave foránea

Esta correspondencia es muy "natural" ya que, en realidad el modelo orientado a objetos y el modelo relacional no son tan diferentes. Veámoslo: en los programas las instancias de un objeto son accedidas a través de un puntero a su posición de memoria. Por ejemplo:

$a = new A;
$b = $a;

En la ejecución del código anterior se realizan las siguientes acciones:

Se instancia la clase A, es decir, se almacena en memoria el registro correspondiente al TDA representado en la clase A (Línea 1)
Se crea una variable tipo puntero llamada $a que apunta al registro anterior (Línea 1)
Se crea otra variable ($b) de tipo puntero que toma el mismo valor que $a, es decir, al registro creado en #1 (Línea 2)

Conceptualmente, podemos decir que el registro en memoria es propiamente el estado del objeto y su posición, indicada en $a, un identificador único del mismo. Y recordemos que los objetos anidados (es decir, las propiedades de $a que sean, a su vez, otros objetos) se almacenarán en el registro como punteros a otros registros.

Esta forma de almacenar información a bajo nivel —manejada comúnmente en el lenguaje C— se asemeja al modelo de las tablas y las relaciones de las bases de datos relacionales: cada registro es una fila, cada puntero una referencia foreign key. Las posiciones en memoria, es decir, los "identificadores únicos" de los objetos podríamos tratarlos como primary keys.

Pero si es tan sencilla la traducción objeto-relacional, ¿por qué la industria sigue usando DAO o sentencias agnósticas? Cuatro principales motivos:

Aunque hemos explicado la estructura de los objetos en los programas, no es directamente como nuestros programas los tratan. Por ejemplo, si tenemos un objeto Libro con las propiedades título, ISBN, y autor, los lenguajes (y más concretamente PHP) no nos permiten acceder a todas las propiedades del objeto de una forma directa, sino a través de reflexión (y hasta la versión 3.5 de PHP no podíamos acceder a las propiedades privadas).
Para cada clase que queramos almacenar se ha de crear un esquema de tablas y relaciones en la base de datos, algo que ya es costoso de por sí. Además, por seguridad, es bueno comprobar la validez de dichos esquemas. Por tanto, el rendimiento se reduce.
PHP es un lenguaje de tipado débil, al contrario que los esquemas de bases de datos (en los cuales incluso se especifica la longitud del registro). Al declarar una propiedad en una clase no se declara el tipo, por lo que no hay modo de conocerlo a priori.
PHP es un lenguaje de tipado dinámico; no así las bases de datos, que por definición tienen esquemas fijos. Por ello, si una propiedad es añadida en tiempo de ejecución no puede ser almacenada en una tabla con campos fijos. Por ejemplo:
```
class A {
	public $foo;
}

$a = new A;
$a->bar = true;
```
Además, el tipo de cualquier propiedad, declarada o dinámica, puede ser modificado en tiempo de ejecución:
```
class A {
	//Dándole un valor por defecto a la propiedad, declaramos su tipo
	public $foo = "valor"; 
}

$a = new A;
$a->foo = 3.14;
```

Estos problemas nos llevan a pensar que, además de la traducción objeto-relacional, PHP presenta un problema añadido de representación de la información, y es que las estructuras de orientación a objetos no son suficientes para definir la información de forma tan concreta como necesitan las bases de datos relacionales. Ante este problema, las soluciones existentes son las siguientes:

Definir la información en el esquema de la base de datos: es la aproximación que implementa CakePHP. En este framework, los objetos de negocio se denominan "modelos", y el programador puede declararlos con solo nombrarlos, dejando que el framework busque y analice una tabla en la base de datos con ese nombre. No obstante, el caso concreto de CakePHP es ambiguo para este estudio, ya que las aplicaciones basadas en él son parcialmente "agnósticas" con respecto a la semántica, ya que los datos se manejan en forma de arrays, y no de objetos. Por ejemplo:
```
class Libro extends AppModel {

	/* Las propiedades de Libro son obtenidas automáticamente
	 * a partir del esquema de BD (tabla "libros")
	 */
	var $belongsTo = array("Autor");
}

/* Devuelve todos los objetos Libro de la base de datos como array 
 * multidimensional (¡no como array de objetos!)
 */
$libros = $this->Libro->findAll();

foreach ($libros as $libro) {
	echo $libro['titulo'] . " (" . $libro['isbn'] . ")\n";
}
```
Definir la información en archivos XML/YAML: los populares ORM Propel y Doctrine hacen uso de este método. Una vez definidos los objetos de negocio en los archivos, el ORM genera los esquemas de bases de datos, las clases y los métodos necesarios para las traducciones. Por ejemplo:
```
Libro:
	columns:
		titulo: string(200)
		isbn: integer(10)
		autor_id: integer(10)
	relations:
		Autor:
			local: autor_id
			foreign: id
			foreignAlias: Autor
Autor:
	columns:
		id: integer
		nombre: string(100)
```
Definir la información como clases PHP, añadiendo anotaciones: esta original aproximación utiliza el formato de documentación phpDoc para añadir el tipado y otras restricciones a cada propiedad. Los comentarios son procesados mediante reflexión por una clase padre que establece los métodos mágicos __get() y __set() para que las restricciones sean efectivas. Por ejemplo:
```
class Libro extends TypeSafe {

	/** @var string */
	public $titulo;
	
	/**
	* @var      int
	* @length   10
	* @required
	*/
	public $isbn;
	
	/** @var Autor */
	public $autor;
}
```
Cabe resaltar que este método de tipado fuerte en PHP no solo es útil en el almacenamiento de datos, sino en la gestión de la información en general, y será desarrollado en el futuro para permitir validación de datos en los modelos de una aplicación MVC.