Magnetismo: campo magnético

Magnetismo

 Magnetita (By Rob Lavinsky, iRocks.com – CC-BY-SA-3.0, CC BY-SA 3.0, https://commons.wikimedia.org/w/index.php?curid=10139390)
Magnetita (By Rob Lavinsky, iRocks.com – CC-BY-SA-3.0, CC BY-SA 3.0, https://commons.wikimedia.org/w/index.php?curid=10139390)

Se conoce la piedra imán,la magnetita, desde la antigüedad, y se aprovechó para las primeras brújulas usadas en navegación. Gilbert (1600) establece que los imanes tienen polos magnéticos,  y postula que el planeta Tierra es un enorme imán que actúa sobre la magnetita, orientándola según el eje de la Tierra Norte-Sur. Cavendish y Coulomb inician la experimentación y descripción matemática del magnetismo, y descubren que la fuerza magnética F_m tiene una expresión similar a la electrostática F_e, sustituyendo las cargas eléctricas por “masas magnéticas”:

F_e=K\frac{q_1q_2}{d^2},\;F_m=\frac{m_1m_2}{d^2}

Viendo las dos leyes, parecía haber una relación entre electricidad y magnetismo no intuida hasta entonces; Oersted descubrió que una aguja imantada cerca de una corriente eléctrica recibía una fuerza, igual que si se ponía cerca de un imán.

Ampère impulsa el nuevo campo de conocimiento deduciendo que el magnetismo se relaciona con las cargas eléctricas en movimiento, poniendo las bases de la Electrodinámica; deduce también que si una corriente se comporta como un imán, entonces dos corrientes próximas se ejercerán efectos magnéticos como si fueran dos imanes, y propone, correctamente, que quizás los imanes permanentes tienen corrientes eléctricas en su interior, que son las que provocan su magnetismo, y que las “masas magnéticas” de Coulomb no existen, sólo existen las cargas eléctricas y sus efectos. Inventa el solenoide, el primer electroimán, y el galvanómetro.

Origen relativista de las fuerzas magnéticas

No deduciremos el origen del magnetismo a partir de la Relatividad especial, pero daremos una idea de por donde va. Imaginemos una carga libre positiva moviéndose a velocidad constante v de forma paralela a un conductor por la que circula una corriente eléctrica; esta corriente de hecho es un movimiento de los electrones del conductor, quedando fijas las cargas positivas .  Para simplificar, supondremos que la velocidad de los electrones es también v. Siendo dos sistemas de cargas en movimiento, deberán experimentar fuerzas magnéticas. Dado que el número de cargas positivas y negativas en el conductor está compensado, la carga libre no experimentará fuerza eléctrica alguna.

Fig. 1: carga en movimiento paralelo a una corriente eléctrica en un conductor
Fig. 1: carga en movimiento paralelo a una corriente eléctrica en un conductor. Fuente: http://galileo.phys.virginia.edu/

Cambiemos ahora al sistema de referencia que se mueve con la carga libre; desde esta referencia las cargas negativas del conductor están fijas y las que se  mueven son las positivas, en sentido contrario:

Fig. 2: la misma situación de la figura 1 vista desde el sistema de referencia de la partícula libre
Fig. 2: la misma situación de la figura 1 vista desde el sistema de referencia de la partícula libre

Ahora bien, siendo ésta referencia móvil respecto a la de la figura 1, debemos aplicar las transformaciones de Lorentz relativistas para tener una imagen real de lo que sucede; concretamente, si aplicamos la contracción de Lorentz (disminución de las distancias en la dirección del movimiento) obtenemos que las distancias entre las cargas positivas se verán como menores desde la referencia de la carga libre, algo así como:

Fig. 3: vista de las cargas móviles aplicando la contracción de Lorentz
Fig. 3: vista de las cargas móviles aplicando la contracción de Lorentz

Ahora las cargas en el conductor no están compensadas: hay más densidad de carga positiva que negativa, y en consecuencia la partícula libre experimentará un campo eléctrico, una fuerza, inducida por la velocidad relativa de las cargas positivas del conductor. Esta fuerza será perpendicular a la velocidad que la genera:

Fig. 6: fuerza debida a la desigual densidad de cargas negativa y positiva
Fig. 6: fuerza debida a la desigual densidad de cargas negativa y positiva

Esta fuerza, vista desde la referencia 1 en reposo, es la denominada fuerza magnética. Decir que la contracción mostrada en las figuras está muy exagerada pues en los casos reales las velocidades de las cargas son muchísimo más pequeñas que la velocidad de la luz, y la contracción relativista es casi despreciable. No obstante, incluso esa pequeña contracción a nivel microscópico (electrones del material) ejerce una fuerza apreciable a nivel macroscópico pues el número de electrones portadores de la electricidad es muy elevado. Estos detalles no se trataran aquí, el sitio adecuado seria un articulo sobre electricidad y magnetismo en la materia.

Así pues, el magnetismo es una de las pruebas, y de las más “cercanas” que tenemos, de los efectos predichos por la Relatividad de Einstein.

Vector campo magnético

Si reflejamos la vista de la figura 1, como si la viéramos en un espejo, ¿qué dirección tomará la fuerza magnética? La situación la vemos en la figura 7:

Fig. 7: hilo conductor recorrido por una corriente y carga en movimiento, y su reflejo
Fig. 7: hilo conductor recorrido por una corriente y carga en movimiento, y su reflejo respecto un plano perpendicular a la corriente I

El espejo invierte el sentido de los vectores velocidad e intensidad de corriente, pero el vector fuerza no se modifica; esto es porque el sentido de la fuerza sólo cambia si la velocidad de la carga no es la misma que la de la corriente, ya que entonces la contracción de Lorentz afectaría  a las cargas positivas y negativas del conductor justo al revés, haciendo que la densidad de negativas fuera mayor que la de positivas.

En el siglo XIX cuando se estudiaba el magnetismo los investigadores no tenían todavía la teoría de la Relatividad, pero ya encontraron este comportamiento extraño en sus experimentos. Este comportamiento anómalo del vector fuerza no se da en otros campos de la Física. En el artículo vectores en Física se explicó que hay dos tipos de vectores: los polares, que bajo una reflexión como la de la figura 7 cambian como lo hacen la velocidad y la intensidad de corriente, y los pseudovectores, que se modifican de otra forma. Parecería entonces que la fuerza magnética no es un vector polar, pero esto es difícilmente aceptable, ya que los vectores fuerza se comportan como vectores polares en todas las situaciones. ¿Cómo solucionamos este comportamiento anómalo del vector fuerza en este caso?  Recordando la propiedad del producto vectorial [vector] x [pseudovector] = [vector]  se planteó vector velocidad de la carga x pseudovector campo magnético = vector fuerza.  O sea, definimos de forma indirecta el pseudovector campo magnético B como aquel que cumple

\overrightarrow F=q\cdot\overrightarrow v\times\overrightarrow B [1]

Con esta definición, el vector fuerza sigue siendo un vector polar, como en el resto de la Física.

la fuerza de inducción magnética sobre una carga en movimiento siempre es perpendicular a la velocidad de la carga
Fig. 8; la fuerza inducida por el campo  magnético sobre una carga en movimiento siempre es perpendicular a la velocidad de la carga, su módulo depende del ángulo que forma con el vector campo magnético B

 

Producto Vectorial según el angulo entre vectores
Fig. 9: El producto vectorial de los vectores a, b siempre es otro vector perpendicular a los dos, pero no en el mismo plano que los contiene. Además, el módulo del producto es variable entre un valor máximo y cero. Fuente: https://es.wikipedia.org/wiki/Producto_vectorial
Tal como “funciona” el producto vectorial, si el campo B resulta ser paralelo a la velocidad v, la fuerza resultante vale cero, y si B y v son perpendiculares, entonces F toma su valor máximo. El producto a x b de dos vectores es perpendicular al plano que contiene a los vectores a, b.

El módulo de F viene dada por

 

F=qvB· \sin \left(\alpha \right) [2]

donde \alpha es el ángulo que forman el campo B y la velocidad v.

Como consecuencia de esta fuerza la carga móvil q variará su trayectoria, girando, pero sin perder velocidad, pues la fuerza es siempre perpendicular a la velocidad; entonces la carga describirá una trayectoria curva en el campo, esta curva dependerá de como varía B en el espacio. En el caso más simple, si suponemos que B es constante en todo el espacio, la fuerza también será constante, y cuando la carga “entre” en el campo, describirá una trayectoria circular, con una aceleración normal a_n=F/m=v^2/R, siendo m la masa de la partícula y R el radio del círculo. Si además el campo B es perpendicular a v tendremos fuerza máxima F=qvB, sustituyendo tenemos qvB/m=v²/R y por tanto el radio de giro es R=\frac{qB}{mv}.

Fig. 4: la carga q con velocidad v curva su trayectoria al entrar en una región con campo magnético perpendicular al plano (aquí B se saldría de la pantalla apuntando hacia nosotros)
Fig. 10: la carga q con velocidad v curva su trayectoria al entrar en una región con campo magnético perpendicular al plano (aquí B se saldría de la pantalla apuntando hacia nosotros)

Si en vez de una corriente tenemos un conjunto de corrientes con diversas intensidades, cada una de ellas creará un campo de inducción magnética; puede demostrarse que el campo magnético conjunto será la suma de cada uno de los generados por cada corriente.

Fig. 4: Campo magnético B creado por un sistema de corrientes y fuerza ejercida sobre una carga q con velocidad v
Fig. 11: Campo magnético B creado por un sistema de corrientes y fuerza ejercida sobre una carga q con velocidad v

Ejemplo 1: En la figura 4 el campo magnético en cada punto del espacio próximo al origen de coordenadas puede considerarse uniforme y viene dado por B= (0, 5, 0) Tesla; la partícula de carga q = 1C tiene una velocidad v = (-3, 2, 0) m/s. Calcular el vector fuerza F ejercido sobre la partícula. Si la partícula tiene una masa de 100 gramos, describir su movimiento.

Aplicando [1]:

\overrightarrow F=q\overrightarrow v\times\overrightarrow B=1\cdot\begin{bmatrix}-3\\2\\0\end{bmatrix}\times\begin{bmatrix}0\\5\\0\end{bmatrix}=\begin{vmatrix}i&j&k\\-3&2&0\\0&5&0\end{vmatrix}=\begin{bmatrix}0\\0\\-15\end{bmatrix}.

La fuerza perpendicular a la velocidad actúa como una fuerza centrípeta, produciendo una aceleración normal a = F/m perpendicular a la velocidad: la partícula gira con velocidad conatante, y como la fuerza también lo es, el movimiento será circular uniforme; dado que la aceleración normal en un movimiento  circular vale a = v²/R, siendo R el radio del círculo descrito, tendremos que F/m = v² / R, por tanto R\;=\;mv²/F=0.1\cdot\left(\sqrt{3^2+2^2+0}\right)^2/15=9\cdot10^{-2}m, la partícula gira con un radio de 9cm.

Una vez definido el pseudovector campo magnético, necesitamos saber calcularlo en situaciones diversas; como suele suceder en Física, sólo podremos hacerlo en casos simples, resultando bastante complicado en los casos más generales.

Fuerza ejercida por un campo magnético sobre una corriente eléctrica

Fig. 7: elemento de corriente
Fig. 5: elemento de corriente

Imaginemos una corriente rectilínea de portadores negativos de carga, todos ellos con la misma velocidad, y consideremos una pequeña porción de longitud dx. Definamos \rho como la densidad de portadores de carga por unidad de volumen (un dato que depende del material conductor) y S como la sección recta del conductor. En la sección considerada tendremos dn = \rho·S·dx portadores de carga (escribimos dn para indicar que es el número de cargas dentro de la pequeña sección dx). Si ahora aplicamos un campo magnético uniforme y constante B, cada una de las n cargas en movimiento experimentará una fuerza  dada por [1],  y la fuerza total sobre la sección del conductor será n veces esa fuerza:

\operatorname d\overrightarrow F=\left(q\overrightarrow v\times\overrightarrow B\right)\cdot\operatorname dn=\left(q\overrightarrow v\times\overrightarrow B\right)\cdot\rho S\operatorname dx=q\rho S\operatorname dx\cdot\left(\overrightarrow v\times\overrightarrow B\right)

Siendo la velocidad constante, podemos definir un vector unitario u en su dirección y sacar la celeridad fuera del producto vectorial:

\operatorname d\overrightarrow F=q\rho Sv\operatorname dx\cdot\left(\overrightarrow u\times\overrightarrow B\right)

Por definición, q\rho Sv es la intensidad de la corriente, I, luego

\operatorname d\overrightarrow F=I\operatorname dx\cdot\left(\overrightarrow u\times\overrightarrow B\right)

Definiendo el vector dl = u·dx, denominado elemento de corriente, obtenemos la fórmula de Laplace para la fuerza ejercida sobre un elemento de corriente por un campo magnético:

\operatorname d\overrightarrow F=I\cdot\left(\operatorname d\overrightarrow l\times\overrightarrow B\right)[3]

Dado que hemos trabajado con elementos diferenciales, que hemos supuesto rectilíneos, se puede aplicar [3] para encontrar la fuerza ejercida sobre corrientes en circuitos que no sean rectílineos pero si describan curvas “suaves” (diferenciables), integrando sobre la trayectoria L que recorre la corriente:

\overrightarrow F=\int_L\operatorname d\overrightarrow F=\int_LI\cdot\left(\operatorname d\overrightarrow l\times\overrightarrow B\right) [4].

Ejemplo 2: Fuerza ejercida por un campo magnético sobre una corriente que recorre una espira rectangular.

Fig. 6: corriente que recorre una espira en un campo magnético
Fig. 6: corriente que recorre una espira en un campo magnético

Una espira rectangular, de lados a, b, es recorrida por una corriente de intensidad I, y está situada en un campo magnético uniforme B que forma un ángulo θ con la recta normal al plano de la espira, como muestra la figura 6. Hallar la fuerza total ejercida sobre la espira.

Consideramos primero el segmento superior de la espira, y los descomponemos en elementos diferenciales de corriente dl; cada uno de ellos estará sometido a una fuerza dada por [3]; el producto vectorial \operatorname d\overrightarrow l\times\overrightarrow B nos indica que la fuerza dF estarà dirigida verticalmente hacia arriba (la dirección de giro desde dl hacia B es contraria a las agujas del reloj). Si nos fijamos ahora en el segmento inferior, obtenemos el mismo valor, sólo que aquí la fuerza estará dirigida hacia abajo; luego las fuerzas en los segmentos inferior y superior son iguales en valor pero de sentido contrario: se anulan entre sí.

Vamos por el segmento vertical izquierdo; el módulo del vector fuerza, dado por [3], teniendo en cuenta que el vector B está en el plano perpendicula al segmento, será

\left|\operatorname d\overrightarrow F\right|=I\cdot\left|\left(\operatorname d\overrightarrow l\times\overrightarrow B\right)\right|=I\cdot\operatorname dl\cdot B

A lo largo de todo el segmento vertical izquierdo, cada elemento de corriente estará sometido a esa misma fuerza constante, al integrarlas todas:

\int_L\left|\operatorname d\overrightarrow F\right|=\int_LI\cdot\operatorname dl\cdot B=IB\int_L\operatorname dl=IBa

donde a es la longitud del segmento; para el segmento vertical derecho obtenemos el mismo valor, pero en sentido contrario, sólo que ahora no se anulará con el segmento izquierdo, pues ambas fuerza resultantes no están aplicadas sobre la misma línea de acción:

Fig. 8: fuerzas sobre la espira. Las verticales se anulan, las horizontales no están sobre la misma recta
Fig. 8: fuerzas sobre la espira. Las verticales se anulan, las horizontales no están sobre la misma recta

En la figura podemos ver que la distancia d entre las líneas de aplicación de las fuerzas de los segmentos verticales es igual a b \sin\left(\theta\right); tenemos pues dos fuerzas de igual valor, sentido contrario, y diferente línea de acción, aplicadas sobre un objeto: constituyen un par de fuerzas, que ejercerán un momento angular que provocará un giro  de la espira (movimiento circular acelerado); el momento resultante será M=F\cdot d=IBa\cdot d=IBab\sin\left(\theta\right).

Usando cálculo integral, puede mostrarse que este resultado se cumple para espiras de cualquier forma, incluso circulares u ovaladas. (Fernandez-Pujal, 1973)

Campo magnético inducido por una corriente rectilínea

Hemos visto que una corriente eléctrica de intensidad I crea un campo magnético. En el caso ideal simple de que la corriente sea rectilínea “indefinida” (hilo conductor muy largo en comparación al espacio que estamos estudiando) por consideraciones de simetría tendremos que la magnitud de B sólo puede depender de la distancia r al conductor. Lo mismo puede decirse de la fuerza F resultante, dada por la expresión [2]. Además, vimos que esta fuerza puede deducirse por aplicación de la relatividad restringida, y vimos que será perpendicular al conductor (figura 6). Siendo además que esta fuerza F es a su vez perpendicular al campo B, encontramos que los vectores F, B han de ser como los de la figura 9.

Fig. 9: campo magnético y fuerza resultante inducida por una corriente rectilínea
Fig. 9: campo magnético y fuerza resultante inducida por una corriente rectilínea: F es radial, y B es tangencial.

Vectorialmente podemos expresar este resultado con la siguiente expresión, conocida como ley de Biot-Savart:

\overrightarrow B=K\cdot\frac{\overrightarrow l\times\overrightarrow r}{r^3}[5]

donde \overrightarrow l es el vector intensidad de corriente, que tiene por módulo la intensidad de corriente I y por dirección la del hilo conductor, el vector \overrightarrow r es el vector radial, que apunta al punto P donde queremos obtener el campo B, y es perpendicular al hilo conductor, y la constante K depende del medio, en el sistema internacional  y en el vacío vale 10⁻⁷

 Ejemplo 3: A lo largo de un hilo conductor muy largo, alineado en la dirección del vector unitario (1,0,0) circula una corriente de 1A; calcular el campo magnético en el punto P(1, 1, 1). Si colocamos en ese punto una carga q = 0.1C, ¿que fuerza se ejercerá sobre ella?

Aplicamos [5]; necesitamos antes obtener el vector radial de P, que en este caso será simplemente (0, 1, 1). Entonces:

\overrightarrow B=K\cdot\frac{\overrightarrow l\times\overrightarrow r}{r^3}=\frac K{2^{3/2}}\begin{bmatrix}1\\0\\0\end{bmatrix}\times\begin{bmatrix}1\\1\\1\end{bmatrix}=\frac K{2^{3/2}}\begin{vmatrix}i&j&k\\1&0&0\\1&1&1\end{vmatrix}=\frac K{2^{3/2}}\begin{bmatrix}0\\-1\\1\end{bmatrix}

La fuerza ejercida sobre la carga viene dada por [2], y será cero, pues la velocidad de la carga es cero: sólo se ejerce fuerza magnética sobre cargas en movimiento.

Bibliografía

  • Julián Fernández – Marcos Pujal: Iniciación a la Física
  • E. M. Purcell: Electricidad y Magnetismo
  • Feynmann: Física, volumen 3, Electromagnetismo y materia

Radio y centro de curvatura de una trayectoria

Trayectorias diferenciables: radio y centro de curvatura

Cuando un punto móvil P se mueve en el espacio describe una trayectoria que en el caso más general es una curva; en el caso de que esta curva sea “suave”, esto es, sin cambios de trayectoria bruscos, será diferenciable, esto es, podrá aproximarse localmente por una circunferencia (en el caso de un movimiento plano) o una esfera (caso de movimiento en el espacio). En la figura 1 se representa una trayectoria plana con dos puntos no diferenciables (en rojo); se denomina a esta curva diferenciable a trozos, pues podemos distinguir en ella tres secciones en las cuales la curva sí es suave.

Fig. 1: Trayectoria curva en general
Fig. 1: Trayectoria curva, en dos dimensiones, en general

Así, en las cercanías del punto móvil P, podemos aproximar la trayectoria por una circunferencia (o esfera) de centro C y radio R, siempre que la curva sea suave en P (figura 2). Llamamos a C al centro de curvatura de la trayectoria en P, y a R el radio de curvatura de la trayectoria en P.

Fig. 2: aproximación local en el punto P por una circunferencia
Fig. 2: aproximación local en el punto P por una circunferencia

En general, el centro y el radio van variando conforme P se mueve, esto es, C y R son propiedades locales de la trayectoria (figura 3). En el caso particular de movimiento circular evidentemente serán constantes. Otro caso particular es el del movimiento rectilíneo, en el que consideramos que R es infinito y que el centro C está en el infinito.

Fig. 3: El centro C y radio de curvatura R van variando a medida que el punto describe la trayectoria
Fig. 3: El centro C y radio de curvatura R van variando a medida que el punto describe la trayectoria

Aceleración y curvatura

Siempre que hay un cambio de dirección en una trayectoria de un móvil, ha de existir una aceleración; es por ello que es de esperar que exista alguna relación entre las propiedades puramente geométricas radio y centro de curvatura de la trayectoria en un punto P y el vector aceleración de P.  Sabiendo esa relación, podríamos deducir la geometría de la trayectoria a partir del vector aceleración, o bien calcular la aceleración a partir del conocimiento de la trayectoria.

Consideremos un movimiento Δs del punto P en la trayectoria s (figura 4) suficientemente pequeña para que se pueda considerar que en esa sección la trayectoria sea aproximadamente circular con radio R y centro C.

Fig. 4: el punto P se mueve hasta otra posición muy próxima P' a lo largo de la trayectoria s
Fig. 4: el punto P se mueve hasta otra posición muy próxima P’ a lo largo de la trayectoria s

Consideremos también una referencia fija Ref, con centro en O. El vector velocidad en el punto P se puede expresar como el límite de la velocidad media en el sector Δs:

\overrightarrow v=\lim_{\triangle t\rightarrow0}\frac{\overrightarrow{OP}'-\overrightarrow{OP}}{\triangle t}=\frac{\operatorname d\overrightarrow{OP}}{\operatorname dt}=\frac{\overrightarrow t\cdot\operatorname ds}{\operatorname dt}=\overrightarrow t\cdot v,

donde hemos definido el vector \overrightarrow t como un vector  unitario en la dirección del vector velocidad (también llamado versor velocidad), que sabemos que es tangente a la trayectoria s en el punto P, y v es el módulo de la velocidad en el punto, también llamado celeridad. Observemos que al hacer el límite la cuerda Δs y el segmento PP’ van a coincidir.

Ahora que tenemos la velocidad, obtenemos la aceleración derivando respecto la referencia fija:

\overrightarrow a=\frac{\operatorname d\overrightarrow v}{\operatorname dt}=\frac{\operatorname d\overrightarrow t}{\operatorname dt}v+\overrightarrow t\cdot\frac{\operatorname dv}{\operatorname dt}=\frac{\operatorname d\overrightarrow t}{\operatorname dt}v+\overrightarrow t\cdot a; [1]

para obtener la derivada del vector unitario tangente, primero pensamos que a medida que el punto P cambia de dirección, el versor t irá girando, moviéndose en un círculo (esfera en el caso de movimiento en el espacio) de radio 1 (pues es un vector unitario).

Fig. 5: el versor velocidad, tangente a la trayectoria, describe un círculo unitario

Si el versor gira un ángulo θ en radianes, siendo el radio la unidad, la longitud de arco valdrá también θ; definiendo el vector unitario n como muestra la figura 5, y llamando t, t’ a los versores tangentes, tendremos,

\overrightarrow t'-\overrightarrow t\approx\theta\cdot\overrightarrow n

la aproximación será buena si el ángulo θ es pequeño, pues el arco y la cuerda serán casi coincidentes, y en el límite será exacta:

\operatorname d\overrightarrow t=\operatorname d\theta\cdot\overrightarrow n,

además, en el límite dθ el vector normal n será perpendicular al versor velocidad t; como éste es a su vez tangente a la trayectoria s, tendremos que el vector n será perpendicular a la trayectoria: es un vector normal unitario a la trayectoria, llamado versor normal.

Fig. 6: el versor normal n és perpendicular al versor velocidad, apunta siempre al centro de curvatura de la trayectoria
Fig. 6: el versor normal n és perpendicular al versor velocidad, apunta siempre al centro de curvatura de la trayectoria

Ahora podemos expresar la derivada temporal del versor velocidad tangencial en función del versor normal:

\frac{\operatorname d\overrightarrow t}{\operatorname dt}=\frac{\operatorname d\theta\cdot\overrightarrow n}{\operatorname dt}=\frac{\operatorname d\theta}{\operatorname ds}\frac{\operatorname ds}{\operatorname dt}\cdot\overrightarrow n. [2]

En la figura 4 vemos que podemos expresar el arco recorrido en función del ángulo girado y del radio de curvatura R: \nabla s=R\nabla\theta, que pasado al límite es

\operatorname ds=R\operatorname d\theta\Leftrightarrow R=\frac{\operatorname ds}{\operatorname d\theta} [3]

Usando [3] en [2]:

\frac{\operatorname d\overrightarrow t}{\operatorname dt}=\frac{\operatorname d\theta}{\operatorname ds}\frac{\operatorname ds}{\operatorname dt}\cdot\overrightarrow n=\frac1Rv\cdot\overrightarrow n [4]

Sustituimos [4] en [1] y resulta:

\boxed{\overrightarrow a=\frac{\operatorname d\overrightarrow t}{\operatorname dt}v+\overrightarrow t\cdot a=\frac{v^2}R\overrightarrow n+\overrightarrow t\cdot a={\overrightarrow a}_n+{\overrightarrow a}_t} [5]

que es una generalización de los resultados conocidos del movimiento circular a trayectorias en general, siendo a_n la aceleración normal y a_t la aceleración tangencial, también llamadas componentes intrínsecas de la aceleración. Dado un movimiento con una trayectoria diferenciable la ecuación [5] relaciona el vector aceleración con el radio de curvatura y la celeridad. Para obtener el centro de curvatura C, observamos en la figura 6 que el vector \overrightarrow{PC} será igual a R \overrightarrow{n} [7].

Procedimiento general de obtención del radio y centro de curvatura de una trayectoria

Dados los vectores velocidad y aceleración \overrightarrow{v}, \overrightarrow{a}, encontramos la celeridad v, el versor tangente \overrightarrow t=\overrightarrow v/v, el módulo a de la aceleración, la aceleración tangencial y la normal {\overrightarrow a}_t=a\cdot\overrightarrow t,\;{\overrightarrow a}_n=\overrightarrow a-{\overrightarrow a}_t, el módulo de la velocidad normal, a_n=\left|\left|\;{\overrightarrow a}_n\right|\right|, e igualamos este valor con v²/R, para obtener el radio: R=\frac{v^2}{\left|\left|\;{\overrightarrow a}_n\right|\right|}. Por último, usamos [7] para obtener el centro de curvatura C.

Ejemplo: Desde un punto O de la costa observamos un barco situado en P, midiendo la distancia r = 1000m y el ángulo θ = 30⁰ formado por su visual y el eje de dirección Norte-Sur tal como muestra la figura 7, en la que también se incluyen el supuesto centro de curvatura C de la trayectoria del barco. Medimos también, en un instante dado, las velocidades radial y angular, dr/dt = 19m/s, dθ/dt = 0.3 ⁰/s, y las aceleraciones radial y angular, d²r/dt² = 2 m/s², d²θ/dt² = 0.05 ⁰/s². Calcular la posición del centro de curvatura C y el radio de curvatura R de la trayectoria del barco usando la base vectorial móvil {12} de la figura y la referencia móvil que usa estos ejes y el origen P. Este ejemplo está tomado de los apuntes de la asignatura de Mecánica de la Escuela Superior de Ingenieros Industriales, escritos por el catedrático Joaquím Agulló.

Fig. 6: Esquema del movimiento de un barco visto desde la costa
Fig. 7: Esquema del movimiento de un barco visto desde la costa

Primero de todo necesitamos obtener los vectores velocidad y aceleración en la base móvil {123}, siendo el eje 3 perpendicular al plano definido por {12}; el vector posición de P en esta base es evidentemente (r, 0 , 0). Derivamos este vector expresado en la base móvil respecto a la referencia fija (ver “Derivación de vectores respecto a bases móviles” en el post Cinemática vectorial: sistemas de referencia, vectores posición, velocidad y aceleración) teniendo en cuenta que la velocidad angular de la base {123} es el vector \left(0,0,\overset.\theta\right), con lo cual:

 

\begin{array}{l}\begin{array}{l}{\left\{\frac d{dt}\overrightarrow{OP}\right\}}_{Ref\;fija}=\\\frac d{dt}\;\begin{bmatrix}r\\0\\0\end{bmatrix}\;+\;\begin{bmatrix}0\\0\\\overset.\theta\end{bmatrix}\times\begin{bmatrix}r\\0\\0\end{bmatrix}=\begin{bmatrix}\overset.r\\0\\0\end{bmatrix}+\begin{bmatrix}0\\\overset.\theta r\\0\end{bmatrix}=\begin{bmatrix}\overset.r\\\overset.\theta r\\0\end{bmatrix}\end{array}\\\end{array}

Sustituimos los valores del enunciado, y calculamos la celeridad:

\overrightarrow v=\begin{bmatrix}\overset.r\\\overset.\theta r\\0\end{bmatrix}=\begin{bmatrix}19\\\left(0.3\frac{2\mathrm\pi}{360}\right)\cdot1000\\0\end{bmatrix}=\begin{bmatrix}19\\5\mathrm\pi/3\\0\end{bmatrix};\;v=\sqrt{19^2+\left(5\mathrm\pi/3\right)^2}\approx20\frac ms.

Derivamos la velocidad para obtener la aceleración, recordando de volver a aplicar la fórmula de derivación respecto referencias fijas de vectores en bases móviles:

{\left\{\frac d{dt}\overrightarrow v\right\}}_{Ref\;fija}=\frac d{dt}\begin{bmatrix}\overset.r\\r\overset.\theta\\0\end{bmatrix}+\begin{bmatrix}0\\0\\\overset.\theta\end{bmatrix}\times\begin{bmatrix}\overset.r\\r\overset.\theta\\0\end{bmatrix}=\begin{bmatrix}\overset{..}r\\\overset.r\overset.\theta+r\overset{..}\theta\\0\end{bmatrix}+\begin{bmatrix}-r\overset.\theta^2\\\overset.r\overset.\theta\\0\end{bmatrix}=\begin{bmatrix}\overset{..}r-r\overset.\theta^2\\2\overset.r\overset.\theta+r\overset{..}\theta\\0\end{bmatrix}.

Sustituimos valores:

\overrightarrow a=\begin{bmatrix}\overset{..}r-r\overset.\theta^2\\2\overset.r\overset.\theta+r\overset{..}\theta\\0\end{bmatrix}=\begin{bmatrix}2\\1\\0\end{bmatrix}\;m/s^2

La aceleración tangencial será la proyección de la aceleración sobre la dirección del vector velocidad tangente:

{\overrightarrow a}_t=a\cdot\frac{\overrightarrow v}v=\sqrt{4+1}\cdot\frac1{20}\begin{bmatrix}19\\5\mathrm\pi/3\\0\end{bmatrix}\;=\begin{bmatrix}19\sqrt5/20\\\sqrt5\mathrm\pi/60\\0\end{bmatrix}\approx\begin{bmatrix}2\\0.6\\0\end{bmatrix}\;m/s^2

la aceleración normal la obtenemos restando:

{\overrightarrow a}_n=\overrightarrow a-{\overrightarrow a}_t\approx\begin{bmatrix}2\\1\\0\end{bmatrix}-\begin{bmatrix}2\\0.6\\0\end{bmatrix}\;=\begin{bmatrix}0\\0.4\\0\end{bmatrix},

igualamos el módulo de este vector con v²/R, para obtener el radio de curvatura: 0.4=20^2/R\Rightarrow R=1000m. El centro de curvatura lo encontramos a partir de la expresión [7]:

\overrightarrow{PC}=R\overrightarrow n=1000\cdot\begin{bmatrix}0\\1\\0\end{bmatrix}=\begin{bmatrix}0\\1000\\0\end{bmatrix}.

Cinemática vectorial: velocidad angular, ángulos de Euler

Velocidad angular y rotaciones en el espacio

En el artículo Vectores en Física explicamos que la velocidad angular es un tipo especial de vector: un vector axial, o pseudovector, y decíamos que estos vectores se diferencian de los vectores “normales” o polares en que se comportan de forma distinta bajo un transformaciones lineales del tipo “reflexión respecto un plano”. En el caso de la velocidad angular además podemos decir que, pese a ser una velocidad, no se obtiene derivando un vector respecto al tiempo.

Esto ocurre por que no podemos definir una base para los “vectores rotación”, tal como hacemos para los vectores posición, para después descomponer cualquier rotación dada en sus componentes,  derivarlos y obtener velocidades de rotación, y no podemos porque las rotaciones son transformaciones lineales, que además no conmutan entre sí. Esto quiere decir que el orden en que se aplican las rotaciones influye en el resultado.

En el espacio euclídeo, podemos escoger cualesquiera tres direcciones ortogonales, definir sobre cada una un vector unitario, y descomponer, de forma única, cualquier vector v según una combinación lineal de los vectores unitarios:

\overrightarrow v=v_1\overrightarrow{e_1}+v_2\overrightarrow{e_2}+v_3\overrightarrow{e_3}

Para hacer lo mismo con las rotaciones, necesitamos una base de rotaciones; podemos pensar que una posibilidad seria escoger rotaciones alrededor de cada eje cartesiano:

Fig. 1: rotaciones alrededor de los ejes cartesianos
Fig. 1: rotaciones alrededor de los ejes cartesianos

Las matrices de cada una de estas rotaciones son, llamando respectivamente R_x, R_y, R_z a las efectuadas sobre los ejes X, Y, Z:

R_x=\begin{bmatrix}1&0&\\0&\cos\left(\alpha\right)&-\sin\left(\alpha\right)\\0&\sin\left(\alpha\right)&\cos\left(\alpha\right)\end{bmatrix},\;R_y=\begin{bmatrix}cos\left(\alpha\right)&0&sin\left(\alpha\right)\\0&1&0\\-sin\left(\alpha\right)&0&cos\left(\alpha\right)\end{bmatrix},\;R_z=\begin{bmatrix}cos\left(\alpha\right)&-sin\left(\alpha\right)&0\\sin\left(\alpha\right)&1&0\\0&cos\left(\alpha\right)&1\end{bmatrix}

Esta matrices no son simétricas, y por lo tanto no conmutan entre si; cualquier combinación lineal que hagamos con ellas dará un resultado distinto dependiendo del orden en el que escribamos las matrices, no es que cambien los coeficientes como cuando cambiamos de base, es que la rotación resultante no es la misma:

\alpha R_1+\beta R_2+\gamma R_3\neq\beta R_2+\gamma R_3+\alpha R_1\neq\gamma R_3+\alpha R_1+\beta R_2

Siendo toda el Álgebra vectorial que conocemos una Álgebra conmutativa, las rotaciones definidas de este modo no la siguen, y nos obligaría a usar álgebras no conmutativas, demasiadas complicaciones.

Es fácil ver que las rotaciones no conmutan sin necesidad de álgebra; la figura 2 muestra como afectan a una ficha de dominó dos rotaciones, en dos columnas.  En la primera fila vemos la ficha en la posición inicial; en la columna de la izquierda,  segunda fila,  se rota la ficha  un ángulo recto en torno a un eje perpendicular a la pantalla en el sentido inverso  de las agujas del reloj, en la segunda fila se vuelve a rotar la ficha en torno al eje Y vertical, en el sentido del reloj, la posición final muestra el lateral de la ficha.

Fig. 2: combinación de dos rotaciones en el espacio, tomadas en distinto orden
Fig. 2: combinación de dos rotaciones en el espacio, tomadas en distinto orden

En la columna de la izquierda, realizamos las dos mismas rotaciones, pero esta vez cambiando el orden. Comparando las posiciones finales, vemos que son distintas.

Ángulos de Euler

Una forma de descomponer cualquier rotación en el espacio según tres rotaciones elementales, de forma que la suma de las tres determine unívocamente la rotación original, es usar los denominados ángulos de Euler; nosotros aquí los utilizaremos en el contexto de dar la orientación de una base móvil Ref2 respecto a una fija Ref1. Se trata de dar la orientación de una base móvil Ref2 cualquiera en base a tres ángulos, que corresponden a tres rotaciones:

  • 1a rotación: respecto a un eje fijo cualquiera, aquí tomamos el eje rotulado como X, puede ser cualquier otro. Respecto a este eje X, efectuar una rotación de la base XYZ con un ángulo \alpha, resulta la base X’Y’Z’:
Fig. 3: Rotaciones según ángulos de Euler, 1ª rotación
Fig. 3: Rotaciones según ángulos de Euler, 1ª rotación
  • 2a rotación: respecto a uno de los nuevos ejes desplazados en la 1a rotación, en nuestro ejemplo, el Y’ o el Z’; por ejemplo, escogemos el eje Y’ para efectuar una rotación de la base con un ángulo \beta, resulta la nueva base X”Y”Z”:
Fig. 4: segunda rotación de Euler
Fig. 4: segunda rotación de Euler
  • 3a rotación: sobre el eje que ha estado afectado sólo por la 2a rotación, en nuestro caso, el eje X’; sobre él, giramos la base un ángulo \gamma para obtener la base X”’Y”’Z”’:
Fig. 5: tercera rotación de Euler, posición final, se indican los vectores rotación en rojo

Otra forma de resumirlo es: los ejes de la base girada cumplen

  1. un eje está afectado por las rotaciones 1a y 3a, en el ejemplo, es el Y
  2. un segundo eje está afectado sólo por la rotación 2a, es el X
  3. el eje restante está afectado por todas las rotaciones, es el Z.

Tal como los hemos descrito, estas rotaciones tienen la siguiente propiedad, que no demostramos:

Propiedad 1: Dada una base móvil con una velocidad angular arbitraria \overrightarrow\Omega, siempre podrá expresarse esta velocidad como suma de las derivadas temporales de los tres ángulos de Euler:

\overrightarrow\Omega=\overset\rightharpoonup\alpha'+\overset\rightharpoonup\beta'+\overset\rightharpoonup\gamma'

Los pseudovectores \overset\rightharpoonup\alpha,\;\overset\rightharpoonup\beta,\;\overset\rightharpoonup\gamma se definen como es habitual: si giramos en el sentido de las agujas del reloj en sobre un eje, el vector giro estará sobre el eje en sentido positivo, si el sentido de giro es el contrario, estará en sentido negativo. Teniendo esto en cuenta, y observando la figura 5, en la que vemos en rojo las posiciones que ocupan los vectores de rotación de Euler, podemos deducir las componentes del vector \overrightarrow\Omega en la base X”’Y”’Z”’:

{\left\{\overset\rightharpoonup\alpha'+\overset\rightharpoonup\beta'+\overset\rightharpoonup\gamma'\right\}}_{X'''Y'''Z'''}=\begin{bmatrix}\gamma'+\alpha'\cos\left(\beta\right)\\\alpha'\sin\left(\beta\right)\sin\left(\gamma\right)+\beta'\cos\left(\gamma\right)\\\alpha'\sin\left(\beta\right)\cos\left(\gamma\right)-\beta'\sin\left(\gamma\right)\end{bmatrix}.

Este seria el caso más general de composición de tres rotaciones de Euler; a menudo, en las aplicaciones prácticas, sólo necesitaremos uno o dos giros para representar la velocidad angular. Dependerá de la geometría de cada problema cuáles ejes y rotaciones serán los más adecuados.

En general es complicado manejar velocidades y aceleraciones angulares en referencias móviles; no obstante, hay casos especiales que pueden simplificar el problema. Uno a considerar se presenta en la figura 5:

Fig. 6: composición simple de rotaciones
Fig. 6: composición simple de rotaciones

Supongamos que tenemos una referencia móvil Ref2 de la cual tenemos su vector velocidad angular \Omega respecto la referencia fija Ref1 (en la figura es el vector en rojo, representado verticalmente, pero puede tener cualquier dirección), y hay un objeto que está girando con velocidad angular w respecto Ref2 en torno a un eje fijo en Ref2; entonces, la velocidad angular del objeto respecto la referencia fija Ref1 es simplemente \left.\overrightarrow\Omega\right|+\overrightarrow w [1] : podemos sumar las velocidades angulares sin recurrir a ángulos de Euler.

Ejemplo 1: En este ejemplo, basado en los apuntes de la asignatura de Mecánica de los estudios de Ingenieria Industrial debidos al profesor Joaquim Agulló (ETSEIB – cpda, 1980), estudiamos la cinemática de un punto en una base móvil usando los ángulos de Euler. En la figura 6 vemos un volante que gira en torno al eje aa’, el cual está sujeto a una plataforma mediante una articulación de tal forma que el eje aa’ puede oscilar en torno al eje bb’. La propia plataforma puede oscilar respecto a un tercer eje cc’. Se pide: a) expresar la velocidad angular del volante en una base móvil adecuada usando ángulos de Euler, b) dar los componentes de la velocidad de un punto P de la periferia del volante en la base móvil del punto anterior.

Fig. 6: volante que gira solidariamente a una plataforma giratoria
Fig. 7: volante que gira en torno al eje aa’, el cual a su vez puede oscilar en torno al eje bb’ solidariamente a una plataforma que a su vez, puede oscilar según el eje cc’

Primero hay que decidir, atendiendo a la geometría del problema, los ejes fijos y móviles que usaremos; en este caso, parece bastante evidente que los propios ejes aa’, bb’ y cc’ son los más adecuados para describir el movimiento del volante respecto a una referencia fija. De hecho, tomando los ejes moviles aa’,  bb’ y el tercer eje simplemente el perpendicular al plano bb’-cc’, sólo necesitaremos dos ángulos de Euler para describir la rotación de la base móvil pues el eje aa’ será directamente el tercer eje. En este caso, podemos ya describir los ángulos de Euler \alpha, \beta de la base XYZ móvil, y los ejes fijos XYZ:

Fig. 7: ejes y ángulos de Euler para el volante del problema
Fig. 8: una elección posible de ejes y ángulos de Euler para el volante del problema

El origen O de las referencias fija y móvil es el mismo: el centro de la plataforma. Encontremos ahora los componentes de las velocidades de las rotaciones de Euler (vectores en rojo en la figura 7) respecto los ejes girados X”Y”Z”, proyectándolos según los ángulos \alpha, \beta, esto equivale a decir, encontrar la velocidad angular de la referencia móvil X”Y”Z”, expresada en su propia base, que es, llamando Ref2 a la referencia de ejes X”Y”Z”, y origen O:

{\left\{{\left.{\overrightarrow\Omega}_{Ref2}\right|}_{Ref1}\right\}}_{Ref2}=\begin{bmatrix}\alpha'\cos\left(\beta\right)\\\beta'\\-\alpha'\sin\left(\beta\right)\end{bmatrix}, [2]

que se interpreta así: velocidad angular de la Ref2, \overrightarrow\Omega}_{Ref2}, relativa a la referencia fija Ref1, {\left.{\overrightarrow\Omega}_{Ref2}\right|}_{Ref1}, con componentes expresados en la base móvil Ref2, {\left\{{\left.{\overrightarrow\Omega}_{Ref2}\right|}_{Ref1}\right\}}_{Ref2}.

Expresemos ahora la velocidad angular del volante respecto Ref1 en la base de Ref2, suponiendo que el volante gira con velocidad angular \gamma' en el sentido contrario a las agujas del reloj respecto del eje aa’. Visto desde la referencia 2 el volante sólo gira en torno al eje fijo (en la Ref2) aa’, así pues,

{\left\{{\left.{\overrightarrow\Omega}_V\right|}_{Ref2}\right\}}_{Ref2}=\begin{bmatrix}0\\0\\\gamma'\end{bmatrix},

que se interpreta: velocidad angular del volante V, relativa a la referencia móvil Ref2, expresada en a base móvil de la Ref2. Para convertir esta velocidad a la relativa a la referencia fija Ref1 observamos que el volante gira en torno a un eje fijo, el Z”, en la Ref2 con velocidad angular que, expresada en la base de la Ref2, es {\left\{{\left.\overrightarrow\omega\right|}_{Ref2}\right\}}_{Ref2}=\left(0,0,\gamma'\right), y a su vez la Ref2 gira con velocidad angular [2] respecto a la Ref1; aplicando [1], encontramos que:

\begin{array}{l}{\left\{{\left.\overrightarrow\omega\right|}_{Ref1}\right\}}_{Ref2}={\left\{{\left.{\overrightarrow\Omega}_{Ref2}\right|}_{Ref1}\right\}}_{Ref2}+{\left\{{\left.\overrightarrow\omega\right|}_{Ref2}\right\}}_{Ref2}=\\\begin{bmatrix}\alpha'cos\left(\beta\right)\\\beta'\\-\alpha'sin\left(\beta\right)\end{bmatrix}+\begin{bmatrix}0\\0\\\gamma'\end{bmatrix}=\begin{bmatrix}\alpha'cos\left(\beta\right)\\\beta'\\-\alpha'sin\left(\beta\right)+\gamma'\end{bmatrix}\end{array} [3].

Para encontrar la velocidad respecto de la referencia fija Ref1 de un punto P cualquiera de la periferia del disco derivaremos el vector OP, expresado en la base móvil Ref2; para ello usaremos la formula de derivación de vectores expresados en bases móviles respecto de una referencia fija (ver Cinemática vectorial: sistemas de referencia, vectores posición, velocidad y aceleración, ecuación [4]):

\boxed{{\left\{{\left.\frac{\operatorname d\overset\rightharpoonup u}{\operatorname dt}\right|}_{Ref}\right\}}_{base}={\left\{\frac{\operatorname d\overset\rightharpoonup u}{\operatorname dt}\right\}}_{base}+{\left\{\overset\rightharpoonup\omega{\textstyle\times}{\textstyle\overset\rightharpoonup u}\right\}}_{base}} [4],

que para el vector de posición OP será:

{\left\{{\left.\frac{\operatorname d\overrightarrow{OP}}{\operatorname dt}\right|}_{Ref1}\right\}}_{Ref2}={\left\{\frac{\operatorname d\overrightarrow{OP}}{\operatorname dt}\right\}}_{Ref2}+{\left\{\Omega\times\overrightarrow{OP}\right\}}_{Ref2} [5]

Las componentes de OP en la base Ref2 serán, considerando el centro O’ del disco de radio r, y tomando el ángulo \gamma de giro alrededor del eje Z”, como muestra la figura 9,

\overrightarrow{OP}=\overrightarrow{OO'}+\overrightarrow{O'P}=\begin{bmatrix}0\\0\\L\end{bmatrix}+\begin{bmatrix}r\cos\left(\gamma\right)\\r\sin\left(\gamma\right)\\0\end{bmatrix}=\begin{bmatrix}rcos\left(\gamma\right)\\rsin\left(\gamma\right)\\L\end{bmatrix}. [6]

Fig. 8: coordenadas de un punto del disco
Fig. 9: coordenadas de un punto del disco

Aplicamos [5] usando [6] y [2]:

\begin{array}{l}{\left\{{\left.\frac{\operatorname d\overrightarrow{OP}}{\operatorname dt}\right|}_{Ref1}\right\}}_{Ref2}=\frac d{dt}\begin{bmatrix}rcos\left(\gamma\right)\\rsin\left(\gamma\right)\\L\end{bmatrix}+\begin{bmatrix}\alpha'cos\left(\beta\right)\\\beta'\\-\alpha'sin\left(\beta\right)\end{bmatrix}\times\begin{bmatrix}rcos\left(\gamma\right)\\rsin\left(\gamma\right)\\L\end{bmatrix}=\\\begin{bmatrix}-r\gamma'\sin\left(\gamma\right)\\r\gamma'cos\left(\gamma\right)\\0\end{bmatrix}+\begin{vmatrix}i&j&k\\\alpha'cos\left(\beta\right)&\beta'&-\alpha'sin\left(\beta\right)\\rcos\left(\gamma\right)&rsin\left(\gamma\right)&L\end{vmatrix}=\\\begin{bmatrix}-r\gamma'sin\left(\gamma\right)\\r\gamma'cos\left(\gamma\right)\\0\end{bmatrix}+\begin{bmatrix}\beta'L+\alpha'rsin\left(\beta\right)sin\left(\gamma\right)\\-L\alpha'cos\left(\beta\right)-\alpha'rsin\left(\beta\right)cos\left(\gamma\right)\\\alpha'rcos\left(\beta\right)sin\left(\gamma\right)-\beta'rcos\left(\gamma\right)\end{bmatrix}=\\\begin{bmatrix}\beta'L+\alpha'rsin\left(\beta\right)sin\left(\gamma\right)-r\gamma'sin\left(\gamma\right)\\-L\alpha'cos\left(\beta\right)-\alpha'rsin\left(\beta\right)cos\left(\gamma\right)+r\gamma'cos\left(\gamma\right)\\\alpha'rcos\left(\beta\right)sin\left(\gamma\right)-\beta'rcos\left(\gamma\right)\end{bmatrix}.\\\end{array}

 

Cinemática vectorial: sistemas de referencia, vectores posición, velocidad y aceleración

La Cinemática se ocupa de describir matemáticamente el movimiento de los cuerpos materiales, en este artículo sólo trataremos cuerpos de dimensiones puntuales, y en este caso simple la descripción del movimiento se basa en los conceptos de posición, velocidad y aceleración. La Cinemática Vectorial, parte de la Mecánica Vectorial, usa la matemática de los vectores, el Álgebra vectorial y el Cálculo diferencial vectorial, para describir y calcular posiciones, velocidades y aceleraciones.

El movimiento es siempre relativo a quién lo describe; el pasajero de un tren de alta velocidad describirá el movimiento dentro del tren de forma distinta a un observador que ve pasar el tren y mira en su interior. Es por esto que se necesita decidir un sistema de referencia antes de calcular nada. En Mecánica Vectorial, escoger un sistema de referencia equivale a escoger un punto O origen de coordenadas, y una base vectorial del espacio, que serán dos o tres vectores (dependiendo de si el espacio que consideramos es plano o tridimensional) unitarios (de módulo igual  la unidad) y perpendiculares entre sí (ortogonales), en el caso del espacio tridimensional, además escogemos una orientación de la base.

Referencias y vector posición

La cinemática del punto usa el concepto de espacio euclídeo para representar el espacio físico real: para definir un marco de referencia euclídeo debemos dar un origen de coordenadas O y una base, que para el espacio tridimensional es un conjunto de tres vectores ortogonales unitarios e_1,e_2,e_3 (también llamados ortonormales).

Fig. 1: ejes ortogonales, base ortogonal, origen de coordenadas, definen una referencia euclídea
Fig. 1: ejes ortogonales, base ortogonal, origen de coordenadas, definen una referencia euclídea

Cualquier punto P en el espacio tendrá asociado un vector de posición OP, que se expresará según una combinación lineal de los vectores de la base; esto significa que, dados dos sistemas de referencia con el mismo origen O pero distintas bases, los vectores de posición de un mismo punto del espacio P serán distintos en cada referencia. También, dos referencias con la misma base pero distintos orígenes O, O’ darán, para un mismo punto del espacio, diferentes vectores de posición.

Ejemplo 1: En el sistema de referencia Ref1, el vector posición OP de un punto tiene por coordenadas (0, 2, 2); otro sistema de referencia Ref2 tiene los ejes paralelos a Ref1, y la misma base, pero su origen O’ tiene coordenadas en Ref1 (0, 0, -2). Determinar el vector posición O’P en la referencia Ref2.

Fig. 2: dos referencias con distintos orígenes y la misma base
Fig. 2: las dos referencias del ejemplo 1

En la figura 2 vemos la geometría del problema; el vector O’P forma un triángulo con los vectores OP, OO’. Usando las propiedades de los vectores, O’P = O’O + OP; el vector O’O es el inverso de OO’, el cual a su vez es el vector posición de O’ respecto a O, que es un dato del problema: O’O = -OO’ = – (0, 0, -2) = (0, 0, 2). Nos queda:

O’P = O’O + OP = (0, 0, 2) + (0, 2, 2) = (0, 2, 4).

Ejemplo 2: Cuando dos referencias Ref1, Ref2 difieren en sus bases, puede determinarse el vector posición en una referencia conociendo el de la otra usando la matriz de cambio de base [S]; se cumple, para un vector cualquiera u:

{\left\{\overset\rightharpoonup u\right\}}_{Ref1}=\left[S\right]{\left\{\overset\rightharpoonup u\right\}}_{Ref2} [1]

donde la matriz [S]  tiene por columnas los componentes de la base de Ref2 en la base de Ref1. Por ejemplo, sea la base de Ref1 la habitual (1,0,0), (0,1,0), (0,0,1), y la base de Ref2 expresada según la base de Ref1, \left(1/\sqrt2,1/\sqrt2,0\right),\;\left(1/\sqrt2,-1/\sqrt2,0\right),\;(0,0,1). La matriz de cambio de base es

\left[S\right]=\begin{bmatrix}1/\sqrt2&1/\sqrt2&0\\1/\sqrt2&-1/\sqrt2&0\\0&0&1\end{bmatrix}

Si el punto P tiene coordenadas (1,1,1) en Ref2, entonces en Ref1 serán

\left[S\right]\cdot\left(1,1,1\right)=\begin{bmatrix}1/\sqrt2&1/\sqrt2&0\\1/\sqrt2&-1/\sqrt2&0\\0&0&1\end{bmatrix}\cdot\begin{bmatrix}1\\1\\1\end{bmatrix}=\begin{bmatrix}2/\sqrt2\\0\\1\end{bmatrix}.

Referencias móviles, y referencias galileanas

Se da el caso de que puede haber movimiento entre referencias: diremos que son referencias móviles; en el caso especial de que el movimiento sea rectilíneo uniforme, diremos que son referencias galileanas, también denominadas sistemas de referencia inerciales. Un espacio euclídeo descrito por referencias galileanas representa un espacio físico homogeneo (todos los puntos tienen las mismas propiedades) e isótropo (en todas las direcciones posibles el espacio tiene las mismas propiedades), y un tiempo uniforme (transcurre al mismo ritmo en todo el espacio). Las leyes de Newton fueron enunciadas, y sólo se cumplen en, sistemas de referencia inerciales.

Si la referencia móvil tiene aceleración (no describe un movimiento rectilíneo uniforme), decimos que es una referencia no galileana, o equivalentemente,  una referencia no inercial. En estas referencias no se cumplen las leyes de Newton.

Dado que, en la práctica, se dan muchos casos de movimientos complicados, que son composición de diversos movimientos, y dan lugar a ecuaciones y expresiones también complicadas, es muy útil expresar esos movimientos según vectores usando una base móvil, que “acompañe” al cuerpo móvil, para simplificar las expresiones. Pero hemos dicho que una base móvil con aceleración, no es un sistema de referencia inercial, y por tanto en ella no se cumplen las leyes de Newton. Para resolver este punto, se recurre al “truco” de encontrar los vectores posición, velocidad y aceleración respecto a una base fija inercial, en la que se cumplen las leyes de Newton, pero expresando las componentes de los vectores en una base móvil adecuada para simplificar las expresiones. Dado que la velocidad es la derivada de la función posición, y la aceleración es a su vez la derivada de la velocidad, lo que acabamos de decir implica que tenemos que saber derivar un vector que está expresado en una base que es móvil (no inercial, en general), respecto a otra base que es fija (más exactamente, inercial).

Vector velocidad

El vector velocidad de un punto P relativo a la referencia Ref se define por la expresión

{\overset\rightharpoonup v}_{Ref}\left(P\right)={\left.\frac{\operatorname d\overset\rightharpoonup{OP}}{\operatorname dt}\right|}_{Ref}=\underset{\triangle t\rightarrow0}{lim}\frac{\overset\rightharpoonup{OP}\left(t+\triangle t\right)-\overset\rightharpoonup{OP}\left(t\right)}{\triangle t}

Es importante notar que la derivada se define también respecto a la referencia; si la referencia no es fija sino que se está moviendo, la derivada tendrá que tener en cuenta la variación creada por este movimiento. Pensemos que, un punto fijo en una referencia Ref1, se verá como móvil en otra referencia Ref2 que se está moviendo respecto a Ref1.

Derivación de vectores respecto a bases móviles

Supongamos que tenemos un vector cualquiera u expresado respecto a una base móvil. Para calcular su derivada respecto a una referencia fija:

{\left.\frac{\operatorname d\overset\rightharpoonup u}{\operatorname dt}\right|}_{Ref}={\textstyle\sum_{i=1}^3}\frac{\operatorname du_i}{\operatorname dt}\cdot{\overset\rightharpoonup e}_i+{\textstyle\sum_{i=1}^3}u_i\cdot{\left.\frac{\operatorname d{\overset\rightharpoonup e}_i}{\operatorname dt}\right|}_{Ref} [2]

donde las e_i son los vectores de la base móvil, u_i las componentes del vector u en la base móvil.  Damos ahora la siguiente propiedad algebraica, que no demostramos:

Propiedad 1: la derivada temporal de una base móvil respecto a una referencia fija puede expresarse mediante el producto vectorial de la velocidad angular de la base por cada uno de los vectores de la base.

{\left.\frac{\operatorname d\overset\rightharpoonup{e_i}}{\operatorname dt}\right|}_{Ref}=\overset\rightharpoonup\omega\times\overset\rightharpoonup{e_i} [3]

Usando [3] en [2] obtenemos

\begin{array}{l}{\left.\frac{\operatorname d\overset\rightharpoonup u}{\operatorname dt}\right|}_{Ref}={\textstyle\sum_{i=1}^3}\frac{\operatorname du_i}{\operatorname dt}\cdot{\overset\rightharpoonup e}_i+{\textstyle\sum_{i=1}^3}u_i\cdot\overset\rightharpoonup\omega\times\overset\rightharpoonup{e_i}=\\{\textstyle\sum_{i=1}^3}{\textstyle\frac{\operatorname du_i}{\operatorname dt}}{\textstyle\cdot}{\textstyle\overset\rightharpoonup e}{\textstyle+}{\textstyle\overset\rightharpoonup\omega}{\textstyle\times}{\textstyle\sum_{i=1}^3}{\textstyle u}{\textstyle{}_i}{\textstyle\cdot}{\textstyle\overset\rightharpoonup{e_i}}{\textstyle=}{\textstyle\;}{\textstyle\sum_{i=1}^3}{\textstyle\frac{\operatorname du_i}{\operatorname dt}}{\textstyle\cdot}{\textstyle\overset\rightharpoonup e}{\textstyle+}{\textstyle\overset\rightharpoonup\omega}{\textstyle\times}{\textstyle\overset\rightharpoonup u}\end{array}

Podemos resumir este resultado así:

\boxed{{\left\{{\left.\frac{\operatorname d\overset\rightharpoonup u}{\operatorname dt}\right|}_{Ref}\right\}}_{base}={\left\{\frac{\operatorname d\overset\rightharpoonup u}{\operatorname dt}\right\}}_{base}+{\left\{\overset\rightharpoonup\omega{\textstyle\times}{\textstyle\overset\rightharpoonup u}\right\}}_{base}} [4],

que se expresará como propiedad así:

Propiedad 2: La derivada temporal respecto de una referencia fija de un vector u expresado en una base móvil es igual a la derivada temporal respecto a la base móvil más el producto vectorial de la velocidad angular de la base móvil (respecto la referencia fija) por el vector u.

Ejemplo 2: Un disco de radio R está girando respecto nuestro sistema de referencia fijo con una velocidad angular Ω. Encima del disco, a una distancia r del centro, una partícula P se está moviendo a velocidad constante y siguiendo una línea paralela al diámetro del disco, como muestra la figura 3; en el instante t = 0 ocupaba la posición O’. Definimos la referencia Ref1 como la fija, y la Ref2 con origen en O’, un eje que sigue la trayectoria del punto, y el otro eje perpendicular al anterior; esta Ref2 vista desde la Ref1 gira con el disco, como se ve en la figura 3. Notar que, al no tener movimiento rectilíneo uniforme, Ref2 no es galileana. Hallar el vector velocidad de P respecto la Ref1 en (a) la base de Ref2, (b) la base de Ref1.

 

Fig. 3: referencias fijas y móviles

 La velocidad de P respecto la Ref1 viene dada por la derivada del vector OP respecto a Ref1; queremos expresar este vector en la base de la Ref2, que es móvil. Para ello, usamos la expresión [4], siendo el vector \overrightarrow u=\overrightarrow{OP}. El vector OP cumple OP = OO’ + O’P, tenemos que expresar estos vectores en la base móvil de la Ref2:

\begin{array}{l}{\left\{\overrightarrow{OP}\right\}}_{Ref2}={\left\{\overrightarrow{OO'}\right\}}_{Ref2}+{\left\{\overrightarrow{O'P}\right\}}_{Ref2}=\\\begin{bmatrix}0\\r\\0\end{bmatrix}+\begin{bmatrix}vt\\0\\0\end{bmatrix}=\begin{bmatrix}vt\\r\\0\end{bmatrix}\end{array}

El vector velocidad angular de Ref2, expresado en la base de Ref2, es

{\left\{\Omega\right\}}_{Ref2}=\begin{bmatrix}0\\0\\\omega\end{bmatrix}

ya que los ejes Z son paralelos en Ref1 y Ref2. Aplicamos [4]:

\begin{array}{l}{\left\{{\left.\frac{\operatorname d\overset\rightharpoonup u}{\operatorname dt}\right|}_{Ref}\right\}}_{base}={\left\{\frac{\operatorname d\overset\rightharpoonup u}{\operatorname dt}\right\}}_{base}+{\left\{\overset\rightharpoonup\omega{\textstyle\times}{\textstyle\overset\rightharpoonup u}\right\}}_{base}=\\\frac d{dt}\begin{bmatrix}vt\\r\\0\end{bmatrix}+\begin{bmatrix}0\\0\\\omega\end{bmatrix}\times\begin{bmatrix}vt\\r\\0\end{bmatrix}=\begin{bmatrix}v\\0\\0\end{bmatrix}+\begin{vmatrix}i&j&k\\0&0&\omega\\vt&r&0\end{vmatrix}=\begin{bmatrix}v\\0\\0\end{bmatrix}+\begin{bmatrix}-r\omega\\\omega vt\\0\end{bmatrix}=\begin{bmatrix}v-r\omega\\\omega vt\\0\end{bmatrix}\end{array}. [5]

Para pasar este vector velocidad de la base de Ref2 a la de Ref1, usamos la matriz de cambio de base S, que recordemos que cumple {\left\{u\right\}}_{Ref1}=\left[S\right]\cdot{\left\{u\right\}}_{Ref2}, donde S es la matriz que tiene por columnas los vectores de la base Ref2 expresados según la base Ref1:

\left[S\right]=\begin{bmatrix}\sin\left(\theta\right)&\cos\left(\theta\right)&0\\-\cos\left(\theta\right)&\sin\left(\theta\right)&0\\0&0&1\end{bmatrix} [6]

donde \theta es el ángulo formado por los ejes de Ref2 y Ref1, que será igual a la velocidad angular por el tiempo: \theta=\omega t. Los coeficientes de la matriz S los deducimos de la geometría del problema:

Fig. 4: Los vectores e1, e2 de la base móvil Ref2 pueden descomponerse según las direcciones de los ejes de Ref1
Fig. 4: Los vectores e1, e2 de la base móvil Ref2 pueden descomponerse según las direcciones de los ejes de Ref1

Aplicamos el cambio de base:

{\left\{\overrightarrow v\left(P\right)\right\}}_{Ref1}=\left[S\right]\cdot{\left\{\overrightarrow v\left(P\right)\right\}}_{Ref2}=\begin{bmatrix}\sin\left(\theta\right)&\cos\left(\theta\right)&0\\-\cos\left(\theta\right)&\sin\left(\theta\right)&0\\0&0&1\end{bmatrix}\begin{bmatrix}v-r\omega\\\omega vt\\0\end{bmatrix}=\begin{bmatrix}\left(v-r\omega\right)\cdot sin\left(\omega t\right)+\omega vt\cdot cos\left(\omega t\right)\\-\left(v-r\omega\right)\cdot cos\left(\omega t\right)+\omega vt\cdot sin\left(\omega t\right)\\0\end{bmatrix} [7].

Comparando [5] con [7] vemos que el último tiene una expresión bastante más complicada, aunque hay que recordar que ambas expresiones son el mismo vector velocidad del punto P respecto Ref1, sólo que expresadas en bases distintas. Es por esto que puede ser conveniente trabajar con bases móviles, para simplificar las expresiones.  En la figura 5 vemos las gráficas de las componentes del vector velocidad [7] respecto al tiempo; son oscilantes con módulo creciente, ya que a medida que P se mueve hacia la periferia del disco, su distancia al centro de giro O aumenta, y por tanto también su velocidad lineal respecto Ref1 (respecto Ref2 es constante). Los picos de velocidad respecto a cada eje corresponden a ceros en el otro eje perpendicular.

Fig. 6: gráficas de las componentes de la velocidad respecto Ref1
Fig. 5: gráficas de las componentes de la velocidad respecto Ref1

Ejemplo 3: Consideramos el mismo disco del ejemplo 2, pero ahora el punto se está moviendo a lo largo de un radio.

velocitat base mòbil6
Fig. 6: movimiento radial de un punto P sobre un disco giratorio

En la referencia móvil Ref2, que está girando con el disco, la posición O’P es simplemente (0, r(t), 0), y el vector OP expresado en la base móvil será el mismo, {OP}ref2 = {O’P}ref2, ya que O y O’ coinciden. La velocidad de P respecto la referencia fija Ref1 expresada en función de la base de Ref2 es:

\begin{array}{l}{\left\{{\left.\frac{\operatorname d\overset\rightharpoonup{OP}}{\operatorname dt}\right|}_{Ref}\right\}}_{base}={\left\{\frac{\operatorname d\overset\rightharpoonup{OP}}{\operatorname dt}\right\}}_{base}+{\left\{\overset\rightharpoonup\omega{\textstyle\times}{\textstyle\overset\rightharpoonup{OP}}\right\}}_{base}=\\\frac d{dt}\begin{bmatrix}0\\r(t)\\0\end{bmatrix}+\begin{bmatrix}0\\0\\\omega\end{bmatrix}\times\begin{bmatrix}0\\r(t)\\0\end{bmatrix}=\begin{bmatrix}0\\r'(t)\\0\end{bmatrix}+\begin{vmatrix}i&j&k\\0&0&\omega\\0&r(t)&0\end{vmatrix}=\begin{bmatrix}0\\r'(t)\\0\end{bmatrix}+\begin{bmatrix}-r(t)\omega\\0\\0\end{bmatrix}=\begin{bmatrix}-r(t)\omega\\r'(t)\\0\end{bmatrix}\end{array}

La componente -r(t)\omega es perpendicular a la trayectoria de P, siendo la velocidad tangencial que sabemos del movimiento circular, la componente r'(t) es simplemente la derivada respecto al tiempo de la función r(t), con el sgnificado de velocidad en sentido radial.

Vector aceleración, aceleraciones centrípeta y de Coriolis

El vector aceleración de un punto P relativo a la referencia Ref se define por la expresión

{\overrightarrow a}_{Ref}\left(P\right)={\left.\frac{\operatorname d{\overrightarrow v}_{Ref}\left(P\right)}{\operatorname dt}\right|}_{Ref}=\underset{t\rightarrow0}{lim}\frac{{\overrightarrow v}_{Ref}\left(t+\triangle t\right)-{\overrightarrow v}_{Ref}\left(t\right)}{\triangle t} [8]

Es importante destacar que, al derivar respecto al tiempo el vector velocidad de un punto respecto a una referencia Ref, la derivada ha de realizarse respecto a la misma referencia Ref para que el resultado sea una aceleración, de lo contrario, ¡el vector obtenido puede no tener significado físico!

Además, la derivada nos da la variación instantánea, respecto a la referencia, del vector velocidad, que puede ser en módulo, en dirección, en sentido, o en una combinación de las tres. Por tanto, si una velocidad es nula en un momento dado, o bien tiene un módulo constante, no implica que su derivada sea nula.

Ejemplo 4: Calcular la aceleración de P del ejemplo 3 respecto a la referencia fija Ref1 en las coordenadas móviles de Ref2, considerando que la velocidad de rotación del disco es variable (el disco está acelerando).

Aplicamos la definición [8]

{\overrightarrow a}_{Ref}\left(P\right)={\left.\frac{\operatorname d{\overrightarrow v}_{Ref}\left(P\right)}{\operatorname dt}\right|}_{Ref}=\frac d{dt}{\begin{bmatrix}v-r\omega\\\omega vt\\0\end{bmatrix}}_{Ref}

El vector velocidad viene dado según la base móvil Ref2, pero derivamos respecto a la base fija Ref1, por tanto usamos la expresión [4], abreviamos las derivadas respecto al tiempo usando apóstrofes: r’ significa dr/dt, r” significa d²r/dt², etc:

\begin{array}{l}{\overrightarrow a}_{Ref}\left(P\right)=\frac d{dt}{\begin{bmatrix}-r(t)\omega\\r'(t)\\0\end{bmatrix}}_{Ref}=\frac d{dt}\begin{bmatrix}-r(t)\omega\\r'(t)\\0\end{bmatrix}+\overrightarrow\Omega\times\begin{bmatrix}-r(t)\omega\\r'(t)\\0\end{bmatrix}=\\\begin{bmatrix}-r'(t)\omega+r(t)\omega'\\r''(t)\\0\end{bmatrix}+\begin{bmatrix}i&j&k\\0&0&\omega\\-r(t)\omega&r'(t)&0\end{bmatrix}=\begin{bmatrix}-r'\omega+r\omega'-\omega r'\\r''(t)-\omega^2r\\0\end{bmatrix}=\\\begin{bmatrix}r\omega'-2\omega r'\\r''(t)-\omega^2r\\0\end{bmatrix}\end{array}.

Tenemos aceleración en dos direcciones perpendiculares: ll componente r''-r\omega^2 da cuenta de la aceleración del punto P según r”(t) y además aparece una aceleración adicional, que tiene la misma dirección que el movimiento de P pero sentido contrario, y es la denominada aceleración centrípeta, que sería la única componente que tendríamos si el punto P tuviera velocidad constante o nula respecto el disco.

Como P además se mueve respecto al disco, aparece un componente adicional de aceleración perpendicular al movimiento de P. En el caso particular de que el disco gire con velocidad angular constante, \omega'=0, este término perpendicular se reduce a -2\omega r': esta aceleración tangencial se conoce como aceleración de Coriolis.

Ejemplo 5: calcular la aceleración del punto P del ejemplo 2 respecto a la referencia fija Ref1.

El vector velocidad viene dado según la base móvil Ref2, pero derivamos respecto a la base fija Ref1, por tanto usamos la expresión [4]:

\begin{array}{l}{\overrightarrow a}_{Ref}\left(P\right)=\frac d{dt}{\begin{bmatrix}v-r\omega\\\omega vt\\0\end{bmatrix}}_{Ref}=\frac d{dt}\begin{bmatrix}v-r\omega\\\omega vt\\0\end{bmatrix}+\overrightarrow\Omega\times\begin{bmatrix}v-r\omega\\\omega vt\\0\end{bmatrix}=\\\begin{bmatrix}0\\\omega v\\0\end{bmatrix}+\begin{bmatrix}0\\0\\\omega\end{bmatrix}\times\begin{bmatrix}v-r\omega\\\omega vt\\0\end{bmatrix}=\begin{bmatrix}0\\\omega v\\0\end{bmatrix}+\begin{bmatrix}i&j&k\\0&0&\omega\\v-r\omega&\omega vt&0\end{bmatrix}=\\\begin{bmatrix}0\\\omega v\\0\end{bmatrix}+\begin{bmatrix}-\omega^2vt\\\omega\left(v-r\omega\right)\\0\end{bmatrix}=\begin{bmatrix}-\omega^2vt\\-r\omega^2\\0\end{bmatrix}\end{array}

Sobre las aceleraciones y fuerzas “ficticias”, o “pseudofuerzas”

Es una costumbre generalizada llamar ficticias a las aceleraciones que hemos visto que “aparecen” en el cálculo, al derivar vectores expresados en bases no inerciales respecto de bases inerciales, como la aceleración centrípeta o la de Coriolis; el motivo de rebajar estas aceleraciones, que de hecho existen, al rango de “ficticias”, es por que, según nos dicen, no hay ningún agente que las provoque, “nadie hace fuerza” para provocar esas aceleraciones. Dado que la 2ª ley de Newton, F = ma, relaciona aceleración con fuerza, se sigue que a cada aceleración ficticia le podemos asociar una fuerza ficticia, o “pseudofuerza”. Por ejemplo es esa (pseudo)fuerza centrífuga que, cuando vamos en un coche que coge una curva a gran velocidad, nos presiona contra la puerta que tenemos al lado.

Para mi humilde opinión, esta forma de discriminación entre aceleraciones confunde más que ayuda a comprender la realidad física. Todas las aceleraciones son reales, no existen las ficticias.

Las aceleraciones lo que son es cambios temporales de la velocidad: siempre que el vector velocidad cambie, hay una aceleración. En el caso de un sistema de referencia no inercial, es el propio espacio que tomamos como referencia el que está cambiando las velocidades, que recordemos, son relativas al sistema de referencia, y por tanto, por definición, hay aceleraciones. Estas aceleraciones son las responsables de, por ejemplo, variar la velocidad para que el móvil efectúe un movimiento circular (por tanto no rectilíneo uniforme)

Esto se ve muy bien en la teoría de la Relatividad General y su principio de equivalencia:   la presencia de masa deforma el espacio circundante, que deja de ser euclídeo, por tanto cualquier sistema de referencia que lo represente será no inercial (recordemos que los inerciales se relacionan con espacios euclídeos), y aparecen aceleraciones vinculadas a  la referencia no inercia, en este caso especial, la aceleración no inercial es la gravedad.  De hecho, la gravedad no es una fuerza, sino una aceleración. El peso es la fuerza que contrarresta la aceleración de la gravedad, que nos sostiene en equilibrio; por eso en la caída libre no se experimenta peso alguno, hay sensación de ingravidez. Una explicación de este hecho, muy sencilla, a nivel divulgativo, es esta: Espacio-tiempo curvo para todos los públicos.

Entonces, hay una aceleraciones producidas directamente por fuerzas aplicadas, y hay otras producidas por el espacio de referencia no inercial; en este último caso, también pueden existir fuerzas reales vinculadas: en el caso del coche que toma la curva, la fuerza que hace el asiento, el cinturón de seguridad, y quizás la puerta, sobre nosotros, es la que genera la aceleración centrípeta necesaria para que nuestra masa tome la curva; si soltamos el cinturón y abrimos la puerta, salimos despedidos hacia fuera del coche, en dirección tangencial a la curva, debido a que en ausencia de fuerzas nuestra masa vuelve a la referencia inercial sin aceleración: a la trayectoria recta. En cambio, la fuerza centrífuga si podría llamarse una pseudo-fuerza, pero creo que es más apropiado no llamarla de ningún modo, pues simplemente no existe: no hay ninguna fuerza que nos empuje fuera del coche en la curva, al contrario, hay una única fuerza real, la centrípeta, que nos obliga a tomar la curva.

separador2

Vectores en Física

Invarancia y vectores

Muchas leyes físicas tienen la propiedad llamada invariancia frente a transformaciones de coordenadas, concretamente presentan invariancia respecto a la traslación y a la rotación de los ejes. Por ejemplo, pensemos en una fuerza aplicada sobre un objeto de masa m = 1Kg tal que su magnitud es de 10N y su dirección forma un ángulo de 45 con el eje X, siendo su sentido positivo. Esa fuerza provocará una aceleración sobre el cuerpo, de magnitud dada por la ley de Newton a = F / m = 10N / 1Kg = 10 m/s² y dirección coincidente con la de la fuerza. Si nos preguntamos que cambiará cuando movemos los ejes de coordenadas hacia la derecha, y los giramos 30 grados en sentido antihorario, la respuesta es que la aceleración será exactamente la misma.

La aceleración producida por la fuerza no depende de la traslación o rotación de los ejes de referéncia
Fig. 1: La aceleración producida por la fuerza no depende de la traslación o rotación de los ejes de referencia, lo que varia es su expresión en términos de coordenadas, pero no su magnitud, dirección y sentido

Para aprovechar esta característica de la invariancia y simplificar los enunciados de las leyes y la resolución de problemas se desarrollaron técnicas matemáticas: el álgebra vectorial y el análisis vectorial.

Cuando expresamos una igualdad física en términos de vectores, estamos asegurando que se cumplirá en cualquier sistema de coordenadas.  Las propiedades de transformación de un vector cuando modificamos las coordenadas son las mismas que las de un movimiento en línea recta de un punto A hasta otro B.

Fig. 2: el movimiento de A hasta B puede definirse por las coordenadas según unos ejes de los puntos A, B
Fig. 2: el movimiento de A hasta B puede definirse por las coordenadas según unos ejes de los puntos A, B. En la figura se indican las coordenadas de A en dos ejes de coordenadas distintos.

De la figura 2, usando la geometría del problema y las funciones trigonométricas, y llamando \theta al ángulo que forman los ejes X’Y’ con los ejes XY, puede deducirse que las ecuaciones de transformación para pasar de las coordenadas (x, y) a las (x’, y’) son:

x'=x\cos\left(\theta\right)+y\sin\left(\theta\right),\;y'=ycos\left(\theta\right)-xsin\left(\theta\right) [1]

Como los vectores y los movimientos en linea recta se transforman igual, suele representarse gráficamente un vector como un segmento orientado: una flecha que va de un punto a otro. También se representan por letras en negrita, como F (vector fuerza), o con flechas encima de la letra: \overrightarrow F. A menudo se adjunta al vector sus componentes en unos ciertos ejes, como por ejemplo \overrightarrow F\left(3,4,-1\right), en este caso es importante recordar que implícitamente se está dando también unos ejes de coordenadas. Esto significa que, dados unos números cualesquiera ordenados, como (1, 2, 3), no tienen porque ser un vector, excepto si nos dicen que son las componentes de un vector en unos ejes determinados.

Álgebra vectorial

El álgebra vectorial describe las operaciones matemáticas que podemos efectuar con vectores: podemos sumar y restar vectores entre sí, multiplicarlos entre sí, multiplicarlos por un número real; no podemos dividir un vector por otro, esa operación no está definida. Las reglas de definición de estas operaciones han estado “diseñadas” de forma que se cumpla la invariancia respecto a diferentes ejes de coordenadas. De hecho, las transformaciones de coordenadas dadas por las ecuaciones [1] son transformaciones lineales, por lo que el álgebra vectorial forma parte del álgebra lineal. A partir de estas transformaciones puede demostrarse que si definimos la suma a + b de los vectores \boldsymbol a\left(a_x,a_y\right),\;\boldsymbol b\left(b_x,b_y\right) es tambien un vector, con componentes \left(a_x+b_x,a_y+b_y\right), y que esta suma verifica las propiedades conmutativa, asociativa, tiene  un elemento neutro (el vector nulo) y un elemento opuesto: el opuesto de un vector \boldsymbol a\left(a_x,a_y\right) es también un vector –a de componentes \left(-a_x,-a_y\right).

Definiendo el producto de un vector \boldsymbol a\left(a_x,a_y\right) por un número real k como el vector k\cdot\boldsymbol a\boldsymbol=\left(ka_x,ka_y\right) tenemos completada la denominada estructura de espacio vectorial.

Vectores polares y vectores axiales, o pseudovectores

En Física, los vectores que se transforman según las leyes [1] se denominan vectores polares (o simplemente vectores), pero no cualquier “montaje” \boldsymbol a\boldsymbol=\left(a_x,a_y,a_z,\cdots\right) con cantidades físicas arbitrarias cumplirá las expresiones [1]. Por ejemplo, definamos en cada punto del espacio (x, y, z) la terna (P, T, H) que contiene la presión P, temperatura T y humedad H en ese punto; si cambiamos el sistema de ejes de forma que el punto (x, y, z) pasa a tener coordenadas (x’, y’, z’), la terna correspondiente seguirá siendo la misma (P, T, H) en ese punto (no cambian la presión ni la temperatura ni la humedad en el punto). Por tanto (P, T, H) no se transforma según las ecuaciones [1] y (P, T, H) no es un vector polar.

En la Física aparecen frecuentemente unos vectores especiales, llamados vectores axiales, o pseudovectores, que se diferencian de los vectores polares al realizar la transformación lineal llamada reflexión respecto de un plano, en la cual dado un vector a y un plano P se busca el vector simétrico b de a respecto de P. En el caso simple de dos dimensiones la reflexión es respecto a una recta, por ejemplo, la reflexión de (x, y) por el eje X (recta y = 0) es el punto (x, -y):

Fig. 3: reflexión de un punto sobre el eje de abscisas X
Fig. 3: reflexión de un punto sobre el eje de abscisas X

Los vectores polares, cuando se reflejan respecto a un plano paralelo a los ejes coordenados, sólo cambian una coordenada, como en el ejemplo de la figura 3. Equivalentemente, un vector polar a(x, y) se transforma en su inverso b(-x, -y)  cuando se cambian de signo sus coordenadas (doble reflexión por planos ortogonales, equivale a girarlo 180⁰), de forma que a + b = 0. Los pseudovectores por su parte cambian todas las coordenadas cuando se reflejan según un plano, equivalentemente, cuando los reflejamos dos veces según los planos coordenados ortogonales obtenemos el pseudovector original.

Fig. 4: dos reflexiones consecutivas de un vector polar respecto de los ejes coordenados resultan en el vector polar inverso del original
Fig. 4: dos reflexiones consecutivas de un vector polar respecto de los ejes coordenados resultan en el vector polar inverso del original

Los vectores axiales necesitan 3 dimensiones para ser visualizados, pero podemos extender su definición a las magnitudes escalares: una magnitud que sólo necesita un número real para expresarse, como por ejemplo la temperatura, se denomina magnitud escalar. Pues bien, igual que existen vectores y pseudovectores, también existen escalares y pseudoescalares.  Los escalares no quedan afectados por una reflexión de los ejes XY, en cambio los pseudoescalares cambian de signo. El ejemplo más simple de pseudoescalar es el módulo de la velocidad angular w en un movimiento circular plano de radio R, en dos dimensiones, con velocidad tangencial v, que numéricamente es w = v²/R; de hecho, la velocidad angular se define como perpendicular al plano de rotación (se “sale” del plano), con un valor positivo si el giro es de derecha a izquierda, y negativo en caso contrario.

Fig. 5: pseudovector velocidad angular, fuente: LP. via Wikimedia Commons

En la figura 6 vemos un movimiento circular plano con dos sistemas de coordenadas, el XY habitual, y otro X’Y’ obtenido reflejando sobre el eje X, con lo cual Y’ = -Y, y X’ = X. En la tabla de la izquierda vemos, en la columna W > 0, la dirección del movimiento cuando la velocidad angular es positiva: en el primer cuadrante se mueve desde el eje X hacia el Y, después del Y hacia el -X, después del -X al -Y, y para terminar del -Y volvemos al X. En la 2ª columna tenemos el movimiento para una velocidad angular negativa. En la 3ª columna está el movimiento visto desde los ejes X’Y’, y observamos que coincide con la 2ª columna: este movimiento, según los ejes XY, tiene velocidad angular positiva, pero al reflejar según un eje para obtener los ejes X’Y’ la velocidad angular pasa a ser negativa, luego la velocidad angular es un pseudoescalar (en tres dimensiones, será un pseudovector).

Fig. 6: movimiento circular plano y signo de la velocidad angular
Fig. 6: movimiento circular plano y signo de la velocidad angular

Obtención de las coordenadas de un vector axial

La regla de formación habitual de un vector axial en 3 dimensiones w, es formando el denominado producto vectorial de dos vectores polares u, v, denotado por \boldsymbol a\times\boldsymbol b y que se calcula usando el determinante:

\boldsymbol w=\boldsymbol u\times\boldsymbol v\boldsymbol\;=\begin{vmatrix}i&j&k\\u_x&u_y&u_z\\v_x&v_y&v_z\end{vmatrix} [2]

donde i, j, k son los vectores unitarios en las direcciones de los ejes X, Y, Z (también llamados versores) o equivalentemente, desarrollando el determinante, por las expresiones:

Fig.7: pseudovector w como producto vectorial de vectores polares u, v
Fig.7: pseudovector w como producto vectorial de vectores polares u, v. Fuente: es.wikipedia.org/wiki/Producto_vectorial

El producto vectorial cumple que:

  • [vector] x [vector] = [pseudovector]
  • [pseudovector] x [pseudovector] = [pseudovector]
  • [vector] x [pseudovector] = [vector]

Otros ejemplos importantes de vectores axiales son el momento angular L , el par de fuerzas o momento de una fuerza, el campo magnético H , y el momento del dipolo magnético.

Orientación de los ejes y vectores

Hemos visto que las transformaciones de coordenadas denominadas reflexiones afectan de forma distinta a los vectores polares que a los axiales. Otra forma de exponerlo se refiere a la orientación del sistema de referencia en 3 dimensiones, que puede ser de dos tipos, como vemos en la figura 7.

Fig. 7: orientación relativa de los ejes en tres dimensiones. Fuente: Wikipedia under GFDL by en:User:Tarquin

En el sistema de la izquierda pasamos de X a Y siguiendo el movimiento de las agujas del reloj, en el de la derecha vamos al contrario que el reloj; éste último es el que se utiliza habitualmente. Según lo que hemos explicado del producto vectorial, el de la derecha cumple, llamando x al vector unitario según X, y al vector unitario según Y, z al vector unitario según Z, que

\boldsymbol x\times\boldsymbol y\boldsymbol\;=\begin{vmatrix}x&y&z\\1&0&0\\0&1&0\end{vmatrix}=\left(0,0,1\right)=\boldsymbol z

Abreviadamente, \boldsymbol x\times\boldsymbol y\boldsymbol\;=\boldsymbol z, en cambio en el sistema de referencia de la izquierda se cumple que \boldsymbol x\times\boldsymbol y\boldsymbol\;=-\boldsymbol z. Ambos sistemas de coordenadas cartesianos son igualmente válidos para describir las leyes de la Física, aunque de forma estándar se usa el de la derecha.

Análisis vectorial

La otra rama matemática que se ha desarrollado en torno a los vectores tiene que ver con el cálculo diferencial e integral. Considerando que los vectores pueden ser funciones, podemos aplicarles el análisis matemático, teniendo en cuenta sus propiedades como vectores.

Por ejemplo, dado un vector velocidad v variable, que es función del tiempo, como \boldsymbol v=3t\boldsymbol i+t^2\boldsymbol j-6=\left(3t,t^2,-6\right), su derivada será otro vector, el vector aceleración a, que se obtiene derivando cada coordenada por separado:

\frac{\operatorname d\overset\rightharpoonup v}{\operatorname dt}=\left(3t\overset\rightharpoonup i+t^2\overset\rightharpoonup j-6\overset\rightharpoonup k\right)'=3\overset\rightharpoonup i+2t\overset\rightharpoonup j=(3,2t,0),

donde el apostrofe indica la derivada respecto al tiempo: \frac{\operatorname d\overset\rightharpoonup v}{\operatorname dt}=\overset\rightharpoonup v'.

Leyes de Newton en notación vectorial: mecánica vectorial

Como ejemplo importante de análisis vectorial podemos dar la 2ª ley de Newton en forma vectorial, y usando derivadas vectoriales:

\overset\rightharpoonup F=\frac{\operatorname d\overset\rightharpoonup p}{\operatorname dt}=\frac{\operatorname d\left(m\overset\rightharpoonup v\right)}{\operatorname dt} [3]

donde F es el vector fuerza, p es el vector impulso, y v el vector velocidad. La expresión vectorial [3] indica que se cumplen tres igualdades (una para cada componente de los vectores), en un sistema de ejes cartesianos cualquiera. A esta presentación de la dinámica de Newton usando vectores se la denomina Mecánica Vectorial.

Ejemplo 1: un punto material se mueve describiendo una trayectoria curva complicada, de forma que en el instante t = 1 su vector velocidad es (3, 1, -1) y en el instante t = 2 es (2, 0, 0). Calcular su vector aceleración media en ese intervalo de tiempo.

Como no tenemos la expresión de la velocidad como función del tiempo, no podemos usar derivadas, hay que proceder con la definición de aceleración media usando diferencias:

\boldsymbol a=\frac{\triangle\boldsymbol v}{\triangle t}=\frac{(2,\;0,\;0)-(3,\;1,\;-1)}{2-1}=\left(-1,-1,+1\right)

Ejemplo 2: un objeto puntual P se mueve radialmente encima de un disco, moviéndose desde el centro O hacia la periferia, viniendo dada su distancia al centro por la función r(t) = t²+2t.

Fig. 8: partícula con un movimiento radial sobre un disco giratorio
Fig. 8: partícula con un movimiento radial sobre un disco giratorio

El disco gira con velocidad angular \psi'  respecto a nuestro sistema de referencia en reposo, donde \psi es el ángulo que forma el radio que está recorriendo el objeto respecto a su posición inicial, y el apostrofe indica la derivada respecto al tiempo: \psi'=\frac{\operatorname d\psi}{\operatorname dt}.  Calcular la velocidad del objeto respecto a nosotros.

Este tipo de problemas se resuelve considerando la composición de movimientos: tenemos el movimiento del disco, con vector velocidad angular \overset\rightharpoonup\psi=\left(0,0,\psi'\right), ya que hemos visto que al girar en el sentido contrario a las agujas del reloj, el vector velocidad angular saldrá del plano XY en sentido positivo. Por otro lado si definimos otro sistema de coordenadas X’Y’Z’ que gira solidariamente con el disco, de forma que su eje X’ coincide con la trayectoria del punto P, y su eje Z’ coincide con el vector velocidad angular, entonces el vector posición del punto P respecto a X’Y’Z’ será \overset\rightharpoonup{OP}=\left(r\left(t\right),0,0\right).

El vector velocidad se obtiene derivando el vector posición, pero como lo queremos respecto al sistema de referencia fijo, usaremos el siguiente resultado del análisis vectorial referente a derivadas con respecto a referencias que se mueven uno respecto a la otra, como es el caso de XYZ y X’Y’Z’:

\boxed{{\left.\frac d{dt}\right|}_{XYZ}\overset\rightharpoonup{OP}={\left.\frac d{dt}\right|}_{X'Y'Z'}\overset\rightharpoonup{OP}+\overset\rightharpoonup\psi\times OP}

Lo aplicamos al problema dado:

\begin{array}{l}{\left.\frac d{dt}\right|}_{XYZ}\overset\rightharpoonup{OP}={\left.\frac d{dt}\right|}_{X'Y'Z'}\left(t^2+2t,0,0\right)+\left(0,0,\psi'\right)\times\left(t^2+2t,0,0\right)=\\\left(2t+2,0,0\right)+\left(0,\left(2t+2\right)\psi',0\right)=\left(2t+2,\left(2t+2\right)\psi',0\right)=\\\boxed{\left(2t+2\right)\left(1,\psi',0\right)}\end{array}.

Campos vectoriales y teoría de campos

Cuando asociamos a cada punto del espacio, localizado por su vector posición, otro vector, que representa una magnitud vectorial, estamos definiendo una aplicación vectorial de variable vectorial, que denominamos campo vectorial. Por ejemplo, en el movimiento de un fluido por un conducto, por cada punto del espacio tendremos un vector velocidad del fluido. El análisis matemático aplicado a campos vectoriales proporciona herramientas para obtener analíticamente propiedades del campo físico real; por ejemplo la ley de Faraday que relaciona el campo eléctrico \overset\rightharpoonup E con el campo magnético \overset\rightharpoonup B utiliza derivadas e integrales de línea:

Ley de Faraday. Fuente: https://es.wikipedia.org/wiki/Ecuaciones_de_Maxwell

La rama de la Física Matemática que relaciona los campos vectoriales con los campos físicos reales, como el campo gravitatorio, el eléctrico, etc, es la teoría de campos. Siendo que esta teoría se ha desarrollado hasta abarcar la Mecánica Cuántica y la Física de partículas (como por ejemplo hace la teoría de campos llamada Cromodinámica Cuántica), resulta que prácticamente todo en Física moderna son campos, aunque no vectoriales, sino de un tipo más general.

Estadística Aplicada -> Contrastes de Hipótesis

Supongamos que hemos comprado un saco de nueces que contiene unas 1000, y que al llegar a casa cogemos una al azar, resultando que está seca, incomestible. Un optimista pensará, “¡bah! he ido a coger la única que está pasada, no importa”, mientras que un pesimista pensará “buenoo … este saco estará lleno de nueces podridas”.  Cualquiera de los dos puede tener razón. Para saberlo, sin tener que vaciar todo el saco, podemos tomar una muestra representativa, esto es, suficientemente grande (por ejemplo, 20 nueces) y bien tomada (mezclamos bien las nueces, cogemos una de arriba, otra del lado derecho, otra de abajo, etc., cambiando de sitio cada vez de forma aleatoria). Después, observando el número de nueces buenas de la muestra, podemos intentar inferir cuantas nueces buenas habrá en el saco. Este procedimiento de comprobación de un producto comercial es parte del proceso de control de calidad, que se hace tanto por parte del fabricante (control de calidad de producción) como del comprador (control de calidad a la recepción del producto). La herramienta estadística que permite, con cierto grado de certeza (denominado nivel de confianza), decidir si una compra como la del saco de nueces es acertada o por el contrario debemos reclamar al fabricante es el contraste de hipótesis estadísticas. Por supuesto, como siempre en Estadística, no podremos saber realmente cuantas nueces están estropeadas a menos que las miremos una por una: aceptar las conclusiones del contraste conllevan un riesgo, como vemos en el siguiente apartado.

Problemas y  errores que podemos cometer en los contrastes

Supongamos que el fabricante, a través de su control de calidad de producción, está convencido de que sólo un 1% de sus nueces envasadas pueden llegar en mal estado al consumidor, y que el consumidor acepta este máximo, y quiere comprobarlo a la recepción del producto, así que aceptará como máximo ese 1% defectuoso. El comprador entonces extrae una muestra para comprobarla … pero puede suceder que esa muestra resulte ser peor de lo que realmente es la producción (el término estadístico correcto sería la población), con lo cual reclamará al fabricante sin motivo real, erróneamente; este error se denomina error-α o  error de tipo I.  También puede suceder lo contrario, que por azar la muestra resulte ser mucho mejor que la población, el comprador aceptará erróneamente la compra siendo defectuosa, es el error-β o error de tipo II.

Por ejemplo si los pesos de un dulce tienen una media de 20gr y sólo uno de cada 100 se desvía de ese peso más de 1gr, en una muestra de tamaño n = 30, el comprador podría pensar de rechazar su pedido si encuentra un sólo dulce que se desvíe más de 1gr del peso medio, pues 30·1/100 = 0.3, la proporción en la muestra no llega a la unidad. Si cada dulce, al ser pesado, tiene una probabilidad 1/100 de salirse de la tolerancia, cuando pesamos uno por uno los 30 dulces de la muestra, la probabilidad de que uno se salga de la tolerancia viene dada por la distribución de probabilidad binomial, y vale 0.2242, que es un valor alto (un 22,42%), peor aún, la probabilidad de que encontremos uno o más de uno fuera de tolerancia es  α = 26%. Y eso que hemos supuesto que el fabricante dice la verdad. Vemos que este procedimiento de control en la recepción del producto produce un alto error tipo I, con un valor de α = 0.26.

Veamos ahora que pasa con el caso contrario: el fabricante no dice la verdad, y realmente está produciendo un 5% de dulces fuera de tolerancia; ¿qué probabilidad hay de que el comprador no se de cuenta y acepte la compra realizada? Según la distribución binomial, con un 5% de probabilidad de dulce “erróneo”, la probabilidad de que no aparezca ninguno en la muestra de 30 dulces es β = 21,5%, que seria la probabilidad de cometer error de tipo II. Este ejemplo muestra claramente que se necesita un procedimiento eficaz para realizar un control de calidad correcto que no perjudique al fabricante con errores de tipo I ni al comprador con errores de tipo II.

En la figura 1 se muestra el aspecto de las probabilidades de aceptación de una muestra en función de la fracción defectuosa en la población; la línea vertical simboliza la tolerancia anunciada por el fabricante, si la fracción defectuosa es menor, la producción es mejor de lo que anuncia, y si es mayor, la producción resulta peor de lo anunciado. Por supuesto, si la fracción defectuosa es cero (producción perfecta) seguro que aceptaremos cualquier muestra, y no hay error posible. Pero entre el valor de cero y la tolerancia de 0,01 vemos que la probabilidad de no aceptar (rechazar) la muestra va aumentando, en esa región se produce el error de tipo I o α. Por otro lado, cuando la producción es más defectuosa de lo anunciado, sigue habiendo una probabilidad significativa de aceptar la muestra (región β).

Fig. 1: Curva de aceptación de una muestra, dependiendo de la proporción real de defectos en la población

Así, la curva divide el cuadrante XY en cuatro regiones: las de error I y II, y las otras dos regiones que corresponden a cuando acertamos en el control: aceptamos la muestra que proviene de una población correcta, o bien rechazamos la muestra que proviene de una población incorrecta.

La matemática del contraste de hipótesis

La Estadística teórica proporciona modelos matemáticos de distribuciones de probabilidad: funciones con ciertas propiedades que nos permiten calcular probabilidades de forma sistemática. Los contrastes de hipótesis usan estos modelos para poder decidir si un control de calidad es o no es válido, y lo hacen del siguiente modo:

  1. Dado un problema real en el que extraemos una muestra de una población para comprobar si un cierto valor (un parámetro de la población) es correcto, identificamos qué modelo matemático es el más adecuado para esa situación, atendiendo al tipo de población y al tamaño de la muestra.
  2. Planteamos dos hipótesis: la denominada hipótesis nula, hipótesis de trabajo, o H0, y la hipótesis alternativa, o H1. La H0 supone que los parámetros dados para la población son correctos, que el modelo de distribución de probabilidad escogido en el paso anterior es también correcto, y que la muestra que tenemos pertenece efectivamente a la población; la hipótesis H1 supone que las afirmaciones anteriores no son correctas (una, algunas o todas)
  3. Suponiendo que la hipótesis de trabajo es cierta, calculamos, usando el modelo de distribución de probabilidad, un valor numérico, denominado estadístico de contraste, que es una variable aleatoria función de la muestra.
  4. Usando las probabilidades dadas por el modelo de distribución de probabilidad, comprobamos si el valor anterior es “creíble” o por el contrario es francamente poco probable que suceda; en el primer caso, damos por verificada la hipótesis H0, en el segundo, rechazamos H0 por ser poco probable y aceptamos la alternativa H1.

Ejemplo 1: comprobar si una moneda es simétrica. Queremos averiguar si, en el lanzamiento al aire de una moneda, realmente el número de caras y de cruces obtenidas son iguales o no. Para ello lanzamos al aire la moneda n = 100 veces y anotamos el número de caras y de cruces, que ha resultados ser 52 y 48, respectivamente. Para decidir si la moneda es simétrica respecto al número de caras y de cruces procedemos sistemáticamente.

  1. Cada lanzamiento de la moneda nos da un valor binario, cara o cruz, cada uno con una cierta probabilidad que llamamos P(cara) = p, P(cruz) = q. Si repetimos el lanzamiento n veces, y nos preguntamos el número de caras X (o de cruces) obtenidas en esos lanzamientos, esa variable X es, por definición, una variable aleatoria con distribución de probabilidad binomial. Tenemos pues el modelo matemático.
  2. En principio, suponemos (hay que comprobarlo) que la moneda es simétrica, o sea que las probabilidades p y q son iguales a 1/2: p = q = 1/2. Nuestra hipótesis H0 será: la variable X número de caras sigue la distribución de probabilidad binomial con p = 1/2. La hipótesis H1 será: o bien X no sigue la distribución de probabilidad binomial, o bien p no es igual a 1/2.
  3. Suponiendo H0 cierta, la proporción de caras obtenidas en la muestra n = 100 lanzamientos, que llamaremos p’ = 52/100, debería no estar muy alejada de p = 1/2. Nuestro estadístico de contraste en este caso será simplemente p’.
  4. Suponiendo H0 cierta, ¿cuál es la probabilidad de obtener p’ = 0.52 en n = 100 lanzamientos de la moneda? Este planteamiento es demasiado estricto, pues dará una probabilidad baja, concretamente da P(X = 52) = 0.07, porque obtener precisamente 52 caras es totalmente aleatorio, si volvemos a lanzar la moneda otras 100 veces seguramente obtendremos otro valor distinto, así que si seguimos este método estaremos trabajando con una probabilidad grande de cometer  error de tipo I: rechazar una hipótesis que era verdadera. Lo que se hace en contrastes de hipótesis es trabajar siempre con intervalos aceptables de valores, no con valores puntuales; por ejemplo, ¿en qué intervalo de valores esperamos encontrar el número de caras X, en n = 100 lanzamientos, con una probabilidad del 95%? Calculamos el intervalo [a, b] tal que  P(a <= X  <= b) = 0.95; siendo n bastante grande, el cálculo se simplifica aproximando la binomial por una distribución normal, concretamente aplicamos el siguiente resultado:

Teorema 1: Si H0 es cierta, y n es grande, entonces el estadístico de contraste

Z=frac{p'-p}{sqrt{displaystylefrac{pleft(1-pright)}n}}

sigue una distribución de probabilidad Normal estándard.

O sea que para nuestra moneda tendremos

Z=frac{0.52-0.5}{sqrt{displaystylefrac{0.5left(1-0.5right)}{100}}}=frac25=0.4

¿Entre qué valores esperamos que Z esté, con una probabilidad del 95%, siendo Z una variable normal estándar? Consultando las tablas de la Normal encontramos que P(-1.96 < Z < 1.96) = 0.95. Vemos que el valor obtenido del estadístico de contraste, Z = 0.4,  cae dentro de este intervalo, por tanto “todo cuadra”, es lo que esperábamos al suponer H0 cierta, por lo que concluimos que, efectivamente, la moneda es simétrica.

Intervalos de aceptación de H0 y H1, p-valor

En el ejemplo 1, el intervalo que hemos obtenido, [-1.96, 1.96], se llama intervalo de aceptación de la hipótesis H0. En seguida deducimos que existe otro intervalo de aceptación de la hipótesis alternativa, que será el complementario: left(-infty,-1.96right)cupleft(1.96,+inftyright), es el intervalo de aceptación de la hipótesis H1. Decidir con qué hipótesis nos quedamos, con H0 o H1, es simplemente ver en cual de estos dos intervalos “cae” el estadístico de contraste.

Claro que estos intervalos son bastante arbitrarios: en el ejemplo 1 lo hemos obtenido a partir de una probabilidad del 95%: el estadístico de contraste Z, debe de estar en [-1.96, 1.96] en un 95% de los casos, siempre que la hipótesis H0 sea cierta; pero, ¿por qué 95%, y no 80%, 70% o 100%? En la siguiente tabla vemos otras elecciones para la probabilidad, su intervalo de aceptación de H0, y la conclusión obtenida al comparar el estadístico de contraste Z = 0.4 con el intervalo:

Probabilidad intervalo aceptación H0   Conclusión
100,00% -∞ +∞ H0 cierta
99,00% -2,5758293035 2,5758293035 H0 cierta
95,00% -1,9599639845 1,9599639845 H0 cierta
90,00% -1,644853627 1,644853627 H0 cierta
80,00% -1,2815515655 1,2815515655 H0 cierta
70,00% -1,0364333895 1,0364333895 H0 cierta
60,00% -0,8416212336 0,8416212336 H0 cierta
50,00% -0,6744897502 0,6744897502 H0 cierta
40,00% -0,5244005127 0,5244005127 H0 cierta
30,00% -0,3853204664 0,3853204664 H0 falsa
20,00% -0,2533471031 0,2533471031 H0 falsa
10,00% -0,1256613469 0,1256613469 H0 falsa
0,00% 0 0 H0 falsa

Sea cual sea la probabilidad escogida, se le llama nivel de confianza del contraste, y se le denota por (1 – α); la probabilidad α también tiene nombre: es el nivel de significación del contraste. Así, en el ejemplo 1 hemos elegido un nivel de confianza del 95%, o equivalentemente, un nivel de significación del 5%.

Recordemos que en todo contraste, al decidir con qué hipótesis nos quedamos, podemos cometer errores, de tipo I o II; el error de tipo I, rechazar H0 cuando era cierta, sería el caso de haber obtenido con una moneda simétrica, por ejemplo, 60 caras en 100 lanzamientos, ya que en este caso obtenemos un estadístico Z = 2, que cae fuera del intervalo de aceptación de H0, [-1.96, 1.96]. Es difícil que esto ocurra, pero no imposible: la probabilidad de obtener un Z fuera del intervalo [-1.96, 1.96] es precisamente del 5%, el nivel de significación, y al mismo tiempo, es ésta la probabilidad de cometer el error de tipo I:

El nivel de significación α es la probabilidad de cometer, en un contraste, el error de tipo I

 Así pues, al escoger la probabilidad (1 – α) del intervalo de aceptación, al mismo tiempo estamos escogiendo con que probabilidad vamos a cometer el error de tipo I. Evidentemente, queremos que sea baja, por lo que los valores de la tabla 0%, 10%, etc para (1 – α) quedan descartados. En la práctica suelen usarse de forma estándar niveles de confianza del 90%, 95% o 99%, equivalentes a niveles de significación de 10%, 5% o 1%. ¿Y por qué no tomamos (1 – α) con lo cual α = 0 y seguro que no cometemos error de tipo I? En la tabla vemos que el intervalo de aceptación de H0 es toda la recta real: sea cual sea el valor del estadístico Z aceptaremos H0: el contraste no hace nada, siempre responde lo mismo, que H0 es cierta, !incluso siendo falsa!. Si lo queremos de otro modo:

Al reducir mucho la probabilidad α de cometer error de tipo I, aumentamos mucho la probabilidad β de cometer error de tipo II.

Dada esta arbitrariedad de elección del nivel de confianza (o del de significación), es útil otra forma alternativa de decidir entre H0 y H1, que consiste en, dado el estadístico z, y la variable aleatoria Z de la población, calcular la probabilidad P(Z > z) = P(z < Z < +∞). Esperamos que esta probabilidad no sea “demasiado pequeña” para aceptar H0, concretamente la comparamos con los niveles de significación habituales, 10%, 5% o 1%. A la probabilidad P(Z > z) se la conoce con el nombre de p-valor del contraste asociado al estadístico Z, o simplemente, el p-valor.

Ejemplo 2: siguiendo con el caso de la moneda, el p-valor correspondiente a z = 0.4 es P(Z > 0.4)  = 0.3446 = p-valor, o expresado en %, es de 34,46%; comparando con los niveles 10%, 5% o 1% vemos que es mayor que todos ellos, así que aceptamos H0 tanto para la significación 10% como para  5% o 1%.

En la realidad sucede a menudo que no está tan claro si aceptar H0 o no, pues depende del nivel de significación finalmente elegido. Por ejemplo, si en el lanzamiento n = 100 veces de la moneda hubiéramos obtenido 60 caras, con lo cual es estadístico z = 2, y el p-valor = 0.0227, o 2.27%, es un valor pequeño, menor que α = 10% o α =5%, pero mayor que α = 1%; entonces, ¿qué decidimos? Diríamos: con unas probabilidades de cometer error I del 10% o del 5%, rechazamos que la moneda sea simétrica, pero con una probabilidad de cometer error I de sólo 1%, lo aceptamos. Todo depende de hasta que punto queramos evitar caer en el error de tipo I: rechazar H0 cuando era cierta.

El p-valor nos informa de la probabilidad de cometer error de tipo I en el contraste: para significaciones α > p-valor, aceptamos H1, para α < p-valor, aceptamos H0.

Contrastes unilaterales y bilaterales

Volvamos al ejemplo de los dulces, sus pesos tienen una media de 20gr y según el fabricante sólo uno de cada 100 se desvía de ese peso más de 1gr. El comprador quiere saber cómo proceder, en una muestra de tamaño n = 30, para decidir si la compra es aceptable o bien si ha de reclamar. Además, nos dice que no le preocupa que el peso real esté por encima de la media ya que en ese caso estará comprando más barato, tendrá más dulce por el mismo precio, lo que le preocupa es pagar por dulces a los que les falte peso para llegar a la media.

En seguida planteamos las hipótesis que darán respuesta al problema planteado:

  • H0: El peso de los dulces, que tiene una distribución de probabilidad normal, tiene una media de al menos 20gr,
  • H1: El peso de los dulces no llega a los 20gr, o bien la distribución real del peso no sigue una distribución normal

Hemos supuesto que la distribución teórica del peso de los dulces es normal, pues así suele suceder. Cuando en la hipótesis de trabajo H0 planteamos una desigualdad respecto a la media, como ahora que hacemos media 20, diremos que hacemos un contraste unilateral, mientras que si trabajamos con una igualdad, como en el caso de la moneda simétrica en el que suponíamos que p = 1/2, es un contraste bilateral.

  • H_0:;mu=mu_0 contraste bilateral
  • H_0:;mugeqmu_0,;H_0:;muleqmu_0 contraste unilateral a la derecha o a la izquierda, respectivamente

Simbólicamente escribimos:

begin{array}{l}left.begin{array}{r}H_0:;;mugeq20\H_1:;mu<20end{array}right}\;end{array}

También tenemos contrastes unilaterales cuando H0 es una igualdad, pero H1 es una desigualdad estricta:

begin{array}{l}left.begin{array}{r}H_0:;;mu=mu_0\H_1:;muneqmu_0end{array}right},left.begin{array}{r}H_0:;;mu=mu_0\H_1:;mu>mu_0end{array}right},;left.begin{array}{r}H_0:;;mu=mu_0\H_1:;mu<mu_0end{array}right}\;end{array}

El primer contraste es bilateral, los otros dos son unilaterales a la derecha o a la izquierda, respectivamente. Aunque no hay unanimidad la corriente mayoritaria considera, por motivos formales, que lo correcto es mantener la igualdad en la hipótesis H0 y en todo caso manejar desigualdades en la hipótesis H1. Siguiendo este convenio, el contraste sobre los dulces quedaría:

begin{array}{l}left.begin{array}{r}H_0:;;mu=20\H_1:;mu<20end{array}right}\;end{array}

entendiendo que si aceptamos H0 significa que el peso es como mínimo de 20gr, ya que se ha rechazado la hipótesis alternativa.

En la práctica el que el contraste sea bilateral o unilateral afecta a los intervalos de aceptación de H0 y H1. Resolvamos ahora el problema del control de calidad a la recepción de los dulces.

Ejemplo 3: Un comprador de dulces al por mayor quiere saber, al tomar una muestra de n = 20 dulces, qué criterio ha de seguir para saber si aceptar o rechazar la compra, con una probabilidad de error tipo I del 10%, suponiendo que los pesos de los dulces siguen una distribución normal de media 20gr.

Ya sabemos que la forma del contraste será

begin{array}{l}left.begin{array}{r}H_0:;;mu=20\H_1:;mu<20end{array}right}\;end{array}

Para calcular el estadístico de contraste en este caso particular necesitamos el siguiente resultado:

Teorema 2: Si la población es normal y H0 es cierta, sabemos la media μ de la población pero desconocemos su desviación típica σ, entonces el estadístico

T=frac{overline x-mu}{s/sqrt n}

es una variable aleatoria que sigue una distribución de probabilidad t-Student con n-1 grados de libertad, siendo s la desviación típica de la muestra.

Conocemos la media y el valor de n, así que:

T=frac{overline x-20}{s/sqrt{20}}

Para aceptar H0 con una significación de α = 10%, el intervalo de aceptación de H0 ha de “abarcar” un 100% – 10% = 90% de probabilidad, y el de H1 el 10% restante. Pero siendo que sólo nos interesa el caso mu<20 para H1, no consideraremos que valores grandes de la media afecten a H1, en otras palabras, el intervalo de aceptación de H1 ha de ser del tipo (-∞, t), siendo t un valor tal que P(-∞ < T < t) = 0.1. Este valor, buscado en las tablas de la distribución t-Student, resulta ser t = -1.328, con lo cual el intervalo de aceptación de H1 es (-∞, -1.328) y  el de H0 será [-1.328, +∞). Para aceptar H0 por tanto debe de cumplirse que

T=frac{overline x-20}{s/sqrt{20}}inlbrack-1.328,+infty)Leftrightarrowfrac{overline x-20}{s/sqrt{20}}geq-1.328Rightarrowboxed{frac{overline x-20}sgeqfrac{-1.328}{sqrt{20}}}

Así que nuestra recomendación al comprador de dulces será:

“Calcule usted la media overline x y la desviación típica s de la muestra de 20 dulces, y sustituya esos valores en la expresión frac{overline x-20}s; si le resulta un valor mayor o igual a -0.2969, acepte la compra, de lo contrario, podrá reclamar al fabricante, con una probabilidad del 10% de error de equivocarse al hacerlo.”

Supongamos que nos hace caso y le resulta overline x=19.5, s = 1.1; entonces resultará frac{19.9-20}{1.1}=-0.09;> -0.2969 y le recomendamos aceptar el pedido.

Ejemplo 4: El comprador de dulces se da cuenta de que no ha usado una información importante: el fabricante afirma que sólo uno de cada 100 dulces se desvía de ese peso más de 1gr; con este dato podemos estimar cual es la desviación típica de la población, y afinar más el contraste. La afirmación equivale a decir que P(20 – 1 < X < 20 + 1) = 99/100, siendo la población normal, podemos hacer un cambio de variable para convertirla en normal estándar Z=frac{X-mu}sigma:

Pleft(19<X<21right)=P(frac{19-20}sigma<Z<frac{21-20}sigma)=Pleft(frac{-1}sigma<Z<frac{1}sigmaright)=0.99

Mirando en las tablas de la normal estándar vemos que para que se cumpla la desigualdad anterior ha de ser frac1sigma=2.576Leftrightarrowsigma=0.3882. Para utilizar esta información sobre la población en el contraste necesitamos otra propiedad matemática:

Teorema 3: Si la población es normal y H0 es cierta, sabemos la media μ de la población y su desviación típica σ, entonces el estadístico

z=frac{overline x-mu}{sigma/sqrt n}

es una variable aleatoria que sigue una distribución normal estándard.

Calculamos el valor del estadístico: z=frac{19.9-20}{0.3882/sqrt{20}}=-1.15. Buscamos en las tablas de la normal estándar la probabilidad P(Z > z), que es, según hemos definido, el p-valor, y resulta ser p = 0.12507, la situación se representa en la figura

Intervalos de aceptación de H0 y H1 según el p-valor
Intervalos de aceptación de H0 y H1 según el p-valor

Entonces, para una significación de 0.01 < p-valor, concluimos que no rechazamos H0, la conclusión no ha cambiado respecto al ejemplo anterior.  Si en vez de usar el p-valor usamos el método de buscar en las tablas el intervalo de aceptación de H0, tendremos que encontrar un z tal que P(Z > z) = 0.90 que resulta ser -1.282, el intervalo de aceptación de H0 es [-1.282, +∞), como z = -1.15 cae dentro del intervalo, aceptamos H0.

Potencia de un contraste

Si comparamos los intervalo para H0 de los eje del ejemplos 3 y 4, que son   [-1.328, +∞) y [-1.282, +∞), vemos que el ejemplo 4 es algo más estrecho; por ejemplo, para un valor del estadístico de contraste de -1.3, en el ejemplo 3 aceptaríamos H0 pero en el ejemplo 4 no. Siendo que en los dos ejemplos la significación es la misma, del 10% (que recordemos que es la probabilidad de cometer error de tipo I), ¿porqué hay esta diferencia?

Recordemos que el error de tipo II es: aceptar H0 cuando realmente es falsa; diremos que, a igualdad de significación, un contraste es más potente que otro, si tiene menor probabilidad beta de cometer el error de tipo II. Lo que sucede con los ejemplos 3 y 4 es que el contraste de este último es más potente que el del primero; esto es así porque en el ejemplo 4 usamos más información que en el 3: sabemos la desviación típica de la población. En general, interesa maximizar la potencia del contraste a utilizar, usando toda la información disponible.

Otros contrastes de hipótesis

En los ejemplos anteriores hemos visto como se contrasta el valor de la media (el peso medio de los dulces) y el de la proporción (en el problema de la moneda y las caras y cruces). Otros contrastes de hipótesis decidirán sobre otros parámetros: sobre la varianza, sobre la diferencia de medias entre dos poblaciones, o la diferencia de proporciones.

Ejemplo 5: Nuestro comprador de dulces decide probar con otro fabricante que asegura que sus dulces tienen un peso medio de 22gr con una desviación típica de 1.3gr. La pregunta que nos hace es: ¿con base a una muestra de n_1 = 20, n_2 = 20 dulces del fabricante 1 y del fabricante 2, cómo puedo estar seguro de que efectivamente el fabricante 2 produce dulces con un peso 2gr superior al fabricante 1, con un 10% de posibilidad de error tipo I?

Formalmente, suponiendo que los pesos de las dos poblaciones de dulces de los dos fabricantes siguen una distribución de probabilidad normal, el contraste se establece como sigue:

  • H0: no hay diferencias entre los pesos medios, mu_1=mu_2
  • H1: mu_1>mu_2

Para cada tipo de contraste se necesita un teorema que nos proporcione el estadístico de contraste a utilizar, tal como hemos visto en los ejemplos anteriores; para esta comparación de medias de dos poblaciones normales con desviaciones típicas conocidas usaríamos:

x=frac{left(overline{x_1}-overline{x_2}right)-d_0}{sqrt{displaystylefrac{sigma_1^2+sigma_2^2}{n_1+n_2}}}

Contrastes no paramétricos

En muchos casos prácticos interesa formular hipótesis estadísticas en las que no tenemos conocimiento teórico de la población (no tenemos sus parámetros); por ejemplo, queremos comparar las calificaciones obtenidas en una prueba de idiomas por los alumnos antes y después de un viaje a Inglaterra, para saber si ha surtido algún efecto, la muestra es:

Alumno 1 Alumno 2 Alumno 3 Alumno 4 Alumno 5
Antes viaje 7,25 8,00 6,00 8,00 9,00
Después viaje 8,25 7,82 6,36 9,69 8,59

A simple vista parece que sí que ha surtido efecto, pero queremos saber si las diferencias observadas son estadísticamente significativas y que no sean producto del azar. Si no podemos suponer normalidad en la variable, necesitamos aplicar un contraste no paramétrico, por ejemplo uno muy sencillo es el de los signos: observamos los signos de las diferencias entre notas:

Alumno 1 Alumno 2 Alumno 3 Alumno 4 Alumno 5
Antes viaje 7,25 8,00 6,00 8,00 9,00
Después viaje 8,25 7,82 6,36 9,69 8,59
Diferéncia 1 -0,18 0,36 1,69 -0,41
Signo + + +

Establecemos el contraste:

  • H0: no hay diferencias en las calificaciones obtenidas en la prueba de idiomas de los alumnos antes y después del viaje a Inglaterra
  • H1: sí hay diferencias en las calificaciones obtenidas en la prueba de idiomas de los alumnos antes y después del viaje a Inglaterra

 

Si H0 es cierta, esperaríamos que los signos de las diferéncias fueran por igual positivos que negativos, la proporción para ambos ha de ser 1/2 ; tenemos 3 positivos y 2 negativos.

Física – > Relatividad -> Diagramas de Minkowski

Las transformaciones de Lorentz pueden ser a veces algo laboriosas de utilizar en cierto problemas, dando lugar a largos cálculos; H. Minkowski introdujo en 1908 unos diagramas en donde se representa el espacio-tiempo de forma que permite obtener las transformaciones de Lorentz de forma gráfica. En el eje de abscisas se representa el espacio unidimensional, x, y en el eje de abscisas el tiempo, pero multiplicado por c.

Para resolver transformaciones de Lorentz entre dos sistemas inerciales S y S’, éste último moviéndose a velocidad v con respecto al primero, se considera que los ejes x, ct de S son rectangulares, y en ese caso los ejes x’, ct’ de S’ serán oblicuos. La línea punteada en la figura 1 representa la trayectoria en el espacio-tiempo de una señal luminosa que en el tiempo t = 0 parte del origen de coordenadas, y es la bisectriz de los ejes x, ct, pues la luz recorre en un tiempo ct = 1 -> t = 1/c una distancia x = c·t = c/c = 1, de hecho se escoge la escala de tiempos ct por esta razón.

Además, cualesquiera otros ejes x’, ct’ relacionados con una referencia S’ que se mueve a velocidad v < c tendrán también como bisectriz a la línea punteada de la señal luminosa, ya que c es la misma para todos los sistemas de referencia. Como mayor sea v, más cercanos estarán los ejes x’ , ct’ la la línea bisectriz. En efecto, en un tiempo ct = 1 -> t = 1/c el sistema S’ recorrerá una distancia x = vt = v/c; el ángulo theta entre el eje ct’ y el eje x cumplirá

tanleft(thetaright)=frac1{v/c}=frac cv [1]

Supondremos que en t=0 los orígenes de ambos sistemas de referencia coinciden. Siendo c la velocidad límite, cualquier otra referencia móvil tendrá unos ejes más cercanos a la bisectriz.

Ejemplo 1: Si el sistema de referencia S’ se mueve a v = c/2 con respecto a S’, entonces

theta=tan^{-1}left(frac c{c/2}right)=tan^{-1}left(2right)=63.4^text o

Aunque para dibujar los ejes es más sencillo simplemente dibujar primero ct’ usando la ratio “una unidad según el eje de abscisas corresponde a 1/2 del eje de ordenadas”.

Minkowski1c
Fig. 2: tres sistemas de referencia, el S’ con v = c/2, el S” con v = c/3

En general, si S’ se mueve a velocidad v, entonces su recta ct’ pasará por los puntos (0, 0) y (v/c, 1). En cuanto a la recta x’, pasará por los puntos (0, 0 ) y (1, v/c). No es necesario calcular el ángulo theta para dibujarlos. En la figura 3 vemos un S’ con v=c/2 y otro S” con v=c/3.

Unidad de medida en las referencias móviles

Es importante recordar que la escala de los ejes no es la misma para la referencia S que para las S’, S”, etc. No podemos usar la misma regla de medir en S que en los demás sistemas. Para definir la distancia unidad en cada referencia se usa el denominado invariante espacio-tiempo:

x^2-left(ctright)^2=1 [2]

Haciendo una tabla de valores (x, ct) para esta ecuación, encontramos los puntos que la cumplen, que resultan formar una hipérbola (en amarillo en la figura 3):

x ct
1 0
1,1180339887 0,5
1,4142135624 1
1,8027756377 1,5
2,2360679775 2
2,6925824036 2,5
3,1622776602 3
Fig. 3: hipérbola de calibración x² - (ct)² = 1
Fig. 3: hipérbola de calibración x² – (ct)² = 1

Vemos que la hipérbola corta al eje x en el punto 1, use acerca asintóticamente a la línea espacio-tiempo de la luz; los puntos de corte con los ejes x’, x”, etc, de las otras referencias determinan la unidad de longitud en esas referencias vistas desde la referencia x en reposo. Claramente se ve que la longitud unidad, en cualquier sistema en movimiento, vista desde el reposo, es mayor que la unidad del sistema en reposo, tendiendo a infinito para referencias que se muevan a velocidades cercanas a la de la luz, esto es una consecuencia de la fórmula de la contracción de longitudes de Lorentz:

triangle x=gammatriangle x'=gammacdot1xrightarrow{vrightarrow c}infty

Ejemplo 2: Si el sistema de referencia S’ se mueve a v = c/2 con respecto a S’, dibujar la hipérbola de calibración para obtener la distancia equivalente a x = 2 en el sistema S’ en el instante t = 0.

Fig. 4: determinar una longitud x'=2 vista desde el sistema S en reposo
Fig. 4: determinar una longitud x’=2 vista desde el sistema S en reposo

Con la hipérbola obtenemos su punto de corte del eje x’, la distancia entre el origen y ese punto será la distancia unidad, la duplicamos sobre el eje x’ para llegar al punto A’ de coordenadas en el sistema S’ (x’=2, t’ = 0).

Ejemplo 3: con los mismos sistemas S, S’ del ejemplo anterior, situar en el diagrama los sucesos A: x = 1, ct = 1 y B: x’ = 1, ct’ = 1.

Fig. 4: diagrama de Minkowski para situar los sucesos B, C
Fig. 5: diagrama de Minkowski para situar los sucesos A, B

 El punto A es inmediato: estará sobre la línea espacio-tiempo de la luz. Para el punto B usamos la hipérbola de calibración que nos da la coordenada (x’=1, ct’=0) sobre el eje x’. Esta misma distancia la medimos sobre el eje ct’ (con una regla o la trasladamos con un compás) para obtener el punto (x’=0, ct’=1); entonces trazamos por estos puntos paralelas a los ejes (líneas punteadas en rojo en la figura), la intersección de estas líneas nos da el punto B(x’=1, ct’=1).

Ejemplo 4: Mediante el diagrama obtener las coordenadas en S’ del punto A, y las coordenadas en S del punto B del ejemplo anterior.

Fig. 6: Diagrama para obtener las coordenada de los puntos del ejemplo anterior en otro sistema
Fig. 6: Diagrama para obtener las coordenada de los puntos del ejemplo anterior en otro sistema

Para el punto A trazamos paralelas a los ejes x’, ct’, los puntos de corte con esos ejes (rombos azules en la figura) nos dan las coordenadas, vemos que son, aproximadamente, x’ = 0.6 (recordar que hay que comparar con la unidad de longitud en el sistema S’, dada por la hipérbola de calibración) y ct’ = 0.5. Si trazamos el gráfico en papel milimetrado y usamos herramientas de dibujo lineal la precisión mejorará bastante.

Para el punto B trazamos paralelas a los ejes x,  ct, obtenemos aproximadamente x = 1.6, ct = 1.6.

Para comparar procedimientos y comprobar resultados, vamos a calcular las coordenadas analíticamente. Para pasar de A: x = 1, ct = 1 a una referencia que se mueve a velocidad v = 0.5c usamos:

begin{array}{l}gamma=left(1-frac{v^2}{c^2}right)^{-1/2}=left(1-frac{left(c/2right)^2}{c^2}right)^{-1/2}=left(frac34right)^{-1/2}=frac2{sqrt3};\x'=gammaleft(x-vtright)=frac2{sqrt3}left(1-0.5ccdotfrac1cright)=frac1{sqrt3}approx0.58;\t'=gammaleft(t-vx/c^2right)=frac2{sqrt3}left(frac1c-0.5ccdot1/c^2right)=frac1{csqrt3}approxfrac{0.58}cend{array}

Recordemos que en el diagrama de Minkowski el tiempo viene multiplicado por c; así, el valor ct = 1 implica que t = 1/c. De la misma forma, en el resultado final para t’, si multiplicamos por c para obtener ct’, el resultado es el mismo que en el diagrama, ct'=frac{ccdot0.58}c=0.58.

Ejemplo 5: El siguiente diagrama representa una nave espacial moviéndose a velocidad v = 0.5c, en el punto-suceso A se produce una explosión, propagándose la radiación en todas direcciones a velocidad c. La nave despliega un escudo anti-radiación en el punto-suceso B. La pregunta que nos hacemos es, ¿cuando la radiación alcance la nave, estará protegida por el escudo, o por el contrario lo habrá desplegado demasiado tarde?

Fig. 6: dos sucesos A, B, el primero representa una explosión, el segundo el despliegue de un escudo
Fig. 7: dos sucesos A, B, el primero representa una explosión, el segundo el despliegue de un escudo

La radiación viajará a velocidad c tanto en el sentido positivo como en el negativo; las dos trayectorias opuestas estarán a 90⁰ entre sí, y a 45⁰ con los ejes x, ct

Fig. 8: la radiación (líneas naranja) viajan a velocidad c (45⁰ con los ejes de S) en los dos sentidos posibles
Fig. 8: la radiación (líneas naranja) viajan a velocidad c (45⁰ con los ejes de S) en los dos sentidos posibles

La radiación que viaja en el sentido negativo de x alcanza al eje ct’ en el punto marcado en rojo, ese punto tiene coordenada x’=0, lo que significa que la radiación ha alcanzado a la nave, pero además lo ha hecho un poco antes de que se despliegue el escudo (suceso B), por tanto la nave ha tenido mala suerte con este diagrama. Ejercicio para el lector: ¿cómo se resolvería este problema usando transformaciones de Lorentz?

Física -> Mecánica relativista

En este artículo nos introducimos en la cinemática y dinámica relativistas a partir de ejemplos, buscando la máxima comprensión en detrimento del rigor, para exposiciones rigurosas podemos acudir a la bibliografía.

La relación entre masa y energía, E=mc^2

Según la mecánica cuántica, un fotón de frecuencia f tiene una energía asociada E=hf, donde h es la constante de Planck; por otro lado, De Broglie propuso que toda partícula de masa m en movimiento con velocidad v, y cantidad de movimiento p=mv, tenía asociada una “onda de materia” de longitud de onda lambda=frac hp (dualidad onda-partícula). Teniendo en cuenta que la relación entre longitud de onda, frecuencia y velocidad de la luz es lambda f=c, operamos y obtenemos E=hf=hfrac clambda=hfrac c{h/p}=cp.

Entonces un haz de luz conteniendo un número muy elevado de fotones transportará una cantidad de movimiento p=E/C, donde E es la energía del haz; incluso sin tener masa, pues la luz es inmaterial, posee una cantidad de movimiento, por lo que cuando “choque” (más usualmente se dice que incide sobre …) con un objeto material, por la ley de la conservación de movimiento, transferirá una parte de p al cuerpo material, de la misma forma que cuando chocan dos cuerpos materiales. es la denominada “presión de radiación“. Todo esto es consecuencia de la Física cuántica básica, desarrollada a principios del siglo XX. En vez de luz, podemos llegar a la misma conclusión pensando en cualquier radiación. Dado que la radiación, en sí inmaterial (caso de la radiación electromagnética) es emitida y absorbida por la materia, nos encontramos que materia y energía radiante pueden “chocar” e intercambiar energía.

Ejemplo 1: Emisión de radiación dentro de una caja aislada.

relativitat1
Fig. 1: caja ideal dentro de la cual hay una emisión y absorción de radiación

Imaginemos una caja aislada, en reposo, de masa M, dentro de la cual hemos hecho el vacío, que contiene un material radiactivo (fig.1, parte superior); en un momento dado (t = 0) el material emite una haz de radiación de energía E, el cual viaja por el interior de la caja hasta llegar al otro extremo donde es reabsorbida por la pared de la caja. Al emitirse la radiación, se genera una cantidad de movimiento p=E/c; siendo el sistema aislado, la cantidad de movimiento total se conserva, así que la caja deberá adquirir una cantidad de movimiento igual e opuesta -p=-E/c, pero para la caja p=Mv luego -E/c=mvRightarrow v=-frac E{mc}, la caja retrocede con esta velocidad. Despues de un tiempo t, se habrá desplazado una distancia x=vt=frac E{mc}t.

Cuando la radiación alcance el otro extremo, habrá transcurrido un tiempo que será, aproximadamente, t=L/c; estamos suponiendo que x<<L pues de hecho la radiación ha de recorrer la distancia L-x. Entonces tenemos que el desplazamiento x es igual a x=frac E{mc}tapproxfrac E{mc}frac Lc=frac{EL}{mc^2} [1], que efectivamente ha de ser despreciable respecto a L pues tenemos el valor c² en el denominador, siendo c = 3·10⁹ m/s.

Pero observando el sistema “desde fuera”, está aislado, no actúa nada sobre él, así que no si fuerzas que actúen no puede moverse en absoluto … x debería ser exactamente cero,  ¿tenemos una contradicción?  Afinando un poco más el argumento, lo que no puede moverse en un sistema aislado es su centro de masas; la caja de masa M se ha movido una distancia x a la izquierda, pero al mismo tiempo se ha emitido una masa m (la masa asociada a la radiación) a la derecha una distancia aproximadamente igual a L. Para que el centro de gravedad del sistema caja-radiación no se mueva, ha de cumplirse mL=Mx, sustituyendo el valor del desplazamiento x obtenemos:

mL=MxLeftrightarrow mL=Mfrac{EL}{Mc^2}=frac{EL}{c^2}Leftrightarrowboxed{E=mc^2} [2]

Hemos obtenido la famosa ecuación de Einstein que relaciona masa con energía, en este caso relaciona la masa m inercial de la radiación con su energía, pues masa material hemos supuesto que no tiene. También se puede ver como la afirmación de que toda energía radiante lleva asociada una masa inercial.

Energía cinética relativista

Si [2] implica que toda energía radiante tiene una masa inercial asociada, nos podemos preguntar si, dado un cuerpo material de masa en reposo M, al comunicarle energía cinética al cuerpo, podemos asociarle a esa energía cinética una masa inercial m, con lo cual la masa total del cuerpo en movimiento será M + m, habrá aumentado. Dado que hemos visto que la materia y la energía radiante pueden “chocar” e intercambiar energía y momento, esta suposición de asignar masa inercial a la energía ya no radiante sino cinética parece fundamentada.

De la dinámica clásica sabemos que el incremento de energía cinética triangle E al trabajo producido: triangle E=Fcdot x=W, para el caso de masa variable, la expresión a usar para la fuerza es F=frac{operatorname dp}{operatorname dt}. Tomando una fuerza F que actúa en un pequeño intervalo dx, obtenemos operatorname dE=operatorname dW=frac{operatorname dp}{operatorname dt}operatorname dx=operatorname dpfrac{operatorname dx}{operatorname dt}=vcdotoperatorname dp [3].

Por otro lado, en Física clásica no relativista la cantidad de movimiento es p=mv, luego la masa cumple m=p/v. Si sustituimos esta masa en la expresión [2] obtenemos E=mc^2=frac pvc^2 [4].

Multipliquemos las ecuaciones [3] y [4] y operemos:

 left.begin{array}{r}operatorname dE=vcdotoperatorname dp\E=mc^2=frac pvc^2end{array}right}Rightarrow Eoperatorname dE=cancel vcdotoperatorname dpcdotfrac p{cancel v}c^2Rightarrowint Eoperatorname dE=int c^2poperatorname dp

integrando llegamos a E^2=c^2p^2+E_0^2. Pero usando [4] resulta que cp=Ev/c, sustituyendo:

E^2=left(frac{Ev}cright)^2+E_0^2Leftrightarrow E^2left(1-frac{v^2}{c^2}right)=E_0^2Leftrightarrowboxed{E=frac{E_0}{sqrt{1-frac{v^2}{c^2}}}} [5]

que es la expresión de la energía total de un cuerpo en movimiento, siendo E_0 la energía en reposo, cuando v = 0.

Masa relativista

Suponiendo que la ecuación E=mc² nos da la energía total de la partícula tanto si está en reposo como si está en movimiento, el incremento de energía ha de ser debido al incremento relativista de la masa inercial triangle E=triangleleft(mc^2right)=c^2triangleleft(mright), pues c es una constante; entonces:

mc^2=frac{m_0c^2}{sqrt{1-frac{v^2}{c^2}}}Leftrightarrow m=frac{m_0}{sqrt{1-frac{v^2}{c^2}}} [6]

expresión que nos permite calcular la masa inercial total de un cuerpo en movimiento.

Velocidad límite

Si en la expresión de la energía [5], o equivalentemente, en el de la masa [6], hacemos que la velocidad del cuerpo se acerce a la velocidad de la luz c, obtenemos valores infinitos:

underset{vrightarrow c}{lim}m=underset{vrightarrow c}{lim}frac{m_0}{sqrt{1-frac{v^2}{c^2}}}=frac{m_0}{sqrt{1-1}}=+infty

Con una masa inercial tendiendo a infinita, la fuerza necesaria para acelerarla tenderá también a infinito, sin llegar nunca al límite v = c. Por tanto los desarrollos anteriores nos llevan a afirmar que c es el límite superior absoluto de la velocidad, no superable por nada, y sólo alcanzable por la energía con masa “material” en reposo nula.

Transformación de velocidades entre sistemas de referencia

Fig. : dos sistemas de referencia inerciales
Fig. : dos sistemas de referencia inerciales

En la figura tenemos el conocido esquema que muestra dos sistemas de referencia inerciales: el LAB que representa el del laboratorio, que suponemos estático, y el Ref, con una velocidad u relativa al laboratorio. Hay un móvil en la posición x’ que se mueve con una velocidad v’ respecto a Ref. En la referencia LAB la posición es x y la velocidad v. En estas condiciones se cumple:

v=frac{v'+u}{1+v'u/c^2};;;v'=frac{v-u}{1-vu/c^2}

Al usar estas fórmulas han de tenerse en cuenta los signos de v, v’, u a partir de la representación de la figura.

Ejemplo: dos cuerpos se acercan el uno al otro con una velocidad relativa entre ellos de 0.89c. Un observador exterior los ve moverse uno hacia el otro a la misma velocidad; hallar esta velocidad.

Fig. : dos móviles acercándose uno al otro
Fig. : dos móviles acercándose uno al otro

En la figura representamos la situación: desde el punto de vista del laboratorio estático los dos móviles se mueven a la misma velocidad u, desde el punto de vista de uno de los móviles (referencia Ref) el otro móvil se acerca a una velocidad 0.89c.  Comparando este esquema con el de transformación de velocidades, identificamos variables: u: velocidad en la ref. LAB de la referencia Ref (el móvil de la izquierda), v: velocidad del móvil de la derecha respecto a LAB, que cumple v = -u, v’: velocidad del móvil de la derecha respecto a Ref (móvil de la izquierda) que cumple v'=-0.89c. Aplicamos la ley de transformación de velocidades para obtener u, y operamos:

begin{array}{l}v=-u=frac{-0.89c+u}{1+left(-0.89ccdot uright)/c^2}=frac{-0.89c+u}{1-0.89u/c}=cfrac{-0.89c+u}{c-0.89u}Rightarrow\-cu+0.89u^2=-0.89c^2+cuRightarrow\0.89u^2-2cu+0.89c^2=0Rightarrow\u=frac{2cpmsqrt{4c^2-4cdot0.89^2c^2}}{2cdot0.89}=cfrac{1pmsqrt{1-0.89^2}}{0.89}approx cfrac{1pm0.46}{0.89}end{array}

De las dos soluciones descartamos la que da un resultado mayor que c por imposible físicamente, nos queda: uapprox0.61c.

Como comprobación, si encontramos la velocidad relativa v’  a una referencia que se mueve a velocidad u=0.61c, sabiendo que el móbil se mueve a velocidad v=-0.61c respecto del sistema LAB, encontramos:

v'=frac{0.61c-(-0.61c)}{1-0.61ccdot(-0.61c)/c^2}=frac{2cdot0.61c}{1+0.61^2}=0.89c

que es la velocidad dada en el enunciado.

Estadística -> Estadística Aplicada -> Análisis Multivariante

En esta entrada sólo pretendemos dar una introducción breve a un tema extenso y complejo como es el análisis estadístico multivariante, y lo haremos de forma constructiva, partiendo de un ejemplo simple pero real que iremos desarrollando. No se incluyen demostraciones matemáticas, sólo nos centramos en el “para qué sirve?” y en el “cómo se hace?”. Espero que sea de utilidad para los estudiantes no especialistas en Estadística que necesitan tener las ideas claras en esta materia sin perderse en detalles técnicos. En este primer artículo sólo introducimos conceptos, y luego aplicamos dos técnicas relacionadas con la simplificación y reducción de datos: componentes principales y factores; en un segundo artículo trataremos de la otra posibilidad del análisis multivariante: la detección de grupos y clasificación de los individuos.

Contenidos:

  1. Análisis Multivariante: ¿para qué sirve?
  2. Reducir el número de variables: análisis de componentes principales
  3. Reducir el número de variables: análisis factorial

separador2

Análisis Multivariante: ¿para qué sirve?

En los estudios estadísticos de casos reales es frecuente encontrarse con que tenemos que manejar no sólo muchos datos, sino también muchas variables; el tener un gran número de variables dificulta la comprensión del problema así como la interpretación de los resultados estadísticos. En el siguiente ejemplo vemos un caso multivariante típico:

Ejemplo 1: En un centro educativo han estado experimentando en los tres últimos cursos académicos con una nueva técnica pedagógica, que se ha aplicado a cinco grupos distintos de alumnos de bachillerato en distintas asignaturas, un total de 125 alumnos. Se quiere realizar un estudio estadístico para averiguar hasta qué punto la nueva técnica ha sido efectiva en términos no sólo de mejora de calificaciones, si no también de otras variables como la participación activa del alumno en la clase, la mejora de habilidades atencionales y de estudio, y la satisfacción en general del alumno en la clase. Además, se considera importante tener en cuenta en el estudio otras variables que pueden condicionarlo, como por ejemplo la edad, la clase social, la asignatura en la que se utilizó la técnica, el nivel de estudios de los padres, y el profesor que la aplicó. Para comparar resultados, se toman también los datos de otros 125 alumnos con los que no se aplicó la nueva técnica. Se trabajará por tanto con una muestra de 250 alumnos y 11 variables. A continuación se muestran las primeras filas de esta tabla, que puede descargarse de aquí.

TEC CAL PAR ATE EST SAT EDAD CLA ASIG PROF ESTP
0 1 0 1 0 3 16 0 2 3 0
0 1 0 1 0 1 17 0 3 5 0
0 1 0 0 1 7 18 2 2 4 3
0 2 1 1 0 2 19 2 3 5 0
0 2 0 1 2 5 18 2 1 1 0

Los significados de cada variable son:

TEC 1: aplicamos nueva técnica, 0: no lo hacemos
CAL Calificación obtenida
PAR Medida de la participación activa en clase
ATE Medida de la atención en clase
EST Medida de las técnicas de estudio personales
SAT Medida de la satisfacción en clase
EDAD Edad del alumno
CLA Clase social: 0 baja, 1 media, 2 alta
ASIG Asignatura en la que se aplicó la técnica: 1 MAT, 2 CIENCIAS, 3 HISTORIA
PROF Profesor que la aplicó, valores 1,2 (MAT), 3,4 (CIENC), 5 (HIST)
ESTP Nivel de estudios padres: 0 sin estudios, 1 básicos, 2 medios, 3 superiores

Sucede a menudo que las variables consideradas no son independientes entre si, al contrario, hay relaciones entre ellas. También a menudo se pueden clasificar los individuos estudiados (los estudiantes en el ejemplo 1) en grupos homogéneos, y realizar un estudio detallado para cada grupo: en el ejemplo 1 podríamos descubrir que agrupando los alumnos según el profesor que aplicó la técnica hay grandes diferencias entre los grupos y resultados parecidos dentro de los grupos. De todo este análisis se ocupan los métodos multivariantes, concretamente lo que hacen es:

  1. investigar si las variables tienen relaciones entre ellas;
  2. dado un gran número de variables, posiblemente relacionadas entre ellas, reducirlas a un número menor de variables, mostrando las posibles relaciones entre las variables originales, para así simplificar el problema y poder sacar conclusiones;
  3. dado un conjunto de datos individuales, asociados con ciertas variables, formar grupos de individuos parecidos usando las variables para clasificarlos.

Veamos a continuación ejemplos y técnicas para estas aplicaciones.

Reducir el número de variables: análisis de componentes principales

Usaremos el método de análisis de componentes principales; una vez cargados los datos en el entorno R, accedemos a Estadísticos -> Análisis dimensional -> análisis de componentes principales. Seleccionamos todas las variables y en Opciones marcamos “Añadir componentes principales al conjunto de datos“; cuando nos pregunta cuantos componentes vamos a incluir, estamos diciendo a cuantas variables queremos reducir las 11 originales, pondremos 3 (idealmente reduciremos a 4 como máximo, para que los datos sean manejables), y aceptamos. R efectúa el análisis y nos proporciona este informe:

multivariant1
Fig. 1: Componentes principales: coeficientes de las combinaciones

R siempre generará tantos componentes principales como variables originales, 11 en este caso. En la figura 1 no se muestran las columnas 4, 5, … 11, pues nos interesa estudiar sólo 3. Lo que ha hecho R es crear nuevas variables Comp.1, Comp.2, …, por combinación lineal de las originales, siendo los coeficientes de las combinaciones los que vemos en la figura 1. O sea que se cumple que:

Comp.1;=;0.06cdot ASIG;-;0.453cdot ATE;-;0.558cdot CAL;+;...;-;0.187cdot TEC

Para el componente principal 2:

Comp.2;=;-0.686cdot ASIG;-;0.012cdot ATE;+;0.029cdot CAL;+;...;;+0.264cdot TEC

etc. En el mismo informe de R encontramos esta otra sección:

Fig. 2: importancia de cada componente principal
Fig. 2: importancia de cada componente principal

Nos fijamos en la fila Cumulative Proportion: nos da la “representatividad” acumulada de las nuevas variables, en tanto por uno; vemos que tomando los tres primeras componentes quedan representados en un 0.50 todas las variables, o en un 50%, por tanto si pasamos de 11 a tres variables perdemos la mitad de la información. Parece una pérdida importante … si cogemos más componentes principales, perdemos menos información, pero ampliamos de nuevo el número de variables, por ejemplo ampliando a 5 llegamos al 69% de representatividad, con 6 llegamos al 77% y con 7 componentes cubrimos hasta el 85% de la información original, pero la reducción de número de variables es ya escasa:

Fig. 3: ampliando el número de componentes con los que trabajar
Fig. 3: ampliando el número de componentes con los que trabajar

La elección del número de componentes principales con los que trabajar es una elección del experimentador; los problemas “de clase” suelen venir preparados de forma que con pocos componentes principales, 2 o 3, se resumen bien los datos, pero en los problemas reales no suele ser tan evidente.

Para saber cómo se relacionan las nuevas variables con las originales podemos usar la matriz de correlaciones entre pares de variables: en R haremos Estadísticos -> Resúmenes -> Matriz de correlación, escogemos todas las variables, y marcamos la opción Parejas de datos. En la matriz de correlaciones resultante nos fijamos en la columna correspondiente al componente principal PC1, para el cual las correlaciones son:

PC1
ASIG 0.009634422
ATE -0.690929281
CAL -0.8508779590
CLA 0.0891672163
EDAD 0.233171700
EST -0.67173527
ESTP 0.093915413
PAR -0.712555990
PC1 1.000000e+00
PC2 1.006389e-17
PC3 -5.316147e-17
PROF 0.006182726
SAT -0.120799459
TEC -0.28527228

Analizemos estas correlaciones: vemos que PC1 está fuertemente correlacionada (más de un 0,5 por uno, o 50%) con las variables ATE (Medida de la atención en clase, valor negativo), CAL (Calificación obtenida, valor negativo, es la correlación más fuerte), EST (Medida de las técnicas de estudio personales, valor negativo) y PAR (Medida de la participación activa en clase, valor negativo), débilmente correlacionada (entre 10-50%) con EDAD (valor positivo), SAT (Medida de la satisfacción en clase, valor negativo) y TEC (1: aplicamos nueva técnica, 0: no lo hacemos, con valores negativos), y prácticamente nada con las demás.

Los valores negativos de correlación indican que si aumentan esas variables disminuye PC1, y viceversa. A la vista de estas correlaciones podemos interpretar que los valores reducidos de PC1 se consiguen sobre todo con valores altos de atención en clase, técnicas de estudio personales y participación activa en clase, y más marginalmente con la elevada satisfacción en clase y la aplicación de la nueva técnica de estudio, de forma que podemos relacionar valores altos de PC1 con la la falta de buenos hábitos (atención en clase, técnicas de estudio, participación activa)  y bajas calificaciones; la edad tiene signo contrario. a más edad más valor de PC1, y peores resultados. Hay que recordar que PC1 sólo recoge un 21% de la información original (figura 2). Si tuviéramos que dar un nombre a PC1, podría ser “altas calificaciones y buenos hábitos de estudio”. El mismo análisis se haría para los componentes PC2 y PC3: PC2 tiene un -0.97 de correlación con la variable ASIG (asignatura) y con las demás variables casi es nula, por tanto PC2 viene a representar a ASIG. En cuanto a PC3 tiene -0.65 con ESTP (nivel de estudios padres) y 0.38 con CLA (clase social), o sea que se relaciona con la familia del estudiante.

Recordar que este método produce variables (los componentes principales) que, a diferencia de las variables originales, no estan correlacionadas entre sí; por ejemplo, el diagrama de dispersión de PC1-PC2 no muestra ninguna tendencia:

Fig. 5: de diagrama de dispersión de dos componentes principales cualesquiera no mostrará ninguna relación
Fig. 4: de diagrama de dispersión de dos componentes principales cualesquiera no mostrará ninguna relación

Hemos podido realizar este diagrama de dispersión gracias a haber seleccionado la opción  , que añade a la hoja de datos original las nuevas variables como columnas adicionales.

Fig. 5: R añade 3 nuevas columnas a la hoja de datos, son los componentes principales elegidos por el usuario
Fig. 5: R añade 3 nuevas columnas a la hoja de datos, son los componentes principales elegidos por el usuario

Como conclusión de este estudio con componentes principales podemos decir:

la nueva técnica de enseñanza sí que parece tener cierta influencia, pues su variable asociada está incluida en el componente PC1 de “buenas prácticas y buenas calificaciones”, aunque su efecto parece ser menor (29% de correlación) en comparación a las otras buenas prácticas: atención en clase, etc. Por otro lado la asignatura donde se ha probado el método, que es el componente PC2, no tiene ninguna relación (no hay correlación) con PC1, esto es bueno, nos dice que en cualquier asignatura las “buenas prácticas” tienen los mismos efectos. Lo mismo podemos decir del entorno familiar, representado por PC3.

Reducir el número de variables: análisis factorial

El análisis factorial es otra técnica diseñada para reducir el número de variables, creando unas de nuevas, llamadas factores, por combinación lineales de las originales, que intentan mostrar condiciones que directamente no son fácilmente reconocibles. El software estadístico de análisis factorial permite realizar las llamadas “rotaciones” de variables, una transformación matemática que pretende simplificar al máximo la nueva descripción de variables. Los resultados no son los mismos que usando componentes principales, pues el método matemático es distinto.

En R, vamos a Estadísticos -> Análisis dimensional -> Análisis factorial, y escogemos todas las variables originales del problema. Nos pregunta el número de factores a retener, probamos con 3. El resultado es este resumen:

Uniquenesses:
 ASIG   ATE   CAL   CLA  EDAD   EST  ESTP   PAR  PROF   SAT   TEC 
0.077 0.541 0.262 0.983 0.952 0.722 0.986 0.293 0.005 0.995 0.956 

Loadings:
     Factor1 Factor2 Factor3
ASIG  0.961                 
ATE           0.672         
CAL           0.769   0.381 
CLA                  -0.116 
EDAD                 -0.198 
EST           0.456   0.258 
ESTP                        
PAR           0.289   0.789 
PROF  0.997                 
SAT                         
TEC                   0.158 

               Factor1 Factor2 Factor3
SS loadings      1.947   1.356   0.925
Proportion Var   0.177   0.123   0.084
Cumulative Var   0.177   0.300   0.384

Test of the hypothesis that 3 factors are sufficient.
The chi square statistic is 22.73 on 25 degrees of freedom.
The p-value is 0.593

Nos proporciona los coeficientes de las combinaciones lineales para cada factor (tabla Loadings) que siempre están en el intervalo [-1, 1], la variabilidad explicada por cada factor, la acumulada (para los tres factores sumados tenemos un 38.4% de variabilidad explicada) y un contraste de hipótesis Chi² donde H0: los tres factores son suficientes, H1: no lo son. Vemos que el resultado del contraste es que el p-valor = 0.593, lo que significa que, para los niveles de significación estándar de aceptación de H0,  10%, 5% y 1%, aceptamos H0 (recordemos que H0 se acepta si la significación es menor que el p-valor). Si se hubiera rechazado la hipótesis nula, hubiéramos repetido el análisis con un factor más.

También, para las conclusiones, podemos mirar los datos denominados “Uniquenesses“: nos da la proporción de variabilidad no explicada por los factores de la variable en cuestión. Por ejemplo, para la variable ASIG es de 0.077, un 7.7% no explicada por los factores, o sea que está bien resumida con los tres factores. En cambio para CLA vale más del 90%, por lo cual los factores no informan bien de esta variable. También los coeficientes (en valor absoluto) de las combinaciones lineales nos informan de la importancia de cada variable en la composición del factor: entre 0% y 100%; por ello hemos destacado en negrita los coeficientes más importantes (más del 50%).

Así pues, resumimos las 11 variables por tres factores, con la siguiente composición:

  • F1 = 0.961· ASIG + 0.997·PROF; este factor considera la asignatura y el profesor que la imparte como un factor importante en el estudio.
  • F2 = 0.672·ATE + 0.769·CAL + 0.456·EST + 0.289·PAR;este segundo factor tiene en cuenta la atención en clase, la calificación, las técnicas de estudio y la participación activa en clase, de forma parecida al componente principal PC1 del apartado anterior.
  • F3 = 0.381·CAL - 0.116·CLA - 0.198·EDAD + 0.258·EST + 0.789·PAR + 0.158·TEC; el tercer factor considera la relación entre calificación, clase social, edad, técnicas de estudio, participación activa en clase y la aplicación de la nueva técnica de estudio, en éste último caso con un peso más bien bajo, 0.158.

Las conclusiones que podemos obtener son:

en este análisis la variable TEC que estudiamos no parece desempeñar ningún papel, sólo entra en el factor 3 con un peso del 15.8%, y además queda no explicada en un 95.6% (Uniquenesses). Las variables relacionadas que tienen más peso son CAL y ATE en el factor 2, lo que sugiere que la atención en clase es la variable mas correlacionada con la calificación obtenida; en el factor 3 la variable dominante es PAR, participación activa, que tiene una relación más bien débil con la calificación (38.1%) y aún más débil con las otras variables.

 

Física -> Magnetismo

Magnetismo

Fig. 1: Magnetita (By Rob Lavinsky, iRocks.com – CC-BY-SA-3.0, CC BY-SA 3.0, https://commons.wikimedia.org/w/index.php?curid=10139390)
Fig. 1: Magnetita (By Rob Lavinsky, iRocks.com – CC-BY-SA-3.0, CC BY-SA 3.0, https://commons.wikimedia.org/w/index.php?curid=10139390)

Antiguamente ya se conocía la propiedad de la magnetita o piedra imán para atraer el hierro, y se utilizó en la primeras brújulas para navegación marítima. También se había observado que la atracción tenía una dirección y también un sentido: la aguja de la brújula se orienta siempre en la misma dirección y sentido.

El primero que dio una explicación al fenómeno de la brújula fue el investigador Willliam Gilbert hacia 1600 en su obra “De Magnete“, en la que postula que toda la Tierra es un imán gigante que actúa sobre cualquier brújula, orientándola.

Coulomb experimentó con imanes hasta encontrar, empíricamente, la ley a la que obedecía la fuerza experimentada entre imanes, encontrando que era idéntica  a la ley de Coulomb para la electrostática, F=K·q·q'/d^2, sustituyendo las cargas eléctricas q, q’ por “cargas magnéticas” m, m’, i la constante K toma un valor distinto dependiendo de las unidades que tomemos (Coulomb consideró K=1). Ello parecía indicar que había alguna relación entre electrostática y magnetismo, pero no fue hasta 1820 que Oersted observó que una aguja imantada colocada cerca de una corriente eléctrica era afectada, como si hubiera un imán cerca; al comunicar su descubrimiento, Ampère propone que el magnetismo observado es creado por el movimiento de cargas eléctricas (o sea, por la corriente eléctrica); en el caso de los materiales magnéticos, como la magnetita, propone que deben haber corrientes eléctricas permanentes en esos materiales. Además postula que no existen las “cargas magnéticas”, sólo las eléctricas.

Campo magnético creado por inducción

En Física un “campo” es una magnitud física, como por ejemplo la fuerza o la velocidad, que está distribuida en el espacio según alguna ley. Por ejemplo, las velocidades de un fluido en una corriente de una tubería definen un campo de velocidades.

Un conjunto de corrientes eléctricas producirán magnetismo a su alrededor, por lo que diremos que las corrientes inducen un campo magnético. Si consideramos que cualquier carga eléctrica en movimiento produce efectos magnéticos, también sucederá que quedará afectada por el campo magnético inducido. Así pues, si por esa región del espacio en la que hay un campo magnético de inducción pasa una pequeña carga eléctrica q con velocidad v, experimentará una fuerza F debida al campo magnético B. Experimentalmente se encuentra que la fuerza es siempre perpendicular a v, pero su magnitud depende de la dirección de v: hay una dirección en la que la fuerza es máxima, en las demás es inferior, y en la dirección perpendicular a la de fuerza máxima, la fuerza se anula.

Fig. 2: la fuerza de inducción magnética sobre una carga en movimiento siempre es perpendicular a la velocidad de la carga
Fig. 2: la fuerza de inducción magnética sobre una carga en movimiento siempre es perpendicular a la velocidad de la carga, su módulo depende de la dirección de la velocidad.

Matemáticamente esta relación entre los vectores v, F y sus direcciones se puede expresar diciendo que existe un vector B campo magnético, tal que:

boldsymbol F=qcdotboldsymbol vwedgeboldsymbol B [1]

donde “^” representa el producto vectorial de los vectores.

Producto Vectorial según el angulo entre vectores
Fig. 3: El producto vectorial de los vectores a, b siempre es otro vector perpendicular a los dos, pero no en el mismo plano que los contiene. Además, el módulo del producto es variable entre un valor máximo y cero. Fuente: https://es.wikipedia.org/wiki/Producto_vectorial

Tal como “funciona” el producto vectorial, si el campo B resulta ser paralelo a la velocidad v, la fuerza resultante vale cero, y si B y v son perpendiculares, entonces F toma su valor máximo. El producto a x b es perpendicular al plano que contiene a los vectores a, b.

Concretamente, la magnitud de F viene dada por

F=qvB·sinleft(alpharight)

donde alpha es el ángulo que forman el campo B y la velocidad v.

Como consecuencia de esta fuerza la carga móvil q variará su trayectoria, girando, pero sin perder velocidad, pues la fuerza es siempre perpendicular a la velocidad; entonces la carga describirá una trayectoria curva en el campo, esta curva dependerá de como varía B en el espacio. En el caso más simple, si suponemos que B es constante en todo el espacio, la fuerza también será constante, y cuando la carga “entre” en el campo, describirá una trayectoria circular, con una aceleración normal a_n=F/m=v^2/R, siendo m la masa de la partícula y R el radio del círculo. Si además el campo B es perpendicular a v tendremos fuerza máxima F=qvB, sustituyendo tenemos qvB/m=v²/R y por tanto el radio de giro es R=frac{qB}{mv}.

Fig. 4: la carga q con velocidad v curva su trayectoria al entrar en una región con campo magnético perpendicular al plano (aquí B se saldría de la pantalla apuntando hacia nosotros)
Fig. 4: la carga q con velocidad v curva su trayectoria al entrar en una región con campo magnético perpendicular al plano (aquí B se saldría de la pantalla apuntando hacia nosotros)

Ecuación de Laplace para la fuerza magnética ejercida sobre un elemento de corriente

Fig. 4: sección de un conductor recorrido por una corriente de electrones
Fig. 4: sección de un conductor recorrido por una corriente de electrones

Pensemos en un cable eléctrico recorrido por una corriente de intensidad I; en su interior se desplazan cargas eléctricas: electrones, de los que tomaremos su velocidad media como v. Si nos fijamos en una pequeña sección longitudinal del cable de longitud dL, si el cable tiene una área transversal S, entonces el número de electrones en la sección de longitud dL y área S será proporcional al producto S·dL que es un volumen (superficie x longitud). Por otro lado la intensidad de corriente I es proporcional al producto S·v, sección recta x velocidad media, y vale

I=frac{triangle q}{triangle t}=frac{eNSvtriangle t}{triangle t}=eNSv

siendo N la densidad de electrones por m³, y e la carga del electrón.

Supongamos ahora que el cable está situado en una región del espacio en el que hay un campo magnético B. Entonces en cada una de las cargas en movimiento actuará una fuerza dada por la ecuación [1]. La fuerza total ejercida sobre el elemento de cable será la suma de fuerzas sobre cada electrón, un total de NSdL:

boxed{mathbf dmathbf F}=operatorname dqcdotboldsymbol vwedgeboldsymbol B=left(eNSoperatorname dLright)cdotboldsymbol vwedgeboldsymbol B=left(eNSvright)cdotboldsymbol dboldsymbol Lwedgeboldsymbol B=boxed{mathbf Iboldsymbolcdotmathbf dmathbf Lboldsymbolwedgemathbf B} [2]

Aquí la “d” significa “diferencial” y la “L” longitud: en Física la diferencial de una magnitud es una fracción muy pequeña de ella, y tiene relación con la diferencial y la derivada de una función, conceptos de análisis matemático, ver por ejemplo Uso de diferenciales en Física. Hemos definido el vector dL como el vector que tiene la dirección de v y la longitud dL, de esta forma en el sustituimos el vector velocidad por  el módulo de la velocidad.

Fuerza ejercida por un campo magnético B sobre la corriente I que circula por una espira cerrada

Fig.5: Espira rectangular de lado d por la que circula una corriente I, sometida a un campo magnético B
Fig.5: Espira rectangular de lado d por la que circula una corriente I, sometida a un campo magnético B

En la figura 5 vemos un circuito cerrado cuadrado de lado d por el que circula una corriente continua I; el circuito está en una región del espacio en el que hay un campo magnético B uniforme, que forma un cierto ángulo con la normal al plano del circuito. En estas condiciones, cada elemento diferencial del circuito estará sometido a una fuerza diferencial dada por la ecuación de Laplace [2]. En cada lado del rectángulo, la fuerza diferencial tendrá el mismo sentido y dirección, por lo que la suma total de fuerzas, en cada lado, será un vector fuerza resultante, dibujado en rojo en la figura 5, y que por simetría se aplicará en el punto medio de cada lado. En los lados superior e inferior las fuerzas resultantes  tienen sentidos opuestos, por lo que anulan entre sí, pero en los laterales las resultantes aunque son iguales en módulo, IBdsinleft(alpharight) no son opuestas, están giradas un ángulo, por lo que forman un par de fuerzas de valor  IBd^2sinleft(alpharight). Si definimos el vector momento magnético de la espira por boldsymbol M=IBScdotboldsymbol n, donde A=d² es el area de la espira y n es el vector unitario normal a la espira, entonces el par de fuerzas resultante se expresa como boldsymbol Pboldsymbol=boldsymbol Mboldsymboltimesboldsymbol B, el producto vectorial del momento magnético de la espira por el campo magnético. Este par tenderá a hacer girar la espira, alineando los vectores M y B (al estar paralelos su producto vectorial será cero). Usando [2] y cálculo integral, puede mostrarse que este resultado se cumple para espiras de cualquier forma, incluso circulares u ovaladas. (Fernandez-Pujal, 1973)

Ley de Ampère

 

Bibliografia

  • Julián Fernandez y Marcos Pujal: Iniciación a la Física, volumen II, 1973