Teoría cinética de los gases

La teoría cinética de los gases, originaria del siglo XIX, es un modelo de la realidad que utiliza la mecánica de Newton, algunos conceptos de la Estadística, y la teoría molecular de la materia, para explicar el porqué de las propiedades macroscópicas observadas de los gases, como la presión, la temperatura o la conducción del calor.

Su hipótesis base es la siguiente: un gas está formado por un gran número de moléculas que se mueven de forma caótica (en todas direcciones, y cambiando a menudo de dirección) que chocan de forma elástica (se conserva la energía cinética) entre sí y con las paredes del recipiente que contiene al gas. A partir de esta imagen, se deducen la propiedades y comportamientos observados en el gas.

Ejemplo 1: en una caja de un litro que contiene gas hidrógeno a temperatura ambiente y presión atmosférica hay 0.09 gr de masa, N = 4·10²² moléculas, cada molécula ocupa un volumen de V=4^{-27}m^{3}, ocupando un volumen total molecular NV = 1.7·10⁻⁴m³ = 1.7·10⁻¹ litros, o sea un 17% del volumen total, el resto del volumen, 83%, está vacío. Cada molécula se mueve a una velocidad media de 1838 m/s, unos 2km por segundo. Vemos que el número de moléculas es muy elevado, que ocupan poco espacio del total disponible, y que se mueven muy rápido, a esa velocidad sólo tardan 5 cienmilésimas de segundo en ir de un lado al otro de la caja que contiene al gas.

Presión de un gas confinado

Fig. 1: moléculas de un gas en movimiento aleatorio

Consideremos un gas confinado en un recipiente de forma cualquiera y  de volumen V; habrán moléculas moviéndose en cualquier dirección. Fijamos una de las direcciones, a la que llamamos X, y pensamos en moléculas que, en un instante dado, se mueven en esa dirección;  las velocidades de esas moléculas en la dirección X pueden ser de módulos distintos v , y cambian continuamente. Nos acercamos a una de las paredes del recipiente, que supondremos plana y de superficie S (si no es plana, siempre podemos considerar una pequeña parte de la pared, y despreciar la curvatura), y consideramos una pequeña distancia d de la pared, dada por d = v·dt, la distancia recorrida por una molécula en un diferencial de tiempo, suficientemente pequeña para suponer que en ese espacio la molécula no chocará con otras.

Fig.2: moléculas moviéndose en la dirección X dentro de un pequeño volumen d·S

Pensemos ahora en todas las moléculas que en un instante t se mueven en la dirección X y llamemos N a su número. Las que ocupan el volumen dV =  S·d = S-v·dt, serán (N/V) · dV. ya que N/V son las moléculas que se mueven en dirección X por unidad de volumen. Las que no se muevan estrictamente en esa dirección pero tengan una componente de velocidad no nula según X también las contaremos, sólo no entran en el cómputo las velocidades ortogonales a X.

Como todas las direcciones y sentidos son igualmente probables, en la dirección X la mitad se moverán en el sentido positivo y la otra mitad en el sentido negativo, por tanto  el numero de moléculas que se mueven hacia la pared del recipiente y están dentro del volumen considerado será:

\operatorname dN_X=\frac12\left(\frac NV\right)\left(Sv\operatorname dt\right)\;\;\;\lbrack1\rbrack,

Veremos más tarde que la distancia que recorren las moléculas entre choques sucesivos es grande comparada con su tamaño (denominada recorrido libre medio), por tanto esta aproximación de considerar que, en la distancia d no chocaran entre sí, es aceptable.

Nos fijamos ahora en los choques elásticos de las moléculas contra la pared, la cual tiene una masa enorme en comparación con las moléculas, por ello, supondremos que la pared no cambia su velocidad tras el choque. La conservación del impulso en el choque implica que, para cada molécula, se conserva todo el impulso sólo que la velocidad cambia de sentido:

\operatorname dp=m\cdot\triangle v=m\left(v-\left(-v\right)\right)=2mv.

La variación total de impulso para todas las moléculas que chocan en la dirección X será el producto de la variación de cada molécula por la expresión [1]:

\operatorname dp_X=\left(2mv\right)\cdot\frac12\frac NVSv\operatorname dt=\frac{mv^2NS}V\operatorname dt\;\;\;\lbrack2\rbrack

En la mecánica de Newton, la variación del impulso con el tiempo es una fuerza, F = dp/dt, o bien F·dt = dp; aplicándolo a [2] y sumando para todos los módulos de velocidades v posibles en la dirección X:

F\cancel{\operatorname dt}=\operatorname dp_X=\frac{mS}V\left(\sum_vv^2N_v\right)\cancel{\operatorname dt}\;\;\;\lbrack2b\rbrack,

dónde hemos llamado N_v al número de moléculas que tienen una velocidad de módulo v en la dirección X, es necesario distinguirlo, pues estamos sumando para todas las posibles velocidades v. y además hemos eliminado el término dt. Tenemos pues la presión P = F/S ejercida por los choques moleculares sobre la pared:

P=F/S=\frac mV\left(\sum_vv^2N_v\right)\;\;\lbrack3\rbrack

Debido a que será imposible en la práctica obtener la suma indicada para cada molécula, trabajamos con los valores medios: definimos la velocidad cuadrática media según la dirección X:

\overline{v_x^2}=\frac{\left(\sum_vv^2N_v\right)}{N_T}\;\;\lbrack4\rbrack.

que no es más que la media ponderada de velocidades al cuadrado: cada velocidad cuadrática v² posible va ponderada por su número N_v, sumadas todas, y dividimos el total por el número total de moleculas del gas N_T. La presión [3] la expresamos en función de [4]:

P=\frac{mN}V\overline{v_x^2}\;\;\lbrack5\rbrack

Consideremos ahora una dirección cualquiera y una velocidad v en esa dirección; se descompondrá según los ejes coordenados en v=\left(v_x,v_y,v_z\right), y su módulo al cuadrado será igual a v^2=v_x^2+v_y^2+v_z^2, y de la misma forma encontramos el valor medio del cuadrado de la velocidad, \overline {v^2}=\overline{v_x^2}+\overline{v_y^2}+\overline{v_z^2}. Como los tres ejes, X, Y, Z, son equivalentes en un movimiento al azar, para cada uno de ellos la velocidad cuadrática media será la misma, y en particular podemos escribir \overline {v^2}=3\cdot\overline{v_x^2}. Entonces, la expresión [5] podemos expresarla en función de la velocidad cuadrática general:

P=\frac13\frac{mN_T}V\overline{v_{}^2}\;\;\lbrack6\rbrack

Observamos ahora que N_T·m es la masa total del gas (masa de cada molécula por número total de moléculas), y por tanto N_T·m/V es la densidad del gas, que denominamos \rho. Por ello, expresamos [6] así:

P=\frac13\rho\overline{v_{}^2}\;\;\lbrack7\rbrack

que literalmente nos dice la presión de un gas contra las paredes del recipiente que lo contiene es proporcional a la densidad del gas y a la velocidad cuadrática media de sus moléculas. También podemos expresar [6] de esta otra forma:

PV=\frac13mN\overline{v_{}^2}\;\;\lbrack8\rbrack

que nos recuerda a la ecuación de estado de los gases perfectos, PV = nRT.

Ejemplo 2: El gas hidrógeno tiene una densidad de 0.09 g/l = 0.09 Kg/m³ a temperatura ambiente y presión atmosférica (1 atm = 101325 Pa), aplicando [7] podemos encontrar la velocidad cuadrática media de la molécula de hidrógeno:

P=\frac13\rho\overline{v^2}\Rightarrow\overline{v^2}=\frac{3P}\rho=\frac{3\cdot101325}{0.09}\frac{N/m^2}{kg/m^3}=3.38\cdot10^6\frac{N\cdot m}{kg}

Recordando que [Newton = kg·m/s²] vemos que [Newton·m/kg] = [kg·m²/s²·kg] = [m²/s²]. La velocidad media molecular será \overline v=\sqrt{3.38\cdot10^6}=1837\;m/s, una velocidad muy elevada, del orden de 2Km por segundo.

Energía cinética interna

La energía cinética total interna del gas es la suma de las moleculares:

E_c=\sum_i\frac12mv_i^2=\frac12m\sum_i{\textstyle v_i}{\textstyle{}^2}

Usando la definición de velocidad cuadrática media, {\textstyle\overline{v^2}}{\textstyle=}\frac1{N_T}\sum_i{\textstyle v_i}{\textstyle{}^2}, y la expresión [8]:

E_c=\frac12m\overline{v^2}\cdot N_T=\frac123PV\Rightarrow PV=\frac23E_c\;\;\;[9]

En el modelo que estamos usando de moléculas vistas como masas puntuales, el producto presión·volumen es proporcional a la energía cinética total de las moléculas.

Gases perfectos monoatómicos

Comparando [9] con la ecuación de estado de los gases perfectos PV = nRT, podemos aventurar que la temperatura T debe de estar relacionada con la energía cinética total; consideremos un mol de gas perfecto (n = 1), y recordemos que la constante universal de los gases, R, tiene dimensiones [Joules / Kelvin], o sea que relaciona energía con temperatura. Por otra parte, la capacidad calorífica a volumen constante de un gas compuesto de moléculas monoatómicas es igual a c_V=3R/2\;\;\;[10]; recordando el primer principio de la termodinámica, Q=W+\triangle E, tomando W = 0 (un proceso de calentamiento del gas sin trabajo), y identificando la energía interna del gas con su energía cinética total (no tenemos otras formas de energía en este modelo), tenemos que Q=\triangle E_C=c_V\triangle T.Usando [10] y simplificando:

\cancel\triangle E_C=c_V\cancel\triangle T\Rightarrow E_C=c_VT=\frac{3R}2T

Usando ahora [9]:

\frac32PV=\frac{3R}2T\Rightarrow\boxed{PV=RT}

hemos obtenido la ecuación de estado de los gases perfectos monoatómicos.

La constante de Boltzmann

En la ecuación [8] cuando consideramos un mol de gas implica que el número total de moléculas N_T es igual al número de Avogadro: PV=\frac13mN_A\overline{v_{}^2}\;. Definamos la energía cinética media molecular a partir de la velocidad cuadrática media:

\overline{E_c}=\frac12m\overline{v^2}

Entonces:

PV=\frac13N_Am\overline{v_{}^2}\;=\frac13N_A\cdot2\cdot\overline{E_c}=\frac23N_A\overline{E_c}

pero por la ecuación [7], PV = RT, deducimos:

RT=\frac23N_A\overline{E_c}\Rightarrow\boxed{\overline{E_c}=\frac32\left(\frac R{N_A}\right)T=\frac32kT}\;\;\;\lbrack10\rbrack

donde k=R/N_A es la constante de Boltzmann, relacionando directamente energía cinética con temperatura.

Ejemplo 3: Para el gas hidrógeno a P = 1atm y V = 1m³, obtenemos una energía cinética media molecular de:

PV=101325\cdot1=\frac236\cdot10^{23}\cdot\overline{E_C}\Rightarrow\overline{E_C}=\frac{3\cdot101325}{2\cdot6\cdot10^{23}}=2.5\cdot10^{-19}J

Principio de Maxwell de equipartición de la energía

En [10] y anteriores estamos relacionando exclusivamente la energía interna del gas con las velocidades moleculares, o sea con la energía cinética; como las direcciones X, Y, Z son equivalentes, podemos descomponer la participación de las velocidades en la energía cinética en tres componentes del mismo valor; usando [10]:

\left.\begin{array}{r}\overline{E_c}={\overline{E_c}}_X+{\overline{E_c}}_Y+{\overline{E_c}}_Z\\{\overline{E_c}}_X={\overline{E_c}}_Y={\overline{E_c}}_Z\end{array}\right\}\Rightarrow{\overline{E_c}}_X=\frac13\overline{E_c}=\frac12kT

Llamando grado de libertad a cada dirección independiente de la velocidad (y de la energía), diremos que el gas monoatómico tiene tres grados de libertad (ejes X, Y, Z) y que cada grado de libertad contribuye con el valor \frac12kT a la energía interna del gas.

En moléculas poliatómicas, cuando aumentamos su energía además de la energía cinética hay otras energías mecánicas que participan: la energía de rotación de la molécula, proporcional al momento de inercia y al cuadrado de la velocidad angular, \frac12I\omega^2, y la energía elástica, proporcional a la constante elástica y al cuadrado de la elongación, \frac12Ax^2. Diremos que el gas poliatómico tiene más grados de libertad que el monoatómico.

El principio de equipartición enuncia que cada contribución a la energía total del gas, debida a cada grado de libertad, participa en la energía total interna en la misma medida,  \frac12kT. Así pues, en un gas poliatómico con 5 grados de libertad (tres de movimiento, más uno de rotación y uno de vibración elástica), la energia total en función de la temperatura vendrá dada por

E=\frac52kT\;\;\;\lbrack11\rbrack

En general, si el gas admite L grados de libertad, la relación entre su energía interna y su temperatura será E=\frac L2kT, en particular, ese gas aumentará menos su energía cinética, a una temperatura T dada, que un gas monoatómico; como hemos visto que la energía cinética del gas es proporcional a la temperatura, deducimos que dada una transferencia de calor Q, los gases poliatómicos aumentaran menos de temperatura que los monotaómicos. Otra forma de decir lo mismo es que el coeficiente calorífico de un gas poliatómico es mayor que el de un gas monoatómico; de hecho puede demostrarse que c_V=\frac L2R.

Publicado en Fí­sica, Termodinámica | Etiquetado , , , | Deja un comentario

Mecánica de Newton

La obra magna de Newton

Isaac Newton definió en el siglo XVII unas leyes universales para el movimiento de los cuerpos sujetos a fuerzas (rama de la Física que se llama Dinámica) en sus Philosophiae Naturalis Principia Mathematica, (Principios Matemáticos de la Filosofía de la Naturaleza) que describían de forma muy precisa y rigurosa el movimiento de una enorme diversidad de cuerpos, desde un grano de arena llevado por el viento hasta las órbitas de los planetas alrededor del Sol. No fue hasta el siglo XX con la teoría de la Relatividad que se vieron inexactitudes en la dinámica de Newton.

Toda la dinámica de Newton se basa en las “fuerzas” (entendidas como interacciones entre cuerpos o entre campos y cuerpos, como por ejemplo el campo gravitatorio) y los “cuerpos” que se definen como objetos con un volumen y una masa. Tales leyes son tres:

  • 1a ley, de la inercia: un cuerpo permanece o bien en estado de reposo o bien en movimiento rectilíneo a velocidad constante cuando ninguna fuerza actúa sobre él.
  • 2a ley, de la masa inercial y la aceleración: la aceleración de un cuerpo, que es la variación de la velocidad por unidad de tiempo, es directamente proporcional a la magnitud de la fuerza que actúa sobre el cuerpo.
  • 3a ley, de acción y reacción: todo cuerpo que ejerce una fuerza F sobre otro cuerpo (acción), recibirá de ese otro cuerpo una fuerza –F (reacción) de sentido contrario y de la misma magnitud

En el pensamiento del siglo XVII tales afirmaciones tenían una buena parte de “filosóficas” pues explicaban el movimiento físico de los cuerpos que tenemos alrededor en base a conceptos no tangibles como “las fuerzas” y “las masas”, conceptos que no estaban nada claros en esa época; en el caso de la caída de los cuerpos no se veía ninguna “cosa” que tirara hacia abajo de los cuerpos para hacerlos caer, así que la interacción era algo intangible. De ahí el título de la obra, que alude a la Filosofía de la Naturaleza, pues así se comporta la Naturaleza, interactuando de forma invisible e intangible.

Primera Ley de Newton, de la inercia

Fig. 1: fuerzas equilibradas, cuerpo puntual

Estática: En ausencia de fuerzas, o no hay movimiento o si lo hay, es rectilíneo y uniforme (de velocidad constante); hay que precisar que pueden haber fuerzas actuando, pero dispuestas de tal forma que se anulen las unas a las otras, en este caso entendemos que queremos decir que la resultante de todas las fuerzas es nula. La rama de la Física que estudia los sistemas de fuerzas en equilibrio es la Estática. La anulación de las fuerzas, al ser vectores, dependerá de sus direcciones y magnitudes; el caso más simple es de fuerzas aplicadas sobre un cuerpo con dimensiones despreciables que puede considerarse puntual (figura 1), descomponiendo cada fuerza en sus componentes según ejes cartesianos, la suma total de componentes en cada eje debe de ser nula para que estemos en el caso estático:

Ecuaciones de la estática de cuerpos puntuales:\sum_i\overrightarrow{F_i}=0\Leftrightarrow\sum_iF_{xi}\widehat x=0,\text{ }\sum_iF_{yi}\widehat y=0,\text{ }\sum_iF_{zi}\widehat z=0 [1]

donde representamos por \widehat x,\widehat y,\widehat z los versores (vectores de módulo 1 en la dirección de un eje) de los ejes X, Y, Z.

Fig. 2: fuerzas sobre un cuerpo no puntual

Si el cuerpo no tiene dimensiones puntuales el problema de ver si el sistema de fuerzas aplicadas se anula se complica, pues si tenemos fuerzas de igual magnitud, dirección opuesta, pero aplicadas en distintos puntos del cuerpo, no se anulan sino que producen un par de giro; esto sucede porque la ecuación vectorial [1] sólo sirve para el caso de que todos los vectores sean vectores fijos (su origen es un punto fijo), pero en el caso de un cuerpo de dimensiones no despreciables las fuerzas pueden desplazarse por el cuerpo y seguir interactuando con él: en la figura 2 vemos un cuerpo con forma de paralepídedo con una fuerza F aplicada en el punto P que lo empujará, pero si deslizamos la fuerza a lo largo de la línea L para aplicarlo en el punto Q seguirá interactuando con el cuerpo, esta vez tirando de él. En ausencia de gravedad el efecto de la fuerza F seria el mismo tanto en el punto P como en el Q: produciría una aceleración en la dirección de L. en esta situación concreta dónde podemos deslizar la fuerza sin que deje de interactuar con el cuerpo decimos que la fuerza es un vector deslizante. En cambio si hay gravedad aparece la fuerza constante del peso del cuerpo P = Mg que suponemos aplicada siempre en el punto centro de gravedad G, y en tal caso la combinación del vector F con el vector P que están situados en puntos distintos del cuerpo produce un par de giro que hará girar al cuerpo de forma acelerada (rotación acelerada) además de moverlo en la dirección de L. Tal par de giro se describe matemáticamente usando el denominado momento de una fuerza. que es un tipo especial de vector denominados vectores axiales, o vectores polares, o también pseudovectores. (ver por ejemplo el artículo Vectores en Física). Entonces la condición de la 1a ley de Newton sólo se cumplirá si las fuerzas actuantes resultan en un par de giro nulo, o equivalentemente, en un momento total nulo, además de cumplir la ecuación de equilibrio [1], tenemos pues dos ecuaciones para la estática de cuerpos no puntuales:

Ecuaciones de la estática de cuerpos no puntuales: \sum_i\overrightarrow{F_i}=0,\text{ }\sum_i\overrightarrow{M_i} [1b]

Un caso especial, más complicado, es cuando aplicamos la primera ley de Newton para los fluidos, pues ni son cuerpos puntuales ni cuerpos con una forma fija y definida: es la estática de fluidos (ver por ejemplo Estática de fluidos (I)).

2a Ley de Newton: masa inercial y aceleración

La segunda ley establece el principio de que si aplicamos diversas fuerzas a un cuerpo, las aceleraciones que observamos son directamente proporcionales a las fuerzas; por tanto dividiendo fuerza aplicada al cuerpo por aceleración obtenida obtenemos una constante que es propia del cuerpo:

\frac Fa=\frac{F'}{a'}=\frac{F''}{a''}=\dots=m [2]

a esta constante la llamamos masa inercial, o simplemente masa; observemos que la masa se define en la mecánica de Newton como esa constante de proporcionalidad entre fuerza y aceleración, sin ninguna referencia a la gravedad y al peso del cuerpo. La expresión matemática de esta ley usa la definición de aceleración como variación de la velocidad respecto al tiempo, en forma más precisa y a la vez más general la establece en base a cómo se relacionan las variaciones de velocidad y de masa con la fuerza aplicada, suponiendo que la masa del cuerpo pueda ser también variable, en forma de ecuación diferencial: F=\frac{\operatorname d\left(mv\right)}{\operatorname dt} [3] al producto de la masa por la velocidad, mv, se le denomina impulso, o cantidad de movimiento, y es un vector pues v también lo es. En el caso de que la masa sea constante puede sacarse fuera de la derivada respecto al tiempo y nos queda la expresión simplificada más conocida, F=\frac{\operatorname d\left(mv\right)}{\operatorname dt}=m\frac{\operatorname dv}{\operatorname dt}=ma [4].

Ejemplo 1: Un motor de combustión ejerce una fuerza F sobre un vehículo de masa m = 1.200Kg que es aproximadamente proporcional a las revoluciones a las que gira el motor, y vale F = 6R Newton, donde R son las revoluciones por minuto (rpm), que toman valores entre 1.000 (ralentí) y 4.000 (régimen de par máximo a partir del cual decae la fuerza). Si pisamos el acelerador a fondo desde el ralentí, el motor gana revoluciones según la formula R = 1000 + 500·t siendo t el tiempo en segundos. Dar una expresión para el impulso y la aceleración del vehículo en función del tiempo. Solución: La fuerza es F = 6·(1000 + 500·t) = 6000 + 3000t. La aceleración es a = F/m = F/1200 = 5 + 2.5t . Para encontrar el impulso p usamos [3] en la forma F = dp/dt o bien Fdt = dp, integrando esta expresión obtenemos \int_{t=0}^tF\operatorname dt=\int_{p=0}^p\operatorname dp\Rightarrow\int_{t=0}^t\;\left(6000\;+\;3000t\right)\operatorname dt=6000t\;+\;1.500t^2=p. Alternativamente como p = mv y la masa es constante, podemos obtener p calculando la velocidad en función del tiempo: siendo la aceleración a = dv/dt implica que dv = a·dt, integrando: \int_{v=0}^v\operatorname dv=\int_{t=0}^ta\operatorname dt=\int_{t=0}^t\left(5\;+\;2.5t\right)\operatorname dt\Rightarrow v=5t+1.25t^2 y multiplicando por la masa volvemos a obtener el impulso p=mv=1200\left(5t+1.25t^2\right). ▢

Si hay diversas fuerzas actuando, tal como hemos hecho con la 1a ley deberemos considerar la resultante suma de fuerzas, y distinguir si podemos considerar el cuerpo como puntual o no; en éste último caso las aceleraciones pueden ser de giro, de traslación, o ambas. Es importante destacar que cualquier cambio en el vector velocidad implica una aceleración y por tanto una fuerza, incluso en el caso de que la celeridad (módulo del vector velocidad) no cambie; este seria el caso de un coche cogiendo una curva “a velocidad constante” como suele decirse, en realidad queremos decir que la celeridad es constante pues al coger la curva la velocidad del coche está cambiando continuamente de dirección, por tanto el vector velocidad no es constante.

Fig. 3: coche en una curva circular

Ejemplo 2, aceleración normal: un coche entra en una curva circular de radio R = 100m y la recorre a velocidad constante v = 90km/h, sabiendo que su masa es de 1.200kg, dar la expresión de los vectores velocidad, aceleración y fuerza sobre el vehículo. Solución: De la figura 3 deducimos que el vector velocidad en coordenadas cartesianas es \overrightarrow v=\frac{90}{3.6}\left(\sin\left(\theta\right),-\cos\left(\theta\right)\right), la aceleración la obtenemos derivando el vector velocidad respecto al tiempo, pero para ello primero necesitamos expresar el ángulo θ en función del tiempo: la longitud de la circunferencia completa de la cual la curva es una parte viene dada por L = 2πR, a la celeridad de v = 90km/h el coche tardaría en recorrer todo el círculo un tiempo t = L / v = 2π·100 / (90/3.6) = 8π s, donde hemos convertido las unidades km/h a m/s, entonces la velocidad angular ω que se define como el recorrido angular por unidad de tiempo, en radianes, del vehículo, será ω = 2π /8π = 1/4 rad/s, y llegamos a la expresión que necesitamos del ángulo θ en función del tiempo: θ = ωt = t/4. Ya podemos derivar la velocidad para obtener la aceleración:

\overrightarrow v=\frac{90}{3.6}\left(\sin\left(t/4\right),-\cos\left(t/4\right)\right)\Rightarrow\frac{\operatorname d\overrightarrow v}{\operatorname dt}=\overrightarrow a=\frac{25}4\left(\cos\left(t/4\right),\sin\left(t/4\right)\right)

Observemos que la aceleración es perpendicular a la velocidad, es la denominada aceleración normal (“normal” en el sentido geométrico de ser perpendicular a la velocidad) o aceleración centrípeta causante del cambio de dirección del vector velocidad. Además, el módulo de la aceleración, a = 25/4, cumple la relación a = v²/R = (90/3.6)² / 100 [5] que es una relación general entre el módulo de la aceleración normal y la celeridad. ▢

Se suele decir que las ecuaciones [3] y [4] de Newton sólo son válidas en los sistemas de referencia denominados sistemas inerciales, que son aquellos que ellos mismos no poseen aceleración, o equivalentemente, son aquellos en los que se cumple la primera ley de Newton. Aclaremos este punto: si dejamos una canica encima de un plato giratorio observaremos que en apariéncia no se cumple la primera ley, pues la canica empieza a moverse hacia la periferia del disco sin que realicemos sobre ella ninguna fuerza. Desde el punto de vista de una persona que estuviera encima del plato, girando con él, la canica “se moveria sola”, y en apariencia no se cumpliria la primera ley. Del mismo modo, un coche que toma una curva a velocidad constante (figura 4) será afectado por una fuerza que tiende a hacer que se salga de la curva por el exterior, y los pasajeros notarán esa misma fuerza tirando de ellos. En algunos textos se recurre a denominar fuerzas ficitícias y aceleraciones fictícias a las que aparecen debido a estar situado en referencias no inerciales, fuerza ficticia llamada así porque “nadie” la está aplicando, aparece como efecto de estar situado en una referencia que está girando, o más generalmente, en una referencia acelerada. El definir fuerzas y aceleraciones “ficticias” es un recurso que permite seguir aplicando las leyes de Newton imaginando que hay fuerzas adicionales relacionadas con las referencias no inerciales.

Fig. 4: aparición de la fuerza ficticia “centrífuga” en una curva.
Fig. 5: Objeto que cae en un disco giratorio

Ejemplo 3: dinámica de un cuerpo que se deja caer sobre otro en rotación, fuerza de rozamiento. Tenemos un plato que gira con velocidad angular constante ω = 1 rad/s (aproximadamente 9.5 revoluciones por minuto) sobre el que dejamos caer verticalmente, a pequeña altura, un pequeño objeto de masa m = 0.1kg (figura 5) que impacta sobre el plato a una distancia r = 1 m del centro. El material del disco y del objeto es el mismo, y tiene un coeficiente de rozamiento dinámico k. Estudiar la aceleración y fuerza que actúan sobre el objeto.

Fig. 6: velocidad de un punto P del plato

Solución: Supondremos que al caer desde baja altura podemos ignorar un posible rebote del objeto. Al contactar las superficies del plato y del objeto se produce fricción entre ambas debido a la diferencia de velocidades, la fuerza de rozamiento F siempre tiende a igualar las velocidades oponiendo resistencia al movimiento relativo de ambas superficies, y en el caso dinámico (superficies en movimiento relativo) vale F = kmg siendo k la constante de rozamiento que depende de los materiales, m la masa del cuerpo que presiona al otro (el objeto que dejamos caer) y g la aceleración de la gravedad. La dificultad de este problema radica en la variación que se produce en la dirección de esa fuerza de rozamiento, que en módulo permanece constante pero no en dirección

Fig. 7: fuerza de rozamiento inicial

En el instante inicial t = 0 el objeto contacta con el plato en un punto P a una distancia r = 1m del centro O, que tiene un vector velocidad v perpendicular al radio OP. La fuerza de rozamiento F del disco sobre el objeto tenderá a reducir la diferencia de velocidades entre las superficies en contacto, acelerando el objeto en la dirección de v con una aceleración a = F/m = kmg/m = km que inicialmente será paralela a la velocidad (figura 7). Avancemos en el tiempo una pequeña cantidad Δt, la velocidad del objeto habrá aumentado desde cero hasta v = a·Δt = kmΔt, si Δt es pequeño la velocidad será todavía inferior a la del plato, que en el punto P (y todos los puntos a esa distancia del centro O) es v = ωr = 1 rad/s · 1m = 1 m/s, y el objeto seguirá deslizando sobre el plato.

Fig. 8: fuerza de rozamiento con el objeto en movimiento

En la figura 8 vemos el esquema de la situación: el objeto cuando estaba en P adquirió una pequeña velocidad v0 perpendicular a OP, pero ahora está en P’, la velocidad del punto P’ del plato es v, perpendicular a OP’, y por tanto la hay un ángulo de giro entre la velocidad actual v0 del objeto y v del plato, la fuerza de fricción F sabemos que tiende a igualar ambas velocidades de forma que no haya deslizamiento, por tanto F cambiará de dirección dejando de ser paralela a la velocidad v para forzar el giro de la velocidad actual v0 del objeto. Usando la relación [5] a = v²/r del ejemplo 2, válida para la aceleración normal (perpendicular a v), podemos descomponer la aceleración y la fuerza en P’ segun dos componentes: una tangencial, paralela a la velocidad v, y otra normal, perpendicular a v, ésta última con módulo v² / r. Teniendo en cuenta que la fuerza de rozamiento tiene un módulo constante F = kmg, y que su componente normal vale m·v² / r, la componente tangencial la obtenemos por medio de raíz de(fuerza total² – fuerza normal²):

F_t=m\sqrt[{}]{\left(\frac{v^2}r\right)^2-\left(kg\right)^2} [6]

A medida que el objeto va ganando velocidad por medio de la aceleración tangencial producida por la componente tangencial de la fuerza de rozamiento F, se incrementa la componente normal debido a su término v²/r, y como el módulo de la fuerza total F es constante, resulta que la aceleración tangencial va disminuyendo conforme la normal aumenta: el vector F va girando, y el vector aceleración del objeto le sigue. Si definimos los vectores unitarios t y n, tangencial y normal respectivamente, la aceleración puede expresarse en cada momento en función de esos vectores: \overrightarrow a=a_t\cdot\widehat t+a_n\cdot\widehat n.

En la figura 9 vemos ese giro de la aceleración con respecto a los ejes determinados por t y n en dos situaciones distintas: a la izquierda el material es acero, con un coeficiente k = 0.58 lo que sucede es que inicialmente el vector aceleración es paralelo al vector tangencial t, y en sólo 0.18 segundos el objeto ha igualado la velocidad del plato, se pega a él, deja de deslizar, su celeridad y su aceleración tangencial pasan bruscamente a valer 0, y el rozamiento pasa de ser dinámico a estático (el coeficiente de rozamiento estático es siempre mayor que el dinámico), toda la aceleración pasa a ser normal, y vale v²/r = 1 m/s², con una fuerza normal Fn = 0.1·1 = 0.1Newton. La situación es bien distinta en el caso de la derecha, en el que el material es teflón con un coeficiente k = 0.04 tan bajo que la celeridad del objeto aumenta lentamente hasta que a los 1.9 segundos el vector aceleración ha girado 90⁰, toda la aceleración proporcionada por el rozamiento se invierte en la componente normal antes de que el objeto haya igualado la velocidad del plato: el objeto queda permanentemente deslizando sobre la superficie sin pegarse nunca a él, pues el rozamiento es insuficiente para ello. Hemos supuesto que no hay deslizamiento en la dirección normal (o centrípeta) para no complicar maś el problema. Los cálculos se han realizado numéricamente, sin usar las ecuaciones analíticas del movimiento que requieren plantear y resolver una ecuación diferencial que relaciona las variables anteriores, celeridad y aceleraciones normal y tangencial. ▢

Fig. 9: evolución de la fuerza de rozamiento con el tiempo en dos superficíes distintas, acero y teflón

En el ejemplo 3 se puede considerar l objeto como un cuerpo puntual; en otro caso al adaptar las leyes de Newton a cuerpos no puntuales en rotación las aceleraciones vendrán determinadas por los momentos resultantes en vez de las fuerzas, y en vez de por las masas por los momentos de inercia de los cuerpos en rotación. Las aceleraciones adicionales que aparecen en sistemas de referencia no inerciales las hemos descrito con detalle en el artículo Cinemática vectorial: sistemas de referencia, vectores posición, velocidad y aceleración. Para la descripción vectorial de las velocidades en sistemas en rotación tenemos el artículo Cinemática vectorial: velocidad angular, ángulos de Euler. Para ver problemas resueltos sobre estos temas podéis consultar Problemas resueltos en la página de Física.

3a ley de Newton, de acción y reacción

Fig. 4: una masa suspendida de un cilindro

Para entender esta ley en casos prácticos es preciso distinguir claramente a qué cuerpo se aplica cada fuerza. Por ejemplo en la figura 4 vemos un esquema de un cuerpo de masa m suspendido de un cilindro en vista axial por una cuerda. Interpretemos las fuerzas: sobre el cuerpo actúan dos fuerzas, la de su peso, de valor -mg, y la tensión de la cuerda +T que tira de ella hacia arriba contrarrestando el peso; en equilibrio estático ha de ser +T – mg = 0, por tanto T = mg. La cuerda está atada al cilindro sobre el que ejerce la misma fuerza T pero en sentido contrario: -mg. ¿Qué fuerzas son aplicadas a la cuerda? Por la 3a ley, el cilindro reacciona ejerciendo una fuerza igual y de sentido contrario a la que recibe, +mg, y el cuerpo reacciona sobre la cuerda también invirtiendo la tensión T = +mg recibida, o sea tira de la cuerda según -mg. Por tanto la cuerda es estirada, con una fuerza +mg en el extremo del cilindro y con una fuerza -mg por el extremo del cuerpo. La resultante es nula, +mg – mg = 0 como exige la 1a ley para el equilibrio estático.

Ejemplo 4: cuerpo que se deja caer sobre otro en rotación. En el ejemplo 3 veíamos un pequeño objeto caer sobre un plato giratorio, la fricción entre las superficies en movimiento relativo producía una fuerza F de rozamiento del plato sobre el objeto que tendía a acelerar a éste. Aplicando la 3ª ley, el objeto ejercerá una fuerza de igual módulo y signo contrario -F sobre el plato, tendiendo a detenerlo. Si el plato se hace girar con un motor, éste deberá compensar la fuerza -F desarrollando un trabajo, o sea, consumiendo energía para que el plato no se detenga. En este sentido el motor está transfiendo cantidad de movimiento al objeto que cae en el plato a través de la fuerza de rozamiento, consumiendo en ello una energía igual a la energía cinética final del objeto. ▢

Conclusión

Aunque a primera vista las leyes de Newton parezcan simples, hemos visto que sólo lo son para cuerpos puntuales y referencias inerciales, e incluso en este caso el problema se complica en seguida debido al caracter vectorial de las fuerzas y aceleraciones. Si el cuerpo tiene dimensiones no despreciables al aplicarle fuerzas en distintos puntos aparecen efectos de giro y necesitamos especializar las ecuaciones al caso de pares de fuerzas e inercias de giro (momentos de inercia). Si la masa o la fuerza o ambas no son constantes, entonces necesitamos la forma diferencial de la 2a ley, que es una ecuación diferencial que puede ser complicada de resolver en muchos casos prácticos, en realidad, en la mayoría. Además si el cuerpo está situado en una referencia acelerada, no inercial, necesitamos también ampliar el modelo incluyendo fuerzas y aceleraciones ficticias. Todo ello lleva a que saber resolver problemas con la mecánica de Newton necesite un trabajo de horas de estudio y práctica, y que además su aplicación directa sólo sea posible en un rango limitado de problemas. Para potenciar la resolución de las ecuaciones de Newton se han desarrollado métodos de solución de ecuaciones diferenciales así como planteamientos alternativos: la mecánica analítica de Lagrange.

Publicado en Dinámica, Fí­sica, Mecánica | Etiquetado , , , , , , , , , , | Deja un comentario

Ecuaciones Diferenciales de la Física

“Las ecuaciones diferenciales son la única forma de presentar las leyes de la Física de forma precisa” – R. Feynman.

“Entender una ecuación diferencial de la Física es saber repersentar las propiedades de sus soluciones sin necesidad de resolver la ecuación” – Paul A. Dirac.

Contenidos

  • Campos y operadores diferenciales
  • Flujo de un campo vectorial. Teorema de Gauss
  • Circulación de un vector, teorema de Stokes
  • Campos conservativos y potenciales escalares
  • Potencial vector
  • Ejemplos: Trabajo de una fuerza, campo electrostático, potencial vector electromagnético, Ecuación diferencial de la hidrostática

Los fenómenos naturales más interesantes implican relaciones dinámicas entre magnitudes físicas variables y se expresan mejor con relaciones entre variaciones de esas variables, esto es, con ecuaciones expresan diferencias y relaciones entre esas diferencias: son las ecuaciones diferenciales. Por ejemplo la 2a ley de Newton de la dinámica se expresa en forma de ecuación diferencial como \overrightarrow F=\frac{\operatorname d\overrightarrow p}{\operatorname dt} siendo p el vector impulso, la forma más familiar F = ma es una solución particular de la ecuación diferencial con la condición de que la masa sea constante (en el típico problema del cohete acelerando la masa es variable pues el cohete va quemando combustible).

En las ecuaciones de la Física se manejan frecuentemente variaciones “pequeñas” y variaciones infinitesimales; por ejemplo la variación de la temperatura T de un cuerpo con respecto al tiempo es proporcional a la diferencia (T – A) donde A es la temperatura del medio ambiente (ley de enfriamiento de Newton), para pequeñas variaciones escribimos \frac{\triangle T}{\triangle t}=k\left(T-A\right), interpretando el símbolo \frac{\triangle} como variación (pequeña) de la temperatura; en realidad tal símbolo representa una variación cualquiera de una magnitud, pero en las ecuaciones de la Física lo más frecuente es que represente una variación “pequeña” pues para variaciones grandes muchas veces la ley deja de cumplirse, como es el caso de la ley de enfriamiento de Newton. En cálculo diferencial se usa la operación “paso al límite” de las diferencias para convertirlas en “infinitesimales”, que deben entenderse como un paso al límite:

\lim_{\triangle t\rightarrow0}\frac{\triangle T}{\triangle t}=\frac{\operatorname dT}{\operatorname dt}

Para terminar con esta introducción, especifiquemos que se entiende por variación “pequeña”: dependerá de la situación en estudio, pero en general será aquella que permita que las hipótesis que realizamos se cumplan. Por ejemplo en el problema del cohete acelerando, si la masa inicial del cohete es de 10⁴kg, el consumo de combustible es de 6kg por hora, y nos preguntamos por la aceleración durante los primeros10 segundos, se consumirán 0.6kg de combustible y la masa del cohete descenderá un 0.006%, podemos considerar como buena aproximación que la masa total se mantiene constante y aplicar la ecuación F = ma.

Campos y operadores diferenciales

Un campo escalar es una función f(x,y,z) que asigna un número real (un escalar) a cada punto del espacio o de una región del espacio. Por ejemplo la temperatura T de una sala con calefacción por radiadores tendrá una temperatura ligeramente variable según el punto en que la midamos, más caliente cerca de los radiadores, y la representamos por el campo escalar T(x,y,z). En los mapas meteorológicos, las líneas isobaras representan los puntos que están a la misma presión atmosférica P, que también constituye un campo escalar P(x,y,z), y las líneas isotermas representan los puntos de la misma temperatura. En general dado un campo escalar C(x,y,z) las líneas que pasan por los puntos con la misma magnitud C se denominan curvas de nivel. Si “andamos” por encima de una curva de nivel L cualquiera, la magnitud C se mantiene constante, su variación es cero: \triangle C_L=0, por el contrario si nos alejamos de una curva de nivel perpendicularmente a ella, la variación de la magnitud C será la máxima posible siempre que el desplazamiento sea pequeño, pues para mantener la variación máxima deberíamos movernos por una trayectoria \Gamma tal que fuera perpendicular en cada uno de sus puntos a la curva de nivel en ese punto. No nos detendremos en las demostraciones matemáticas de estas propiedades ni de otras que saldrán a menos que nos aporten comprensión física de las leyes. En la figura 1 simplificamos el modelo pasando de tres a dos dimensiones, z = f(x,y): vemos tres curvas de nivel en el plano (x,y) correspondientes a tres valores distintos de z, tenemos también tres movimientos entre curvas de nivel, la que proporciona mayor variación con menor desplazamiento es la trayectoria C perpendicular a la curva de nivel.

Fig. 1: curvas de nivel en el plano (X,Y) correspondientes a tres valores de Z=f(X,Y); el movimiento A mantiene el valor de la función Z pues se mueve por encima de una curva de nivel, el movimiento B introduce una variación de una unidad pues pasa de la curva de nivel Z=2 a la Z=3, finalmente el movimiento C al ser perpendicular a la curva de nivel será la distancia más corta entre las curvas consecutivas, y por tanto la que aporta más variación de Z con mínimo desplazamiento.

Pasando al límite de desplazamiento infinitesimal, la ratio entre variación del campo C(x,y,z) y la de variación de la posición coincide por definición con la de derivadas parciales del campo escalar C:

\lim_{\triangle x\rightarrow0}\frac{\triangle C}{\triangle x}=\frac{\partial C}{\partial x},\;\lim_{\triangle y\rightarrow0}\frac{\triangle C}{\triangle y}=\frac{\partial C}{\partial y},\;\lim_{\triangle z\rightarrow0}\frac{\triangle C}{\triangle z}=\frac{\partial C}{\partial z}

Si agrupamos las tres derivadas parciales como si fueran un vector (cualquiera tres cantidades puestas en línea como si fueran un vector en general no lo serán, deben de transformarse adecuadamente bajo cambios de coordenadas, ver Vectores en Física) obtenemos el denominado gradiente del campo escalar:

Grad\;C=\left(\frac{\partial C}{\partial x},\frac{\partial C}{\partial y},\frac{\partial C}{\partial z}\right) [1]

que resulta que sí es un vector “de verdad”: el vector gradiente. Resulta que para un pequeño desplazamiento \left(\triangle x,\triangle y,\triangle z\right) la variación de C es igual, aproximadamente, a

\frac{\partial C}{\partial x}\triangle x+\frac{\partial C}{\partial y}\triangle y+\frac{\partial C}{\partial z}\triangle z=\overrightarrow{Grad}(C)\cdot\overrightarrow r

que es el producto escalar del vector gradiente por el vector desplazamiento; si este último es paralelo al gradiente, el producto escalar toma su valor máximo, y si es perpendicular, vale cero, en correspondencia a lo que hemos dicho de los movimientos siguiendo lineas de nivel: “el vector gradiente del campo C en cada punto es paralelo a la línea de nivel por ese punto”.

Dado que la operación “derivada parcial del campo” es una operación lineal (la derivada de la suma de campos es la suma de derivadas) se puede definir un operador diferencial lineal, el operador gradiente, como sigue:

\overrightarrow\nabla C=\overrightarrow{Grad}(C)=\left(\frac{\partial C}{\partial x},\frac{\partial C}{\partial y},\frac{\partial C}{\partial z}\right)

válido para cualquier campo escalar C; podemos incluso obviar ese campo cualquiera C y “desnudar” el operador gradiente:

\overrightarrow\nabla=\overrightarrow{Grad}=\left(\frac\partial{\partial x},\frac\partial{\partial y},\frac\partial{\partial z}\right)

Entendiendo que ese operador no es un vector, sino que al operar sobre un campo escalar cualquiera nos resulta un vector, el vector gradiente de ese campo. Aunque el operador no sea un vector, podemos realizar operaciones vectoriales con él como si lo fuera, por ejemplo, el producto escalar de dos gradientes:

\overrightarrow\nabla\cdot\overrightarrow\nabla=\overrightarrow{Grad}\cdot\overrightarrow{Grad}=\left(\frac\partial{\partial x},\frac\partial{\partial y},\frac\partial{\partial z}\right)\cdot\left(\frac\partial{\partial x},\frac\partial{\partial y},\frac\partial{\partial z}\right)=\frac{\partial^2}{\partial x^2}+\frac{\partial^2}{\partial y^2}+\frac{\partial^2}{\partial z^2}

resulta como era de esperar un operador escalar que además es muy importante en Física. el operador Laplaciano:

\bigtriangleup=\overrightarrow\nabla\cdot\overrightarrow\nabla=\nabla^2\frac{\partial^2}{\partial x^2}+\frac{\partial^2}{\partial y^2}+\frac{\partial^2}{\partial z^2} [2]

Consideremos ahora un campo vectorial, que es una función F(x,y,z) que asigna a cada punto del espacio un vector, seria un ejemplo el campo de velocidades del aire en la atmósfera. Si realizamos el producto escalar del operador gradiente con el vector de campo F obtenemos el denominado rotacional de F:

\overrightarrow{Rot}\left(\overrightarrow F\right)=\overrightarrow\nabla\times\overrightarrow F=\left(\frac{\partial F_z}{\partial y}-\frac{\partial F_y}{\partial z},\frac{\partial F_x}{\partial z}-\frac{\partial F_z}{\partial x},\frac{\partial F_y}{\partial x}-\frac{\partial F_x}{\partial y}\right) [3]

que es obviamente un vector; observemos que si invertimos el orden del producto vectorial, F x Grad, no obtenemos un vector sino un operador diferencial: aplicar el gradiente a un camo escalar, y al vector gradiente resultante lo multiplicamos vectorialmente por el campo F.

Hemos visto que el operador gradiente está relacionado con las direcciones de máxima variación de un campo escalar, y no hay gran misterio en ello, al ser perpendicular a las líneas de nivel y por tanto seguir la dirección de variación más rápida. Pero además veremos que tiene otras aplicaciones fundamentales para la Física, al estar también relacionado con la cantidad de flujo de una magnitud a través de superfícies y volúmenes (como el calor, la radiación, un líquido, etc).

Flujo de un campo vectorial. Teorema de Gauss

Para fijar ideas imaginemos que el campo escalar de la figura 1 nos da las temperaturas T(x,y) en una superficie, y las curvas de nivel son curvas isotermas; como tenemos temperaturas distintas, habrá flujo de calor desde las zonas más calientes a las más frías: el flujo tiene una dirección y un sentido contrario al gradiente de temperatura, podemos pues definir el vector flujo de calor q asignándole una magnitud igual al incremento de calor por unidad de longitud, \frac{\triangle Q}{\triangle s}, y sentido inverso al vector gradiente de temperatura, \overrightarrow\nabla T, (ver figura 2) esto es:

\overrightarrow q=\frac{\triangle Q}{\triangle s}\;\frac{\overrightarrow\nabla T}{\left|\overrightarrow\nabla T\right|}=\frac{\triangle Q}{\triangle s}\widehat e

Fig. 2: El flujo de calor ΔQ por unidad de longitud a través de un pequeño segmento Δs, ΔQ/Δs, define el módulo del vector flujo de calor q de dirección igual al gradiente de temperatura pero con sentido contrario.
Fig. 3: elemento de superficie formando un ángulo con el gradiente de temperatura

En el caso de un campo T(x,y,z) en el espacio, el flujo de calor lo tomamos a través de la unidad de superficie. En la figura 2 para T(x,y) hemos tomado Δs sobre una curva de nivel T = constante y si T depende de x,y,z hubiéramos tomado Δs sobre una superficie de nivel (región del espacio tal que T es constante), pero podemos considerar un Δs cualquiera formando un ángulo con el gradiente (figura 3), llamando n al vector unitario normal al elemento Δs obtenemos el flujo de calor a través de Δs con el producto escalar q·n.

Si consideramos que el elemento Δs es infinitesimal, ds, y recubrimos con tales elementos una superficie S, el flujo total de calor a través de esa superficie será \Phi=\int_S\overrightarrow q\cdot\widehat n\cdot\operatorname ds, y el vector q juega el papel en esa integral de vector de densidad de flujo. Cuando la superfície S es cerrada, encierra en su interior un volumen V, y el flujo total de calor a través de S nos da la variación de energía térmica en el volumen V; en estas condiciones es de aplicación un teorema de cálculo diferencial: el teorema de Gauss,

\Phi=\oint_S\overrightarrow v\cdot\widehat n\cdot\operatorname ds=\int_V\triangle\overrightarrow v\cdot dV [4]

que leemos así: el flujo total de un vector v a través de una superficie cerrada es igual a la divergencia del vector integrada sobre el volumen V limitado por S. Hemos usado un vector v cualquiera porque el teorema es cierto para cualquier campo vectorial v(x,y,z), y en particular para el vector flujo de calor q.

Circulación de un vector, teorema de Stokes

Fig. 4: circulación de v a lo largo de C

Consideremos ahora un campo vectorial v(x,y,z) y una curva cerrada C suave (sin aristas, y por tanto diferenciable), en la figura 4 tomamos es una elipse pero puede ser cualquier curva suave; escojamos un sentido de recorrido de la curva y dividamos C en segmentos infinitesimales ds, en cada uno de ellos, situados en un punto (x,y,z) de C, tendremos un valor del vector v. Si definimos el vector ds como el de módulo ds y dirección la de la tangente a la curva en ese punto, podemos multiplicar escalarmente los vectores ds y v en cada punto, y sumar los productos a lo largo de toda la curva C, o sea integrar, para obtener la circulación del vector v a lo largo de C.

\Phi=\oint_C\overrightarrow v\cdot\operatorname d\overrightarrow s [5]

Fig. 5: camino C cerrado, cuadrado, para el cálculo de la circulación

Consideremos el caso particular de que C es un cuadrado “pequeño” que encierra una superficie Δs (figura 5) y tiene lados Δx, Δy. Recorramos C en la dirección marcada por las flechas, en sentido contrario a las agujas del reloj (es el sentido estándard) y calculemos la circulación de un vector \overrightarrow v=\left(v_x,v_y\right) obteniendo el producto v·Δs en cada arista del cuadrado, teniendo en cuenta que en cada arista la dirección de Δs es constante. El que sea pequeño el cuadrado significa que sus dimensiones Δx, Δy no son infinitesimales, de forma que los valores de v son distintos en cada arista, pero al mismo tiempo seran válidas las aproximaciones

\overrightarrow v\left(3\right)\approx\overrightarrow v\left(1\right)+\frac{\partial\overrightarrow v\left(1\right)}{\partial y}\triangle y,\;\overrightarrow v\left(2\right)\approx\overrightarrow v\left(4\right)+\frac{\partial\overrightarrow v\left(4\right)}{\partial x}\triangle x

que provienen del desarrollo en serie de Taylor de la función v(x,y) truncada hasta el término de primer orden (aproximación lineal).

Lado 1: \overrightarrow v\left(1\right)\cdot\triangle s_1=\left(v_x\left(1\right),v_y\left(1\right)\right)\cdot\triangle x\cdot(1,0)=v_x\left(1\right)\triangle x

Lado 2: \overrightarrow v\left(2\right)\cdot\triangle s_2=\left(v_x\left(2\right),v_y\left(2\right)\right)\cdot\triangle y\cdot(0,1)=v_y\left(2\right)\triangle y

Lado 3: \overrightarrow v\left(3\right)\cdot\triangle s_3=\left(v_x\left(3\right),v_y\left(3\right)\right)\cdot\triangle x\cdot(-1,0)=-v_x\left(3\right)\triangle x

Lado 4: \overrightarrow v\left(4\right)\cdot\triangle s_2=\left(v_x\left(4\right),v_y\left(4\right)\right)\cdot\triangle y\cdot(0,-1)=-v_y\left(4\right)\triangle y

Sumando todo nos queda \Phi=\left(v_x\left(1\right)-v_x\left(3\right)\right)\triangle x+\left(v_y\left(2\right)-v_y\left(4\right)\right)\triangle y,, aplicamos la aproximación de primer orden de Taylor:

\Phi=\left(v_x-v_x-\frac{\partial v}{\partial y}\triangle y\right)\triangle x+\left(v_y+\frac{\partial v}{\partial x}\triangle x-v_y\right)\triangle y=\left(\frac{\partial v}{\partial x}-\frac{\partial v}{\partial y}\right)\triangle x\triangle y

que podemos expresar como operador:

Si hubiéramos desarrollado la circulación en tres dimensiones (x,y,z) la expresión seria

El determinante al desarrollarlo coincide con el rotacional del vector:

Rot\left(\overrightarrow v\right)=\nabla\times\overrightarrow v=\left(\frac{\partial v_z}{\partial y}-\frac{\partial v_y}{\partial z},\frac{\partial v_x}{\partial z}-\frac{\partial v_z}{\partial x},\frac{\partial v_y}{\partial x}-\frac{\partial v_x}{\partial y}\right)

Por tanto para tres dimensiones se cumple que la circulación de un vector a lo largo de un cuadrado elemental C es igual al producto del rotacional del vector por el área del cuadrado: \Phi=\sum_i\overrightarrow{v_i}\cdot\operatorname d\overrightarrow{s_i}=\nabla\times\overrightarrow v\operatorname ds [6].

Si imaginamos un cuadrado formado por n cuadrados pequeños, y miramos la circulación por todos ellos, observaremos que los lados que coinciden anulan la circulación entre sí (figura 6).

Fig.6: unión de caminos elementales y circulación en cada uno

Por ello si en cada cuadrado elemental se cumple la ecuación [6], también se cumplirá para el cuadrado mayor. Para una superficie S cualquiera delimitada por una curva C cerrada podemos imaginar que la recubrimos con cuadrados elementales, de forma que la circulación total por C es también la suma de circulaciones elementales, que expresamos como integral, en la ecuación conocida como Teorema de Stokes: la circulación de un vector a lo largo de un camino cerrado C es igual a la integral sobre la superficie S contenida por del rotacional del vector:

\Phi=\oint_C\overrightarrow v\cdot\operatorname d\overrightarrow s=\int_S\nabla\times\overrightarrow v\operatorname ds [7].

La deducción anterior no es rigurosa, lo que nos interesa es ver la relación entre el operador rotacional y la circulación de un vector por un camino cerrado.

Campos conservativos y potenciales escalares

Una propiedad importante de los operadores es que el rotacional de un gradiente es siempre cero: Rot\left(\overrightarrow{Grad}\right)=\nabla\times\nabla=0 que puede verse como la consecuencia de que el producto vectorial de un vector por sí mismo es cero. Segun el teorema de Stokes [7] la circulación sobre una curva cerrada C de un vector gradiente habrá de ser también cero: \int_S\nabla\times\nabla q\operatorname ds=0=\oint_C\overrightarrow q\cdot\operatorname d\overrightarrow s=\Phi. Nos podemos preguntar que tipos de campos vectoriales proporcionan una circulación nula por cualquier camino cerrado C, tal como sucede con los vectores gradientes. El cálculo diferencial nos asegura que todo campo vectorial con circulación nula para cualquier camino cerrado C es el vector gradiente de un campo escalar al que llamamos potencial escalar (o simplemente potencial). El campo vectorial que es un gradiente de un potencial y por tanto tiene rotacional nulo y circulación nula se llama campo conservativo.

Fig. 7: dos caminos para ir del punto A al B en un campo gravitatorio

Ejemplo 1: Trabajo de una fuerza. El trabajo realizado por una fuerza F actuando sobre una masa m a lo largo de una trayectoria C toma la misma forma que la circulación del vector fuerza a lo largo de C: W=\int_C\overrightarrow F\cdot\operatorname d\overrightarrow s [8]; si la curva C no es cerrada, el trabajo no tiene por que ser nulo, pero ¿que sucede si C es un ciclo que empieza y acaba en el mismo punto? En el caso del campo vectorial gravitatorio g=(0,0,-g) si la fuerza F trabaja contra ese campo, sólo efectuará trabajo no nulo la componente vertical de F, y será un trabajo igual a menos el trabajo del campo gravitatorio. En la figura 7 vemos dos caminos distintos para ir desde el punto A al B en un campo gravitatorio; descomponiendo la integral [8] en suma de integrales para cada tramo 1234567, los tramos horizontales 1357 al ser perpendiculares a la gravedad no aportan trabajo, y los verticales 246 al ser paralelos a la gravedad aportan W=-\int_{tramo\;i}m\left(0,0,-g\right)\cdot\operatorname d\overrightarrow s=-mg\int_{tramo\;i}\operatorname d\overrightarrow s=-mg\cdot altura\;tramo\;i sumando todos los tramos nos queda el trabajo total W = -mgh siendo h la diferencia de altura entre A y B. Evidentemente por el camino alternativo 11’2′ encontramos lo mismo: el trabajo efectuado por el campo gravitatorio entre dos puntos sólo depende de la diferencia de altura entre los puntos y no del camino recorrido. Por tanto si ejercemos la fuerza F en un ciclo cerrado que empieza y acaba en el mismo punto A, el trabajo deberá de ser nulo, y por definición la circulación de F también: el campo gravitatorio es un campo conservativo y el vector fuerza gravitatoria será igual al gradiente de un potencial: \overrightarrow F=(0,0,-g)=\nabla\psi, además, el rotacional del campo gravitatorio ha de ser nulo. El potencial gravitatorio resulta ser \psi\left(x,y,z\right)=-mgz.

Ejemplo 2: campo electrostático. El campo electrostático E generado por un conjunto de cargas estáticas es también conservativo, verificando Rot x E = 0; y existe un potencial electrostático A(x,y,z) tal que E = Grad(A). En cambio si las cargas estan en movimiento el campo E deja de ser conservativo, y se cumple una de las ecuaciones de Maxwell del electromagnetismo, Rot\left(\overrightarrow E\right)=-\frac{\partial\overrightarrow B}{\partial t} siendo B el campo magnético generado por las cargas en movimiento; además la circulación del campo E en torno a un bucle cerrado no será nula.

Potencial vector

Hemos visto que si el rotacional de un campo vectorial v es cero, entonces ese campo es igual a gradiente de algun campo escalar A que denominamos el potencial escalar de v. La idea provenia del hecho de que Rot (Grad A) = 0 para cualquier campo escalar A. Por otro lado la divergencia del rotacional también es siempre cero, \overrightarrow\nabla\cdot\overset\rightharpoonup\nabla\times\overrightarrow v=0, intuitivamente vemos que el producto vectorial de por v es un vector perpendicular a ámbos, y por tanto su producto escalar por ha de ser nulo. Nos preguntamos si es un resultado general el que si la divergencia de un vector v es nula, entonces ese vector es el rotacional de otro vector w, la respuesta es afirmativa, y llamamos al vector w el potencial vector de v.

Si ·v = 0, entonces existe un w tal que v = X w.

Ejemplo 3: potencial vector electromagnético. El campo magnético B verifica la ecuación de Maxwell ·B = 0, luego existe un potencial vector A tal que B = Rot (A) denominado potencial vectorial electromagnético.

Ejemplo 4: Ecuación diferencial de la hidrostática. La hidroestática estudia las leyes físicas de los fluidos en equilibrio estático; consideremos el interior de un fluido en el que hay unas presiones variables que pueden representarse mediante un campo escalar p(x,y,z), e imaginemos un elemento de volumen de lados ∇x, ∇y, ∇z y volumen ∇x∇y∇z = ∇V, sometido a presiones externas en sus caras (figura 8).

Fig. 8: elemento de volumen de fluido sometido a presión

La presión dado que el elemento es pequeño podemos considerar que es la misma para cada cara y aplicada en el centro, pero ligeramente diferente entre caras; así, segun el eje X de coordenadas, y dadas la presiones de sentido contrario p, p’, podemos expresar la segunda en función de la primera por p'=p+\frac{\partial p}{\partial x}\triangle x. Nos fijamos ahora en las fuerzas generadas por las presiones p y p’ que son, respectivamente F = p·∇x∇y y F’ = p’·∇x∇y, la suma de fuerzas en la dirección X será F – F’, que es:

F-F'=p\triangle y\triangle z-\left(p+\frac{\partial p}{\partial x}\triangle x\right)\triangle y\triangle z=-\frac{\partial p}{\partial x}\triangle x\triangle y\triangle z=-\frac{\partial p}{\partial x}\triangle V,

pero en las direcciones Y y Z tendremos expresiones similares, pues la presión se ejerce en todas las caras del elemento de volumen. El vector fuerza que actúa sobre el volumen será, teniendo en cuenta sus tres componentes,

\overrightarrow F=\left(-\frac{\partial p}{\partial x}\triangle V,-\frac{\partial p}{\partial y}\triangle V,-\frac{\partial p}{\partial z}\triangle V\right)-=\left(\frac{\partial p}{\partial x},\frac{\partial p}{\partial y},\frac{\partial p}{\partial z}\right)\triangle V=-\overrightarrow\nabla p\cdot\triangle V. [9]

Consideremos que además de la presión actuan sobre el fluido otras fuerzas conservativas, como la gravedad, que representamos en conjunto por un potencial φ(x,y,z) que para simplificar las expresiones suponderemos que es un potencial por unidad de masa (se obtiene dividiendo el potencial por la masa); observemos que la fuerza [9] dividida por el volumen V se convierte en una fuerza por unidad de volumen y vale \overrightarrow{F_v}=-\overrightarrow\nabla p, y por otro lado multiplicando el potencial por unidad de masa por la densidad del fluido ρ obtendremos el potencial por unidad de volumen, así pues la fuerza total por unidad de volumen la podemos expresar por \sum_{}F=-\overrightarrow\nabla p-\rho\overrightarrow\nabla\varphi. Esta fuerza ha de ser cero si el fluido está en equilibrio, al espresarlo tenemos la ecuación diferencial de la hidrostática en condiciones de presión y de fuerzas conservativas:

\overrightarrow\nabla p+\rho\overrightarrow\nabla\varphi=0 [10],

y viene expresada en función de gradientes de campos escalares. Veamos ahora como los operadores diferenciales nos ayudan a ver las soluciones de tal ecuación; si aplicamos el operador rotacional a toda la expresión, recordando que es un operador lineal, que el rotaconal de un gradiente es cero, y que el rotacional del vector nulo es también cero, obtenemos:

Rot\left(\overrightarrow\nabla p+\rho\overrightarrow\nabla\varphi\right)=Rot\left(0\right)\Rightarrow Rot\left(\overrightarrow\nabla p\right)+Rot\left(\rho\overrightarrow\nabla\varphi\right)=0\Rightarrow Rot\left(\rho\overrightarrow\nabla\varphi\right)=0.

En general, para densidades variables segun la posición (x,y,z), esta última ecuación no se cumple, por ejemplo en los gases sometidos a presión y fuerzas conservativas en general, siendo los gases fácilmente compresibles las densidades variarán de forma que habrá movimiento del gas, no habrá equilibrio estático. En el caso de un líquido, mucho más difícil de comprimir, si consideramos que tiene un densidad constante entonces podemos sacarlo fuera del operador rotacional y entonces la condición de equilibrio se cumple siempre: Rot\left(\rho\overrightarrow\nabla\varphi\right)=0\Rightarrow\rho\cdot Rot\left(\overrightarrow\nabla\varphi\right)=0\Rightarrow\rho\cdot0=0. En este caso la condición [10] implica la igualdad entre gradientes \overrightarrow\nabla p=-\rho\overrightarrow\nabla\varphi que se cumplirá siempre que p+\rho\varphi=\; constante que es la ecuación de equilibrio del fluido para densidad constante.

Publicado en Fí­sica, Matemáticas | Etiquetado , , , , , , , , , , , | Deja un comentario

Campo eléctrico

Vector campo eléctrico

En electrostática se estudia la fuerza que se ejercen mutuamente dos cargas eléctricas puntuales Q, Q’ entre ellas; si fijamos sólo en una de las cargas, digamos la Q, nos damos cuenta de que si colocamos cualquier carga Q’ en cualquier posición del espacio que rodea a Q, se ejercerá una fuerza sobre Q’, es como si el espacio que rodea a Q tuviera una nueva propiedad, la de ejercer una fuerza sobre cualquier carga Q’ en cualquier posición que la situemos.

Situemos una pequeña carga de prueba q de valor conocido en cualquier posición del espacio dada por el vector de posición v; si vemos que se ejerce una fuerza F (un vector) sobre la carga por el simple hecho de estar situada en ese punto, inferimos que el espacio está afectado por alguna otra carga Q desconocida que crea ese efecto, y entonces se cumplirá la ley de Coulomb,

F = r·k·qQ/r³ [1]

donde r es el vector de posición de q relativo a Q. La figura 1 muestra las cargas q, Q, sus vectores de posición v, w, el vector de posición relativo de q a Q, r = v – w, y la fuerza resultante F, en la dirección de r, que se supone repulsiva (las cargas son del mismo signo y se repelen entre sí).

Fig.1: fuerza electrostática entre dos cargas

Asumiendo el punto de vista de que el espacio alrededor de Q está afectado por esa carga, pues se ejerce una fuerza a distancia sobre cualquier carga q en cualquier posición v, podemos definir un vector E tal que la fuerza ejercida sobre cualquier carga q sea simplemente F = qE a partir de la expresión [1]:

E = k(r/)·Q [2]

Este vector se denomina vector campo eléctrico, y no depende de la carga de prueba q, sólo de la carga causante Q. Si tomamos dos cargas de prueba q, q’, y medimos los vectores fuerza F, F‘, buscando la intersección de las rectas soporte de las fuerzas encontraremos el origen del campo: la posición de la la carga Q que lo genera (figura 2). Además, la magnitud de la fuerza F, conocida la carga q, nos determina también la carga Q a través de la ecuación [1], y por tanto nos determina el campo E.

Fig.2: dos cargas de prueba q, q’ determinan el origen del campo eléctrico, la carga Q, y el vector campo E

La propiedad de que todas las rectas soportes de las fuerzas electrostáticas se corten en un punto se puede expresar diciendo que el campo eléctrico es un campo central pues todas las fuerzas parten de un punto central del espacio.

En Física se utiliza el concepto campo para describir cómo se “reparte” una magnitud física medible por el espacio; así, podemos hablar de campos eléctricos, campos magnéticos, e incluso de campos de velocidades en un fluido. Si la magnitud es escalar, el campo lo será, si es vectorial, el campo es vectorial, y si la magnitud es un tensor, el campo será tensorial. La matemática específica para describir campos se ha estudiado en profundidad, dando lugar a la rama de la Física Matemática conocida como Teoría de Campos.

Campo eléctrico producido por varias cargas puntuales

Fig.3: las líneas del campo eléctrico de una única carga puntual son rectas que se cortan en la carga

En el caso de una única carga puntual hemos visto que todas las las rectas soportes de las fuerzas, rectas que llamaremos líneas de fuerza del campo o simplemente líneas del campo  parten de un punto central donde se sitúa la única carga (fig. 3).

¿Qué pasa con las líneas si el campo es generado por dos cargas? Dado que la fuerza electrostática es acumulativa (se suman las contribuciones de todas las cargas) el campo eléctrico E también lo será, y en cada punto del espacio se sumaran los vectores de campo correspondientes a cada carga. Además, la fuerza F y el campo E decrecen con el cuadrado de la distancia, por ello, las líneas del campo se curvan; por cada punto del espacio pasa una línea de campo, de tal modo que el campo eléctrico en ese punto es tangente a la línea. En la figura 4 se representan dos cargas positivas iguales, y una pequeña carga de prueba en la que se suman los dos vectores E, E’ generados por las fuentes del campo. Los vectores resultantes no apuntan a ningún centro, el campo resultante deja de ser central, y las líneas de campo (en color negro en la figura) se curvan.

Fig. 4: campo y lineas de campo generadas por dos cargas puntuales iguales

Hay que tener en cuenta que toda carga generará su propio campo eléctrico que se superpondrá a los ya existentes; por ello en lo expuesto hasta ahora hablamos de colocar “cargas de prueba” que se suponen mucho menores que las cargas generadoras del campo, de forma que se puede despreciar su contribución. Además, las cargas fuente, incluso siendo de mucha mayor magnitud que las de prueba, se supone que son de dimensiones puntuales para evitar complicaciones matemáticas.

Campo del dipolo eléctrico

Un caso particular importante es el del denominado dipolo eléctrico, que son dos cargas de igual magnitud q y de signo contrario separadas por una distancia d pequeña (fig. 5).

Fig. 5: líneas de campo producidas por un dipolo eléctrico, fuente: By Geek3 [GFDL (http://www.gnu.org/copyleft/fdl.html) or CC BY-SA 3.0 (https://creativecommons.org/licenses/by-sa/3.0)], from Wikimedia Commons

Se define el momento eléctrico del dipolo, p, por el vector

p = qd, [3]

siendo d el vector que parte de la carga negativa y acaba en la carga positiva. La distancia d se supone que es mucho menor que las distancias a las cuales colocaremos las cargas de prueba donde mediremos el campo E, ello permite simplificar su expresión matemática, que se obtiene de sumar las contribuciones de cada carga al campo total, resultando ser:

\boldsymbol E=qk\left(3\frac{d\cos\left(\theta\right)}{r^4}\boldsymbol r-\frac{\boldsymbol d}{r^3}\right) [4]

donde r es el vector que parte del punto central del dipolo (entre sus dos cargas); alternativamente, usando [3]:

\boldsymbol E=k\left(3p\frac{d\cos\left(\theta\right)}{r^4}\boldsymbol r-\frac{\boldsymbol p}{r^3}\right) [5]


Ejemplo 1: Situamos una carga de +10⁻³C en el origen de coordenadas, y otra carga de -10⁻³C en el punto (1, 0, 0). Calcular el campo eléctrico en el punto P(0.5, 1, 1). Si colocamos en ese punto una pequeña carga de +10⁻⁶C, ¿qué fuerza ejercerá el campo sobre ella?

El campo E’ debido a la primera carga será, aplicando [2]:

\begin{array}{l}E'=k\cdot\lbrack{(0.5,1,1)-(0,0,0)}/\sqrt{(0.5²+1²+1²)\rbrack}^3\cdot(10⁻³)=\\\;(0.5,\;1,\;1)\cdot\frac{10⁻³k}{\left(3/2\right)^3}\end{array}

Para la segunda carga:

\begin{array}{l}E''=k\cdot\lbrack{(0.5,1,1)-(1,0,0)}/\sqrt{(0.5²+1²+1²)\rbrack}^3\cdot(-10⁻³)=\\-\;(-0.5,\;1,\;1)\cdot\frac{10⁻³k}{\left(3/2\right)^3}\end{array}

El campo total será la suma de los anteriores:

E=10^{-3}k\left(\frac23\right)^3\left(1,0,0\right).

La fuerza ejercida sobre la carga de prueba q viene dada por  F = qE:

\boldsymbol F=q\boldsymbol E=10^{-6}\cdot10^{-3}\cdot k\left(\frac23\right)^3\left(1,0,0\right)=9\cdot\cancel{10^9}\cdot\bcancel{10^{-9}}\frac8{27}\left(1,0,0\right)=\left(1,0,0\right)

una fuerza de 1 Newton en la dirección del eje X.


Campo eléctrico creado por una distribución de cargas

Cuando en vez de cargas puntuales tenemos cuerpos materiales cargados los modelamos como si contuvieran cargas puntuales distribuidas por el cuerpo, de forma que el campo eléctrico producido por el cuerpo se obtiene sumando las contribuciones de las cargas puntuales; dependiendo de la forma matemática que demos a la distribución, la suma puede ser más o menos directa, sencilla, o complicada. En el caso límite, que es de hecho el habitual, en el que consideremos que hay una infinidad de cargas puntuales será necesario usar el cálculo diferencial y el integral.

Campo eléctrico creado por una distribución de cargas plana y homogénea

El caso más sencillo de distribución de infinidad de cargas puntuales es el de una barra delgada de longitud 2L que tiene cargas sólo en una cara y además están distribuidas de forma uniforme; llamemos ρ a la densidad de carga eléctrica por unidad de longitud, que evidentemente será ρ = Q/2L siendo Q la carga total de la barra. y limitémonos a calcular al campo eléctrico en un punto P situado sobre la bisectriz de la barra, a una altura h:

Fig. 6: geometría para el cálculo del campo E producido por una línea homogénea de carga en un punto situado sobre la bisectriz de la línea

Tomando un elemento diferencial de longitud dx y situado a una distancia x del centro de la barra, por la geometría del problema vemos que la distancia r² será igual a x² + h², y la carga diferencial de ese elemento será dQ =  ρ·dx, por ello el campo diferencial creado por ese elemento en el punto P (punto azul en la figura) tendrá un módulo

\operatorname dE_1=k\frac{dQ}{r^2}=k\frac{\rho\cdot dx}{x^2+h^2}

Dada la situación simétrica el punto P con respecto a la barra, existirá otro elemento dx situado en -x que producirá un campo diferencial dE_2 tal que al sumar los vectores dE_1 con dE_2 se anularan las componentes horizontales y la resultante será vertical, dE con un módulo:

\operatorname dE=\operatorname dE_1\sin\left(\theta\right)+\operatorname dE_2\sin\left(\theta\right)=2\cdot k\frac{\rho\cdot dx}{x^2+h^2}\cdot\sin\left(\theta\right)

Esto sucederá a lo largo de toda la barra, por ello concluimos que el campo resultante ha de ser vertical. Tenemos ahora que sumar todas las contribuciones diferenciales a lo largo de la barra:

E=\int_0^L\operatorname dE=2k\int_0^L\frac{\rho\cdot dx}{x^2+h^2}\cdot\sin\left(\theta\right)

Notemos que los límites de integración son [0, L] y no [-L, L] pues para cada elemento dx a la derecha de la barra (en x) ya hemos sumado la contribución del elemento simétrico a la izquierda (en -x). Teniendo en cuenta que \sin\left(\theta\right)=\frac hr=\frac h{\sqrt{x^2+h^2}} llegamos a la integral

E=2k\int_0^L\frac{\rho\cdot dx}{x^2+h^2}\cdot\frac h{\sqrt{x^2+h^2}}=2kh\rho\int_0^L\frac{dx}{\left(x^2+h^2\right)^{3/2}}

Sin entrar en detalles del cálculo de la integral (podemos calcularla por ejemplo usando WolframAlpha), nos quedará:

E=2kh\rho\frac L{h^2\sqrt{h^2+L^2}}=\frac{2k\rho L}{h\sqrt{h^2+L^2}}

En el caso de que la barra sea muy larga comparado con la distancia h, o sea L >> h, podemos simplificar el valor del campo:

\lim_{L\rightarrow\infty}E=\frac{2k\rho}h\lim_{L\rightarrow\infty}\frac L{\sqrt{h^2+L^2}}=\frac{2k\rho}h [6]

El valor del campo variará según 1/h.


Flujo del campo vectorial. Ańgulo sólido

En el apartado anterior hemos visto que incluso en un caso simple (línea unidimensional de carga, homogénea, campo en un punto de la bisectriz…) cuando calculamos campos debidos a distribuciones continuas de cargas en seguida aparecen integrales complicadas, o muy complicadas. En este apartado y el siguiente vemos un punto de vista de la cuestión basado en la geometria que a menudo simplifica mucho los cálculos,

Consideremos un campo vectorial central, que es aquel que hace corresponder a cada punto P del espacio un vector V que sigue la dirección OP, siendo O el centro del campo, un punto fijo (figura 7).

Fig.7: Campo central, la masa agente situada en O

El caso especial de la forma V = r·c/r² donde r es el módulo de OP (la distancia al centro del campo), r el vector unitario que indica la dirección de OP, y c es una constante que denominamos masa agente del campo; se denomina campo newtoniano. Son campos newtonianos el campo electrico, el campo magnético y el campo gravitatorio. Vamos a definir el flujo del campo vectorial a través de una superfície infinitesimal dS, que denominamos d\phi, como el producto escalar V·dS, donde dS es el vector perpendicular a la superfície; siendo dS infinitesimal (muy pequeña), consideraremos que su curvatura es despreciable, y por tanto es plana (figura 8):

Fig. 8: elemento diferencial de superficie, vector dS, y campo vectorial V que suponemos pasa por el centro de la superficie

\operatorname d\phi=V\cdot dS=V\cdot dS\cdot\cos\left(\theta\right) [7]

Definamos a continuación el ángulo sólido de la superficie dS con respecto al origen del campo central O. Unamos los extremos de la superficie dS con el punto O usando líneas OP, y definamos una esfera C de radio 1 con centro en O; las lineas OP cortaran a la esfera definiendo sobre ella una pequeña superficie dΩ a la que llamamos ángulo sólido de dS sobre C (figura 9).

Fig. 9: ángulo sólido subtendido sobre la esfera C por el elemento de superficie dS

Veamos ahora una propiedad geometrica de los campos newtonianos: el flujo del campo a través de dS es:

\operatorname d\phi=V\cdot dS=V\cdot dS\cdot\cos\left(\theta\right)=\frac c{r^2}dS\cdot\cos\left(\theta\right)=\frac c{r^2}dS' [8]

donde hemos igualado dS\cdot\cos\left(\theta\right)=dS', que es la proyección de la superficie dS sobre la perpendicular al vector de campo V. Las superficies dS’ y dΩ (Fig. 10) son paralelas, y están unidas por las mismas rectas al punto central O, se cumple entonces que la razón de sus áreas es igual a la razón de sus distancias al centro O al cuadrado:

Fig. 10: dS’ y dΩ son paralelas, y están unidas por las mismas rectas al punto central O

\frac{\operatorname d\phi}{dS'}=\frac1{r^2}\Leftrightarrow dS'=r^2\operatorname d\phi

Si no ve el por qué el lector, piense que el área de la esfera es 4πr², el área de la esfera unitaria es 4π, y el área de una esfera que pase por dS’ es 4πr², luego la razón de áreas es 4πr² : 4π = r². Usando esta proporción en la ecuación [8] obtenemos:

\operatorname d\phi=\frac c{r^2}r^2\cdot d\Omega=c\cdot d\Omega [9]

que nos dice que el flujo del vector campo newtoniano a través de una superficie diferencial cualquiera no depende de la distancia r, y es directamente igual al producto de la masa agente del campo por el ángulo sólido subtendido por la superficie sobre la esfera unidad centrada en el origen del campo.

Flujo del campo a traves de superficies cerradas

El producto escalar definido en [7] puede ser positivo o negativo dependiendo de la orientación relativa de los vectores campo V y dS; consideremos una superficie cerrada S, pdemos calcular el flujo total del campo a través de S integrando para cada elemento dS:

\phi=\int_S\operatorname d\phi=\int_SV\cdot dS  [10]

Si el flujo total es positivo, diremos que es un flujo entrante en S, y si es negativo, será un flujo saliente de S. Si el centro del campo O está en el exterior de S, las lineas OP desde el centro que pasen por S cortaran a S en un número par de puntos; en cambio si O está en el interior de S, las lineas cortaran a S en un número impar de puntos (figura 11).

Fig.11: flujos provenientes del centro O a través de superficies cerradas

Por tanto en el caso exterior cada linea creará una sucesión de flujos entrante-saliente-entrante-saliente-etc en número par, o sea, de flujos positivos y negativos alternados; hemos visto que el flujo no depende de la distancia al centro (ecuación [9]) sino sólo del ángulo sólido subtendido, que será el mismo para cada elemento de superficie sobre las lineas que parten de O. Por ello, para un punto O exterior, los flujos entrantes y salientes tienen el mismo valor y se anulan entre sí, resultando un flujo total nulo:

En un campo newtoniano, el flujo total a través de una superficie cerrada que no contiene al centro del campo es nulo.

En cambio si la superficie contiene al centro del campo tendremos un número impar de flujos entrantes-salientes, y su suma no se anulará; de hecho su valor viene dado por el teorema de Gauss, que se deriva de las ecuaciones [9] y [10]:

\phi=\int_S\operatorname d\phi=\int_Sc\cdot\operatorname d\Omega=c\cdot\int_S\operatorname d\Omega=4\pi c  [11]

Expresado en palabras:

En un campo newtoniano, el flujo total a través de una superficie cerrada que contiene al centro del campo es igual a 4\pi multiplicado por el valor de la masa agente.

En el caso del campo eléctrico, la masa agente vale k·Q, siendo Q la carga eléctrica.

Si tenemos un conjunto de cargas, cada carga creará su flujo de campo, y el flujo total será la suma de todos ellos.

Campo creado por una distribución infinita de cargas, plana y homogenea, usando el teorema de Gauss

Como ejemplo de la utilidad del concepto de flujo de campo y del teoriema de Gauss calcularemos el campo electrico creado por una placa cargada uniformemente, que supondremos de extensión muy grande, sobre un punto P situado a una altura h del plano.  Imaginemos otro punto P’ situado al otro lado del plano, simétrico a P, y pensemos en un cilindro con eje PP’ y de àrea superior dS (en la figura 12 vemos una vista lateral del plano cargado y de la situación).

Fig. 12: usando el teorema de Gauss para calcular el campo eléctrico E

Por simetría el campo E ha de ser vertical y en las direcciones indicadas en la figura; los vectores dS normales a las bases del cilindro tendrán la misma dirección que E, luego el producto escalar resultante, teniendo en cuenta que no habrá flujo de E en las paredes laterales del cilindro por ser paralelas al campo (luego el vector normal a las paredes es perpendicular a E y su producto escalar, nulo) es \operatorname d\phi=E\cdot dS+E\cdot dS=2E\cdot dS.  Si llamamos \sigma a la densidad de carga por unidad de superfície de la placa, la carga encerrada dentro del cilindro será \operatorname dQ=\sigma\cdot\operatorname dS. Por el teorema de Gauss, el flujo ha de ser entonces \operatorname d\phi=4\mathrm\pi\cdot\mathrm k\cdot\mathrm\sigma\cdot\operatorname d\mathrm S; igualando las dos expresiones para el flujo obtenemos:

d\phi=4\pi k\sigma\cdot\cancel{dS}=2E\cdot\cancel{dS}\Leftrightarrow\boxed{E=2\pi k\sigma}

Vemos que la ingensidad de campo E creada por una placa infinita cargada homogéneamente no depende de la distancia h a la placa, un resultado notable.

Problemas

  1. Calcular el campo eléctrico producido por una esfera cargada con densidad de carga homogenea, tanto en el interior de la esfera como en el exterior.
  2. Una esfera  cargada con densidad de carga homogenea tiene una cavidad esférica en su interior, los centros de la esfera cargada y la cavidad estan a una distancia d. Calcular el campo electrico en la cavidad.

 


Soluciones

Problema 1 – En la figura vemos la geometría del problema: representamos una superficie esférica S interior y concéntrica  a la esfera cargada (en azul) y sobre S un punto cualquiera P, por la que trazamos una línea que pasa por el centro O y divide a las esferas en dos mitades simétricas; por simetría, el vector campo E(P) en el punto P no puede estar dirigido hacia ninguno de las dos mitades en particular, así que ha de ser radial. Además, el punto P podría ser cualquier punto situado en S pues tenemos simetría esférica, luego el módulo del campo E será el mismo en todo S, es decir, el valor de E depende sólo del radio de S.

Por simetría del problema respecto cualquier recta que pase por O, el campo E ha de tener el mismo módulo en toda esfera S interior, y ha de ser radial

Vamos a aplicar el teorema de Gauss a la superficie S: primero de todo damos forma matemática a las consideraciones anteriores sobre el campo E:

\overrightarrow E(P)=\frac1rE(r)\cdot\overrightarrow{OP},

o sea el vector campo E es igual al módulo E(r) por el vector radial OP dividido por el módulo de OP, que es r. Equivalentemente podemos definir el vector unitario radial \widehat r=\frac{\overrightarrow{OP}}r y la expresión del campo en todo punto P de S queda más compacto: \overrightarrow E(P)=E(r)\cdot\widehat r.

Ahora calculamos el flujo de E a través de la superfície S, aplicando [10]:

\phi=\int_S\operatorname d\phi=\int_S\overrightarrow E\cdot d\overrightarrow S=\int_SE\left(r\right)\widehat r\cdot d\overrightarrow S=E\left(r\right)\int_SdS=E\left(r\right)\cdot4\pi r^2

donde hemos aplicado que el elemento diferencial vectorial de superfície dS es un vector radial de módulo dS, y por tanto su producto escalar con el vector radial unitario es simplemente dS, además E(r) es constante sobre S, luego puede salir fuera de la integral, y esta integral sobre S del elemento dS es simplemente la superfície de la esfera S. Este flujo que hemos calculado, según el  teorema de Gauss [11], ha de ser igual a \phi=4\pi kQ, donde Q es la carga contenida en el volumen interior a S; llamando \rho a la densidad de carga por unidad de volumen, tenemos que:

Q=\int_V\rho\cdot\operatorname dV=\frac43\rho\pi r^3\Rightarrow\phi=4\pi k\cdot\frac43\rho\pi r^3=\frac{16}3k\rho\pi^2r^3 [12]

Igualando este flujo dado por el teorema de Gauss con el que hemos calculado antes, hallamos el módulo del campo E:

E(r)\cdot4\pi r^2=\frac{16}3k\rho\pi^2r^3\Rightarrow\boxed{E(r)=\frac43k\rho\pi r} [13]

Vemos que la dependencia E(r) es lineal: aumenta linealmente con r. En el sistema internacional de unidades la constante k se expresa en funcion de la denominada permitividad eléctrica del vacío \varepsilon_0, y el campo se reduce a

E(r)=\frac43\frac1{4\pi\varepsilon_0}\rho\pi r=\frac1{3\varepsilon_0}\rho r. [14]

Esta expresión vale para r\leq a, siendo a el radio de la esfera cargada. Para distancias r al centro de la esfera que sean mayores que el radio a el cálculo es muy parecido, sólo que el valor de la carga Q es constante, siendo la carga total de la esfera, Q=\frac43\pi a^3\rho, y al sustituirla en el teorema de Gauss, el flujo total a través de una superficie de radio r > a vale\phi=\frac43\pi a^3\rho\cdot4\pi k, igualando este flujo con el calculado vectorialmente:

\phi=\frac43\pi a^3\rho\cdot\cancel{4\pi}k=E\left(r\right)\cdot\cancel{4\pi}r^2\Leftrightarrow\boxed{E\left(r\right)=\frac43\pi\frac{a^3}{r^2}\rho k} [14b]

que en función de \varepsilon_0 valdrá

E\left(r\right)=\frac43\pi\frac{a^3}{r^2}\rho\frac1{4\pi\varepsilon_0}=\frac{\rho a^3}{3\varepsilon_0r^2}. [15]

O sea que en el interior de la esfera el campo E crece linealmente con la distancia a centro, y en el exterior decrece cuadráticamente:

Variación del campo E con la distancia r al centro en el caso de una esfera de radio a cargada uniformemente

Problema 2 – La complicación de este problema está en ver como tratar la cavidad dentro de la esfera; la forma más fácil consiste en darse cuenta de que la situación es equivalente, en cuanto al cálculo del campo E, a suponer que la esfera, de radio R y centro en O, está cargada uniformemente en su totalidad con una densidad de carga \rho, y que la cavidad es otra superficie esférica, de radio r < R y centro O’, a la que añadimos, superponiéndola, otra densidad de carga de igual valor pero signo contrario, -\rho, con ello, la carga neta en la cavidad será cero. Entonces, debido a que el campo electrico es acumulativo, podemos calcular el campo E por superposición del campo creado por toda la esfera de radio R, al que llamamos E_O, más el campo creado por la carga negativa en la esfera de radio r, al que llamamos E'_O. La geometría de este esquema lo vemos en la imagen, donde hemos dibujado un punto P cualquiera dentro de la cavidad, los dos campos generados en ese punto y el campo total.

Vectores E y geometria del problema

Para calcular cada campo aplicamos [13] pues el punto P es interior a las dos esferas consideradas:

\overrightarrow E\left(P\right)={\overrightarrow E}_O\left(P\right)+\overrightarrow E'_O\left(P\right)=\frac43k\pi\rho r\cdot\widehat r-\frac43k\pi\rho r'\cdot\widehat r'=\frac43k\pi\rho\left(r\cdot\widehat r-r'\cdot\widehat r'\right)

Tenemos que r\cdot\widehat r=\overrightarrow r,\;r'\cdot\widehat r'=\overrightarrow r' y observando la figura deducimos que r\cdot\widehat r-r'\cdot\widehat r=\overrightarrow r-\overrightarrow r'=\overrightarrow{OP}-\overrightarrow{O'P}=\overrightarrow{OO}'.  Por tanto nos queda la siguiente expresión para el campo en el interior de la cavidad:

\overrightarrow E\left(P\right)=\frac43k\pi\rho\cdot\overrightarrow{OO}'=\frac43k\pi\rho\cdot\overrightarrow d

Observemos que E es un vector constante dirigido según la recta OO’ (el vector d de módulo igual a la distancia d entre centros).

El campo en el interior de una cavidad dentro de una esfera uniformemente cargada es constante

Publicado en Electricidad y Magnetismo, Fí­sica | Etiquetado , , , , , , | Deja un comentario

Electrostática

Tales de Mileto (600 aC) observó que una barra de ámbar (una resina vegetal) frotada con fuerza atraía y levantaba objetos pequeños; en griego el ámbar se llama “elektron“, y de aquí vino que se llamara a estos fenómenos como “eléctricos”.  William Gilbert (siglo XVI) descubre que sucede lo mismo con otros materiales, a los que llama materiales eléctricos, que hoy en dia llamamos  materiales aislantes, los cuales presentan este fenómeno de electrización por frotamiento.

Dos tipos de electrización

Si frotamos dos varillas de vidrio y las acercamos nortaremos que se repelen mútuamente; lo mismo ocurre si lo hacemos con dos varillas de ámbar. En cambio si acercamos una varilla electrizada de vidrio y una de ámbar, se atraen.  Experimentalmente se encuentra que, dados dos materiales electrizados, algunos se repelen entre sí y otros se atraen; más aún, se pueden agrupar sólo en dos categorias: los que son atraidos por la varilla de vidrio y repelidos por la varilla de ámbar, y los que reaccionan al contrario. B. Franklin (siglo XVIII) llamó a estas categorias, de forma arbitraria, “positiva” (para las cargas similares a la del vidrio) y “negativa” (para las similares al ámbar). La experiencia probaba que electrificaciones del mismo signo se repelen y de distinto signo se atraen.

Creando péndulos con pequeñas masas electrificadas (fig. 1) se puede deducir la fuerza con que se atraen o repelen, midiendo la desviación de la verticalidad y sabiendo las masas.

Fig. 1: Dos péndulos con material electrificados del mismo signo se repelen entre sí

Supongamos que hemos realizado las mediciones de la fuerza F_A que un cuerpo A ejerce sobre otro C de distinto signo, y también la fuerzaF_B de otro cuerpo B sobre C, también de distinto signo (por tanto A y B deben de ser del mismo signo). Podemos conjeturar que si las fuerzas anteriores no son iguales en magnitud, debe de ser por que los materiales A y B no tienen la misma “cantidad de electrificación”, cantidad que llamaremos carga eléctrica, y simbolizaremos por Q. Entonces, la fuerza deberá ser proporcional a la carga, y al dividir las fuerzas entre sí se cumplirá la proporción

\frac{F_A}{F_B}=\frac{Q_A}{Q_B} [1]

Si ahora medimos la fuerza que ejercen A y B (unidos por ejemplo con cola) sobre C, encontraremos que es F_{A+B}=F_A+F_B (figura 2).

Fig. 2: Al añadir cuerpos cargados, la fuerza electrica aumenta en el mismo grado

Usando  la proporción [1] con la fuerza resultante obtenemos:

\frac{F_{A+B}}{F_B}=\frac{F_A+F_B}{F_B}=\frac{F_A}{F_B}+1=\frac{Q_A}{Q_B}+1=\frac{Q_A+Q_B}{Q_B} [2]

expresión que nos dice que el efecto de acumular el objeto con carga Q_A más el objeto con carga Q_B es el mismo que produciría un objeto con la carga Q_A+Q_B, es decir, que la carga es una magnitud física escalar, se pueden comparar cantidad de cargas, sumarlas, etc.

Ley de conservación de la carga eléctrica

Supongamos que henos frotado una varilla de vidrio con un paño suave para electrificarla con una carga Q_A que será positiva. Con instrumentos más precisos que el péndulo se puede medir que también el paño se ha electrificado, y lo ha hecho con una carga de igual magnitud pero de signo contrario a la de la varilla, -Q_A: antes de electrificar la varilla no había carga electrica, y después si consideramos el conjunto varilla + paño tampoco, pues la suma algebraica de cargas sigue siendo cero. Es un caso particular de la ley física de la conservación de la carga eléctrica:

En un sistema aislado la carga eléctrica permanece constante.

En general la materia es eléctricamente neutra; si un objeto adquiere una carga positiva será porque otro cuerpo se la ha cedido, adquiriendo carga negativa, y siendo la suma total de cargas cero.

Electrones ligados y electrones libres

Sabemos que la materia está constituida por átomos, con un núcleo cargado positivamente rodeado de una nube de electrones cargados negativamente; el núcleo es muy estable, y sólo puede verse afectado por reacciones nucleares o por desintegración natural, si es un elemento radiactivo, en cambio la nube de electrones es mucho más inestable, y es relativamente fácil extraer electrones de esa nube. Eso es lo que sucede al frotar un material aislante con un paño: algunos electrones, por efecto del frotamiento, “cambian de bando”, por ejemplo pasan de la varilla al paño, con el efecto de alterar la neutralidad de cargas, el material que pierde elecrones queda con carga neta positiva, y el que los recibe con carga negativa.

También sabemos que la carga eléctrica del electrón Q_e es la unidad básica de carga, no existen cargas inferiores. Por ello, se podrá expresar cualquier carga Q como un múltiplo de Q_e.

En los metales los átomos estan en un estado tal que algunos de sus electrones puede “saltar” con facilidad de un átomo a otro; la carga total sigue siendo neutra, pero esos electrones no estan fijados en un átomo en particular sino que se van moviendo por el material, por ejemplo debido a la agitación térmica de las moléculas, que las hace vibrar.  Son los electrones libres, o electrones de conducción.  Los demás electrones que están fijados a un átomo son los electrones ligados. Los materiales se consideran conductores si disponen de abundantes electrones libres y por el contrario aislantes si sus electrones son mayoritariamente ligados.

Al frotar el vidrio, la energía cinética que suministramos es suficientemente fuerte para arrancar algunos de sus electrones ligados, que pasan al paño, y el vidrio queda con déficit de electrones; en cambio al frotar ámbar, siendo sus electrones ligados más fijos que el vidrio, sucede lo contrario, algunos electrones del paño saltan al ámbar, cargándolo negativamente.  Si lo intentamos con una varilla de madera no conseguiremos que atraiga pequeños objetos, pues los electrones de la madera estan más ligados que los del vidrio y además no admite electrones externos, como sí hace el ámbar: decimos que la madera es muy aislante pues no se electrifica.

Electrificación por inducción

Fig.3: separación de cargas en el volumen de un conductor

Si acercamos un cuerpo A cargado, por ejemplo positivamente, a un conductor neutro, sus electrones libres seran atraídos cerca de A, formando una región cargada negativamente (figura 3). Habrá una región central de la que habrán salido electrones hacia la izquierda pero que también recibirán electrones de la derecha, quedando neutra, y habrá una región a la derecha que, como no hay más material a su derecha, habrá perdido electrones y quedará cargada positivamente. Si acercamos un tercer cuerpo C por ejemplo con carga positiva, veremos que es repelido por el metal. Al retirar el cuerpo A, los electrones del metal vuelven a dispersarse por todo su volumen, y el cuerpo C dejaría de ser repelido.

Pero si mantenemos A cerca del metal y conectamos el metal con la tierra usando un cable conductor, los electrones libres de la tierra seran atraídos por la carga positiva del metal B y se incorporaran a éste. Si después retiramos tanto el cable como el cuerpo A, el metal quedará con una carga neta negativa distribuida por todo su volumen.

Fig. 4: electrificación de un conductor por inducción

Ley de Coulomb

Coulomb (siglo XVIII) usó una balanza de torsión para averiguar el efecto de la separación entre cuerpos cargados sobre la fuerza que se ejercen (figura 5).

Fig.5: Esquema de la balanza de torsión de Coulomb

Dispuso dos bolitas de saúco electrizadas A, B, la primera fijada a la tapa del cilindro por una varilla aislante rígida y la segunda en el extremo de otra varilla, balanceada por un peso, ámbos colgando de un hilo muy fino de plata. La repulsión entre A y B hace que éste se aleje, retorciendo el hilo. Midiendo la torsión del hilo puede deducirse la fuerza de respulsión. Colocando A en diversas posiciones, pudo estudiar el efecto que tenia la separación r entre A y B. Su conclusión se conoce como ley o fórmula de Coulomb de la electrostática:

F=k\frac{QQ'}{r^2} [3]

La k es una constante de proporcionalidad que depende del medio (aire, vacío, agua, …), Q y Q’ son las cargas y r la distancia que las separa. El hecho de que k dependa del medio indica que hay una transmisión de fuerza electrostática a través del medio, el cual puede ser más o menos permeable eléctricamente.

Inicialmente se propuso como unidad de carga aquella que, siendo Q = Q’ = 1, y situadas a una distancia de 1cm produjeran una fuerza atractiva de 1 dina (que a su vez es la fuerza que acelera una masa de un gramo a un cm/s²). En este sistema de medidas cegesimal la constante k vale la unidad, y a relación entre carga eléctrica y las unidades básicas gr, cm, s son poco intuitivas, pues aparecen exponentes fraccionarios:

\left[gr\frac{cm}{s^2}\right]=\left[\frac{Q^2}{cm^2}\right]\Rightarrow\left[Q\right]=\left[\sqrt{gr\frac{cm^3}{s^2}}\right]=\left[\frac{gr^{1/2}cm^{3/2}}s\right]

Se propuso otra unidad de medida, el Coulomb C, derivada de la corriente eléctrica, evitando exponentes racionales: la unidad de carga se define como aquella que es transportada por una corriente de un Ampere en un segundo, [C] = [A/s]. Además, se dió un valor a k adecuado para simplificar expresiones:

El 4\pi evita que salga ese término en muchas formulas del electromagnetismo. Este sistema es el internacional de unidades.

Distribución de cargas

Como hemos mostrado en [2] las cargas son aditivas; entonces si colocamos diversas cargas en el espacio, para cada par de ellas se aplicará la ley de Coulomb [3]; ¿cuál será la fuerza resultante sobre una de las cargas? Siendo la fuerza un vector, necesitamos una versión vectorial de [3]. Denominando \overrightarrow r_{21} al vector que parte de la carga Q_2 y llega a la carga Q_1, podemos escribir:

\overrightarrow F(Q_1)=k\frac{Q_1Q_2}{r_{21}^3}{\overrightarrow r}_{21} [4]

en donde tenemos que especificar sobre qué carga estamos calculando la fuerza (el sentido sobre Q_1 es el contrario que sobre Q_2); observemos que la fuerza sobre Q_1 utiliza el vector r_{21} que va de la carga 2 a la 1. Para cargas del mismo signo este convenio proporciona una fuerza de repulsión entre cargas. Otra expresión equivalente es:

{\overrightarrow F}_{A\rightarrow B}=k\frac{Q_AQ_B}{\overrightarrow{\left\|AB\right\|}^3}\overrightarrow{AB} [4b]

que expresa la fuerza que ejerce la carga situada en A sobre la carga situada en B, siendo Q_A,Q_B las cargas y \overrightarrow{AB} el vector que va del punto A hasta el B.

Alternativamente, utilizando el vector unitario {\widehat r} que tiene la dirección de\overrightarrow r_{12} pero módulo 1, será:

\overrightarrow F(Q_1)=k\frac{Q_1Q_2}{r^2}{\widehat r}_{21} [5]

Para un conjunto Q_1,Q_2,...,Q_n de cargas, la fuerza ejercida por todas ellas sobre la i-ésima carga Q_i será la suma de las fuerzas de cada pareja posible, o sea sumando las contribuciones dadas por [5]:

\overrightarrow F(Q_i)=k{\textstyle\sum_{j\neq i}}\frac{Q_iQ_j}{r_{ji}^2}{\widehat r}_{ji} [6]

donde el subíndice j recorre todos los valores 1 … n excepto el propio i (no evaluamos la fuerza de Q_i sobre ella misma).

Ejemplo:  Tenemos tres cargas A, B, C todas de valor 10⁻⁴Coulomb;  A y B son positivas, C es negativa, y estan situadas en un plano, en las coordenadas A(0, 0), B(2,3), C(-1, 2). Calcular la fuerza resultante sobre la carga situada en C.

Aplicamos [4b] a la fuerza de la carga A sobre C, y después a la de B sobre C:

De A hasta C: AC = C(-1, 2) – A(0, 0) = (-1, 2);

{\overrightarrow F}_{A\rightarrow C}=9\cdot10^9\frac{-10^{-4}10^{-4}}{5^{3/2}}\overrightarrow{\left(-1,2\right)}=\frac{90}{5^{3/2}}\overrightarrow{\left(-1,2\right)}

De B hasta C: C(-1, 2) – B(2,3) = (-3, -1);

{\overrightarrow F}_{A\rightarrow C}=9\cdot10^9\frac{-10^{-4}10^{-4}}{10^{3/2}}\overrightarrow{\left(-3,-1\right)}=\frac{90}{10^{3/2}}\overrightarrow{\left(-3,1\right)}

Sumamos las fuerzas:

\begin{array}{l}\overrightarrow F\left(C\right)={\overrightarrow F}_{B\rightarrow C}+{\overrightarrow F}_{A\rightarrow C}=-\frac{90}{5^{3/2}}\overrightarrow{\left(-1,2\right)}-\frac{90}{10^{3/2}}\overrightarrow{\left(-3,-1\right)}=\\\frac{90}{5^{3/2}}\left[\overrightarrow{\left(-1,2\right)}+\frac1{2^{3/2}}\overrightarrow{\left(3,1\right)}\right]\cong\overrightarrow{\left(0.48,20\right)}\end{array}

Cuestiones y ejercicios resueltos

  1. ¿La formula de Coulomb se puede utilizar para calcular la fuerza electrostática entre dos cuerpos de dimensiones arbitrarias?
  2. Si acercamos una varilla de ámbar a otra varilla electrificada de vidrio, y vemos que se atraen, ¿debemos suponer que la de ámbar también está electrificada? ¿Y si en vez de atraerse se repelen?
  3. Calcular la proporción que guardan la fuerza de repulsión electrostática y la fuerza gravitatoria entre losprotones  constituyentes de una partícula alfa (idéntica a un núleo de helio; dos protones y dos neutrones). Comentar el valor obtenido, ¿tiene alguna implicación práctica? Datos: masa cada partícula = 1,5·10⁻²⁷kg, carga del protón = 1,6·10⁻¹⁹C, constante de gravitación universal G = 6,7·1⁻¹¹ Nm²Kg⁻¹.
  4. Dos pequeñas esferas electrificadas de masa 0.1gr  cuelgan de un mismo punto por hilos de longitud 1m. Sabiendo que los hilos forman un ángulo entre sí de 15⁰, calcular la carga eléctrica que poseen.

Soluciones

  1. No, sólo tiene sentido para cargas puntuales o de dimensiones despreciables. Para cuerpos cargados ha de desarrollarse una formula más compleja que usa diferenciales e integración.

2. No necesariamente, incluso si el ámbar es neutro, al acercarlo a la varilla cargada puede producirse el fenómeno de la inducción electrostática, que acumule cargas negativas en la parte del ámbar más cercana al vidrio. En cambio si observamos repulsión sí es seguro que el ámbar está cargado con el mismo signo que el vidrio.

3.  La fuerza de repulsión electrostática viene dada por la ley de Coulomb, en la forma no vectorial, donde d es la distancia entre protones:

F_e=9\cdot10^9\frac{\left(1,6\cdot10^{-19}\right)^2}{d^2}

La fuerza de atracción gravitatoria viene dada por la ley de Newton de la gravitación universal:

F_g=6,7\cdot10^{-11}\frac{\left(1,5\cdot10^{-27}\right)^2}{d^2}

Dividiendo la primera por la segunda obtenemos la proporción de ámbas fuerzas naturales:

\frac{F_e}{F_g}=\frac{9\cdot10^9}{6,7\cdot10^{-11}}\frac{\left(1,6\cdot10^{-19}\right)^2}{\left(1,5\cdot10^{-27}\right)^2}\approx0.2\cdot10^{9+11-38+54}\approx10^{35}

Vemos que la fuerza electrostática es prodigiosamente mayor que la gravitatoria. Imaginemos que tenemos dos máquinas de tren de 100 toneladas, que supondremos son de hierro,  cada una separadas a la distancia de 1 metro. La atracción gravitatoria entre ellas es despreciable comparada con la atracción de la Tierra sobre ellas. Supongamos que, por algún procedimiento, pudiéramos conseguir que uno de cada 100 millones de átomos del hierro (Fe) de las máquinas perdiera un sólo electrón, de los 55 que tiene cada uno. Sabiendo que un mol de Fe son 55gr, y que cada mol contiene el número de Avogradro de átomos, 6·10²³, obtenemos que cada locomotora contiene alrededor de 10³⁰ átomos de Fe, y por tanto 55·10³⁰ electrones. Al quitar uno de cada 100·10⁶ = 10⁸, quitariamos un total del 55·10²² electrones; como cada electrón tiene una carga de 1,6·10⁻¹⁹C, habría más carga positiva que negativa, siendo la carga total neta = 55·10²² · 1,6·10⁻¹⁹ = 8800 Coulomb … esta es una carga enorme. En efecto, las dos locomotoras electrificadas se repelerian con una fuerza de 9·10⁹·(8800)² / 1 = 7·10¹⁷Newton, y serian aceleradas una respecto la otra con una aceleración a = F/m = 7·10¹⁷/10⁵ = 7·10¹², aproximadamente un billón de veces la aceleración de la gravedad: las locomotoras saldrian despedidas y en millonesimas de segundo alcanzarian una valocidad próxima a la de la luz.

4. Ejercicio para el lector. Si quereis la solución, podeis contactar por la página den Facebook.

 

 

Publicado en Electricidad y Magnetismo, Fí­sica | 1 comentario

Problemas del 2º principio

1. En un ciclo de Carnot ¿en qué isoterma se producirá mayor variación de entropía del sistema?

Respuesta: En un clclo cualquiera la variación de entropía del sistema es nula; un ciclo de Carnot incluye dos transformaciones adiabáticas y dos isotermas, el sistema no sufre variación de entropía en las adiabáticas pues Q = 0 y el ciclo es reversible (luego \begin{array}{l}\triangle S=\int\frac{dQ}T\\\end{array}) así que toda la variación de entropía ocurre en las isotermas, pero siendo nula la global, por fuerza las dos isotermas han de producir la misma variación de entropía del sistema, y con signo contrario, para que una anule a la otra.

2. Dos de las siguientes afirmaciones son falsas, y una es incompleta; identificarlas y explicarlas. A) La entropía es constante en toda transformación isotérmica. B) La entropía es constante en toda transformación adiabática. C) La entropía es constante en toda transformación a volumen V constante.

Respuesta: A) es falsa, pues en una transformación isotérmica la temperatura se mantiene constante, pero puede haber transferencia de calor y trabajo, como sucede en los ciclos de Carnot, en los cuales precisamente en las transformaciones isotérmicas es en donde se producen las variaciones de entropía (ver problema 1). B) es parcialmente cierta, pues sólo se cumple en las transformaciones adiabáticas que además son reversibles, pero no en las irreversibles. C) es falsa, pues V = cte implica que no se produce un trabajo, W = 0, pero por el primer principio Q = ΔE, se puede producir una transferencia de calor y puede variar la entropía.

3. Un sistema recorre un ciclo una de cuyas transformaciones es irreversible. ¿De qué signo será la variación de entropía del sistema?

Respuesta: Siendo un ciclo, la variación de entropía S del sistema ha de ser nula, pues S es una función del estado del sistema, y en un ciclo siempre se retorna al estado inicial.

4. Un gramo de agua helada a 0ºC se calienta poniéndola en contacto con una fuente térmica a 200ºC y 1º) se funde, 2º) se calienta hasta 100ºC y 3º) se evapora, siempre a presión constante de 1 atm. De los tres procesos, ¿cuál aumenta más la entropía? Datos: calor de fusión = 80 cal/gr,  calor de vaporización = 540 cal/gr, calor específico: 1 cal/gr·K

Respuesta: la primera transformación se realiza a T = cte, y P = cte, y podemos considerarla reversible, pues en los cambios de fase el sistema siempre está en equilibrio. Entonces, usando los datos y convirtiendo a sistema mks:

A) \triangle S=\int\frac{\operatorname dQ}T=\frac1T\int\operatorname dQ=\frac1T\triangle Q=\frac1{273}1\cdot80\cdot4.1868=1.23\;J/K

La transformación B en cambio es irreversible pues la diferencia de temperaturas entre el agua y la fuente teŕmica aleja a la primera del equilibrio. Imaginemos una transformación reversible que lleve del estado A (T= 0ºC, P = 1 atm) hasta B (T= 100ºC, P = 1 atm), supondremos que el volumen se mantiene constante (una aproximación bastante buena) y que el agua se va calentando poniéndose en contacto con una fuente sólo ligeramente más caliente; si el agua está a T, la fuente estará a T + dT. Entonces,

B) \triangle S=\int\frac{\operatorname dQ}T=\int_{273}^{373}\frac{mc_p\operatorname dT}T=1\cdot1\cdot4.1868\cdot\ln\left(\frac{373}{273}\right)=1.31\;J/K

La transformación C es reversible pues vuelve a ser un cambio de fase, luego:

\triangle S=\int\frac{\operatorname dQ}T=\frac1T\int\operatorname dQ=\frac1T\triangle Q=\frac1{373}1\cdot540\cdot4.1868=6.06\;J/K

Claramente la evaporación es la que aumenta más la entropía.

5. Sean 3·10⁻² moles de un gas ideal en el estado A definido por P=1 atm, V=R m³, (R: constante de los gases perfectos), T = 300⁰K que evoluciona irreversiblemente hasta el estado B definido por P=2 atm, V=4R/3 m³, T = 400⁰K según la transformación 1 que puede verse en el diagrama PV (figura 1). Supondremos el valor 1 para el coeficiente térmico a volumen constante, c_v=1. Calcular la variación de entropía.

Fig.1: diagrama PV de un sistema que evoluciona irreversiblemente entre los estados A, B

Solución: Para calcular la variación de entropía, buscamos una transformación reversible, o sea, que respete en cada instante los estados de equilibrio dados por la ecuación de estado PV = nRT. Imaginemos el camino 2 de A->C que mantiene el volumen constante, luego P/T = nR/V = cte, llevando el sistema hasta la temperatura del estado B; todos los estados en equilibrio a temperatura T_B=400 están sobre la isoterma en rojo, la isoterma en azul corresponde a T = 300. A continuación, imaginamos que el sistema evoluciona reversiblemente desde C hasta A por la isoterma T =400. La variación de entropía entre A y B será la suma de las entropías A->C más la de C->B. Vamos por ello:

S_{AC}=\int_{AC_{REV}}\frac{\operatorname dQ}T=nc_v\int_{300}^{400}\frac{\operatorname dT}T=3\cdot10^{-2}\ln\left(\frac43\right),

para la entropía del paso A->C; sobre la isotérmica, PV = cte, por el 1r principio, Q = W pues el gas perfecto no cambia su energía interna si no lo hace la temperatura; el trabajo W realizado es:

W_{CA}=\int_{CA_{REV}}P\operatorname dV=\int_{CA_{REV}}\frac{nRT}V\operatorname dV=nR\ln\left(\frac{V_2}{V_1}\right)=12R\ln\left(\frac43\right),

la variación de entropía a T = cte es:

S_{CA}=\frac{Q_{CA}}T=\frac{12R\ln\left({\displaystyle\frac43}\right)}{400}=3\cdot10^{-2}R\ln\left(\frac43\right)

y la variación de entropía total:

S_{AB}=S_{AC}+S_{CA}=3\cdot10^{-2}R\ln\left(\frac43\right)+3\cdot10^{-2}\ln\left(\frac43\right)=3\cdot10^{-2}\left(R+1\right)\ln\left(\frac43\right).

6. Un gramo de agua calentado a 100ºC al convertirse en vapor a la presión de 1atm ocupará un volumen de 1671 cm³, absorbiendo 2257J de energía calorífica. Si evaporamos 1Kg de agua, ¿cuál será su aumento de energía interna y de entropía?

Solución: Los cambios de fase (evaporación, solidificación, sublimación …) son transformaciones de estado especiales pues siendo reales son reversibles (el sistema permanece en equilibrio durante el cambio de fase). En la figura 2 vemos el diagrama PV de la evaporación del agua, a presión y temperatura constante, el volumen específico aumenta linealmente.

Fig.2: diagrama PV de un cambio de fase líquido a gas, caso del agua ( por cm³)

Por el 1r principio: Q = W + ΔE; el trabajo realizado por el vapor correspondiente a 1gr de agua al expandirse bajo una presión constante de  P = 1atm (101.325 Pascales) es W = PΔV = 101.325Pa · (1671 – 1)·10⁻⁶m³ = 169.21 J. El calor absorbido sabemos que vale 2257J, luego ΔE = Q – W = 2257 – 169.21 = 2087.79 J.

El incremento de entropía, al ser un proceso reversible y suceder a temperatura constante, es simplemente ΔS = Q/T = 2257 J / (100+273)K = 6.05 J·K⁻¹ . Siendo la energía interna y la entropía propiedades extensivas (o sea que son propiedades conservativas), para un Kg de agua simplemente multiplicamos por 1000 los resultados anteriores:

  • ΔE total = 1000 · 2087.79 = 2,088 · 10⁶ J
  • ΔS total = 1000 · 6.05 = 6050 J·K⁻¹.

7. Ponemos en contacto 2kg de agua a T=20ºC con una fuente térmica a 100ºC, dejando que al agua se caliente hasta los 100ºC. Calcular las variaciones de entropía del agua, de la fuente y del Universo.

Solución: cuando hay una transferencia de calor debido a una diferencia de temperaturas el proceso es irreversible pues el sistema (el agua) deja de estar en estado de equilibrio mientras se calienta, para que sea reversible ha de calentarse lentamente, cuasiestáticamente, esto es, con una fuente a T = 20C + dT (una diferencia infinitesimal de temperatura), seguida de otra fuente a T = 20C + 2·dT, … etc.  Como la entropía S es función de estado, imaginamos un proceso así reversible entre los estados inicial y final para calcular la variación de S, y el resultado valdrá para todo proceso entre esos estados.

Sea pues una fuente a T = 20C + dT; como la diferencia de T es infinitesimal, suponemos el proceso isotérmico (T=cte). tendremos una variación dS = dQ/T = cm·dT / T donde c es el coeficiente de absorción de calor del agua, c = 1 cal/gr, m es la masa de agua. Integrando (o sea sumando todos los pasos dT desde 20C hasta 100C):

\triangle S_{agua}=\int_{293}^{373}cm\frac{dT}T4180\cdot1\cdot\ln\left(\frac{373}{293}\right)=1009\;JK^{-1}.

La fuente térmica permanece a T=cte pues se supone que tiene una capacidad calorífica muy grande, entregando una cantidad de calor total Q (por el convenio de signos, será negativa). Si suponemos que la fuente, por tener una capacidad calorífica muy grande, se mantiene en un estado casi estacionario, su proceso se puede considerar reversible, y entonces:

\triangle S_{fuente}=\frac Q{T_{fuente}}=\frac{-mc\triangle T_{agua}}{T_{fuente}}=\frac{-1\cdot4187\cdot80}{373}=-898\;JK^{-1}, [1]

que es negativo pues el calor es cedido. El incremento de entropía de todo el conjunto será la suma: 1009 – 898 = 111 JK⁻¹, que es positivo de acuerdo al 2º principio de la termodinámica.

Si en cambio suponemos que la fuente también está saliendo del equilibrio (capacidad calorífica grande pero no infinita) el proceso será irreversible, y también deberemos aproximarlo por uno de reversible: supongamos que la fuente cede un dQ estando a temperatura T = cte, y siendo dQ el dado por [1]; entonces:

\triangle S=\int\frac{\operatorname dQ}T=\frac{-mc}T\int_{293}^{373}\operatorname dT=-\frac{1\cdot4187}{373}\left(373-293\right)=898\;J/K,

resultado que coincide con el anterior cálculo, donde considerábamos el proceso de la fuente como reversible, era pues una aproximación muy buena.

8. Demostrar que en una transferencia de calor irreversible entre un sistema y una fuente de calor la entropía del universo siempre aumenta.

Solución: Supongamos que el sistema pasa de la temperatura T a la T’, siendo T’> T, y que la fuente es isotérmica. Imaginando un calentamiento reversible del sistema, la variación de entropía es, suponiendo que el coeficiente calorífico c no varía con la temperatura:

\triangle S_s=\int\frac{\operatorname dQ}T=\int_T^{T'}\frac{mc\operatorname dT}T=mc\ln\left(\frac{T'}T\right)

La fuente térmica se mantiene a una temperatura T” > T’, y cede de forma reversible un salor Q  (pues permanece en equilibrio al tener una capacidad calorífica virtualmente infinita), luego:

\triangle S_f=\int\frac{-\operatorname dQ}T=\frac1{T''}\int_{}^{}-\operatorname dQ=-\frac{mc\left(T'-T\right)}{T''}

La variación total de S será la suma:

\triangle S_s+\triangle S_f=mc\ln\left(\frac{T'}T\right)-\frac{mc\left(T'-T\right)}{T''}=mc\left[\ln\left(\frac{T'}T\right)-\frac{T'-T}{T''}\right] [1]

Veamos que esta expresión será siempre mayor que cero; sabiendo que T < T’ > T” se sigue que

\frac{T'-T}{T''}<\frac{T'-T}{T'}=1-\frac T{T'} [2]

Comparemos ahora 1-\frac T{T'} con \ln\left(\frac{T'}T\right): llamemos x=\frac{T'}T; f(x)=\ln\left(x\right); g(x) = 1 - 1/x; derivando las funciones f, g vemos que sus pendientes son f'(x) = 1/x, g'(x) = 1/x², ambas funciones son crecientes, pero la segunda  crece a menor tasa pues 1/x² < 1/x. Los valores mínimos de f, g se dan para x = 1 (que se corresponde con T = T’) en donde coinciden, f(1) = g(1) = 0. Así pues, f(x) es siempre mayor que g(x) y por tanto [1] será siempre positiva: la entropía del universo siempre aumenta. En la figura se representan las funciones f(x) (azul) y g(x) (rojo), la diferencia en vertical entre las dos líneas es la variación de entropía del universo en función de x = T’ / T. En el caso de T” > T’ la diferencia será mayor.

Comparación de la funciones de variación de entropía del sistema y de la fuente térmica

 

 

 

 

 

Publicado en Fí­sica, Termodinámica | Deja un comentario

Entropía y 2º principio de la termodinámica

Se observa que el calor Q fluye de forma natural desde las fuentes térmicas de más temperatura a las de menos, pero al revés no sucede, excepto si lo forzamos gastando un trabajo W. El 1r principio de la termodinámica establece un balance entre el calor entregado a un sistema, el trabajo realizado por el sistema y su incremento de energía interna, Q = W + ΔE, pero no dice nada del sentido de la transferencia de calor, nada prohíbe que fluya de menos a más temperatura. Se necesita un criterio adicional al 1r principio que regule el sentido de las transferencias de calor, y ese será el 2º principio.

Lo que se explica a continuación sigue el siguiente esquema: 1) exploramos la relación calor transferido/temperatura, Q/T,  en un ciclo reversible, 2) visitaremos brevemente el análisis matemático recordando las nociones de campos vectoriales conservativos, circulación de un vector en el campo y potencial del campo, 3) usaremos esos conceptos matemáticos y la relación Q/T de un ciclo para definir la función de estado entropía S, y a continuación 4) veremos las propiedades más importantes de S y sus aplicaciones prácticas en los cambios de estado termodinámicos.

Relación entre calor transferido y temperatura en un ciclo de Carnot

En Trabajo, calor y primer principio de la Termodinámica se estudian los ciclos de Carnot, que son sucesiones continuas de cambios de estado reversibles (en cada instante el sistema está siempre en equilibrio termodinámico) y  cíclicos (estado final igual al estado inicial) formados por dos transformaciones isotermas (temperatura T = cte) y dos adiabáticas (calor transferido Q = 0). En la figura 1 vemos en un diagrama Presión-Volumen las isotermas (transformaciones desde 1 a 2 y de 3 a 4) y las adiabáticas 2->3 y 4->1.

Fig.1: ciclo de Carnot representado en el diagrama Presión-Volumen

Aplicando la relación PV = cte para las isotermas y PV^\gamma para las adiabáticas del ciclo de Carnot:

\begin{array}{l}P_1V_1=P_2V_2\\P_2V_2^\gamma=P_3V_3^\gamma\\P_3V_3=P_4V_4\\P_4V_4^\gamma=P_1V_1^\gamma\end{array}

si las multiplicamos todas entre sí y eliminamos términos repetidos, nos queda

{V_2}V_4=V_3V_1 [1]

Supongamos ahora que el sistema usado en el ciclo es un gas ideal, entonces la ecuación de estado es PV = nRT, y además el trabajo generado en las isotermas será (para detalles ver Trabajo, calor y primer principio de la Termodinámica) W_{12}=nRT\ln\left(\frac{V_2}{V_1}\right),\;W_{34}=nRT'\ln\left(\frac{V_4}{V_3}\right). Dividiendo la primera por la segunda y aplicando [1]:

\frac{W_{12}}{\;W_{34}}=\frac{T\ln\left({\displaystyle\frac{V_2}{V_1}}\right)}{T'\ln\left(\frac{V_4}{V_3}\right)}=\frac{T\ln\left({\displaystyle\frac{V_2}{V_1}}\right)}{-T'\ln\left(\frac{V_3}{V_4}\right)}=-\frac T{T'}.

Tengamos ahora en cuenta que, pr el 1r principio, Q = W_{12},\;Q'=W_{34}, así que nos queda la relación

\frac Q{Q'}=-\frac T{T'}\Leftrightarrow\boxed{\frac QT+\frac{Q'}{T'}=0} [2]

que relaciona de forma simple los calores transferidos con las temperaturas a las que se transfieren. En particular, si prescindimos de los signos (valores absolutos) implica que si T > T’ entonces |Q| > |Q’|: se transfiere más calor del foco térmico que está a más temperatura; la diferencia |Q| – |Q’| es igual al trabajo realizado por el ciclo, y si fuera T = T’, entonces |Q| = |Q’| y el trabajo W seria nulo. Pero el trabajo es igual al área encerrada en el diagrama PV por el ciclo, y un trabajo nulo implica que no hay área, luego no se puede recorrer un ciclo manteniendo la temperatura constante en todo él, ha de haber una diferencia de temperatura.

Relación entre calor transferido y temperatura en un ciclo reversible

Generalicemos ahora el resultado del apartado anterior al caso de ciclos reversibles cualesquiera, que representamos en la figura 2.

Fig.2: ciclo reversible cualquiera, parcialmente recubierto por ciclos de Carnot

Hemos añadido algunos ciclos de Carnot (recordemos, isoterma seguida de adiabática seguida de isoterma seguida de adiabática) tales que recubren parcialmente el área del ciclo C, representado en el diagrama PV por una elipse, pero puede ser cualquier figura (con alguna restricción geométrica que no enunciaremos); los ciclos de Carnot tienen las curvas adiabáticas muy pequeñas, de forma que se van ajustando más o menos a la curva C, mientras que las isotermas son más largas y recorren de lado a lado el interior de C, Podemos imaginarnos que dibujamos más ciclos Carnot hasta recubrir en su totalidad toda el área C. Además, observando la figura 1, como cada ciclo de Carnot está adyacente a otro ciclo, podemos pensar que el calor cedido Q’ por cada ciclo es igual al absorbido Q por el siguiente, pero no son exactamente iguales, pues cada ciclo de Carnot tampoco coincide exactamente con su contiguo (fig. 3), de forma que el calor cedido Q’ por el i-èsimo ciclo de Carnot no es exactamente igual al absorbido por el (i+1): \textstyle Q'_i=Q_{i+1}+\triangle Q_{i,i+1}, hay una diferencia.

Fig.3: detalle de dos ciclos contiguos de Carnot  del recubrimiento de un ciclo C

Además, para cada ciclo de Carnot se cumplirá [2]: \frac{Q_i}{T'_i}+\frac{Q_i'}{T_i'}=0, y la suma anterior extendida a todos los n ciclos también dará cero:

\sum_i\left(\frac{Q_i}T+\frac{Q'_i}{T_i'}\right)=0 [3]

Llevando al límite para n\rightarrow\infty ciclos de Carnot, C quedará recubierto de forma que \triangle Q_i\rightarrow\operatorname dQ, las adiabáticas de cada ciclo de Carnot tenderán a coincidir con el elemento diferencial de longitud dl de la curva C, y la suma [3] pasará a ser una integral extendida a todo el contorno C:

\oint_{C,rev}\frac{\operatorname dQ}T=0 [4]

donde hemos dejado de distinguir calor absorbido Q del emitido Q’ y simplemente tenemos un dQ transferido (en más o en menos), y la temperatura T es una variable que toma valores distintos en cada punto de C; también hemos puesto el subíndice rev para indicar que el ciclo se recorre de forma reversible. A continuación hacemos una breve incursión por el análisis matemático, que nos da herramientas potentes para manejar las integrales [4].

Circulación y potencial de un campo conservativo

Un campo vectorial es una función que asigna a cada punto P un vector v(P), como por ejemplo el campo eléctrico, o la asignación a cada punto del espacio (x, y, z) del interior de un gas de una magnitudes (P, V, T) entendidas como un vector en un espacio vectorial. Imaginemos un camino cualquiera (una trayectoria entre dos puntos A, B)  en el espacio a través de una curva C; para cada uno de sus puntos P, existirá un vector campo v(P), y un elemento diferencial dl que será tangente a la curva en P:

Fig.4: curva C, elemento diferencial dl tangente a C en P, y vector campo v(P) en P

Denominamos circulación del campo v(P) entre los puntos A, B a lo largo de la curva C a la suma de los productos escalares v(P)·dl extendida a todos los puntos P entre A y B:

Circ_C\left(\overrightarrow v,A,B\right)={\int_A^B}_C\overrightarrow v\operatorname d\overrightarrow l [5]

En el caso de que C sea un camino cerrado, escribimos la integral así:

Circ_C\left(\overrightarrow v\right)=\oint_C\overrightarrow v\operatorname d\overrightarrow l[6]

Hay un tipo especial de campos vectoriales que en Física son de gran interés, son los denominados campos conservativos, en los que se cumple la condición siguiente para todo camino cerrado C:

Circ_C\left(\overrightarrow v\right)=\oint_C\overrightarrow v\operatorname d\overrightarrow l=0 [7]

Se llaman “conservativos” pues, por las propiedades de las integrales (ver figura 5):

\oint_C\overrightarrow v\operatorname d\overrightarrow l=\int_{PQR}\overrightarrow v\operatorname d\overrightarrow l+\int_{RSP}\overrightarrow v\operatorname d\overrightarrow l=0\Rightarrow\int_{PQR}\overrightarrow v\operatorname d\overrightarrow l=-\int_{RSP}\overrightarrow v\operatorname d\overrightarrow l,

además, invirtiendo el sentido de integración,

\int_{RSP}\overrightarrow v\operatorname d\overrightarrow l=\int_{PSR}-\overrightarrow v\operatorname d\overrightarrow l

y por tanto:

\int_{PQR}\overrightarrow v\operatorname d\overrightarrow l=\int_{PSR}\overrightarrow v\operatorname d\overrightarrow l,

que nos dice que el valor de la circulación de un campo conservativo sólo depende de los puntos inicial P y final R, y no del camino concreto recorrido entre esos dos puntos. [7′]

Fig.5: un camino cerrado C y algunos de sus puntos, P, Q, R, S

Debido a esta propiedad de conservar el valor de la circulación entre dos puntos independientemente del camino recorrido, en los campos conservativos se puede la magnitud diferencia de potencial V_{PR} como

V_{PR}=\int_{PR}\overrightarrow v\operatorname d\overrightarrow l [8]

para cualquier trayectoria entre los puntos P y R. Tomando un punto cualquiera O como referencia, el potencial en otro punto P se define como V_P=V_{PO}=V_P-V_O.

Los potenciales tiene gran interés en física; así por ejemplo, un campo vectorial eléctrico es conservativo, y por tanto se puede definir un potencial eléctrico en cada punto del campo, además, la corriente eléctrica solo fluye en el sentido de más potencial a menos potencial.

Entropía

Por analogía, siguiendo el apartado anterior y comparando con el resultado [4] obtenido para la relación Q/T en un ciclo reversible, podemos igualar dQ/T al producto escalar de un cierto campo vectorial v por el elemento diferencial de longitud del camino C; siendo nula la integral para todo C reversible y cerrado, concluimos que ese campo v es conservativo, luego admite un potencial que se calculará según [8], que en el caso termodinámico será

S_{AB}=S_A-S_B=\int_{AB_{REV}}\frac{\operatorname dQ}T [9]

A la cantidad S_A la llamamos entropía del estado A, y seria el potencial del campo en ese punto; de hecho no nos interesa el campo en sí, que sólo es instrumental, sino el potencial, la entropía. Para cada estado (P, V, T) queda definido una entropía (resultado [7′]) , de forma que podemos decir que la entropía es una función de estado: dos estados distintos tienen entropía distinta.

Observar que en la integral [9] entre los estados A, B hemos incluido el subíndice REV para indicar que la transformación A->B que se use para el cálculo ha de ser reversible. [9a]

Propiedades inmediatas de la entropía S

  1. Como S es función de estado, la variación de entropía de un sistema que evoluciona siguiendo un ciclo cerrado cualquiera, tanto si es reversible como si es irreversible, es nula.
  2. Como S es función de estado, en una transformación de un sistema desde el estado A hasta el B, la variación de entropía será la misma tanto si se hace de forma reversible como si se hace de forma irreversible.

Transformaciones internas reversibles de sistemas aislados

A continuación aplicaremos la entropía como herramienta para comprender mejor qué sucede en las transformaciones de los denominados  sistemas aislados, que son aquellos que no reciben ni entregan calor ni trabajo, siendo todas sus transformaciones internas. Imaginemos un sistema así, como por ejemplo un recipiente con aislamiento térmico en el que hemos introducido un líquido A a temperatura T_1 superior a la T_2  del aire que contiene el resto del volumen B del recipiente, y acto seguido lo cerramos. Como hay una diferencia de temperatura interna, habrá un flujo de calor Q (fig. 6)

Fig.6: Sistema aislado del exterior, con una transferencia interna de calor Q

Llamando Q_A al calor absorbido por A, y Q_B al absorbido por B, en general en un sistema aislado en el que no se intercambia calor con el exterior, Q_A+Q_B=0. Por el 1r principio de la termodinámica, Q = W + ΔE, siendo W = 0, tendremos también ΔE = 0, o sea \triangle E_A+\triangle E_B=0.

Supongamos que el intercambio de calor es reversible: implica que la diferencia de temperatura entre A y B es tan pequeña que en ningún momento ni A ni B salen de los estados de equilibrio, supondremos T = T’; entonces los incrementos diferenciales de entropía (reversible) de cada subsistema A, B son, aplicando [9]:

\operatorname dS_A=\frac{\operatorname dQ_A}T,\;\operatorname dS_B=\frac{\operatorname dQ_B}T,

pero ha de ser \operatorname dQ_A=-\operatorname dQ_B al ser reversible, y la variación de entropía total es:

\operatorname dS=\operatorname dS_A+\operatorname dS_B=\frac{\operatorname dQ_A}T+\frac{\operatorname dQ_B}T=0,

que puede enunciarse así:

en un sistema aislado que evoluciona reversiblemente, la variación de entropía interna es nula.

En los sistemas reales no podremos en general hacer una suposición tan fuerte, veamos que sucede.

Segundo principio de la termodinámica

En toda transformación irreversible de un sistema aislado, la entropía aumentará.

En las transformaciones reales, que no podemos suponer que mantienen constantemente el equilibrio, incluso si ocurren en un sistema aislado que no transfiere ni recibe calor ni trabajo de su entorno, producen un aumento de la entropía del sistema. En particular este principio se relaciona con el hecho observado que mencionamos al principio, que el calor Q fluye de forma natural desde las fuentes térmicas de más temperatura a las de menos, pero al revés no.

Podemos ver una justificación (que  no una demostración) considerando el caso de un gas ideal que evoluciona  de forma irreversible (ver el diagrama PV en la fig. 7) desde el estado A, definido por (P_A, V_A, T_A) hasta el estado B (P_B, V_B, T_B), de más presión temperatura y volumen; para saber el cambio de entropía entre esos dos estados consideramos la transformación alternativa A->B’->B: la primera parte A->B’ es reversible adiabática, la segunda parte B’->B es reversible isotérmica. La variación de entropía será

S_{AB}=S_{AB'}+S_{B'A}=0+\frac Q{T_B}

pues en una adiabática reversible no varía S. El signo de la ΔS depende pues del calor Q absorbido o emitido en la transformación isoterma B’B; por el 1r principio, Q = W + ΔE = Q, pues ΔE en el gas ideal depende exclusivamente de la temperatura, así pues el signo de Q será igual al del trabajo: positivo si el gas realiza trabajo,

Fig. 7: transformación irreversible y camino reversible alternativo

El recorrido completo A-B’-B produce un trabajo W > 0. Por el primer principio, Q = W + ΔE, siendo Q el calor absorbido total, pero sólo en la isoterma, ya que en la adiabática Q = 0,  y ΔE la variación de energía interna total, pero sólo en la adiabática, ya que en los gases perfectos ΔE depende exclusivamente de la temperatura). La variación de entropía total será

S_{AB}=S_{AB'}+S_{B'A}=0+\frac Q{T_B},

ya que A-B’ es adiabática reversible, luego Q_{AB'} = 0 y no hay variación de entropía.  Para calcular Q_{B'B} aplicamos el 1r principio, Q = W + ΔE, siendo:

W_{B'A}=\int_{B'}^BP\operatorname dV=nrT\ln\left(\frac{V_B}{V_{B'}}\right)>0

y ΔE = 0 pues T es constante, luego Q_{B'B}>0 y la variación de entropía total S es positiva: aumenta.

El 2º principio afirma que en una transformación irreversible S aumentará incluso si no hay transferencia de calor Q, seria el caso de un proceso adiabático irreversible; llamemos ΔS’ a este aumento sin transferencia de calor, si a este proceso la añadiéramos además una transferencia de calor, tendríamos además un ΔS” debido ese calor Q, por ello, en general podemos decir que el ΔS de toda transformación irreversible puede descomponerse en dos factores:

ΔS = ΔS’ + ΔS” (entropía intrínseca irreversible + debida a Q) [10]

Procesos isoentrópicos son aquellos procesos en los que la entropía S no varia. S es función de estado, y eso significa que cada estado ha de tener un valor de S fijado, pero al mismo tiempo podemos tener varios estados que tengan la misma entropía; un proceso que se mueva entre esos estados será isoentrópico. Un sistema aislado que se transforma irreversiblemente no puede ser isoentrópico, pero si es reversible seguro que lo será.

Diagramas TS

Representan los estados y su evolución usando como coordenadas la temperatura y la entropía. En la figura 8 vemos un ciclo de Carnot para un gas perfecto en el diagrama TS, se ven como rectángulos: las líneas horizontales son las isotermas, en las que se transfiere calor y por tanto hay variación de entropía, las líneas verticales son las adiabáticas con Q = 0, la entropía no varía pero la temperatura sí. Como en el diagrama PV, el área interior al ciclo en el TS equivale al valor de trabajo realizado por el ciclo; en efecto, \operatorname dW=P\operatorname dV, y además \operatorname dS=\frac{\operatorname dQ}T\Rightarrow T\operatorname dS=\operatorname dQ=\operatorname dE+\operatorname dW. Integrando y recordando que la energía interna no varia en un ciclo: \oint T\operatorname dS=\cancel{\oint\operatorname dE}+\oint\operatorname dW\Rightarrow W=\oint T\operatorname dS

Fig.8: un ciclo de Carnot visto en el diagrama TS

 

Máquina térmica perpetua

Se llama así a una máquina (térmica en estos apuntes) teórica con una eficiencia del 100% de forma que se puede invertir todo el trabajo que genera en producir calor para retroalimentarla y que siga funcionando de forma autónoma y perpetua, o sea que no necesita una fuente térmica externa (fig. 8), tal máquina tendría dos partes, una que se encarga de transformar todo el calor Q en trabajo w, y otra que transforma todo el trabajo W de nuevo en calor Q, sin pérdidas).  Se desarrollaron diversos intentos de construirla, todos fallidos.

Fig.8: esquema de una máquina térmica perpetua, que constituye un sistema aislado que se retroalimenta

Veamos que según el 2º principio es imposible tal máquina; en efecto, por ser S una función de estado, su variación es cero en todo ciclo tanto reversible como no reversible, pero una máquina autónoma y perpetua que no interacciona con nada (ni tiene fuentes térmicas ni intercambia trabajo con el exterior) es por definición un sistema aislado, y el 2º principio afirma que todo sistema aislado que evoluciona de forma irreversible ha de aumentar su entropía: llegamos a una contradicción, luego no existe tal máquina térmica perpetua.

Teorema de Carnot

Fig.9: esquema para demostrar el teorema de Carnot con dos máquinas de Carnot conectadas entre sí

Dice así:

el rendimiento de una máquina térmica cualquiera sólo depende de las temperaturas extremas T, T’ con las que trabaja.

Equivalentemente, dos máquinas térmicas que trabajen entre las mismas temperaturas extremas tendrán el mismo rendimiento.

Consideremos dos máquinas A y B acopladas que trabajan entre los mismos focos térmicos T > T’, en el esquema de la fig. 9 vemos las transferencias de calor y trabajo; el acoplamiento consiste en que el trabajo suministrado por la máquina A se utiliza para hacer funcionar la máquina B, que actúa en modo inverso, o sea como bomba de calor, extrayéndolo del foco frío e inyectándolo en el foco caliente. Ajustemos ambas máquinas de tal forma que Q_A=Q_B y Q'_A=Q'_B; esto equivale a modificar sus ciclos hasta que las áreas interiores sean iguales, pues por el 1r principio para cada máquina Q – Q’ = W (fig. 10).

Fig.10: dos ciclos entre distintas isotermas y adiabáticas, ajustados para tener la misma área W

 

Entonces será W = W’, además, W = Q_A-Q'_A y W'=Q_B-Q'_B luego Q_A-Q'_A=Q_B-Q'_B. Recordemos que los rendimientos de las máquinas son r_A=W/Q_A,r_B=W'/Q_B o sea  r_A=W/Q_A,r_B=W/Q_B , y vamos a suponer que A tiene más rendimiento que B, r_A > r_B, que implica W/Q_A>W/Q_B, que equivale a Q_A<Q_B: la máquina A toma menos calor de la fuente caliente que el calor devuelt por B.

Fig.11: combinación de máquinas térmicas equivalente a una que viola el 2º principio

Entonces, podemos prescindir de la fuente térmica T acoplando las máquinas como muestra la figura 11; el conjunto A+B toma un calor Q'_B-Q'_A  de un foco T’ y devuelve un calor neto Q_B-Q_A>0, obviamente este calor podría pasarse a una tercera máquina C que produciria un trabajo neto  W” con lo cual el sistema completo A+B+C (linea de trazos en la figura 11) produciria un trabajo neto W”’ con un único foco térmico: tendríamos una máquina térmica perpetua en contradicción con el 2º principio.

Fig.12: con rendimentos iguales, la combinación propuesta equivale a una máquina nula que no transfiere calor ni trabajo y por tanto no vulnera ningún principio

 

La contradicción se deshace si consideramos que los rendimientos de A y B son iguales, en este caso la máquina A + B simplemente no hace nada (figura 12) pues extrae y devuelve la misma cantidad de calor de los focos T y T’ sin aportar nada de trabajo.

 

Rendimiento de máquinas reales irreversibles

Consideremos de nuevo una máquina térmica M operando entre dos fuentes T > T’ pero de forma irreversible; el conjunto máquina + fuentes térmicas será un sistema aislado, con transformaciones internas irreversibles, luego por el 2º principio su entropía S_{total} debe aumentar, y será igual al incremento de entropía de la máquina M más los incrementos de entropía de las fuentes térmicas: \triangle S_{total}=\triangle S_M+\triangle S_T+\triangle S_{T'}. Pero la entropía S_M se mantiene constante en toda transformación cíclica, por ser S función de estado, luego \triangle S_{total}=\triangle S_T+\triangle S_{T'}>0. Para calcular estas entropías consideremos una cesión de calor muy lenta, infinitesimal, dQ, de cada una de las fuentes; teniendo en cuenta que peramenecen a temperatura constante, y tomando la definición de entropía, obtenemos:

\operatorname dS_T=\frac{\operatorname dQ}T,\;\operatorname dS_T'=\frac{\operatorname dQ'}{T'}\Rightarrow\triangle S_T=\int\frac{\operatorname dQ}T=\frac QT,\;\triangle S_{T'}=\int\frac{\operatorname dQ'}{T'}=\frac{Q'}{T'}

luego deducimos que

\frac QT+\frac{Q'}{T'}>0\Leftrightarrow\left|\frac{\displaystyle Q}{\displaystyle T}\right|\neq\left|\frac{\displaystyle Q'}{\displaystyle T'}\right|

Comparando con la expresión [3] vemos que en general,

\frac QT+\frac{Q'}{T'}\geqslant0

siendo válida la igualdad para procesos reversibles y la desigualdad estricta para los irreversibles. Recordemos ahora la expresión [10] y la aplicamos a un ciclo irreversible; para todo ciclo es ΔS = 0, luegoΔS’ + ΔS” = 0, siendo ΔS’ debida a la irreversibilidad y ΔS” debida al intercambio de calor Q, esta última será igual a \frac QT+\frac{Q'}{T'}, luego:

\frac QT+\frac{Q'}{T'}+\triangle S''=0,

despejando Q’:

Q'=-T'\left(\triangle S''+\frac QT\right),

como en un ciclo ha de ser W = Q + Q’ nos queda:

W=Q-T'\left(\triangle S''+\frac QT\right)=Q\left(1-\frac{T'}T\right)-T'\triangle S'',

entonces el rendimiento del ciclo irreversible será R = W/Q:

R=\left(\frac{T-T'}T\right)-\frac{T'\triangle S''}Q=r-\frac{T'\triangle S''}Q

donde r es el rendimiento de un ciclo de Carnot (reversible por tanto), vemos que el rendimiento irreversible R es siempre menor que el reversible r: los rendimientos de las máquinas reales son inferiores a los de las máquinas ideales reversibles.

 

 

 

Publicado en Fí­sica, Termodinámica | Deja un comentario

Problemas de trabajo, calor y 1r principio de la termodinámica

Problemas resueltos

1 – Determinar el trabajo de expansión realizado por un mol de una sustancia al pasar del estado sólido al estado líquido bajo la presión de 1 atm, sabiendo que su volumen específico en el estado líquido supera al del estado sólido en 0,16 cm³/gr. Otros datos: masa de un mol de la sustancia: 60gr/mol.

Solución: el trabajo de expansión viene dado por (ver Trabajo, calor y 1r principio de la termodinámica. ecuación [1]):

W=\int_{V_1}^{V_2}P\operatorname dV[1]

La fusión del sólido ocurre a presión constante, luego

W=\int_{V_1}^{V_2}P\operatorname dV=P\int_{V_1}^{V_2}\operatorname dV=P\left(V_2-V_1\right)=P\triangle V[a]

¿Cuál es el incremento de volumen de un mol cuando se funde? Tenemos 60gr por mol, y el incremento de volumen por gramo es 0,16 cm³/gr, luego el incremento de volumen total es 60gr/mol · 0,16 cm³/gr = 9.6 cm³/mol. Sólo queda pasar todas la unidades a sistema internacional y aplicar [a]:

1 atm = 1. 013·10⁵ N/m²; 9.6 cm³ = 9.6 · 10⁻⁶m³;

W = 1. 013·10⁵ N/m² · 9.6 · 10⁻⁶m³ = 0.972 Nm = 0.972 J (en Joules).


2 – Se comprime de forma reversible e isotérmica un mol de un gas ideal a T = 18⁰C desde la presión inicial de 0.8 atm hasta la presión final de 3.5 atm. ¿Qué trabajo se ha realizado sobre el gas?

Solución: El trabajo de expansión viene dado por (ver Trabajo, calor y 1r principio de la termodinámica. ecuación [1]):

W=\int_{V_1}^{V_2}P\operatorname dV[1]

En nuestro caso es una compresión, luego el trabajo será negativo (producido sobre el gas, y no producido por el gas). Siendo una gas ideal, se cumple la ecuación de estado PV = nRT, y como T es constante, se cumple PV = cte, o sea que P_1V_1=P_2V_2. Además, P=nRT/V, sustituyendo en [1]:

W=\int_{V_1}^{V_2}\frac{nRT}V\operatorname dV=nRT\int_{V_1}^{V_2}\frac{\operatorname dV}V=nRT\left(\ln\left(V_2\right)-\ln\left(V_1\right)\right)=nRT\ln\left(\frac{V_2}{V_1}\right)

Expresamos el volumen en función de la presión usando P_1V_1=P_2V_2\Leftrightarrow\frac{V_2}{V_1}=\frac{P_1}{P_2}, y el trabajo en función de las presiones queda

W=nRT\ln\left(\frac{P_1}{P_2}\right)

Sustituyendo los valores numéricos:

0.8 atm = 0.8 · 1. 013 · 10⁵ N/m² = 0.8104 · 10⁵ N/m² ,

3.5 atm = 3.5 · 1. 013 · 10⁵ N/m² = 3.5455 · 10⁵ N/m² ,

18⁰C = 18 + 273⁰K = 291⁰K,

W=1\cdot8314\cdot291\cdot\ln\left(\frac{0.8104}{3.5455}\right)=-3496\;J.


3. Un gas ideal encerrado en un émbolo a 25⁰C y presión inicial P = 2 atm (estado A) se calienta suministrándole un calor Q sin variar el volumen (émbolo fijado). A continuación, una vez absorbido el calor por el gas (estado B) se libera el émbolo permitiendo que el gas se expanda adiabáticamente, de forma que la presión final es 1,1 atm y la temperatura final la misma que la inicial, 25⁰C (estado C). Calcular la presión y la temperatura en el estado intermedio B, y el calor suministrado. Se supone que todos los cambios son reversibles. Datos adicionales: masa del gas m = 1Kg, calor específico molar a volumen constante c = 5R/2, siendo R la constante universal del los gases perfectos.

Solución. En la imagen 1 vemos los estados del sistema y su evolución en un diagrama PV. La línea vertical AB es a volumen constante, y el sistema absorbe un calor Q, aumentando su presión; por el punto A se ha dibujado en discontinuo la curva isoterma correspondiente a la T = 25⁰C, observemos que el estado final C, al estar a la misma temperatura, está también sobre la isoterma, debe de ser así pues al ser todo el proceso reversible, el estado C es de equilibrio, y al estar A, C  a la misma temperatura, han de estar unidos por una isoterma. La curva BC es adiabática de temperatura variable.

Fig.1: las transformaciones del problema en el diagrama PV

Resumimos lo que sabemos y lo que desconocemos:

  • Estado A: PA = 2 atm, VA = ? , TA = 25⁰C
  • Estado B: PB = ?, VB = VA, TB = ?
  • Estado C: PC = 1.1 atm, VC = ?, TC = 25⁰C
  • Transformación A->B a volumen constante
  • Transformación B->C adiabática Q = 0

Para el estado A es immediato calcular VA, usando PV = nRT -> VA = nRTA / PA = (100·R·295) / (2·1.013·10⁵) = 295R/2026 m³. Luego también tenemos VB = VA = 295R/2026 m³.

Lo mismo sucede con el estado C: VC = nRTC / PC = (100·R·295) / (1.1·1.013·10⁵) = 2950R/11143 m³. Los estados A y C quedan totalmente determinados, y del B nos falta la presión y el volumen.

Transformación B->C. Es una adiabática, aplicaremos lo visto en Trabajo, calor, 1r principio de la Termodinámica apartado Transformaciones adiabáticas; aplicación a los gases perfectos: \mathrm{PV}^\mathrm\gamma=\mathrm{cte} siendo \gamma=c_p/c_v y además se cumple la relación de Mayer, c_p-c_v=R. Con  los datos del enunciado, encontramos el valor de la constante gamma:

\mathrm\gamma=\frac{{\mathrm c}_\mathrm p}{{\mathrm c}_\mathrm v}=\frac{\mathrm R+{\mathrm c}_\mathrm v}{{\mathrm c}_\mathrm v}=\frac{\mathrm R+{\displaystyle\frac{5\mathrm R}2}}{\displaystyle\frac{5\mathrm R}2}=\frac75=1.4

Por tanto, en la transformación B->C, PV^{1.4}=cte, y podemos escribir:

P_BV_B^{1.4}=P_CV_C^{1.4}\Rightarrow P_B=P_C\frac{V_C^{1.4}}{V_B^{1.4}}=1.1\frac{2950\cdot2026}{295\cdot11143}=2.31\;atm

Nos falta TB . Veamos la transformación A->B.

Transformación A-B. Siendo un gas ideal se cumple PV = nRT, y como el volumen es fijo, se cumple la ley de Gay-Lussac (que se deduce directamente de la ecuación PV=nRT considerando el volumen constante):

\frac{P_A}{T_A}=\frac{P_B}{T_B}\Leftrightarrow T_B=T_A\frac{P_B}{P_A}=298\frac{2.31}2=344,

Las presiones no las hemos convertido a sistema internacional pues el cociente \frac{P_B}{P_A} vale lo mismo en atmósferas que en Pascales. Ahora podemos obtener el calor absorbido por el sistema, que es absorbido a volumen constante; el incremento de temperatura viene dado por:

Q=nc_V\triangle T=100\cdot\frac528,314\cdot\left(344-298\right)=95611J\;\simeq\;96KJ.,

o en kilocalorias, aproximadamente 23 Kcal.


4. Una máquina térmica que sigue un ciclo de Carnot trabaja entre las temperaturas de 150⁰C y 50⁰C. ¿Cuál es la cantidad de calor que absorbe si la máquina tiene una potencia de 75 KW?

Solución: En la teoría Trabajo, calor, 1r principio de la Termodinámica apartado Máquina térmica de Carnot para gases perfectos se muestra que “el ciclo de Carnot opera entre dos fuentes térmicas a temperaturas distintas T, T’, absorbiendo calor Q de la fuente más caliente y cediendo calor Q’ a la fuente más fría, y realizando un trabajo neto W = Q – Q’.“; una potencia de 75 KW equivale a desarrollar un trabajo de 75 KJ por segundo, luego Q – Q’ = 75000 J. Además, sabemos que el rendimiento de los ciclos de Carnot cumplen:

r=\frac WQ=\frac{T-T'}T

En nuestro caso,

r=\frac{75000}Q=\frac{\left(150+270\right)-\left(50+270\right)}{\left(150+270\right)}=\frac5{21}\Rightarrow Q=\frac{21}575000=315000J

Hay que suministrar 315 KJ por segundo, o sea 315 KW en forma de energía térmica a la máquina para obtener 75 KW de potencia; la máquina tiene un rendimiento de 5/21, en tanto por ciento es de solo el 23.8%: de cada 100 J suministrados en forma de calor, 23.8 J se transforman en calor, y el resto, 76.2 J, se devuelven en forma de calor no aprovechable. El rendimiento de las máquinas térmicas es pues bajo, y mucho menor que el de los motores eléctricos, que rondan el 80% de eficiencia.


Preguntas cortas

1 – Un gas perfecto se dilata reversiblemente en dos fases, la primera es isoterma, la segunda adiabática, recorriendo tres estados, el inicial A, el intermedio B y el final C. Tenemos conocimiento completo de les estados A y C, pero no sabemos nada del estado intermedio B. ¿Es posible calcular el trabajo de expansión realizado por el sistema?

Respuesta. No es posible, y no lo es porque el trabajo realizado en una transformación de diversos estados depende de cada uno de los estados intermedios. En la figura 2 vemos en un diagrama PV dos posibles caminos ABC y AB’C entre los mismos estados A y C, recordando que el trabajo realizado coincide con el área bajo la curva, vemos claramente que las áreas delimitadas por los dos caminos son distintas, luego conocer el estado intermedio B es necesario para calcular el trabajo.

Fig. 2: el trabajo realizado en una transformación de estados depende de todos los estados, no sólo del inicial y el final


2 – Un gas perfecto se dilata reversible y adiabáticamente desde el estado inicial A al final B. Conocemos las temperaturas en A y B pero  no los volúmenes. ¿Es posible calcular el trabajo de expansión realizado por el sistema?

Respuesta. Sí es posible, pues en un proceso adiabático Q = 0, y por el 1r principio Q = W + E -> 0 = W + E -> W = -E, el trabajo realizado será igual al cambio de energía interna cambiado de signo (pues en la expansión se pierde energía interna), además sabemos que en los gases perfectos el cambio de energía interna sólo depende del cambio en la temperatura \triangle E=nc_V\triangle T.


3 – Es conocido el hecho de que, al inflar a mano un neumático con una bomba de aire, ésta se calienta, el efecto es muy notable con los neumáticos de bicicleta de carretera, que han de hincharse a presiones elevadas (de unos 7kg/cm² para un ciclista de 70kg), y no puede explicarse por simple rozamiento, ¿a que es debido? Considerar que el aire se comporta como un gas perfecto.

Respuesta. La bomba comprime el aire y lo inyecta en la cámara del neumático; para hacerlo realizamos trabajo sobre el aire (la fuerza que aplicamos a la bomba), lo que no suministramos es calor: nosotros no calentamos el aire poniéndolo en contacto con una fuente térmica cálida, nos limitamos a realizar un trabajo. Por el 1r principio, Q = W + E, el incremento de energía interna es igual al trabajo suministrado (signo negativo, recordemos el convenio de signos, el trabajo realizado por el sistema es positivo), -W = E, pero en los gases perfectos el cambio de energía interna sólo depende del cambio en la temperatura \triangle E=nc_V\triangle T, así pues, el gas se ha de calentar si aumenta su energía interna.


4. Un ciclo de un gas ideal tiene forma rectangular en el diagrama Presión-Volumen. ¿Qué aspecto tendrá en un diagrama Presión-Temperatura?

Respuesta. En la figura 2 vemos el diagrama PV, indicando el carácter de cada transformación entre los cuatro estados ABCD. Siendo un gas ideal, tenemos la ecuación de estado PV = nRT. Veamos que no dice para cada transformación respecto a las variables P, T:

Fig.2: diagrama PV en forma de rectángulo

A->B: dilatación a presión constante, se produce trabajo, V=\left(\frac{nR}P\right)T, la temperatura depende linealmente del volumen, a más volumen, más temperatura; esto sólo es posible si hay una aportación de calor Q al gas, que se expandirá y calentará a presión constante. P = cte implica que será una linea horizontal en el plano PT.

B->C: Descompresión a volumen constante, P=\left(\frac{nR}V\right)T, dependencia lineal, la temperatura disminuye con la presión, manteniendo el volumen constante, implica que no se produce trabajo, y por el 1r principio la disminución de energía interna (debido al descenso de temperatura) es igual al calor emitido: se debe quitar calor al gas para disminuir la presión a volumen constante. En el diagrama PT será una línea con pendiente positiva \frac{nR}V

C->D: reducción de volumen a presión constante, se recibe trabajo (trabajo negativo), V=\left(\frac{nR}P\right)T, la temperatura depende linealmente del volumen, desciende con éste, y se desprende calor (1r principio, Q = W + E, ambos negativos). En el diagrama PT será una línea horizontal.

D->A: compresión a volumen constante, P=\left(\frac{nR}V\right)T, dependencia lineal, la temperatura aumenta con la presión, manteniendo el volumen constante, implica que no se produce trabajo, luego Q = E, el gas absorbe calor. En el diagrama PT será una línea con la misma pendiente que B->C.

Con todo ello nos resulta un ciclo con forma de paralelogramo:

Fig. 3: diagrama PT equivalente


 

Publicado en Fí­sica, Termodinámica | Etiquetado , , , , , | Deja un comentario

Trabajo, calor, 1r principio de la Termodinámica

La Termo-dinámica se ocupa de la dinámica (movimiento, transferencia) térmica, y utiliza las magnitudes temperatura, volumen, presión, energía, calor y trabajo para relacionarlas entre sí. El intercambio calor-energía-trabajo supondremos que se realiza entre un “sistema” – una parte del Universo delimitada por un volumen cerrado – y su entorno – el resto del Universo – , aunque a menudo restringiremos el entorno a las denominadas “fuentes térmicas” que definiremos. Entonces, hay magnitudes que utilizaremos para definir el estado termodinámico del sistema, y otras para definir su evolución o cambio de estado. Si tenemos alguna ecuación matemática que relacione entre sí las magnitudes que definen el estado, la llamaremos ecuación de estado; un ejemplo conocido de ecuación de estado es la de los gases perfectos, PV = nRT.

Diagramas PV de Clapeyron

Una herramienta útil para entender y trabajar con cambios de estado es el diagrama de presión y volumen, que muestra como un punto cada valor de esas magnitudes, y como una línea su evolución estado a estado.  Por ejemplo, consideremos un gas encerrado en un cilindro con un émbolo encima del cual hemos colocado un conjunto de pequeños pesos, que vamos quitando uno a uno (figura 1).

Fig. 1: un gas comprimido en un pistón con una presión P que variamos quitando unos pequeños pesos

El  gas, cuando no tocamos los pesos, y si lo hemos dejado en reposo, estará en equilibrio termodinámico: no hay flujo de calor y la presión y volumen están estables; tendrá una presión P y un volumen V representados por el punto A del diagrama PV (figura 2).

Fig.2: diagrama PV de Clapeyron, mostrando cambios irreversibles AB, BA’, A’B’, …

Entonces levantamos uno de los pesos y la presión disminuye bruscamente: el sistema está ahora en el punto B, que no es un estado de equilibrio (no es estable), entonces el gas se expande espontáneamente hasta alcanzar el punto A’ que vuelve a ser de equilibrio.  Vamos repitiendo el procedimiento con los otros pesos, y el gas va pasando por los estados  A”,  A”’, …etc hasta llegar al estado final C. La línea continua azul que une todos los estados de equilibrio A, A’, …, C representa una transformación suave desde el estado inicial A hasta el final C sin que el sistema deje de estar en equilibrio.

En general, un cambio brusco en una magnitud saca del equilibrio al sistema: decimos que es un cambio de estado irreversible; sólo si los cambios son tan progresivos y suaves que, en cada momento, el sistema sólo se desvía del equilibrio una cantidad infinitesimal, de forma que podemos considerar que el sistema evoluciona estando siempre en equilibrio, entonces diremos que es un cambio de estado reversible. Los cambios que se ven como una función escalonada en el diagrama de Clapeyron son todos irreversibles, mientras que la línea azul continua que une estados de equilibrio A y C representa una transformación reversible.

Para estar siempre en equilibrio y no obstante cambiar de estado, las variaciones han de ser continuas: imaginemos que en lugar de los pesos de la figura 1 usamos arena, y que vamos quitando la arena grano a grano, entonces tendremos una buena aproximación a una transformación reversible; se llama así porque en cualquier estado intermedio entre A y C podríamos volver a poner los granos de arena y el sistema recorrería el camino inverso de C hacia A de forma suave: se puede revertir con una modificación infinitesimal. En cambio si realizamos una transformación brusca irreversible como la A->B, si queremos “deshacerla” no basta con una modificación infinitesimal de la presión, pues la presión exterior ha variado bruscamente y una modificación infinitesimal de la presión no detendrá la expansión del gas que seguirá evolucionando hacia el estado B. En definitiva:

Una transformación reversible mantiene al sistema siempre en equilibrio, y puede revertirse cambiando infinitesimalmente las condiciones. Una transformación irreversible aleja al sistema del equilibrio y no  puede revertirse cambiando infinitesimalmente las condiciones.

El estudio de las tranformaciones irreversibles, la termodinámica de los procesos irreversibles, es considerablemente más complicada que la de los procesos reversibles, a las cuales dedicaremos el resto de este artículo.

Cambios isobáricos, isotérmicos, isócoros

En el ejemplo del gas en un cilindro de la figura 1, en el cambio brusco de estado AB varia la presión pero no el volumen, que aumenta: decimos que es una transformación isócora. Cuando el gas se expande en el cambio BA’, lo hace a presión constante: es una transformación isobárica.

Fig. 3: sistema de la figura 1 envuelta en un baño térmico a temperatura constante

Si mantenemos la temperatura constante, por ejemplo fabricando el cilindro de un material muy conductor del calor y rodeándolo de un baño térmico (un entorno que no varia de temperatura por su gran capacidad calorífica, por ejemplo, una habitación acondicionada o una piscina, figura 3) entonces es una transformación isotérmica; supongamos que el sistema es un gas perfecto, entonces se cumplirá, para una transformación isotérmica, que PV = cte, y la representación gráfica de la curva de estados de equilibrio del gas ideal en el diagrama PV será una hipérbola con asíntotas en los ejes, tal como la línea azul de la figura 2.

Trabajo realizado por dilatación

Supongamos que tenemos un sistema delimitado por una superficie S, sujeto a una presión exterior P, que se está dilatando. El trabajo W realpizado al desplazarse una distancia x contra una fuerza F es W = S·x, y la fuerza total ejercida por la presión F sobre la superfície S es F = P·S. Pensemos en una dilatación infinitesimal del sistema, de forma que sus límites se muevan una distancia dx y su superfície aumente en dS; el trabajo elemental realizado contra la presión exterior será dW = dF·dx = P·dS·dx, pero el producto dS·dx es igual al incremento de volumen dV = dS·dx. luego dW = P·dV, integrando entre el volumen inicial y el volumen final nos queda

W=\int_{V_1}^{V_2}P\operatorname dV [1]

En el diagrama PV, esta integral coincide con el área bajo la curva de cambio de estado (figura 4)

Fig. 4: El trabajo realizado por el sistema al expandirse de A a B es el área rayada

Si en vez de una expansión tenemos una contracción, el desplazamiento cambia de signo, y el trabajo resultante es negativo: es trabajo realizado sobre el sistema. Tenemos pues: si el sistema realiza un trabajo W, éste tendrá un valor positivo, y si se realiza un trabajo sobre el sistema, tendrá un valor negativo.

Transformaciones cíclicas

Fig.5: una transformación termodinámica PV cíclica, o brevemente, un ciclo

Son transformaciones que empiezan y acaban en el mismo estado. En la figura 5 vemos representado un ciclo en el diagrama PV recorrido en el sentido de las agujas del reloj; al recorrer la rama superior el trabajo de dilatación realizado será igual al área bajo la curva roja, en cambio al recorrer la rama inferior el sistema se contrae, luego el trabajo es negativo, y será igual al área bajo la curva azul cambiada de signo. El trabajo total del ciclo será la suma de los dos anteriores, y se ve claramente que será igual al área contenida dentro del ciclo y tendrá un valor positivo (trabajo neto realizado por el sistema).

Si recorremos el ciclo en sentido inverso a las agujas de reloj, los signos de los trabajos cambian, y el trabajo del ciclo será negativo, el ciclo recibirá un trabajo neto.

Primer principio de la Termodinámica

El principio de conservación de la energía enuncia que ésta nunca se pierde sino que se transforma de unos tipos a otros; en termodinámica hemos visto que los tipos de energías que estudiamos son la energía térmica o calor Q, y el resto de energías que puedan tener un papel en las transformaciones las agrupamos todas bajo la denominación genérica “energía E”, con mención especial a la energía genérica interna del sistema que estudiamos, que denominaremos energía interna del sistema. La energía se puede invertir en realizar un trabajo, y aquí es dónde llegamos a enunciar el primer principio de la termodinámica, que relaciona calor y trabajo:

1r principio: Si un sistema absorbe una cantidad de calor Q i una cantidad de trabajo W, y emite una cantidad de calor Q’ y realiza una cantidad de trabajo W, se cumple siempre que:

Q + Q’ = W + W’ [2]

Fig. 6: balance entre calor absorbido y emitido, y trabajo absorbido y realizado

El 1r principio no es más que un balance energético donde usamos el trabajo para explicar lo que sucede con el calor que “desaparece”; observemos los convenios de signo: el trabajo realizado por el sistema y el calor absorbido por él se consideran de signo positivo, mientras que el calor emitido por el sistema y el trabajo recibido sobre él son negativos. Pero no significa que el trabajo sea una forma de energía; parecería pues que el 1r principio violaría la conservación de la energía, veamos que esto no es así.

Energía interna y magnitudes conservativas

Consideremos la transformación A->B de la figura 5, que es parte de un clclo, una expansión del sistema que generará un trabajo W > 0 dado por la expresión 1. Supongamos que el sistema absorbe un calor Q > 0  en esa transformación; la diferencia entre calor absorbido y trabajo realizado, Q – W, debe de “ir a algún sitio”; diremos que se utiliza para aumentar la energía interna del sistema:

\triangle E_{A\rightarrow B}=Q-W

Cerrando el ciclo, la transformación B->A es una compresión, luego se genera trabajo sobre el sistema, W’ < 0, y quizá el sistema libere calor Q’ < 0, de nuevo, la diferencia Q’ – W’ se empleará en variar la energía interna del sistema:

\triangle E_{B\rightarrow A}=Q'-W'

Si consideramos ahora todo el ciclo A->B->A, como el sistema queda en el mismo estado inicial, la energía interna también ha de ser la misma; sumando las dos igualdades anteriores:

\begin{array}{l}\begin{array}{l}\triangle E_{AB}=Q-W\\\triangle E_{BA}=Q'-W'\end{array}\\---------\\\triangle E_{ABA}=\left(Q+Q'\right)-\left(W-W'\right)\end{array}

Luego

\left(Q+Q'\right)-\left(W-W'\right)=0\Leftrightarrow\boxed{Q+Q'=W-W'}

recuperamos el 1r principio; vemos que nos faltaba para entender la conservación de la energía la energía interna del sistema: la energía térmica, el trabajo, y la energía interna se van equilibrando en cada transformación termodinámica. Enunciamos ahora unas propiedades importante:

P1) La energía interna E del sistema es una función del estado del sistema: a cada estado le corresponde una única energía definida.

Por ejemplo si un sistema queda totalmente definido por las magnitudes presión P y Volumen V, entonces la energía interna es función de P, V: E = f(P, V).

P2) El trabajo W no es una función de estado del sistema, para cada estado no es posible asignar un único valor de W.

En efecto, sabemos que el valor del trabajo es igual al área definida por la curva de cambio de estado PV y el eje V; en la figura 7 vemos tres trayectorias distintas entre los mismos estados A, B, y cada una representa un trabajo distinto. Este hecho también se enuncia diciendo que el trabajo no es una magnitud conservativa, significando que si hacemos un ciclo ABA, el trabajo total no tiene porque ser nulo, pues dependerá de las trayectorias seguidas. En cambio la energía interna es una magnitud conservativa, pues siempre la recuperaremos en un ciclo (variación total nula) independientemente del camino seguido.

Fig. 7: El trabajo ralizado en una tranasformación no depende sólo de los estados inicial A y final B

Con esto podemos reformular el 1r principio en una forma equivalente:

1r principio: El calor absorbido por un sistema se invierte íntegramente en el trabajo realizado por él más su incremento de energía interna, Q=W+\triangle E. [3]

Energía interna y temperatura

Diferenciando la expresión 3, \operatorname dQ=\operatorname dW+\operatorname dE, y recordando la expresión 1 para el trabajo: \operatorname dQ=P\operatorname dV+\operatorname dE. [4]

Por otra parte, el calor absorbido y el incremento de temperatura están relacionados con el coeficiente calorífico c, \triangle Q=nc\triangle T, siendo una medida de la masa del sistema (como por ejemplo el número de moles); sucede que c toma valores distintos en transformaciones isóbaras que en isócoras:

a V = cte, \triangle Q=nc_V\triangle T,

a P = cte, \triangle Q=nc_P\triangle T.

Tomemos un proceso a V = cte y diferenciemos: \operatorname dQ=nc_V\operatorname dT. Comparando con 4:

P\operatorname dV+\operatorname dE=nc_V\operatorname dT\Leftrightarrow\operatorname dE=nc_V\operatorname dT

pues V es constante y dV = 0. integrando:

\triangle E=nc_V\triangle T [5]

que nos da la variación de energía interna respecto a la variación de temperatura en un proceso a volumen constante. Pero la energía es una función de estado, y su variación sólo depende de los estados, no de los procesos, por ello, la expresión 5 es válida en general, y nos da la variación de la energía interna en función del cambio de temperatura para cualquier transformación.

Transformaciones adiabáticas; aplicación a los gases perfectos.

Si no hay intercambio de calor, el 1r principio dice que Q=0\Rightarrow W+\triangle E=0. Hemos visto que podemos relacionar el incremento de energía interna en un sistema termodinámico con un incremento de temperatura (ecuación 5):

\operatorname dW+nc_v\operatorname dT=0\Leftrightarrow P\operatorname dV+nc_v\operatorname dT=0 [6]

ecuación que nos da la relación entre diferenciales de volumen y temperatura cuando Q = 0.

Aplicación a los gases perfectos

La ecuación de estado es PV = nRT, aislando P y sustituyendo en 6:

\frac{nRT}V\operatorname dV+nc_v\operatorname dT=0

dividimos todo por nCvT e integramos:

\int\frac R{c_v}\frac{\operatorname dV}V+\int\frac{\operatorname dT}T=0\Leftrightarrow\frac R{c_v}\ln\left(V\right)+\ln\left(T\right)=\mathrm C

donde C es una constante de integracion; operamos con los logaritmos, y además definimos la constante \gamma=c_p/c_v, y usamos la relación de Mayer, c_p-c_v=R para obtener:

\left.\begin{array}{r}\frac R{c_v}\ln\left(V\right)+\ln\left(T\right)=\mathrm C\\c_p-c_v=R;\;\gamma=\frac{c_p}{c_v}\end{array}\right\}\Rightarrow\frac{c_p-c_v}{c_v}\ln\left(V\right)+\ln\left(T\right)=\mathrm C\Rightarrow\ln\left(\mathrm{TV}^{\mathrm\gamma-1}\right)=\mathrm C

Volvemos a utilizar la ecuación de estado ideal PV = nRT para eliminar T de la expresión anterior:

\ln\left(\frac{PV}{nR}V^{\mathrm\gamma-1}\right)=\mathrm C\Leftrightarrow\ln\left(\frac1{\mathrm{nR}}\mathrm{PV}^\mathrm\gamma\right)=\mathrm C

Como 1/nR es una constante, lo incorporamos a la constante de integración, y concluimos:

\ln\left(\frac1{\mathrm{nR}}\mathrm{PV}^\mathrm\gamma\right)=\mathrm C\Rightarrow\ln\left(\mathrm{PV}^\mathrm\gamma\right)=\mathrm{cte}\Rightarrow\boxed{\mathrm{PV}^\mathrm\gamma=\mathrm{cte}}

que nos da la ecuación de los estados de las transformaciones adiabáticas de gases perfectos;  sabiendo que c_p-c_v=R>0, deducimos que c_p=R+c_v>c_v y por tanto que \gamma>1.

La figura 8 compara gráficamente las transformaciones adiabáticas con las isotérmicas de gases perfectos, en las que PV = cte:

Fig.8: transformaciones isoterma y adiabáticas de gases perfectos en el diagrama PV

Observamos que la isotérmica tiene una pendiente menor que todas las adiabáticas, pues \gamma>1. Asintóticamente todas coinciden en los ejes P y V.

Máquina térmica de Carnot para gases perfectos

Pensemos ahora en un ciclo de transformaciones reversibles como el mostrado en la figura 9, recorido en el sentido de las agujas del reloj, 1-2-3-4, y con las siguientes condiciones:

  • 1-2: isotérmica, T=cte, absorbe Q > 0
  • 2-3: adiabática, Q = 0, T variable pasa a ser T’
  • 3-4: isotérmica, T’=cte, emite Q’ < 0
  • 4-1: adiabática, Q = 0, T’=cte

El diagrama tiene la geometría correcta, pues hemos visto que las curvas adiabáticas tienen mayor pendiente que las isotérmicas, al menos lo hemos visto para gases perfectos, y nos restringimos a este caso en lo que sigue.

En las isotérmicas la energía interna debe de ser constante según la ecuación 5, y en este caso por el 1r principio, el trabajo ha de ser igual al calor, Q = W(12) y Q’=W(34). Además, el valor del área 112’1′ coincide con el valor de Q, y el del área 44’33’ coincide con el valor de Q’,

En cambio en las adiabáticas hay cambios de temperatura y de energía interna, y por el 1r principio W(23) = incremento E(23) y W(41) = incremento E(41). Además, los valores de las áreas 11’44’ y 22’3’3 coinciden con los cambios de energía interna. Como el cambio de energía interna del ciclo completo ha de ser cero, se deduce que las áreas 11’44’ y 22’3’3 han de ser iguales (en el diagrama no lo son).

Las variaciones de temperatura, en las transformaciones adiabáticas, viene dadas por (5) y son:

\triangle T=\frac{nc_v}{\triangle E}=\frac{nc_v}{-W}\left\{\begin{array}{l}<0\text{ en expansión adiabática}\\>0\text{ en compresión adiabática}\end{array}\right.

Como en la adiabática 23 la variación de temperatura es negativa, implica que T > T’: el ciclo de Carnot opera entre dos fuentes térmicas a temperaturas distintas, absorbiendo calor Q de la fuente más caliente y cediendo calor Q’ a la fuente más fría, y realizando un trabajo neto W = Q – Q’.

Ciclo inverso de Carnot: bomba de calor

Siendo un ciclo reversible puede invertirse en cualquier momento y hacerse en sentido contrario al del reloj; en el sentido 4321 la 32 es una compresión adiabática, que implica un aumento de temperatura, luego T > T’ como en el ciclo directo; en la 21 tenemos compresión isoterma que libera calor Q, y en cambio en 43 se absorbe: el ciclo inverso absorbe calor de la fuente fría, cede calor a la fuente caliente y consume un trabajo W, por ello decimos que bombea calor de la fuente fría a la cálida, es decir, que la refrigera.

Rendimiento de un ciclo

Nos preguntamos, ¿que trabajo neto W obtenemos a cambio de inyectar un calor neto Q + Q’ en el ciclo? (recordemos que Q’ tendrá signo negativo). Este último calor suele provenir de la combustión (fuente térmica a alta temperatura), se genera un trabajo y se libera un calor residual al medio ambiente Q’.  Definimos el índice de rendimiento del ciclo r = W / Q, que idealmente seria 1 (todo el calor se convierte en trabajo). Vemos que r = (Q  + Q’) / Q. Se puede demostrar que, para un ciclo de Carnot, se cumple

r=\frac{T-T'}T=1-\frac{T'}T [6]

que sólo depende de las temperaturas de los focos térmicos, y será siempre menor que 1 excepto en el caso extremo de T’ = 0 (medio exterior en el cero absoluto de temperaturas). Se puede definir un índice análogo para bombas de calor.

 

 

Publicado en Fí­sica, Termodinámica | Etiquetado , , , , , , , , , , , , , | 3 comentarios

Física del sonido

En anteriores artículos de la categoría “Acústica” hemos sobre todo realizado una descripción de las características del sonido y de la música, un tipo especial de sonido. En este  artículo tratamos los detalles desde un punto de vista más matemático.

Intensidad del sonido

El sonido es una onda elástica de presión, la intensidad que percibimos en el sonido es proporcional al cuadrado de de la amplitud de la vibración (esto es así para el movimiento ondulatorio en general). También podemos expresar la intensidad en función de la variación máxima de presión del aire originada por el sonido al propagarse, como vamos a ver a continuación.

La presión del aire, cuando propaga el sonido, es variable en cada punto, y por tanto el volumen que ocupa una cantidad fija de aire también varia con la presión.

Fig. 1: Onda longitudinal de presión: desplazamientos instantáneos

Imaginemos (figura 1) un volumen de aire dentro de un pequeño cilindro de área S y longitud dx, situado inicialmente entre las posiciones x, x + dx, con volumen V = S·dx,  que es atravesado por la onda de expansión (el sonido) en la dirección de el eje X; decimos que sea pequeño para aproximar el frente de onda a una onda plana, cuando en realidad es esférica. El cilindro se desplazará y ensanchará sólo en la dirección X (la base S es transversal a X, y la onda es longitudinal según X) de forma que las posiciones de los extremos serán (x + dy) y (x + dx + dy), donde llamamos y a la elongación de la onda, que recordemos es longitudinal y por tanto paralela al eje X.

El el nuevo volumen será S(dx + dy), luego el incremento de volumen es dV = S·dy. Luego:

\frac{\operatorname dV}V=\frac{S\operatorname dy}{Sdx}=\frac{\operatorname dy}{\operatorname dx} [1]

No confundamos la variable y con la dimensión vertical del eje de ordenadas: aquí y representa la elongación de la onda longitudinal en la dirección horizontal.

Por otro lado, la velocidad de propagación de una onda longitudinal en un medio elástico sólo depende de su densidad \rho y del denominado módulo de compresibilidad \chi=-V\frac{\triangle p}{\triangle V} [2], donde p es la presión, según la igualdad:

v=\sqrt{\frac\chi\rho} [3]

Combinando las expresiones [1] y [2], e identificando las variaciones finitas \triangle con las diferenciales:

\chi=-\cancel{\operatorname dV}\frac{\operatorname dx}{\operatorname dy}\frac{\operatorname dp}{\cancel{\operatorname dV}}=-\operatorname dp\frac{\operatorname dx}{\operatorname dy}

Sustituimos en la expresión de la velocidad [3]:

v=\sqrt{-\operatorname dp\frac{\operatorname dx}{\rho\operatorname dy}}\Rightarrow-\operatorname dp=v^2\rho\frac{\operatorname dy}{\operatorname dx} [4]

Supongamos ahora que el sonido es un movimiento ondulatorio armónico (por tanto, es un sonido musical simple, puro) con elongación dada por

y=A\sin\omega\left(t-\frac xv\right) [5]

Derivamos respecto x manteniendo t constante:

\frac{\operatorname dy}{\operatorname dx}=-\frac Av\omega\cos\left(t-\frac xv\right)

Sustituimos el valor de dy/dx en [4]:

\operatorname dp=Av\rho\omega\cos\omega\left(t-\frac xv\right)=\widehat A\cos\omega\left(t-\frac xv\right) [6]

que nos dice que la variación de presión debida al sonido se propaga como una onda de presión, con amplitud \widehat A y que, comparada con la onda de elongación [5], está adelantada en fase 90⁰ (ya que depende de la función coseno en vez de la seno).

El valor máximo de la sobrepresión es \operatorname dp_{MAX}=Av\rho\omega; en general, la intensidad de una onda (energía que atraviesa la unidad de superficie normalmente a ella en la unidad de tiempo) es I=\frac12A^2\rho\omega^2v, de donde deducimos, usando [6]:

\frac{\operatorname d{p^2}_{MAX}}I=\frac{A^2v^2\rho^2\omega^2}{\frac12A^2\rho\omega^2v}=2v\rho\Rightarrow\boxed{I=\frac{\operatorname d{p^2}_{MAX}}{2v\rho}}

La intensidad del sonido es proporcional al cuadrado de la sobrepresión  máxima asociada a la onda de presión.

Cálculo de la velocidad del sonido en el medio ambiente

En el aire y en condiciones normales, las variaciones de presión son muy rápidas, y se puede considerar que no da tiempo al intercambio de calor (un gas al ser comprimido se calienta y al ser expandido se enfría), en términos termodinámicos, son variaciones de presión adiabáticas. Supongamos que el aire se comporta aproximadamente como un gas perfecto, cumpliendo la ecuación de los gases ideales en expansión adiabática, pV^\gamma=cte [7], donde \gamma es el coeficiente adiabático. Diferenciando: \operatorname dp\cdot V^\gamma+\gamma V^{\gamma-1}\cdot\operatorname dV=0\Rightarrow\operatorname dp\cdot V+\gamma\operatorname dV=0, de donde \operatorname dp=-\gamma p\frac{\operatorname dV}V. Sustituyendo en la expresión [2]:

\operatorname dp=-\gamma p\frac{\operatorname dV}V,\;\chi=-V\frac{-\gamma p\frac{\operatorname dV}V}{\operatorname dV}=\gamma p

Sustituyendo en la velocidad [3]:

v=\sqrt{\frac\chi\rho}=\sqrt{\frac{\gamma p}\rho} [8]

Para el aire es \gamma=1.4; además, a 0⁰ grados Celsius y presión p = 1atm = 1.013·10⁵ N/m², la densidad del aire es ρ = 1.293  kg/m³, sustituyendo en [8] obtenemos

v=\sqrt{\frac{1.4\cdot1.013\cdot10^5}{1.293}}=331

Vemos que con consideraciones teóricas obtenemos un valor muy de acuerdo con las mediciones experimentales. Nos damos cuenta, además, de que la velocidad del sonido en el aire dependerá de la temperatura, pues con ella variará la presión atmosférica. Usando la ecuación de los gases perfectos pV = nRT, para eliminar la presión p de la ecuación [8] se obtiene (T en grados Kelvin):

v=\sqrt{\frac{\gamma RT}M} [9]

En la figura 2 vemos la variación de v según la temperatura obtenida aplicando [9] para un rango de [0, 30] grados centígrados, es prácticamente lineal, variando unos 0,6 m/s por cada grado.

Fig. 2: Variación de la velocidad del sonido con la temperatura

Efecto Doppler

Cuando oímos un tren que se acerca con el silbato actuando, nos parece que el sonido es más agudo que si el tren se aleja de nosotros. El mismo efecto se observó con la luz, su frecuencia parece más alta cuando el foco emisor se acerca a nosotros que cuando se aleja, si la luz es visible, en el primer caso vemos la luz “más azul” (corrimiento al azul) y en el segundo, “más roja” (corrimiento al rojo). Veamos la expresión exacta que nos da el corrimiento en frecuencia.

Fig. 3: foco de sonido y receptor en movimiento mutuo. Efecto Doppler.

En la figura 3 representamos la situación: un observador O se mueve hacia la derecha con velocidad v y un foco de luz se mueve en dirección contraria con velocidad u (todo con respecto a un sistema de referencia que suponemos fijo); los frentes de onda se suponen planos (realmente son esféricos). La velocidad del sonido relativa al foco es w, y la absoluta (respecto al suelo) será u + w, mientras que la velocidad relativa al observador O será u + w – v (estamos suponiendo que las velocidades son mucho menores que la de la luz, y por ellos despreciando los efectos relativistas).

La frecuencia percibida del sonido es el número de ondas que llegan al receptor por segundo; en el caso de observador y foco en reposo, esa frecuencia será ν, y está relacionada con la velocidad w de la onda y su longitud λ por la relación w = λ·ν, de donde ν = w/ λ.  Cuando el foco de sonido se mueve, el número de ondas por segundo que  llegan a un receptor no será el mismo, y se percibirá una frecuencia ν’ distinta. La onda de sonido en sí no cambia: su longitud de onda, su amplitud, su forma, no cambian, sólo que su velocidad relativa al observador sí lo hace (figura 4).

Fig. 4: onda sinusoidal, se desplaza a velocidad w relativa a una referencia fija

Desde el punto de vista del foco, que se mueve en la misma dirección que los frentes de onda y con velocidad u, se emiten ν ondas por segundo, y se “ven” los frentes de onda alejándose del foco a velocidad (w – u), por ello el foco verá una longitud de onda de λ = (w – u) / ν.

Veamos ahora el punto de vista del observador O, que se mueve a velocidad v acercándose al foco, y por tanto verá moverse a los frentes de onda a velocidad (v + w). Razonando de la misma forma que para el foco, verá una longitud de onda λ = (v + w ) / ν‘. Igualando las dos expresiones para λ:

\lambda=\frac{w-u}\nu=\frac{w+v}{\nu'}

que nos proporciona la relación buscada entre frecuencia emitida f y frecuencia observada f’. Por ejemplo, si el silbato de un tren emite un sonido de frecuencia f = 440 Hz (440 ondas por segundo), estamos parados respecto al suelo (luego v = 0) y el tren se acerca hacia nosotros a velocidad u = 30 m/s, la frecuencia percibida será:

\frac{331-30}{440}=\frac{331+0}{f'}\Rightarrow f'=484 m/s

donde hemos tomado para la velocidad del sonido w = 331 m/s. Cuando el tren llega a nuestra posición para empezar a alejarse de nosotros, tendremos una velocidad  u = -30 m/s, luego:

\frac{331-(-30)}{440}=\frac{331+0}{f'}\Rightarrow f'=403 m/s

Vemos que se aprecian claramente variaciones de frecuencia de aproximadamente un 9% del valor real, en más o en menos.

Acústica de salas

Para terminar con este breve paseo por la física del sonido, vemos la física del acondicionamiento de salas para escuchar música.

Cuando en una sala un emisor emite un sonido breve (una nota musical o una sílaba si es un orador), la onda sonora se expande por la sala, reflejándose en las paredes, suelo y techo. A un oyente que esté en el otro extremo le llegará el sonido primero por el camino directo más corto, pero un instante más tarde recibirá las ondas reflejadas, con menor intensidad. Las reflejadas siguen expandiéndose por la sala y se vuelven a reflejar una y otra vez, llegando cada vez más atenuadas al oyente, hasta que son demasiado débiles para ser percibidas. Decimos que hay reverberación en la sala para resumir este fenómeno de estar oyendo el sonido directo y reflejado. La reverberación refuerza el sonido: si salimos al aire libre se oirá menos. Tiene también un grave inconveniente: si se emiten más notas o sílabas, puede pasar que se mezclen en nuestro oído varias notas: las que llegan de forma directa y las anteriores que todavía están reverberando, las notas “se pisan” unas a otras.

En las iglesias antiguas se tenia en cuenta esto: la reverberación es grande allí, ayudando a que se oiga bien en el otro extremo, pero obliga a hablar lentamente, para dar tiempo a que se disipen las palabras anteriores. El tiempo de reverberación de una sala se define como el tiempo que tarda en hacerse inaudible el sonido reflejado. más exactamente, se define como es tiempo después del cual la intensidad del sonido es la millonésima parte. Se intuye que el tiempo de reverberación óptimo depende de la finalidad de la sala: para conferencias estará cerca de un segundo, para un concierto de rock será inferior y para un concierto de órgano será mayor.

Para ajustar la reverberación de una sala podemos usar materiales más o menos absorbentes del sonido en las paredes; en cada reflexión se pierde una parte de la energía: el coeficiente de absorción sonora α es la fracción de energía absorbida: si I es la energía incidente,  I’ es la reflejada, entonces se cumple I’ = I·(1-α). Para α cercano a 1, el sonido es absorbido totalmente por la superficie. En la página del portal de Acústica y Sonido encontraremos más detalles del coeficiente α y una tabla de valores para distintos materiales. Sucede que α no es constante para cada material, sino que depende de la frecuencia del sonido; algunos valores típicos son 0.02 para paredes de hormigón, 0.08 para el yeso, o 0.80 para el poliuretano, a una frecuencia de 1 KHz. Para ajustar la reverberación podemos poner o quitar superficies con α cercano a 1: alfombras, cortinas gruesas, etc. Incluso la ropa que llevan puesta los espectadores influye en la reverberación: una sala repleta de gente en verano con poca ropa reverbera más que en invierno con más ropa.

Puede demostrarse, haciendo un estudio estadístico de todas las múltiples reflexiones en las diversas superficies, que la intensidad del sonido decrece exponencialmente con el tiempo, y que el tiempo de reverberación de la sala viene dado aproximadamente por la fórmula de Sabine:

T=0.16\frac V{S\overline\alpha}

donde S es la superficie total de las paredes, V el volumen de la sala, y \overline\alpha es el coeficiente de absorción medio de la sala, calculado promediando todos las superficies de la sala:

\overline\alpha=\frac{{\overline\alpha}_1S_1+{\overline\alpha}_2S_2+\dots}{S_1+S_1+\dots}

Se puede tener en cuenta también la absorción del sonido por el aire: en salas grandes el recorrido del sonido entre reflexiones será también mayor, y el efecto será más notable, especialmente a frecuencias altas. Se puede demostrar que el recorrido libre medio L, que se define como la media de los tramos recorridos entre reflexiones sucesivas, vale

L=\frac{4V}S

Podemos pues complementar el coeficiente de absorción α con un término adicional que tenga en cuenta la absorción por el aire, que a su vez depende del recorrido libre medio:

\alpha'=\overline\alpha+kL

donde k es una constante que depende de las condiciones físicas del aire (temperatura, humedad, presión …).

Ejemplo práctico

Una habitación destinada a audición musical tiene un tiempo de reverberación de 1s. Se pone un tabique hecho del mismo material que las paredes, de forma que la superficie total S de la habitación aumenta un 20%, evidentemente el volumen V no varia. Calcular el nuevo tiempo de reverberación.

Antes de poner el tabique teníamos, por la formula de Sabine,

T=0.16\frac V{S\overline\alpha}=1

Con el tabique será

T'=0.16\frac V{1.2S\overline\alpha}

dividiendo la 1a por la 2a:

\frac T{T'}=1.2\Rightarrow T'=\frac T{1.2}=\frac{\displaystyle1}{\displaystyle1.2}=\frac56\approx0.8s

Publicado en Acústica, Fí­sica | Etiquetado , , , , , , , , | Deja un comentario